Khoa CNTT - ÐH KHTN TP.HCM
Khoa CNTT - ÐH KHTN TP.HCM
`
2.2.1.4 Kết luận:..............................................................................................21
2.2.2 Mô hình mạng neural..................................................................... 22
2.2.2.1 Giới thiệu: ...........................................................................................22
2.2.2.2 Mạng neural: .......................................................................................22
2.2.2.3 Giải thuật gán nhãn từ loại dựa trên mạng neural...............................25
2.2.2.4 Từ điển:...............................................................................................27
2.2.3 Mô hình Maximum Entropy (ME): ............................................... 28
2.2.3.1 Giới thiệu: ...........................................................................................28
2.2.3.2 Các đặc trưng của gán nhãn từ loại:....................................................29
2.2.3.3 Mô hình kiểm tra:................................................................................33
2.2.4 Mô hình TBL nhanh (FnTBL) ....................................................... 34
2.2.4.1 Giới thiệu giải thuật FnTBL: ..............................................................34
2.2.4.2 Tính điểm và phát sinh luật:................................................................36
2.2.4.3 Giải thuật FnTBL:...............................................................................39
Chương 3: Mô hình ...................................................................... 41
3.1 Một số khái niệm sử dụng trong mô hình: ....................................... 42
3.1.1 Ngữ liệu(Corpus): .......................................................................... 42
3.1.2 Ngữ liệu vàng(Golden Corpus)...................................................... 44
3.1.3 Ngữ liệu huấn luyện(Training corpus): ......................................... 45
3.2 Một số mô hình kết hợp hiện nay:..................................................... 46
3.2.1 Mô hình kết hợp sử dụng nhiều mô hình liên kết.......................... 47
3.2.2 Phương pháp kết hợp dựa trên tính điểm cho các nhãn ứng viên.. 48
3.2.3 Phương pháp kết hợp dựa trên gợi ý của ngữ cảnh. ...................... 50
3.2.4 Phương pháp kết hợp dựa trên tính kế thừa kết quả của giải thuật
TBL 51
3.3 Mô hình gán nhãn từ loại dựa trên song ngữ Anh-Việt.................. 52
3.3.1 Sơ đồ hoạt động của mô hình: ....................................................... 55
3.3.1.1 Ngữ liệu huấn luyện:...........................................................................56
3.3.1.2 Quá trình khởi tạo: ..............................................................................58
3.3.1.3 Quá trình huấn luyện:..........................................................................58
3.3.1.4 Quá trình gán nhãn từ loại trên cặp câu song ngữ..............................61
3.3.2 Thuật giải ....................................................................................... 63
3.3.3 Khung luật (Template):.................................................................. 64
3.3.4 Cải tiến ........................................................................................... 66
3.3.5 Chiếu sang tiếng Việt..................................................................... 67
Chương 4: Cài đặtthửnghiệmvàđánh giá kếtquả................. 70