DANH MỤC TÀI LIỆU
Luận văn thạc sĩ khoa học: Kỹ thuật dịch máy và ứng dụng vào tài liệu hàng không- Nghiên cứu và tìm hiểu khoa học
TRẦN LÂM QUÂN CÔNG NGHỆ THÔNG TIN 2004-2006
Hà Nội
2006
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
------------------------------------------
LUẬN VĂN THẠC SĨ KHOA HỌC
NGÀNH: CÔNG NGHỆ THÔNG TIN
TÌM HIỂU KỸ THUẬT DỊCH MÁY VÀ ỨNG
DỤNG VÀO TÀI LIỆU HÀNG KHÔNG
TRẦN LÂM QUÂN
HÀ NỘI 2006
BỘ GIÁO DỤC VÀ ĐÀO TẠO
TRƯỜNG ĐẠI HỌC BÁCH KHOA HÀ NỘI
------------------------------------------
LUẬN VĂN THẠC SĨ KHOA HỌC
TÌM HIỂU KỸ THU ẬT DỊCH MÁY VÀ ỨNG
DỤNG VÀO TÀI LIỆU HÀNG KHÔNG
NGÀNH: CÔNG NGHỆ THÔNG TIN
MÃ SỐ:
TRẦN LÂM QUÂN
Người hướng dẫn khoa học: TS. NGUYỄN KIM ANH
HÀ NỘI 2006
Trần Lâm Quân - 1 -
LỜI CẢM ƠN
Lời đầu của luận văn, em xin chân thành cảm ơn Thầy trong khoa
Công nghệ Thông tin trường Đại học Bách khoa Nội đã tận tình chỉ bảo,
truyền đạt kiến thức cho em trong suốt hai năm qua.
Xin biết ơn Nguyễn Kim Anh, người trực tiếp hướng dẫn em làm
luận văn. Nếu không sự hướng dẫn tận tình, truyền đạt kiến thức của thì
luận văn này sẽ khó hoàn thành.
Cũng chân thành cám ơn gia đình, các bạn trong lớp, các cộng tác viên
đã động viên, sát cánh cùng tôi trong thời gian học tập tại Trường, cũng như
trong quá trình thực hiện luận văn.
Mặc dù đã rất cố gắng, song chắc chắn luận văn không tránh khỏi những
thiếu sót –có khikhuyết điểm. Em rất mong nhận được sự thông cảm và
những ý kiến đóng góp tận tình của các Thầy Cô và các bạn.
Hà Nội, ngày 01 tháng 11 năm 2006
Tác giả
Trần Lâm Quân
TÌM HIỂU KỸ THUẬT DỊCH MÁY VÀ ỨNG DỤNG VÀO TÀI LIỆU HÀNG KHÔNG
Trần Lâm Quân - 2 -
MỤC LỤC
trang
Lời cảm ơn 1
Mục lục 2
Danh mục các bảng 5
Danh mục các hình vẽ 6
Lời nói đầu 7
Chương 1: Tổng quan về dịch máy
I) Định nghĩa dịch máy 11
II) Vai trò của dịch máy 12
III) Lịch sử dịch máy 13
1) Giai đoạn 1930 - 1940 14
2) Giai đoạn 1940 - 1970 14
3) Giai đoạn 1970 - 1990 16
4) Giai đoạn 1990 - hiện nay 17
IV) Phân loại dịch máy 18
I) Phạm vi của luận văn 19
VI) Kết chương 20
Chương 2: Các phương pháp dịch máy
I) Vấn đề ngôn ngữ trong dịch máy 21
II) Kho ngữ liệu 24
III) Dịch trực tiếp 25
IV) Dịch chuyển đổi 27
1) Dịch chuyển đổi cú pháp 27
2) Dịch chuyển đổi cú pháp + phân giải ngữ nghĩa 29
TÌM HIỂU KỸ THUẬT DỊCH MÁY VÀ ỨNG DỤNG VÀO TÀI LIỆU HÀNG KHÔNG
Trần Lâm Quân - 3 -
3) Quy trình dịch chuyển đổi 30
V) Dịch máy dựa trên thống kê (Statistical Machine 29
Translation)
VI) Dịch máy dựa trên mẫu ví dụ (Example-Based 32
Machine Translation)
VII) Dịch dựa trên cơ sở tri thức 33
VIII) Dịch dựa trên ngữ liệu 33
IX) Dịch liên ngữ 33
1) Ưu điểm 34
2) Nhược điểm 35
3) Phân hoạch liên ngữ 36
X) Kết chương 38
Chương 3: Từ điển hàng không
I) Khảo sát 39
1) Tập hợp các từ điển Anh - Việt hàng không 40
(dạng sách)
2) Tập hợp các từ điển Anh - Việt thông dụng 41
(dạng phần mềm)
II) Biên tập để xây dựng kho ngữ liệu
1) Nhập liệu (từ, nghĩa từ, từ xem thêm) 42
2) Phân nhóm từ 42
3) Biên tập 43
III) Lựa chọn mô hình, thiết kế giải thuật, giao diện và 44
viết chương trình
IV) Thiết kế và viết mã 49
V) Xin ý kiến đóng góp của các chuyên gia và người sử 60
dụng. Hoàn thiện từ điển và thử nghiệm dịch máy
TÌM HIỂU KỸ THUẬT DỊCH MÁY VÀ ỨNG DỤNG VÀO TÀI LIỆU HÀNG KHÔNG
thông tin tài liệu
Ta có thể nhận thấy một vài đặc điểm của sơ đồ trên : • Sự phụ thuộc nặng nề của quá trình dịch đối với ngôn ngữ nguồn. Cây cú pháp của ngôn ngữ nguồn quyết định cách thức biên dịch văn bản sang ngôn ngữ đích. Điều này dẫn đến sự suy biến của bước tổng hợp : ta không thấy có khối tổng hợp cú pháp của ngôn ngữ đích. Công đoạn phức tạp nhất chính là phân tích cú pháp. Kết quả là phải cần rất nhiều quy tắc dịch (cho những tình huống khác biệt giữa hai ngôn ngữ) kéo theo rất nhiều quy tắc phân tích văn phạm (có dạng tương tự nhau trên ngôn ngữ nguồn nhưng khác nhau về luật dịch sang ngôn ngữ đích) • Dữ liệu chỉ sử dụng được cho dịch một chiều và cho một cặp ngôn ngữ. Để dịch ngược lại ta phải xây dựng lại toàn bộ hệ quy tắc và từ vựng.
Mở rộng để xem thêm
tài liệu giúp tôi
Nếu bạn không tìm thấy tài liệu mình cần có thể gửi yêu cầu ở đây để chúng tôi tìm giúp bạn!
xem nhiều trong tuần
yêu cầu tài liệu
Giúp bạn tìm tài liệu chưa có

LÝ THUYẾT TOÁN


×