DANH MỤC TÀI LIỆU
Luận văn thạc sỹ: Tổng quan về học máy SVM và bài toán khai phá ý kiến phản hồi khách hàng, ứng dụng SVM vào bài toán khai phá ý kiến phản hồi khách hàng trên website
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
---------------------------------------
NGUYỄN THỊ LAN ANH
NGHIÊN CỨU THUẬT TOÁN HỌC MÁY SVM VÀ ỨNG DỤNG
TRONG BÀI TOÁN KHAI PHÁ Ý KIẾN PHẢN HỒI CỦA KHÁCH
HÀNG TRÊN WEBSITE
Chuyên ngành: Hệ thống thông tin
Mã số: 60.48.01.04
TÓM TẮT LUẬN VĂN THẠC SĨ
Hà Nội - 2013
Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: TS HOÀNG XUÂN DẬU
Phản biện 1: ……………………………………………………………………
Phản biện 2: ……………………………………………………………………
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc sĩ tại Học viện
Công nghệ Bưu chính Viễn thông
Vào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm
Có thể tìm hiểu luận văn tại:
- Thư viện của Học viện Công nghệ Bưu chính Viễn thông
1
MỞ ĐẦU
Với sphát triển mạnh mẽ của mạng Internet, thương mại
điện tử, thời đại của công nghệ thông tin. Mọi người
hội chia sẽ những ý kiến, quan điểm của mình, đưa các bài
đánh giá về các sản phẩm tại các trang web thương mại
điện tử diễn đạt quan điểm của họ trên hầu hết bất kỳ
thứ diễn đàn, nhóm thảo luận các blog, các tác
phẩm n học họ đọc, chúng được gọi chung nội
dung do người dùng tạo ra. Một nhân nếu muốn mua
một sản phẩm, nhân đó không nhất thiết phải giới hạn
tham khảo bạn gia đình nữa bởi nhiều người
đánh giá sản phẩm trên trang Web đó đưa những ý kiến
liên quan đến việc sử dụng sản phẩm. Đây nguồn thông
tin quan trọng, cung cấp cho người mua hàng cái nhìn toàn
diện hơn về một sản phẩm họ định mua. Còn đối với
nhà sản xuất, đánh giá của khách hàng sở để tiến
hành cải tiến, hoàn thiện sản phẩm của mình.
Tuy nhiên, việc tìm kiếm những nguồn ý kiến giámt
chúng trên Web vẫn là một công việc hết sức khó khăn bởi
một số lượng lớn những nguồn khác nhau mỗi
nguồn ngoài ra còn có số lượng lớn văn bản ý kiến hoặc
2
cảm nghĩ. Trong nhiều trường hợp, các ý kiến thường ẩn
bên trong những bài viết dài. Điều đó gây khó khăn cho
người đọc để tìm kiếm các nguồn liên quan, trích
nhữngcâu liên quan đến quan điểm đánh giá, đọc, tóm tắt
và tổ chức chúng thành dạng có thể sử dụng được.
Do đó, việc nghiên cứu phát triển hệ thống tự động cần
thiết trong việc phát hiện, tổng hợp và phân loại các ý kiến
người dùng. Phân tích cảm nghĩ, còn được biết đến như
khai thác ý kiến, phát triển lên từ những nhu cầu này. Đây
một bài toán lớn nhiều thách thức đối trong lĩnh vực xử
lý ngôn ngữ tự nhiên và khai phá văn bản.
Theo hướng nghiên cứu thuật toán học máy để xử
nguồn dữ liệu như đã đề cập, tôi chọn đề tài Nghiên cứu
thuật toán học máy SVM và ứng dụng trong bài toán khai
phá ý kiến phản hồi của khách hàng trên website làm đề
tài luận văn thạc sỹ của mình.
Luận văn gồm 3 chương chính với các nội dung sau:
Chương 1 Tổng quan về học máy bài toán khai phá ý
kiến phản hồi khách hàng - trình bày các khái niệm về
bản của học máy và giới thiệu khái quát về bài toán khai
3
phá ý kiến phản hồi khách hàng ứng dụng của trong
các lĩnh vực công nghệ thông tin.
Chương 2 Phương pháp học máy SVM trình bàysở
thuật toán học máy SVM, các dạng SVM ứng dụng của
SVM.
Chương 3 - Ứng dụng SVM o bài toán khai phá ý kiến
phản hồi khách hàng trên website – xây dựng mô hình ứng
dụng SVM vào việc giải quyết bài toán khai phá ý kiến
phản hồi khách hàng trên website, cài đặt thử nghiệm
đánh giá kết quả thu được.
Chương 1 TỔNG QUAN VỀ HỌC MÁY BÀI
TOÁN KHAI PHÁ Ý KIẾN PHẢN HỒI KHÁCH
HÀNG
1.1. Tổng quan về học máy
1.1.1 Giới thiệu học máy
Học máy (Machine Learning) một ngành khoa học
nghiên cứu các thuật toán cho phép máy tính thể học
được các khái niệm (concept). Cụ thể hơn, học máy là một
phương pháp để tạo ra các chương trình máy tính
4
bằng việc phân tích các tập dữ liệu. Học máy liên quan
mật thiết đến thống kê, cả hai lĩnh vực đều nghiên cứu
việc phân tích dữ liệu. Tuy nhiên khác với thống kê, học
máy tập trung vào sự phức tạp của các giải thuật trong
việc thực thi tính toán.
1.1.2. Học không giám sát, học có giám sát và học
bán giám sát
1.1.2.1. Học không giám sát
Học máy không giám sát (unsupervised learning)
phương pháp học máy nhằm tìm ra một hình phù hợp
với các quan sát. Cho trước một mẫu chỉ gồm các đối
tượng (objects),cần tìm kiếm cấu trúc quan tâm
(interesting structures) của dữ liệu, nhóm các đối tượng
giống nhau.
1.1.2.2. Học có giám sát
Học giám sát (supervised learning) một thuật
của ngành học máy để xây dựng một hàm (function) từ tập
dữ liệu huấn luyện. Dữ liệu huấn luyện bao gồm các cặp
gồm đối tượng đầu vào (thường dạng vec-tơ), đầu ra
mong muốn. Đầu ra của một hàm có thể là một giá trị
thông tin tài liệu
1.1.1. Giới thiệu học máy Học máy (Machine Learning) là một ngành khoa học nghiên cứu các thuật toán cho phép máy tính có thể học được các khái niệm (concept). Cụ thể hơn, học máy là một phương pháp để tạo ra các chương trình máy tính4 bằng việc phân tích các tập dữ liệu. Học máy có liên quan mật thiết đến thống kê, vì cả hai lĩnh vực đều nghiên cứu việc phân tích dữ liệu. Tuy nhiên khác với thống kê, học máy tập trung vào sự phức tạp của các giải thuật trong việc thực thi tính toán.
Mở rộng để xem thêm
tài liệu giúp tôi
Nếu bạn không tìm thấy tài liệu mình cần có thể gửi yêu cầu ở đây để chúng tôi tìm giúp bạn!
xem nhiều trong tuần
yêu cầu tài liệu
Giúp bạn tìm tài liệu chưa có

LÝ THUYẾT TOÁN


×