và sai số giữa phụ tải dự đoán và phụ tải thực tế là rất nhỏ, trong
khi đó đường phụ tải dự đoán ở khoảng từ 1h chiều đến 4h chiều
có sai số là khá lớn. Điều này phần lớn xảy ra do dữ liệu phụ tải
không được đúng trong khoảng đó. Ngoài ra, trong luận văn này,
chúng tôi chỉ dự đoán phụ tải qua dữ liệu phụ tải điện trong quá
khứ, nếu muốn được chính xác hơn ta sẽ cần thêm một số điều
kiện của thời tiết như nhiệt độ, độ ẩm, … thì đường dự đoán phụ
tải điện và phụ tải điện thực tế sẽ có sai số bé hơn.
Kết luận
Luận văn trình bày với cấu trúc 3 chương, với mục đích thể
hiện việc khai phá dữ liệu thông qua kỹ thuật mạng nơ ron và
minh họa cụ thể qua bài toán phụ tải điện năng. Các kết quả
chính của luận văn là:
Ở chương 1, chúng tôi đã nghiên cứu tổng quan về khai phá
dữ liệu, phân loại khai phá dữ liệu, đưa ra được các nhiệm vụ
của khai phá dữ liệu đó là mô tả, ước lượng, dự đoán, phân loại,
phân cụm và cuối cùng là luật kết hợp. Tiếp theo, là phân tích
về quá trình khai phá dữ liệu bao gồm 5 bước: Phát biểu bài
toán và đề ra giả thiết. Thu thập dữ liệu. Tiền xử lý dữ liệu.
Ước lượng mô hình. Diễn giải mô hình và đưa ra kết luận.
Ở chương 2, chúng tôi đi vào nghiên cứu về kỹ thuật mạng
nơ ron, là một trong các phương pháp được ứng dụng nhiều và
mang lại hiệu quả cao trong các nhiệm vụ khai phá dữ liệu. Bắt
đầu với việc giới thiệu về mạng nơ ron sinh học, rồi lên mô
hình toán cụ thể cho một nơ ron nhân tạo, chúng tôi tìm hiểu
tiếp về kiến trúc của mạng nơ ron nhân tạo gồm mạng truyền
thẳng, mạng hồi quy, và khả năng học sửa lỗi của mạng nơ ron
28
b) Lên tỉ lệ, mã hóa, và lựa chọn các thuộc tính.
Hai lớp nhiệm vụ tiền xử lý này chỉ là các ví dụ mô tả của
một phạm vi lớn các hoạt động tiền xử lý trong một quá trình
khai phá dữ liệu.
1.3.4 Ước lượng mô hình
Sự lựa chọn và thực hiện kỹ thuật khai phá dữ liệu thích hợp
là nhiệm vụ chính trong giai đoạn này. Quá trình này không dễ
dàng, trong thực hành việc thực thi dựa trên một vài mô hình,
và kèm theo là nhiệm vụ chọn được cái tốt. Phần đầu tiên của
dữ liệu được gọi là tập học, phần tiếp theo được gọi là tập xác
nhận, cũng được gọi là tập kiểm tra. Một mô hình được nhận ra
thông qua quá trình khai phá dữ liệu sử dụng các kỹ thuật học
quy nạp có thể được ước lượng sử dụng tham số tốc độ lỗi
chuẩn như một phép đo việc thực hiện của nó.
1.3.5 Diễn giải mô hình và đưa ra kết luận
Trong phần lớn các bài toán, các mô hình khai phá dữ liệu hỗ
trợ trong phần ra quyết định. Do vậy, các mô hình thực sự hữu
ích thì cần thiết phải diễn giải được bởi vì con người không chắc
chắn dựa vào các quyết định của chúng trên các mô hình “khép
kín” phức tạp. Để ý rằng các đích của sự chính xác của một mô
hình trái ngược với sự chính xác của sự diễn giải của nó. Thông
thường, các mô hình đơn giản là diễn giải được nhiều hơn,
nhưng chúng cũng kém chính xác hơn. Các phương pháp khai
phá dữ liệu hiện đại được mong đợi gặt hái các kết quả chính
xác cao sử dụng các mô hình có số chiều cao.
5