5
1.3.2.7. Phép kết nối (Join)
1.3.2.8. Phép chia
1.3.2.9. Các ví dụ về tìm kiếm bằng đại số qua hệ
1.3.3. Cây vấn tin
Cây vấn tin làm nhiệm vụ giải thích phương án thi hành một câu SQL: Cho
biết thứ tự thực hiện mỗi phép toán, phương pháp tính toán mỗi toán tử. Mỗi nút
của cây là một hay nhiều phép toán đại số quan hệ, mỗi nút lá là một quan hệ cơ sở.
Phần ghi chú trên mỗi nút mô tả cách thức thực hiện toán tử gì trên đó..
1.4. Sắp sếp lại phép nối và viết lại câu vấn tin
1.4.1. Sắp sếp lại phép nối
1.4.2. Viết lại câu vấn tin
1.5. Quá trình tối ưu hóa
Tối ưu hóa vấn tin phân tán là phương pháp lựa chọn phương án thực hiện
câu vấn tin (QEP Query Executtion Plan) phân tán tốt nhất theo nghĩa có chi phí
thấp nhất trong số các phương án có khả năng được thực hiện bởi thể vấn tin.
Chi phí thực hiện được diễn tả bởi hàm chi phí, thường được xem là hàm
mục tiêu. Nó bao gồm chi phí xuất nhập, chi phí xử lý tại các CPU và chi phí truyền
thông tin. Một đơn giản hoá điển hình của các thể tối ưu hoá vấn tin phân tán ban
đầu là bỏ qua chi phí xử lý cục bộ (chi phí xuất nhập và chi phí CPU) bằng cách giả
thiết rằng chi phí truyền dữ liệu chiếm ưu thế. Dữ liệu vào của thể tối ưu hóa vấn tin
là các số liệu thống kê của các mảnh và các công thức đánh giá lực lượng của các
quan hệ trung gian được tạo ra. Trong chương này chúng ta tập trung chủ yếu vào
vấn đề sắp thứ tự các phép nối trong câu vấn tin phân tán vì: Phép nối thường là
phép toán giảm dữ liệu trung gian, và vì các câu vấn tin có ,chứa nối, chọn và chiếu
thường là loại vấn tin hay gặp nhất. Hơn nữa chúng ta dễ dàng tổng quát hóa thuật
toán cơ bản này cho các câu vấn tin có các phép toán hai ngôi như phép hợp.
1.6. Giới thiệu về ngôn ngữ Java
1.6.1. Khái niệm