DANH MỤC TÀI LIỆU
Các kỹ thuật bảo trì khung nhìn của kho dữ liệu và đánh giá được không gian sử dụng trong kho dữ liệu, số hàng truy nhập trong kho dữ liệu để tích hợp và bổ sung kho dữ liệu.
HC VIN CÔNG NGH BƯU CHÍNH VIỄN THÔNG
---------------------------------------
PHÂN TÍCH HIỆU NĂNG CỦA CÁC K THUT BO TRÌ
KHUNG NHÌN CA KHO D LIU
Chuyên ngành: H thng thông tin
Mã s: 60.48.01.04
TÓM TT LUẬN VĂN THẠC SĨ
HÀ NI NĂM 2013
Luận văn được hoàn thành tại:
HỌC VIỆN CÔNG NGHỆ BƯU CHÍNH VIỄN THÔNG
Người hướng dẫn khoa học: PGS.TS. Đặng Văn Chuyết
Phản biện 1: …………………………………………………………
Phản biện 2: ……………………………………………………….
Luận văn sẽ được bảo vệ trước Hội đồng chấm luận văn thạc tại Học
viện Công nghệ Bưu chính Viễn thông
Vào lúc: ....... giờ ....... ngày ....... tháng ....... .. năm ...............
Có thể tìm hiểu luận văn tại:
- Thư viện ca Hc vin Công ngh Bưu chính Viễn thông
1
M ĐẦU
Trong kho dữ liệu việc sử dụng khung nhìn đem lại lợi ích cho các tổ chức doanh
nghiệp đó là vấn đề bảo mật dữ liệu, đơn giản hoá các thao tác truy vấn dữ liệu, tập trung
đơn giản hoá dữ liệu, độc lập dữ liệu. Làm thế nào để bảo trì các khung nhìn thực sao cho
chúng vẫn được duy trì khi cập nhật các quan hệ thực tế các nguồn dữ liệu thì lúc nào k
thuật bảo trì khung nhìn ra đời. Các kthuật bảo trì khung nhìn kho dữ liệu được chia m
hai nhóm lớn: bảo trì theo phương pháp tính lại phương pháp bảo trì y tiến. y thuộc
vào việc kho dữ liệu truy vấn nguồn dữ liệu từ xa để tính lại khung nhìn mới không, các
kỹ thuật y lại được phân thành chế tự duy trì và không tduy trì. vậy, có bốn nhóm
kỹ thuật: tính lại có chế tự duy trì, tính lại không cơ chế tự duy trì, bảo trì y tiến
chế tự duy trì, bảo trì lũy tiến không cơ chế tự duy trì. Nhưng để ứng dụng các k
thuật bảo trì khung nhìn này thực tế thì ta phải đánh giá được khả năng của mỗi loại bảo trì
khung nhìn. vậy, em chọn nghiên cứu đề tài Phân tích hiệu ng của các kỹ thuật bảo
trì khung nhìn của kho dữ liệu nghiên cứu về các kthuật bảo trì khung nhìn của kho dữ
liệu. Thông qua đó đánh giá được không gian sử dụng trong kho dữ liệu, số hàng truy nhập
trong kho dữ liệu để tích hợp và bổ sung kho dữ liệu.
CHƢƠNG 1: TỔNG QUAN
1.1. Khái nim
Theo John Ladley, Kỹ thuật kho dữ liệu (Data Warehouse Technology) tập các
phương pháp, kthuật các công cụ thể kết hợp, hỗ trợ nhau để cung cấp thông tin cho
người sử dụng trên cơ sở tích hợp từ nhiều nguồn dữ liệu, nhiều môi trường khác nhau.
Khung nhìn (View) mt mi quan h ảo được định nghĩa bằng cách s dng mi
quan h thc được lưu tr trong cơ s d liu.
Khung nhìn thc (Materialized view) là kết qu mi quan h truy vấn đã được lưu trữ
trưc. th cho phép thc thi các truy vn phc tạp trên các s d liu với dung lượng
hàng Terabytes trong vài giây hoc phn nh ca giây.
2
1.2. Trin vng ca kho d liu
Hầu hết các kho dữ liệu đang được dùng cho quản trị doanh nghiệp thông minh m
tăng mối quan hệ khách hàng (CRM - Customer Relationship Management) khai thác dữ
liệu. Một số được sử dụng để báo o tổng hợp, một số được sử dụng để tích hợp dữ liệu.
Các cách sử dụng này đều tương quan với nhau.
Quản trị doanh nghiệp thông minh (BI)
Quản lý mối quan hệ khách hàng (CRM)
Khai phá dữ liệu
Quản lý dữ liệu chủ
Tích hợp dữ liệu khách hàng
1.3. Kiến trúc h thng kho d liu
Hình 1.1. Kiến trúc cơ bản của một hệ thống kho dữ liệu.
1.4. Các vấn đề nghiên cu
1.4.1 B chuyển đi và giám sát
Chuyển đổi:
Chuyển đổi nguồn thông tin thành mô hình dữ liệu được sử dụng bởi hệ thống kho dữ
liệu. dụ, nếu các nguồn thông tin bao gồm một tập hợp các tập tin flat, nhưng hình
Bộ tích hợp
Bộ quan sát và
chuyển đổi
Bộ quan sát và
chuyển đổi
Bộ quan sát và
chuyển đổi
Nguồn
thông tin
Nguồn
thông tin
Nguồn
thông tin
3
kho dữ liệu hình quan hệ, do đó Bộ chuyển đổi giám sát phải hỗ tr một giao diện
để trình bày các dữ liệu nguồn thông tin theo kiểu quan hệ.
Quan sát sự thay đổi:
Để phát hiện sự thay đổi của các dữ liệu nguồn liên quan đến kho dữ liệu
chuyển những thay đổi y cho Bộ tích hợp. Chức năng y dựa trên bộ chuyển đổi, giống
như các dữ liệu chính nó, thay đổi dữ liệu phải được chuyển các định dạng hình của
nguồn dữ liệu sang định dạng hình được sử dụng trong hệ thống kho dữ liệu. Một
cách khác chuyền bản sao toàn bộ dữ liệu có liên quan từ các nguồn dữ liệu đển kho dữ liệu.
Bộ tích hợp thể kết hợp dữ liệu này với các kho dữ liệu hiện từ các nguồn khác, hoặc
nó có thể yêu cầu thông tin đầy đủ từ tất cả các nguồn dữ liệu tính lại kho dữ liệu từ đầu.
Tuy nhiên phương pháp y đòi hỏi kho dữ liệu phải ngừng hoạt động trong từ khoảng thời
gian và tình trạng dữ liệu không đáp ứng kịp thời.
1.4.2. B tích hp
Việc tiếp theo của Bộ tích hợp nhận được thông báo cập nhật từ Bộ giám sát đối với
các nguồn thông tin phản ánh những thay đổi trong các kho dữ liệu. Chức năng của Bộ
tích hợp bảo trì khung nhìn nơi chứa sở dữ liệu tại các nguồn thông tin. Do y
công việc của Bộ tích hợp thực hiện bảo trì khung nhìn, đó là sự kết nối chặt chẽ giữa bảo
trì khung nhìn và kho dữ liệu.
Các nguồn thông tin cập nhật dữ liệu thường hoạt động độc lập với kho dữ liệu
các sở dữ liệu không thể hoặc không muốn tham gia trong việc bảo trì khung nhìn. Hầu
hết các kthuật bảo trì dựa trên việc cập nhật cùng với bảo trì khung nhìn việc thay đổi
cập nhât khung nhìn xảy ra trong cùng một giao dịch. Trong môi trường kho dữ liệu
một số trường hợp xảy ra:
- Hệ thống bảo trì khung nhìn (Bộ tích hợp) không gắn với các hệ thống xử sở
dữ liệu (các nguồn thông tin).
- Các nguồn thông tin không tham gia trong việc bảo trì khung nhìn, nhưng báo cáo
những thay đổi.
- Để xác định khung nhìn mi quan h thc th được u tr ti nguồn sở
d liu khác nhau ti nhiu ngun khác nhau. Các ngun này có th thông báo cho kho d
liu khi cp nht xy ra nhưng họ không th xác định nhng d liu nào cn thiết để
câp nht các khung nhìn ti các kho d liu.
4
Vì vy h chth gi d liu cp nht hin ti hoc cp nht toàn b các mi quan
h đến kho d liu. Khi nhận đưc thông tin y, các kho d liu th b sung mt s
ngun d liệu để cp nhật khung nhìn. Sau đó, truyền mt s truy vn t mt s nguồn để
yêu cu b sung ngun d liu. Mt s ngun th cp nht d liu mt lần trước khi h
yêu cu truy vn t các kho d liu. Vì vy, h s gi thêm d liu sai vào kho d liu, sau
đó sử dng d liệu không chính xác để tính toán các khung nhìn. Hiện tượng y gi
phân tán bo trì khung nhìn bất thường. Gii quyết vấn đề bo trì khung nhìn trong kho d
liu phc tạp hơn các h thống cơ sở d liu truyn thng.
1.5. Kết lun
Kho dữ liêu đang phát triển mạnh trong công nghệ sở dữ liệu, chúng ta n rất
nhiều vấn đề cần nghiên cứu để giải quyết những khó khăn, đó những vấn đề bảo trì tính
nhất quán dữ liệu của khung nhìn trên kho dữ liệu không m ngừng việc cập nhật dữ
liệu. Trên thực tế, các kỹ thuật bảo trì khung nhìn để giải quyết các vấn đề đó. Nhưng để
lựa chọn, đánh giá khả năng của loại kỳ thuật này thì chúng ta phải xem xét. Đây cũng chính
vấn đề luận án này tập trung nghiên cứu. Đó phân loi k thut bo trì khung nhìn
để đưa ra đề xut tiến hành so sánh các k thuật y trong điều kin s dng không gian
s ng hàng truy cp bng cách s dụng điểm chun TPC (The American Transaction
processing performance council) cho các H h tr truy vn quyết đnh.
thông tin tài liệu
Trong kho dữ liệu việc sử dụng khung nhìn đem lại lợi ích cho các tổ chức doanh nghiệp đó là vấn đề bảo mật dữ liệu, đơn giản hoá các thao tác truy vấn dữ liệu, tập trung và đơn giản hoá dữ liệu, độc lập dữ liệu. Làm thế nào để bảo trì các khung nhìn thực sao cho chúng vẫn được duy trì khi cập nhật các quan hệ thực tế ở các nguồn dữ liệu thì lúc nào kỹ thuật bảo trì khung nhìn ra đời. Các kỹ thuật bảo trì khung nhìn kho dữ liệu được chia làm hai nhóm lớn: bảo trì theo phương pháp tính lại và phương pháp bảo trì lũy tiến. Tùy thuộc vào việc kho dữ liệu có truy vấn nguồn dữ liệu từ xa để tính lại khung nhìn mới không, các kỹ thuật này lại được phân thành cơ chế tự duy trì và không tự duy trì. Vì vậy, có bốn nhóm kỹ thuật: tính lại có cơ chế tự duy trì, tính lại không có cơ chế tự duy trì, bảo trì lũy tiến có cơ chế tự duy trì, bảo trì lũy tiến không có cơ chế tự duy trì. Nhưng để ứng dụng các kỹ thuật bảo trì khung nhìn này thực tế thì ta phải đánh giá được khả năng của mỗi loại bảo trì . Vì vậy, em chọn nghiên cứu đề tài „Phân tích hiệu năng của các kỹ thuật bảo trì khung nhìn của kho dữ liệu“ nghiên cứu về các kỹ thuật bảo trì khung nhìn của kho dữ liệu. Thông qua đó đánh giá được không gian sử dụng trong kho dữ liệu, số hàng truy nhập trong kho dữ liệu để tích hợp và bổ sung kho dữ liệu
Mở rộng để xem thêm
tài liệu giúp tôi
Nếu bạn không tìm thấy tài liệu mình cần có thể gửi yêu cầu ở đây để chúng tôi tìm giúp bạn!
xem nhiều trong tuần
yêu cầu tài liệu
Giúp bạn tìm tài liệu chưa có

LÝ THUYẾT TOÁN


×