DANH MỤC TÀI LIỆU
Luận văn: nghiên cứu các giải pháp khai thác các thông tin tiềm ẩn trong các kho dữ liệu nhân sự

Luận văn tốt nghiệp
Khai thác d liệu hồ sơ nhân
s hiện nay
LI CAM ĐOAN
Tôi xin cam đoan đây là công trình nghiên cu ca bn thân, được xut
phát t yêu cu phát sinh trong công vic để hình thành hướng nghiên cu. Các
s liu có ngun gc rõ ràng tuân th đúng nguyên tc và kết qu trình bày trong
lun văn được thu thp được trong quá trình nghiên cu là trung thc chưa tng
được ai công b trước đây.
Hà Ni, tháng 5 năm 2008
Tác gi lun văn
Phm Đức Chiến
- 2 -
Li
cám
ơn

Lun văn được thc hin dưới s hướng dn ca PGS. TS. Hà Quang
Thy - Trường Đại hc Công ngh. Em xin bày t lòng biết ơn sâu sc ti Thy
đã hướng dn và có ý kiến ch dn quý báu trong quá trình em làm lun văn. Em
xin chân thành cm ơn Tiến sĩ Nguyn Hi Châu và Tiến sĩ Nguyn Hà Nam
B môn Các H thng Thông tin, Khoa Công ngh Thông tin đã cho nhiu ý
kiến đóng góp quý báu để bn lun văn được hoàn thin hơn. Em xin chân thành
cm ơn các Thy giáo trong b môn Các H thng Thông tin, nhóm seminar
“Khai phá d liu và ng dng”. Em cũng xin cm ơn các thy cô giáo trong
Khoa, cán b thuc phòng Khoa hc và Đào to sau Đại hc, Trường Đại hc
Công ngh đã to điu kin trong quá trình hc tp và nghiên cu ti Trường.
Cui cùng xin bày t lòng cm ơn ti nhng người thân trong gia đình, bn bè
đã động viên và giúp đỡ để tôi hoàn thành bn lun văn này.
Hà Ni, Tháng 5/2008
Hc viên thc hin
Phm Đức Chiến
- 3 -
MC LC Trang
LI CAM ĐOAN .....................................................................................................1
MC LC.................................................................................................................3
DANH MC HÌNH V MINH HA.....................................................................5
M ĐẦU ...................................................................................................................7
CHƯƠNG 1. TNG QUAN..................................................................................10
1.1. Ý nghĩa: .............................................................................................................................10
1.2.Các yêu cu đặt ra trong công tác qun lý ngun nhân lc:.........................................11
1.2.1 Yêu cu chung ..............................................................................................................11
1.2.2 Yêu cu c th: .............................................................................................................12
1.2.3. Thông tin qun lý : ......................................................................................................12
1.2.4. Kho sát thc trng yêu cu vn đề qun lý ngun nhân lc ca cơ quan Hi quan: .15
1.2.5. Thc trng d liu, đề xut yêu cu cn đạt được và kiến trúc ca h thng: ...........27
Kết lun chương 1....................................................................................................................31
CHƯƠNG 2. NGHIÊN CU CÔNG NGH, K THUT VÀ CÔNG C
PHC V YÊU CU.............................................................................................32
2.1. Khai phá d liu:..............................................................................................32
2.1.1. Khái nim ....................................................................................................................32
2.1.2. Ưu thế khai phá d liu ...............................................................................................33
2.2. Các k thut khai phá d liu: ........................................................................34
2.3. Cây quyết định:.................................................................................................37
2.3.1. Sc mnh ca cây quyết định:.....................................................................................37
2.3.2.Nhược đim ca cây quyết định:..................................................................................38
2.4. Các phn mm công c khai phá d liu: ......................................................38
2.4.1. Phân tích s liu bng R:.............................................................................................38
2.4.2. Phân tích s liu bng phn mm weka.......................................................................40
2.4.3 Phân tích s liu bng See5/C5.0 .................................................................................43
2.4.4. Phân tích s liu bng DTREG1 .................................................................................44
2.4.5.Phân tích s liu s dng công c ca Microsoft:........................................................45
2.5. Công c la chn:............................................................................................47
Kết lun chương 2....................................................................................................................52
CHƯƠNG 3.PHÂN LP D LIU S DNG CÂY QUYT ĐỊNH .............53
3.1. Tng quan v phân lp d liu trong khai phá d liu.................................................53
- 4 -
3.1.1.Phân lp d liu............................................................................................................53
3.1.2. Các vn đề liên quan đến phân lp d liu..................................................................56
3.1.3 Các phương pháp đánh giá độ chính xác ca mô hình phân lp..................................58
3.2 Cây quyết định ng dng trong phân lp d liu ..........................................................59
3.2.1.Định nghĩa: ...................................................................................................................59
3.2.2. Các vn đề trong khai phá d liu s dng cây quyết định.........................................60
3.2.3.Xây dng cây quyết định..............................................................................................62
Kết lun chương 3....................................................................................................................63
CHƯƠNG 4. THC NGHIM ............................................................................64
4.1.Gii thiu v mô hình xây dng:......................................................................................64
4.1.1.Sơ đồ lung d liu thông tin nhân s:.........................................................................64
4.1.2. Gii quyết vn đề:........................................................................................................65
4.1.3.Các mô hình được xây dng:........................................................................................66
4.2. Minh ha kết qu h tr thu được t mô hình xây dng .............................................68
4.2.1 Minh ha h tr công tác tuyn la và đào to-cây la chn cán b đào to qun lý
nhà nước ........................................................................................................................................68
4.2.2. Minh ha công tác kim tra thông tin h sơ nhp máy-cây phân lp v trí công tác
(lãnh đạo, nhân viên) .....................................................................................................................71
4.2.3.Minh ha công tác hoch định mô hình t chc...........................................................74
4.2.4.Minh ha mô hình giám sát theo dõi công vic phc v công tác đánh giá:................77
4.2.5. Minh ha h tr xây dng các quy trình qun lý ngun nhân lc: .............................78
Kết lun chương 4....................................................................................................................80
KT LUN .............................................................................................................81
TÀI LIU THAM KHO .....................................................................................83
PH LC 1: MÔ T BNG D LIU S DNG ...........................................84
PH LC 2: THÔNG TIN V QUN LÝ QUÁ TRÌNH CÁ NHÂN CA
CHC NĂNG H SƠ HIN TI........................................................................85
- 5 -
DANH MC HÌNH V MINH HA
Hình 1.1 Thng kê tng hp s liu bng vic s dng phn mm tin hc ...... 14
Hình 1.2 Ví d bng tham chiếu ......................................................................... 28
Hình 1.3 Đề xut kiến trúc tng th ca h thng qun lý nhân s.................... 30
Hình 2.1 Quá trình phát hin tri thc trong cơ s d liu................................... 33
Hình 2.2 Hình mô t chc năng Export d liu t d liu nhân s.................... 39
Hình 2.3 Minh ha chc năng chn phân lp d liu trong R............................ 40
Hình 2.4 Minh ha chn phân lp trong weka.................................................... 41
Hình 2.5 Lit kê các phương pháp phân lp ca công c................................... 42
Hình 2.6 Lit kê kết qu phân lp....................................................................... 42
Hình 2.7 Dng kết qu ca DTREE.................................................................... 44
Hình 2.8 Kết qu cây quyết định......................................................................... 45
Hình 2.9 Bng khuyến cáo la chn thut toán ca Microsoft........................... 46
Hình 2.10 Màn hình Analysis Manager ............................................................. 47
Hình 2.11 Chn bng d liu đầu vào cho mô hình ........................................... 48
Hình 2.12 Chn k thut “Data Mining” ............................................................ 49
Hình 2.13 La chn các ct d liu cho mô hình d đoán................................. 49
Hình 2.14 Kết qu cây quyết định....................................................................... 50
Hình 2.15 Lược đồ minh ha cho d đoán thuc tính liên tc ........................... 51
Hình 2.16 Minh ha cho d đoán thuc tính liên tc ......................................... 51
Hình 3.1 Bài toán phân lp ................................................................................. 53
Hình 3.2 Quá trình phân lp d liu - (a) Bước xây dng mô hình phân lp....55
Hình 3.3 Quá trình phân lp d liu - (b1)Ước lượng độ chính xác ca mô hình
...................................................................................................................... 56
Hình 3.4 Quá trình phân lp d liu - (b2) Phân lp d liu mi ...................... 56
Hình 3.5Ước lượng độ chính xác ca mô hình phân lp vi phương pháp
holdout.......................................................................................................... 59
Hình 3.6 Ví d v cây quyết định ....................................................................... 60
thông tin tài liệu
Luận văn nghiên cứu tổng quan về đặc tính công nghệ khai phá dữ liệu, các kỹ thuật khai phá dữ liệu (phân cụm, phân lớp..), các phần mềm thông dụng khai phá dữ liệu và giải pháp phân lớp dựa trên cây quyết định. Luận văn tập trung vào thuật toán tiêu biểu ứng dụng cho phạm vi phân tích dữ liệu là “Microsoft Decision Tree”, sử dụng công cụ phân tích dữ liệu của Microsoft. Đây là công cụ rất thuận tiện trong việc kết nối với cơ sở dữ liệu nhân sự dùng phần mềm Hệ quản trị SQL Server của Microsoft, công cụ có khả năng phân tích trực tuyến qua mạng (có quyền truy cập hợp pháp có thể phân tích từ bất kỳ máy tính nào có trong mạng) và là một công cụ mạnh khai thác nhanh đáp ứng được phân tích theo mô hình tăng trưởng dữ liệu. Ta biết rằng các tập dữ liệu được bổ sung và tăng trưởng theo thời gian, do vậy các tập thường xuyên và các luật kết hợp đã được tính toán không còn giá trị trên tập dữ liệu mới. Ngoài ra, với một dữ liệu ổn định, khi cần tìm các tập thường xuyên với độ hỗ trợ khác, công việc phải tính lại từ đầu.
Mở rộng để xem thêm
tài liệu giúp tôi
Nếu bạn không tìm thấy tài liệu mình cần có thể gửi yêu cầu ở đây để chúng tôi tìm giúp bạn!
xem nhiều trong tuần
yêu cầu tài liệu
Giúp bạn tìm tài liệu chưa có

LÝ THUYẾT TOÁN


×