DANH MỤC TÀI LIỆU
Hệ thống File phân tán và những điều cần biết
H thng file phân tán
- 1 -
MC LC
Li m đầu…………………………………………………………………………...2
I. Tng quan v h phân tán
I.1 H phân tán là gì?.............................................................................3
I.2 Các đặc trưng cơ bn ca h phân tán.............................................3
II. Các nguyên lý ca h phân tán
II.1 Truyn thông....................................................................................4
II.2 Tiến trình...........................................................................................5
II.3 Định danh..........................................................................................7
II.4 Đống b hoá .....................................................................................8
II.5 Nht quán và Nhân bn ....................................................................11
II.6 Chu li..............................................................................................12
II.7 Anh toàn – An ninh............................................................................14
III. H thng qun tr tp phân tán
III.1 Sun File Network System..................................................................16
III.1.1 Tng quan v NFS .............................................................17
III.1.2 Truyn thông ......................................................................20
III.1.3 Stateless - Stateful .............................................................21
III.1.4 Định danh...........................................................................21
III.1.5 Đồng b hóa.......................................................................25
III.1.6 Lưu đệm và bn sao ..........................................................28
III.1.7 Chu li ...............................................................................29
III.1.8 An toàn – an ninh ...............................................................31
III.2 H thng file Coda ............................................................................33
III.3 Các h thng file phân tán khác........................................................34
III.4 So sánh gia các h thng file phân tán...........................................37
IV. Kết lun…………………………………………………………………………..40
H thng file phân tán
- 2 -
LI M ĐẦU
Cùng vi s phát trin ca mng máy tính, vic tính toán, qun lý ngày nay
không ch đơn gin tp trung trong máy tính đơn như trước na. Nó đòi hi các h
thng tính toán phi được kết hp t mt s lượng ln các máy tính kết ni vi
nhau qua 1 mng tc độ cao. Chúng thường được gi là các mng máy tính hay
còn có tên khác là các H phân tán, nhm ám ch tương phn vi H tp trung
trước đây.
Ngày nay, h phân tán phát trin rt nhanh và được ng dng rng khp. Đó
có th là các dch v thông tin phân tán, như các dch v trên Internet chng hn.
Đó cũng có th là các cơ s d liu phân tán như các h thng đặt vé máy bay, xe
la…hoc các h thng tính toán phân tán.
Mc đích ca tiu lun này nhm nêu ra 1 cách khái quát nht nhng khái
nim, nhng nguyên lý cơ bn ca mt h phân tán nói chung. Đồng thi phân
tích sâu vào vic chia s d liu trong h phân tán, 1 trong nhng chc năng cơ
bn nht ca h phân tán. Chúng ta thường gi đó là h thng qun tr file phân
tán. Ta cũng s ln lượt nghiên cu các mô hình khác nhau ca h thng file phân
tán như Sun NFS, Coda, Plan 9, XFS…
H thng file phân tán
- 3 -
I.Tng quan v h phân tán
I.1. H phân tán là gì?
Có nhiu định nghĩa cho 1 h phân tán. Tuy nhiên, ta có th định nghĩa h
phân tán là mt tp hp bao gm các máy tính t tr được liên kết vi nhau qua
mt mng máy tính, và được cài đặt phn mm h phân tán. Phn mm h phân
tán cho phép máy tính có th phi hp các hot động ca nó và chia s tài nguyên
ca h thng như phn cng, phn mm và d liu.
Mt s tính cht quan trng ca mt h phân tán:
Th nht chúng cho phép chúng ta chy nhng ng dng khác nhau trên nhiu
máy khác nhau thành mt h thng duy nht. Mt ưu đim khác ca h phân tán
đó là khi mt h thng được thiết kế đúng cách, mt h phân tán có th có kh
năng thay đổi tu theo quy mô ca h thng rt tt. Tuy nhiên, tt c mi th đều
có hai mt ca nó, mt h phân tán cũng vy bên cnh nhng mt ưu vit thì nó
cũng có nhng nhược đim đó là tính bo mt kém
Nhng ng dng ca h phân tán:
Cung cp nhng thun li cho vic tính toán đa mc đích đến nhng nhóm
người dùng, t động hoá công vic ngân hàng và h thng truyn thông đa
phương tin, ngoài ra chúng còn bao quát toàn b nhng ng dng thương mi và
kĩ thut. H phân tán đã tr thành tiêu chun để t chc v mt tính toán. Nó có
th được s dng cho vic thc hin tương tác h thng tính toán đa mc đích
trong UNIX và h tr cho phm vi rng ca thương mi và ng dng công nghip
ca nhng máy tính…
I.2. Các đặc trưng cơ bn ca h phân tán
a. Kết ni người s dng vi tài nguyên
Chia s ngun tài nguyên là mt đặc tính cơ bn ca h thng phân tán, nó là
cơ s cho nhng đặc tính khác và nó nh hưởng đến nhng kiến trúc phn mm
có sn trong các h phân tán. Các ngun tài nguyên có th là mc d liu, phn
cng và các thành phn ca phn cng. Các ngun tài nguyên được phân bit t
mt d liu được qun lý vi nhng quá trình xđơn bi nhu cu ca vài quá
trình xđể chia s chúng
b. Tính trong sut (transparency)
Mt h phân tán được gi là trong sut nếu nó có kh năng che du tính ri rc
và nhng nhược đim có th ca nó đối vi người s dng cui và người lp trình
ng dng. Có 8 dng trong sut :
Trong sut truy cp : che du cách biu din d liu và cách thc truy cp
tài nguyên.
Trong sut v trí : che du v trí thc ca tài nguyên.
Trong sut di trú : che du kh năng di trú (di chuyn t nơi này sang nơi
khác) ca tài nguyên.
Trong sut định v li : che du kh năng tài nguyên có th di chuyn t nơi
này đến nơi khác ngay c khi đang được s dng.
Trong sut bn sao : che du các bn sao được nhân ra.
Trong sut v tương tranh.
H thng file phân tán
- 4 -
Trong sut v li.
Trong sut truy cp nhanh.
c. Tính m (openess)
Mt h phân tán được gi là có tính m nếu nó có kh năng b sung thêm các
dch v mi mà không làm nh hưởng xu đến các dch v đã có.
d. Tính co dãn (scalability)
Mt h phân tán được gi là có tính co dãn nếu nó có th thích nghi được vi
nhng s thay đổi qui mô ca h thng.. Tính co dãn th hin trên 3 khía cnh.
D dàng b sung thêm tài nguyên và người s dng.
H thng thay đổi qui mô v mt địa lý.
H thng thay đổi qui mô v qun tr.
e. Tính chu li (Fault tolerance)
Xđược nhng li xy ra trong quá trình làm vic. Bên cnh tính chu li
luôn đi kèm theo là khc phc li.
f. Tính an toàn an ninh (security)
II. Các nguyên lý ca h phân tán
Trong phn này, ta s xem xét 1 cách tng quan, tóm tt các nguyên lý ca h
phân tán. Bi nếu đi sâu thì bn thân trong mi nguyên lý li còn có rt nhiu vn
đề cn phân tích. Có tng cng 7 nguyên lý cơ bn đối vi 1 h phân tán, bao
gm:
1. Truyn thông (Commmunication).
2. Tiến trình (Processes).
3. Định danh (Naming).
4. Đồng b hóa (Synchronization).
5. Nht quán và nhân bn (Consistency & Replication).
6. Chu li (Fault tolerance).
7. An toàn – an ninh (Security).
Sau đây ta đi vào phân tích sơ b tng nguyên lý ca h phân tán.
II.1. Truyn thông
Truyn thông gia các tiến trình rt quan trng trong mt h phân tán. Truyn
thông có th chia thành 2 mc:
Truyn thông mc mng máy tính.
Truyn thông mc midleware: bao gm 4 mô hình được s dng rng rãi:
Gi th tc t xa (RPC), Triu gi đối tượng t xa (RMI), Truyn thông hướng
thông đip (MOC) và Truyn thông hướng dòng (SOC).
II.1.1. Truyn thông mc mng
Mô hình OSI được thiết kế cho phép các h thng m truyn thông vi nhau,
phc v cho các ng dng phân tán.
Các tng trong mô hình OSI:
1. Tng vt lý (Physical layer)
H thng file phân tán
- 5 -
2. Tng liên kết d liu (Data link)
3. Tng mng (Network)
4. Tng vn chuyn (Transport)
5. Tng phiên (Session)
6. Tng trình din (Presentation)
7. Tng ng dng (Application)
Mi tng ca mô hình OSI gii quyết mt phn ca vic giao tiếp. Và mi
tng li có giao thc riêng ca nó.
Mi h thng m có các qui tc v định dng, ni dung, và ng nghĩa ca
thông đip gi và nhn – các qui tc này được gi là các giao thc (protocol). Để 1
nhóm các máy tính có th truyn thông được vi nhau, cn phi có các giao thc
thng nht gia các máy tính. Có 2 loi giao thc khác nhau: giao thc hướng kết
ni (Connection-Oriented protocol) phi thiết lp kết ni trước khi truyn.nhn d
liu, sau khi xong phi gii phóng kết ni. Và giao thc phi kết ni (Connectionless-
Oriented protocol): không cn kết ni, thông tin được truyn ngay khi đã sn sàng.
II.1.2. Truyn thông mc midleware
a. Gi th tc t xa (Remote Procedure Call):
RPC cho phép gi các th tc nm trên các máy khác. Khi 1 tiến trình trên máy
A gi 1 th tc trên máy B, thì tiến trình gi trên máy A đó s b tm dng, thay vào
đó s thc thi th tc được gi trên máy B. Phương pháp này được gi là Gi th
tc t xa (RPC). Đây là kĩ thut được s dng rng rãi nht trong các h phân tán.
RPC xy ra vi các bước tóm tt như sau:
1. Th tc client gi client stub mt cách bình thường.
2. Client stub xây dng mt thông đip và gi h điu hành cc b.
3. H điu hành ca client gi thông đip đến h điu hành t xa.
4. H điu hành t xa gi thông đip cho server stub.
5. Server stub m gói các tham s ra và gi server.
6. Server thc thi và tr kết qu đến stub.
7. Server stub đóng gói nó vào thông đip và gi h điu hành cc b.
8. H điu hành ca server gi thông đip cho h điu hành ca client.
9. H điu hành ca client trao thông đip đến client stub.
10. Stub m gói kết qu và tr v cho client.
b. Triu gi đối tượng t xa (Remote Object Invocation):
K thut hướng đối tượng được dùng rt ph biến hin nay trong vic phát
trin các ng dng phân tán (distributed) và không phân tán (non-distributed). Mt
trong điu quan trng ca đối tượng đó là nó n giu đi nhng gì bên trong ca nó
vi bên ngoài, mà nó s ch cung cp các giao din (interface). Hướng tiếp cn
này cho phép các đối tượng d dàng được thay thế và chnh sa. RPC và ROI
giúp n du thông tin trong các h phân tán, tăng cường s truy cp trong sut.
c. Truyn thông hướng thông đip (Message Oriented Communication)
Cơ chế truyn thông đip có hai loi:
1. Truyn thông tm thi hướng thông đip.
H thng file phân tán
- 6 -
2. Truyn thông hướng thông đip dài lâu.
d. Truyn thông hướng dòng (Stream Oriented Communication)
Cũng có mt s dng truyn thông mà yếu t đáp ng thi gian đóng vai trò ct
yếu như d liu âm thanh hoc hình nh chng hn. Do đó cn phi có 1 cơ chế
truyn thông hướng dòng.
II.2 Tiến trình
Tiến trình (process) là 1 chương trình đang trong quá trình thc thi nghĩa là mt
chương trình hin đang được thc thi bi mt trong các b xo ca h điu
hành. Đối vi tiến trình thì vn đề qun lý và lp lch cho các tiến trình nhng vn
đề quan trng cn gii quyết. Nhiu tiến trình có th đồng thi chia s cùng mt
CPU và các tài nguyên phn cng khác.
II.2.1 Lung (threads) và mô hình đa lung (multi-threading)
Lung (thread) tương t mt tiến trình, tuy nhiên cũng có đim khác bit cơ
bn gia lung vi tiến trình. Mt lung là mt đơn v x lý cơ bn trong h thng .
Mi lung x lý tun t đon code ca nó, s hu mt con tr lnh, tp các thanh
ghi và mt vùng nh stack riêng. Các lung chia s CPU vi nhau ging như cách
chia s gia các tiến trình: khi 1 lung đang x lý thì các lung khác s phi ch
cho đến lượt. Mt lung cũng có th to lp các lung con. Và 1 tiến trình có th
s hu nhiu lung.
Mt thuc tính quan trng ca lung là chúng cho phép khóa các li gi h
thng mà không cn phi khóa toàn b tiến trình mà có lung đang chy.
K thut đa lung (multi-threading) cho phép khai thác tính song song khi thc
thi mt chương trình trên mt h thng nhiu b x lý. Khi đó, mi lung được gán
cho mt CPU khác nhau trong khi d liu dùng chung được lưu tr trong b nh
chính dùng chung. Phương pháp này thường được dùng trong môi trường UNIX.
II.2.2 Di trú mã (code migration)
Di chuyn tiến trình t máy này sang máy khác là mt nhim v phc tp và
tn kém nhưng nó s ci thin v mt hiu sut. Toàn b hiu sut h thng có th
được nâng lên, nếu các tiến trình được di chuyn t máy có mc độ x lí quá
nhiu đến máy có mc độ x lí ít hơn. Di trú mã ũng có th giúp tăng hiu sut
bng cách tn dng cơ chế song song mà không cn quan tâm đến vn đề lp
trình song song. Bên cnh đó là tính mm do ca mã di trú. Cách xây dng ng
dng phân tán truyn thng là tách ri ng dng thành các phn khác nhau, và
quyết định phn nào được thc thi. Tuy nhiên nếu mã có th di chuyn gia các
máy khác nhau ta có th cu hình động h phân tán.
Quy ước 1 tiến trình bao gm 3 thành phn :
1. Code segment : cha tp lnh chương trình.
2. Resource segment: cha các tham chiếu đến tài nguyên bên ngoài mà
tiến trình cn.
3. Execution segment : cha trng thái thc thi hin hành ca tiến trình.
Có hai mô hình cơ bn cho vic di trú mã (di trú tiến trình) :
Mô hình di động yếu (weak mobility): ch chuyn code segment kèm theo 1
s điu kin ban đầu. Mt đặc đim ca mô hình mã di trú yếu là mt chương trình
được chuyn luôn bt đầu trng thái khi to ca nó. Li thế ca di trú yếu đó là
tính đơn gin, nó ch cn máy đích có th thc thi mã là được.
thông tin tài liệu
Tài liệu cung cấp những kiến thức cơ bản về hệ thống file phân tán cũng như ứng dụng của nó
Mở rộng để xem thêm
từ khóa liên quan
xem nhiều trong tuần
yêu cầu tài liệu
Giúp bạn tìm tài liệu chưa có

LÝ THUYẾT TOÁN


×