http://www.ebook.edu.vn Căn bản về XML
TRUNG TÂM CÔNG NGHỆ PHẦN MỀM THỪA THIÊN HUẾ Trang 2 / 59
Địa chỉ: Số 6 Lê Lợi, Huế
Điện thoại: (054).849.499 Fax: (054).849.498
Email: huesoft@dng.vnn.vn website: http://www.huesoft.com.vn
Chương mở đầu
Trong thời đại Công nghệ Thông tin hiện nay XML (eXtensible Markup Language)
chiếm vị trí số một và rất quan trọng trong việc chuyển tải, trao đổi dữ liệu và liên lạc giữa
các ứng dụng. Điều này càng được khẳn định khi trong các hệ điều hành từ WindowsXP
trở đi, bên trong nó chứa đầy XML. Hơn nữa khi bộ .Net ra đời thì càng làm cho XML trở
nên thịnh hành.
Sử dụng kỹ thuật XML không chỉ có tập đoàn Microsoft mà ngay cả Sun, IBM, Oracles
điều hỗ trợ XML và dùng nó trong các ứng dụng.
1 XML là gì?
XML là ngôn ngữ xây dựng cấu trúc tài liệu văn bản, dựa theo chuẩn SGML
(Standard Generalized Markup Language: siêu ngôn ngữ có khả năng sinh
ngôn ngữ khác). SGML được phát triển cho việc định cấu trúc và nội dung tài
liệu điện tử, do tổ chức ISO (International Organization for Standards) chuẩn
hoá năm 1986.
SGML là do IBM đưa ra, song không thể không kể đến những đóng góp của
các công ty khác. XML được W3C (World Wide Web Consortium: tổ chức độc
lập định ra tiêu chuẩn cho trình duyệt Web, máy chủ và ngôn ngữ) phát triển,
nhưng đặc tả XML lại do Netscape, Microsoft và các thành viên của dự án
Text Encoding Initiative (TEI) xây dựng. Tổ chức W3C XML Special Interest
Group có đại diện từ hơn 100 công ty cùng nhiều chuyên gia được mời khác.
Lý do ra đời của XML vì SGML rất rắc rối, và HTML có nhiều giới hạn nên
năm 1996 tổ chức W3C thiết kế XML. XML version 1.0 được định nghĩa trong
hồ sơ February 1998 W3C Recommendation.
Điểm quan trọng của kỹ thuật XML là nó không thuộc riêng về một công ty
nào, nó là một sản phẩm mà trí tuệ của nó thuộc về cả thế gới, nó là một tiêu
chuẩn được mọi người công nhận vì được soạn ra bởi World Wide Web
Consortium - W3C (một ban soạn thảo với sự hiện diện của tất cả các chuyên
gia Tin học) và những ý kiến đóng góp bằng cách trao đổi qua Email.
Bản thân của XML rất là đơn giản, nhưng các công cụ chuẩn được định ra để
làm việc với XML như Document Object Model - DOM, XPath, XSL, v.v.. thì
rất hữu hiệu, và chính các chuẩn này được phát triển không ngừng.
XML cũng giống như HTML đều là ngôn ngữ đánh dấu, nhưng điều cần nói ở
đây là sự ra đời của XML để khắc phục cho một số yếu kém của HTML.
HTML và XML đều sử dụng các tag nhưng các tag của HTML là một bộ dữ
liệu tag được xây dựng và định nghĩa trước, tức là người lập trình phải tuân
thủ theo các thẻ đã định nghĩa của HTML, hiện HTML có khoản hơn 400 tag,
để nhớ hết 400 tag này cũng không có gì khó khăn đối với người lập trình web
chuyên nghiệp nhưng thật khó đối với những người không chuyên. Hơn nữa
các tag của HTML không nói lên được mô tả dữ liệu trong đó. Nhưng đối với
XML thì hoàn toàn khác bởi vì tag trong XML là do người lập trình định nghĩa
và mỗi tag là một mô tả dữ liệu mà người lập trình muốn truyền đạt.
2 Các nội dung sẽ trình bày
Khi XML ra đời thì có hàng loạt các ngôn ngữ chuẩn được đưa ra để làm việc
với XML, nhưng trong tài liệu này tôi chỉ xin được trình bày các phần chính
sau:
1. Ngôn ngữ XML(eXtensible Markup Language )