10 khái niệm cơ bản về XML
1. XML cho cấu trúc dữ liệu Dữ liệu có cấu trúc bao gồm những thứ như bảng tính, sổ địa chỉ, các thông số cấu hình, quản lý kinh doanh và vẽ kỹ thuật. XML là nguyên tắc để định dạng văn bản cho phép bạn cấu trúc dữ liệu của mình....

1. XML cho cấu trúc dữ liệu

Dữ liệu có cấu trúc bao gồm những thứ như bảng tính, sổ địa chỉ, các thông số cấu hình, quản lý kinh doanh và vẽ kỹ thuật. XML là nguyên tắc để định dạng văn bản cho phép bạn cấu trúc dữ liệu của mình. XML không phải là một ngôn ngữ lập trình và bạn không cần phải là một lập trình viên để sử dụng nó hay học nó. Chính XML là cho nó dễ dàng trong việc tạo, đọc dữ liệu và làm cho cấu trúc dữ liệu được rõ ràng hơn. XML tránh những hạn chế trong thiết kế ngôn ngữ: XML có tính mở rông, độc lập về nền tảng và hỗ trợ quốc tế. XML hoàn toàn hướng theo chuẩn Unicode.

2. XML gần giống với HTML

Giống như HTML, XML dùng những thẻ (tags - các từ được đặt giữa dấu "<" và dấu ">") và những thuộc tính (attributes - có dạng name="giá trị"). Trong khi HTML chỉ rõ ý nghĩa, tác dụng của từng thẻ để chúng có thể hiển thị dữ liệu trên trình duyệt như thế nào thì XML sử dụng những thẻ chỉ cho mục đích phân định rõ các mảnh dữ liệu và các ứng dụng có thể đọc được chúng. Đây là một ví dụ, trong HTML thẻ <p> được dùng để hiển thị đoạn văn bản (paragraph), nhưng trong XML nó có thể mang nhiều nội dung khác nhau như tên người, một con số, bí danh...tùy thuộc vào nhu cầu người sử dụng

3. XML là văn bản nhưng không có nghĩa là để đọc

Những chương trình xuất dưới dạng bảng tính, sổ địa chỉ, và các dữ liệu có cấu trúc khác thường lưu trữ dữ liệu trên đĩa, lưu trữ dữ liệu sử dụng dưới dạng nhị phân hoặc định dạng văn bản. Điều thuận lợi của việc sử dụng dạng định dạng văn bản là cho phép mọi người nếu cần thiết thì có thể xem những dữ liệu trên đó bằng một chương trình biên soạn văn bản khác mà không nhất thiết phải xem bằng chương trình tạo ra nó. Những định dạng văn bản cũng cho phép người phát triển dễ dàng hơn trong việc gỡ lỗi (debug) của các ứng dụng. Cũng giống như HTML, những tập tin dưới định dạng văn bản của XML thì người dùng không nên đọc chúng, chỉ trừ những lúc cần kíp nhất. Khác với HTML, các quy tắc trong các tập tin XML rất nghiêm ngặt. Chỉ cần một thẻ mở mà quên đóng hay một thuộc tính không đặt giữa 2 dấu ngoặc kép sẽ làm cho tập tin XML trở nên vô dụng trong khi HTML vẫn có thể cho phép được hiển thị. Đặc tả XML chính thức bắt buộc những ứng dụng khi đọc gặp lỗi trong tập tin XML phải dừng lại ngay tại dòng có lỗi và thông báo về lỗi đó.

4. Kích thước tập tin XML

Kể từ lúc XML là một định dạng văn bản và dùng thẻ để phân định dữ liệu, các tập tin XML luôn luôn có kích thước lớn hơn so với những định dạng nhị phân. Đó là điều được lường trước bởi những nhà thiết kế XML. Sử dụng định dạng văn bản hiển nhiên là một lợi thế (xem lại điểm thứ 3) và nó cũng có điểm bất lợi tương ứng ở mức độ khác. Không gian lưu trữ trên đĩa hiện nay không còn đắt như trước đây, thêm vào đó những chương trình nén như zip và gzip có thể nén các tập tin rất tốt và rất nhanh. Hơn nữa, những giao thức truyền thông như giao thức modem và HTTP/1.1, giao thức cốt lõi trên Web có thể nén dữ liệu trên đường truyền và cũng tiết kiệm băng thông tương tự như định dạng nhị phân mang lại.

5. XML là tập hợp của những công nghệ

XML 1.0 là một đặc tả định nghĩa các thẻ và các thuộc tính là gì. Vượt xa hơn XML 1.0, "gia đình XML" là một tập hợp những môđun (module) dịch vụ rất hữu ích giúp hoàn thành những nhu cầu quan trọng trong công việc. Xlink vạch ra một hướng chuẩn để thêm vào các siêu liên kết trong tập tin XML. Xpointer và XFragments là những cú pháp đang phát triển để chỉ tới những phần của một tài liệu XML. Một XPointer có phần nào đó giống một URL, nhưng thay vì chỉ tới một tài liệu trên Web, Xpointer lại chỉ tới những phần nhỏ bên trong một tập tin XML. CSS - một ngôn ngữ dùng để hiển thị trang web được ứng dụng vào XML cũng như HTML. XSL là một ngôn ngữ cao cấp cũng có nhiệm vụ hiển thị trang web, XSL được xem như có tương lai cho XML hơn so với CSS. XSL dựa trên XSLT, một ngôn ngữ chuyển đổi dùng trong việc sắp xếp lại, thêm vào và xóa đi những thẻ và thuộc tính. DOM là một bộ chuẩn hàm gọi các tập tin XML và HTML từ một ngôn ngữ lập trình. XML Schemas 1 và 2 giúp người phát triển định nghĩa một cách chính xác cấu trúc của các tập tin định dạng dựa trên XML. Nói cách khác, Schema cho bạn khả năng định nghĩa sự xuất hiện, kiểu dữ liệu của các thẻ, thuộc tính cùng các giới hạn và cách thức xử lý tập tin. Bạn cũng co thể tới trang www.w3.org/TR để tìm hiểu thêm nhiều môđun và công cụ có sẵn hoặc đang phát triển.

6. XML mới nhưng không mới

Việc phát triển XML được bắt đầu năm 1996 và đã được W3C tiến cử từ tháng 2-1998, điều này sẽ làm bạn nghi ngờ rằng đây chỉ là công nghệ non nớt. Trong trường hợp đó, công nghệ không qúa mới. Trước khi XML ra đời thì đã có SGML được phát triển trong những năm 80 - một siêu ngôn ngữ có thể tạo ra ngôn ngữ khác, trở thành một chuẩn ISO từ năm 1986 và được dùng cho những tài liệu dự án lớn. HTML được phát triển từ ngăm 1990. Những người thiết kế ra XML đã chọn những phần tốt nhất của SGML và kết hợp với những kinh nghiệm từ HTML để tạo ra một thứ gì đó có sức mạnh không thua kém SGML đồng thời phải phổ biến và dễ dàng sử dụng rộng rãi. Chính vì lý do đó, XML đã ra được phát triển.

7. XML dẫn HTML tới XHTML

XHTML là một ứng dụng quan trọng để định dạng tài liệu. XHTML của W3C được coi như "người kế vị" của HTML. XHTML có nhiều thành phần giống như HTML. Tuy vậy cú pháp của XHTML đã được thay đổi một chút để thích hợp với các quy tắc của XML. Một tài liệu "dựa trên XML" thừa kế cú pháp từ XML và cũng giới hạn nó theo cách đó (VD: XHTML cho phép "<p>" nhưng không cho "<r>"), XHTML cũng thêm ý nghĩa vào cú pháp (đối với XHTML "<p>" biểu trưng cho "paragraph" và không biểu trưng cho "price", "person" hoặc bất cứ thứ gì khác).

8. XML is modular

XML cho phép bạn định nghĩa một định dạng tài liệu mới bằng cách kết hợp và dùng lại những định dạng khác. Cũng từ lúc 2 định dạng được phát triển một cách độc lập có thể có những thành phần hoặc thuộc tính trùng tên, bạn sẽ gặp vấn đề này khi kết hợp các định dạng (VD: "<p>" định dạng một đoạn văn trong HTML nhưng lại có thể là viết tắt của "person" trong XML). Để tránh việc lẫn lộn khi kết hợp các định dạng, XML cung cấp một kỹ thuật gọi là namespace. XSL và RDF là những ví dụ tốt cho những định dạng dựa trên XML sử dụng các namespace. XML Schema được thiết kế để có thể cho phép lắp ghép một Schema mới từ hai Schema riêng biệt để hợp nhất cấu trúc tài liệu một cách dễ dàng.

9. XML là nền tảng cho RDF và Web có nghĩa

Khung mô tả tài nguyên (Resource Description Framework - RDF) là một định dạng văn bản XML hỗ trợ việc mô tả tài nguyên và các ứng dụng siêu dữ liệu (metadata) như những playlist nhạc, tập album ảnh, các mục lục. Ví dụ, RDF có thể cho bạn nhận diện được người trong một tập ảnh web album sử dụng thông tin của một danh sách các liên hệ cá nhân; sau đó chương trình nhận gửi thư sẽ tự động gửi message đến những người này thông báo cho họ biết ảnh của họ đang ở trên mạng. Cũng như các văn bản tích hợp HTML, hệ thống menu, và ứng dụng forms dùng để bắt đầu các Web gốc, ứng dụng tích hợp RDF và các tác nhân trong Semantic Web. Cũng giống như người ta cần có sự thống nhất về ý nghĩa những từ họ sử dụng trong giao tiếp, các máy vi tính cần có cơ chế thống nhất về ý nghĩa các thuật ngữ để truyền đạt thông tin một cách hiệu quả. Định nghĩa chính thức các thuật ngữ trong một vài lĩnh vực (mua bán hay sản xuất)gọi là bản thể học rất cần thiết trong Web Semantic. RDF, bản thể học, và việc thể hiện ý nghĩa vì vậy các máy tính có thể giúp người ta tiến hành công việc của mình là toàn bộ nội dung hoạt động của Semantic Web.

10. XML: cấp phép miễn phí, nền tảng độc lập và được hỗ trợ tốt

Bằng cách chọn XML như làm một nền tảng cho dự án, bạn sẽ hưởng lợi từ một cộng đồng những công cụ (trong những công cụ đó có thể có thứ bạn cần) và các kỹ sư có kinh nghiệm về kỹ thuật đang phát triển lớn mạnh. Chọn XML cũng có phần giống việc chọn SQL cho các cơ sở dữ liệu: bạn vẫn xây dựng được cơ sở dữ liệu riêng và những chương trình, quy trình vận hành, trong cộng đồng đó bạn có nhiều công cụ có sẵn và nhiều người có thể giúp bạn. Và khi XML được cấp phép miễn phí, bạn có thể xây dựng những phần mềm của riêng mình dành cho XML mà không cần phải trả cho ai bất cứ thứ gì. XML không phải luôn là giải pháp tốt nhất, nhưng nó cũng luôn có một giá trị nhất định nào đó.

Bài viết cùng danh mục

Đừng để bản thân luôn sống trong sự sợ hãi
Chia sẻ Trong cuộc sống thường nhật, chúng ta có hàng trăm ngàn thứ để sợ, nhưng thực ra không nên gộp tất cả thành một vì không phải nỗi sợ nào cũng không tốt. Nhìn chung, ta có thể phần nào phân loại nỗi sợ theo hai dạng: nỗi sợ bản năng và nỗi sợ tâm lý.
5 bí quyết để tập trung cao độ trong công việc
Chia sẻ Sự tập trung cao độ sẽ là chìa khóa giúp bạn vượt qua những cám dỗ và đạt được các mục tiêu trong công việc. Hiệu suất làm việc tăng đồng nghĩa với việc bạn sẽ có thêm thời gian đầu tư cho việc phát triển sự nghiệp. Tuy nhiên, không phải lúc nào bạn cũng có được sự tập trung cần thiết. Vậy làm cách nào để có thể tập trung tối đa?
Nằm bên người đẹp mà vẫn lạnh
Chia sẻ Một đêm tối trời ở một làng quê hẻo lánh, một khách bộ hành nhỡ độ đường ghé vào một căn nhà xin thuê phòng nghỉ qua đêm. Chủ nhà từ chối vì nhà chỉ có hai phòng, một của hai vợ chồng và một của cô con gái...
Hạnh phúc đến từ đâu
Chia sẻ Vị vua nọ đang đi công du trên một chiếc tàu thì gặp cơn bão lớn. Gió to, sóng dữ gầm thét như muốn quật đổ những cột buồm và nuốt chửng con tàu