天天看點

【XML】——XML基礎

目錄

第一章xml基礎

xml的起源

xml的定義

xml的應用

xml的組成

格式良好的xml

第二章dtd

第三章schema

第四章dom

第五章sax

第六章dom4j

首先,學習一個新知識的時候需要從宏觀把握它都涉及到了哪些方面,正如目錄中看到的一樣,其次,從微觀入手,逐個擊破。

xml(可擴充标記語言)與之前學到的html(超文本标記語言)一樣都是标記語言,除了這倆種以外,還有哪些是标記語言呢?

【XML】——XML基礎

了解xml之前先來複習html,看二者之間有何差別有何聯系。

html

html(hypertext markup language)

html是網際網路應用的最基礎技術

html關注的是資料的顯示

html的核心作用是資訊的布局和顯示

xml(extensible markup language)

xml是一種标記語言,類似html

可擴充标記語言

xml标記都是自定義的

xml設計宗旨是包含和傳輸資料

xml是w3c的推薦标準

xml标準的網址:http://www.w3.org/tr/rec-xml/

xml和html的差別:

xml不是用來替換html的技術

xml和html為不同的目的而設計。xml設計的核心是包含與傳輸資料;html設計的核心是顯示資料。

作為系統的配置檔案

【XML】——XML基礎

ajax中傳輸資料

web services中傳輸資料

異構平台(跨平台)的資料交換與整合

(1)xml執行個體

(2)xml格式

根元素

xml檔案的結構上是一種樹狀結構,它從“根部”開始,然後擴充到“枝葉”

xml的内容必須包含在一個單一進制素中。這個單一進制素稱為根元素,它包含文檔中所有文本和所有其他元素。

xml檔案必須要有根元素

 元素

元素是開始标簽、結束标簽以及位于二者之間的所有内容

元素是區分大小寫的

元素要正确嵌套

xml元素都必須正确關閉

父元素與子元素,栗子:

 實體引用

為了避免把字元資料和标簽中需要用到的一些特殊符号相混淆,xml還提供了實體引用。

字元

實體引用

&

&

>

>

<

⁢

"

"

'

&spos;

例如:如果想在xml頁中顯示書名号,如果是下面這種寫法就會報錯,因為程式會自動将《》與<>相混淆,識别不出書名号

第一種正确的寫法如下:

第二種正确的寫法如下:

屬性

屬性必須有值

那些值必須用引号括起

可以使用單引号,也可以使用雙引号,但要始終保持一緻

cdata

在特殊的标簽cdata下,所有的标簽,實體引用都被忽略,而被xml處理程式一視同仁的當做字元資料看待。

cdata的形式如下:

<![cdata[文本内容]]>

處理訓示(pi)

processing instructions(pi)

訓示目前的xml檔案的内容,如何被顯示或者處理

文法格式:<?target arg*?>

栗子:使用xslt處理目前的xml檔案

格式良好的xml會遵守以下xml文法規則:

xml檔案必須有根元素

xml檔案必須有關閉标簽

xml标記對大小寫敏感

xml元素必須被正确的嵌套

xml屬性必須加引号

xml