目錄
第一章xml基礎
xml的起源
xml的定義
xml的應用
xml的組成
格式良好的xml
第二章dtd
第三章schema
第四章dom
第五章sax
第六章dom4j
首先,學習一個新知識的時候需要從宏觀把握它都涉及到了哪些方面,正如目錄中看到的一樣,其次,從微觀入手,逐個擊破。
xml(可擴充标記語言)與之前學到的html(超文本标記語言)一樣都是标記語言,除了這倆種以外,還有哪些是标記語言呢?
了解xml之前先來複習html,看二者之間有何差別有何聯系。
html
html(hypertext markup language)
html是網際網路應用的最基礎技術
html關注的是資料的顯示
html的核心作用是資訊的布局和顯示
xml(extensible markup language)
xml是一種标記語言,類似html
可擴充标記語言
xml标記都是自定義的
xml設計宗旨是包含和傳輸資料
xml是w3c的推薦标準
xml标準的網址:http://www.w3.org/tr/rec-xml/
xml和html的差別:
xml不是用來替換html的技術
xml和html為不同的目的而設計。xml設計的核心是包含與傳輸資料;html設計的核心是顯示資料。
作為系統的配置檔案
ajax中傳輸資料
web services中傳輸資料
異構平台(跨平台)的資料交換與整合
(1)xml執行個體
(2)xml格式
根元素
xml檔案的結構上是一種樹狀結構,它從“根部”開始,然後擴充到“枝葉”
xml的内容必須包含在一個單一進制素中。這個單一進制素稱為根元素,它包含文檔中所有文本和所有其他元素。
xml檔案必須要有根元素
元素
元素是開始标簽、結束标簽以及位于二者之間的所有内容
元素是區分大小寫的
元素要正确嵌套
xml元素都必須正确關閉
父元素與子元素,栗子:
實體引用
為了避免把字元資料和标簽中需要用到的一些特殊符号相混淆,xml還提供了實體引用。
字元
實體引用
&
&
>
>
<
&it;
"
&quot;
'
&spos;
例如:如果想在xml頁中顯示書名号,如果是下面這種寫法就會報錯,因為程式會自動将《》與<>相混淆,識别不出書名号
第一種正确的寫法如下:
第二種正确的寫法如下:
屬性
屬性必須有值
那些值必須用引号括起
可以使用單引号,也可以使用雙引号,但要始終保持一緻
cdata
在特殊的标簽cdata下,所有的标簽,實體引用都被忽略,而被xml處理程式一視同仁的當做字元資料看待。
cdata的形式如下:
<![cdata[文本内容]]>
處理訓示(pi)
processing instructions(pi)
訓示目前的xml檔案的内容,如何被顯示或者處理
文法格式:<?target arg*?>
栗子:使用xslt處理目前的xml檔案
格式良好的xml會遵守以下xml文法規則:
xml檔案必須有根元素
xml檔案必須有關閉标簽
xml标記對大小寫敏感
xml元素必須被正确的嵌套
xml屬性必須加引号