天天看點

XML檔案和HTML檔案一樣

<script type="text/javascript"> if(top.location != self.location){ top.location = self.location; } var myref = encodeURIComponent("http://hi.baidu.com/huang0052/blog/item/5fb9a28b8899a9dbfd1f10b6%2Ehtml"); </script> #usrbar{padding:4px 10px 3px 0;font-size:12px;height:19px;line-height:19px;color:#000000;font-family:Arial;text-align:right;background:#ffffff;filter:alpha(opacity=65);-moz-opacity:0.5;width:auto !important;width:100%;letter-spacing:normal} #usrbar a,#usrbar a:link,#usrbar a:visited{color:#0000CC;text-decoration:underline} #ft{clear:both;height:20px;line-height:20px;color:#666666;font-size:12px;font-family:Arial;text-align:center} #ft a,#ft a:link,#ft a:visited{color:#7777CC;text-decoration:underline} #usrbar,#usrbar a,#usrbar a:link,#usrbar a:visited,#ft,#ft a,#ft a:link,#ft a:visited{letter-spacing:normal}

百度空間  |  百度首頁   <script type="text/javascript"> document.write('| <a href="https://passport.baidu.com/?login&tpl=sp&tpl_reg=sp&u=http://hi.baidu.com' + encodeURIComponent('/huang0052/blog/item/5fb9a28b8899a9dbfd1f10b6%2Ehtml') + '" target="_blank" rel="external nofollow" >登入</a>'); </script> | 登入                

<script> <!-- function newUserTipShow(f) { if(f=="0"){//close G("newUserTipSwf").style.width="40px"; G("newUserTip").style.width="40px"; G("newUserTipShadow").style.display="none"; }else{//show G("newUserTip").style.width="225px"; G("newUserTipSwf").style.width="225px"; G("newUserTipShadow").style.display="block"; } } function newUserRegLog(){ var now=new Date(); now.setTime(now.getTime()+5*60*1000); document.cookie="BDSP_REGFLAG=1;expires="+now.toGMTString()+";path=/"; new Image().src="http://hi.baidu.com/sys/statlog/1.gif?m=blog_newer_pro2_click&v=/huang0052&t="+Math.random(); } //--> </script> <script type="text/javascript"> function set_cookie_4_bdtip(index, value){ var bdtip = document.cookie.match(/(^| )BDTIP=([^;]*)(;|$)/); if(!bdtip){ bdtip=new Array(index); for(var i=0,n=bdtip.length;i<n;i++) { if(bdtip[i]=="" || bdtip[i]==null) bdtip[i]=0; if(i == index - 1){ bdtip[i] = value; } } }else{ bdtip = bdtip[2].split('-'); if(index > bdtip.length) bdtip.length= index; for(var i = 0, j = bdtip.length; i < j; i ++){ if(bdtip[i]=="" || bdtip[i]==null) bdtip[i]=0; if(i == index - 1){ bdtip[i] = value; } } } bdtip = bdtip.join('-'); document.cookie = "BDTIP=" + bdtip+ ";expires=Wed, 28-Nov-37 01:45:46 GMT;path=/;"; } </script> 在路上~~   首頁 部落格 相冊 | 個人檔案 | 好友

檢視文章

XML檔案格式文法及DTD (轉) 2009-02-28 12:02

XML檔案和HTML檔案一樣,實際上是一個文本檔案。顯然大家立刻就會明白,建立XML檔案最普通的工具和HTML一樣,就是“記事本”了。除了 “記事本”之外,當然還有一些更加友善的工具,如XML Notepad、XML Pro、CLIP!XML Editor等,這些工具的一大特點是:能夠檢查你所建立的XML檔案是否符合XML規範。不過,現在這些工具都隻有英文版的,并且需要付費使用。當然, 你仍然能夠使用FrontPage、DreamWeaver等工具,不過使用起來不是很友善。随着XML的逐漸普及,相信在不久後,也會出現非常好用的創 建XML檔案的工具。

 現在我們暫且使用“記事本”來建立我們的XML檔案吧。先看一個XML檔案:

  例1

  〈?xml version="1.0" encoding="gb2312" ?〉

   〈參考資料〉

   〈書籍〉

   〈名稱〉XML入門精解〈/名稱〉

   〈作者〉張三〈/作者〉

   〈價格 貨币機關="人民币"〉20.00〈/價格〉

   〈/書籍〉

   〈書籍〉

   〈名稱〉XML文法〈/名稱〉

   〈!--此書即将出版--〉

   〈作者〉李四〈/作者〉

   〈價格 貨币機關="人民币"〉18.00〈/價格〉

   〈/書籍〉

   〈/參考資料〉

  這是一個典型的XML檔案,編輯好後儲存為一個以.xml為字尾的檔案。我們可以将此檔案分為檔案序言(Prolog)和檔案主體兩個大的部 分。在此檔案中的第一行即是檔案序言。該行是一個XML檔案必須要聲明的東西,而且也必須位于XML檔案的第一行,它主要是告訴XML解析器如何工作。其 中,version是标明此XML檔案所用的标準的版本号,必須要有;encoding指明了此XML檔案中所使用的字元類型,可以省略,在你省略此聲明 的時候,後面的字元碼必須是Unicode字元碼(建議不要省略)。因為我們在這個例子中使用的是GB2312字元碼,是以encoding這個聲明也不 能省略。在檔案序言部分還有一些聲明語句,我們在後面給予介紹。

  檔案的其餘部分都是屬于檔案主體,XML檔案的内容資訊存放在此。我們可以看到,檔案主體是由開始的〈參考資料〉和結束的〈/參考資料〉控制标 記組成,這個稱為XML檔案的“根元素”;〈書籍〉是作為直屬于根元素下的“子元素”;在〈書籍〉下又有〈名稱〉、〈作者〉、〈價格〉這些子元素。貨币單 位是〈價格〉元素中的一個“屬性”,“人民币”則是“屬性值”。

  〈!--此書即将出版--〉這一句同HTML一樣,是注釋,在XML檔案裡,注釋部分是放在“〈!--”與“--〉”标記之間的部分。

  大家可以看到,XML檔案是相當簡單的。同HTML一樣,XML檔案也是由一系列的标記組成,不過,XML檔案中的标記是我們自定義的标記,具有明确的含義,我們可以對标記中的内容的含義作出說明。

  對XML檔案有了初步的印象之後,我們就來詳細地談一談XML檔案的文法。在講文法之前,我們必須要了解一個重要的概念,就是XML解析器(XML Parse)。

  1.XML解析器

  解析器的主要功能就是檢查XML檔案是否有結構上的錯誤,剝離XML檔案中的标記,讀出正确的内容,以交給下一步的應用程式處理。XML是一種 用來結構化檔案資訊的标記語言,XML規範中對于如何标記檔案的結構性有一個詳細的法則,解析器就是根據這些法則寫出來的軟體(多用Java寫成)。同 HTML一樣,在浏覽器中,必須有HTML的解析器,這樣浏覽器才能夠“讀懂”各種用HTML标記所組成的網頁,将它們顯示在我們面前。如果有浏覽器的 HTML解析器讀不懂的标記,将會傳回給我們錯誤資訊。

  由于現在的HTML标記實際上相當混亂,存在大量不規範的标記(有的網頁用IE能正常顯示,而用Netscape Navigator則不行),是以從一開始,XML的設計者就嚴格規定了XML的文法和結構,我們編寫的XML檔案必須遵循這些規定,否則XML解析器将 毫不留情地給你顯示錯誤資訊。

  有兩種XML檔案,一種是Well-Formed XML檔案,一種是Validating XML檔案。

  如果一個XML檔案滿足XML規範中的某些相關法則,且沒有使用DTD(檔案格式定義——後詳述)時,可稱這份檔案是Well-Formed。 而如果一個XML檔案是Well-Formed,且正确地使用了DTD,DTD中的文法又是正确的,那麼這個檔案就是Validating。對應兩種 XML檔案,有兩種XML解析器,一種是Well-Formed 解析器,一種是Validating解析器。IE 5中就内含Validating解析器,Validating解析器也可用來解析Well-Formed XML檔案。

  檢查它是否滿足了Well-Formed的條件。我們可以将剛才編輯的第一個XML 檔案用IE 5以上版本的浏覽器打開。

  大家可能要問為什麼在浏覽器中的顯示和我的源檔案一樣?沒錯,因為對于XML檔案,我們鼋龉匦乃 的内容,而它的顯示形式是交給CSS或XSL來完成的。這裡,我們并沒有給這個XML檔案定義它的CSS或XSL檔案,是以它按照原來的形式來顯示。實際 上,對于電子資料交換,僅僅需要一個XML檔案即可,如果要将它以某種形式顯示出來,我們就必須編輯CSS或XSL檔案(這個問題會在以後讨論)。

  2.Well-Formed的XML檔案

  我們知道,XML必須是Well-Formed的,才能夠被解析器正确地解析出來,顯示在浏覽器中。那麼什麼是Well-Formed的XML檔案呢?主要有下面幾個準則,我們在建立XML檔案的時候,必須滿足它們。

  首先,XML檔案的第一行必須是聲明該檔案是XML檔案以及它所使用的XML規範版本。在檔案的前面不能夠有其它元素或者注釋。

  第二,在XML檔案中有且隻能夠有一個根元素。我們的第一個例子中,〈參考資料〉... 〈/參考資料〉就是此XML檔案的根元素。

  第三,在XML檔案中的标記必須正确地關閉,也就是說,在XML檔案中,控制标記必 須有與之對應的結束标記。如:〈名稱〉标記必須有對應的〈/名稱〉結束标記,不像HTML,某些标記的結束标記可有可無。如果在XML檔案中遇到自成一個 單元的标記,就是類似于HTML 中的〈img src=.....〉的這些沒有結束标記的時候,XML把它稱為“空元素”,必須用這樣的寫法:〈空元素名/〉,如果元素中含有屬性時寫法則為:〈空元素 名 屬性名=“屬性值”/〉。

  第四,标記之間不得交叉。在以前的HTML檔案中,可以這樣寫:

  〈B〉〈H〉XXXXXXX〈/B〉〈/H〉,〈B〉和〈H〉

  标記之間有互相重疊的區域,而在XML中,是嚴格禁止這樣标記交錯的寫法,标記必須以規則性的次序來出現。

  第五,屬性值必須要用“ ”号括起來。如第一個例子中的“1.0”、“gb2312”、“人民币”。都是用“ ”号括起來了的,不能漏掉。

  第六,控制标記、指令和屬性名稱等英文要區分大小寫。與HTML不同的是,在HTML中, 類似〈B〉和〈b〉的标記含義是一樣的,而在XML中,類似〈name〉、〈NAME〉或〈Name〉這樣的标記是不同的

  第七,我們知道,在HTML檔案中,如果我們要浏覽器原封不動地将我們所輸入的東西顯示出來,可以将這些東西放到〈pre〉〈/pre〉或者 〈xmp〉〈/xmp〉标記中間。這對于我們建立HTML教學的網頁是必不可少的,因為網頁中要顯示HTML的源代碼。而在XML中,要實作這樣的功能, 就必須使用CDATA标記。在CDATA标記中的資訊被解析器原封不動地傳給應用程式,并且不解析該段資訊中的任何控制标記。CDATA區域是由:“〈! [CDATA[”為開始标記,以“>〉”為結束标記。例如:例2中的源碼,除了“〈![CDATA[”和“>〉”符号,其餘的内容解析器将原 封不動地交給下遊的應用程式,即使CDATA區域中的開始和結尾的空白以及換行字元等,都同樣會被轉交(注意CDATA是大寫的字元)。

  例2

  〈![CDATA[飛翔的xml〉〉〉〉〉,:-)

   oooo〈〈〈〈〈〈〈

   >〉

  第八,XML處理空白字元和HTML不一樣。HTML标準規定,不管有多少個空白,都當作一個空白來處理;而在XML中規定,所有标記以外的空 白,解析器都要忠實地交給下遊的應用程式處理。這樣,我們有時必須摒棄編寫HTML檔案時的縮排習慣,因為縮排的空格,解析器也要處理。如:

   〈作者〉張三〈/作者〉

   和

   〈作者〉

   張三

   〈/作者〉

  上述内容對于解析器來說是不同的(後者在〈作者〉〈/作者〉标記之内除了張三這個字元以外,還包括兩個換行記号以及“張三”前的文字縮排符号)。是以解析器在去掉标記後将資訊傳給應用程式将有不同的處理結果。

  如果我們想明确地告訴XML程式,标記中的空白有明确的含義,不要随便去掉(如在一些詩中,空格有它具體的意義),則可在标記中加入一個XML内置的屬性——xml:space 。如(注意屬性名稱和值的大小寫):   

  〈詩歌 xml:space="preserver"〉

   祖國啊! 祖國!

   我的祖國!

   〈/詩歌〉

  另外,在XML檔案中,如果要用到表1的特殊字元,必須用相應符号代替。

  表1

  特殊字元 替代符号

   && &

   < &it;

   > >

   " "

   ' &apos;

  在此做個小結:符合上述規定的XML檔案就是Well-Formed的XML檔案。這是編寫XML檔案的最基本要求。可以看到XML檔案的文法 規定比HTML要嚴格多了。由于有這樣的嚴格規定,軟體工程師編寫XML的解析器就容易多了,不像編寫HTML語言的解析器,必須費盡心思去适應不同的網 頁寫法,提高自己浏覽器的适應能力。實際上,這對于我們初學者來說,也是一件好事。該怎樣就怎樣,不必像原來那樣去疑惑各種HTML的寫法。

  我們看到,在XML檔案中,用的大多都是自定義的标記。但是大家考慮一下,如果兩個同行業的公司A和B要用XML檔案互相交換資料,A公司用 〈價格〉标記來表示他們産品的價格資訊,而B公司可能用〈售價〉來表示價格資訊。如果一個XML應用程式來讀取他們各自的XML檔案中的資訊時,如果它隻 知道〈價格〉标記裡表示的是價格資訊,那麼B公司的價格資訊就讀不出來,必将産生錯誤。顯然,對于想利用XML檔案來交換資訊的實體來說,他們之間必須有 一個約定——即編寫XML檔案可以用哪些标記,母元素中能夠包括哪些子元素,各個元素出現的順序,元素中的屬性怎樣定義等。這樣他們在用XML交換資料時 才能夠暢通無阻。這種約定稱為DTD(Document Type Definition,文檔格式定義)。可以把DTD看作編寫XML檔案的模闆。對于同行業之間的XML資料交換,有一個固定的DTD将會友善很多。比如 說,如果網上的各大電子商場的XML網頁都遵循同一個DTD時,那麼我們就可以輕松地依據這個DTD 編寫一個應用程式,去網上将我們感興趣的東西自動抓回來。事實上已經有了好幾個定義好的DTD,如前面所說的MathML、SMIL等。

  如果一個XML檔案是Well-Formed的,并且它是正确的依據某個DTD建立的,那麼,這個XML檔案就被稱為:Validating XML檔案。相應的解析器就稱為:Validating Parser。

   DTD實際上可以看作一個或多個XML檔案的模闆,這些XML檔案中的元素、元素的屬性、元素 的排列方式/順序、元素能夠包含的内容等,都必須符合DTD中的定義。XML檔案中的元素,即我們所建立的标記,是根據我們應用的實際情況來建立的。想要 建立一份完整性高、适應性廣的DTD是非常困難的,因為各行各業都有他們自己的行業特點,是以DTD通常是以某種應用領域為定義的範圍,如:醫學、建築、 工商、行政。DTD定義的元素含蓋範圍越廣泛,那麼就越複雜。

     DTD可以是一個完全獨立的檔案,也可以在XML檔案中直接設定。是以,DTD分為外部DTD(在XML檔案中調用另外已經編輯好的DTD)和内部 DTD(在XML檔案中直接設定DTD)兩種。比如,有幾十家互相聯系的、合作夥伴關系的公司、廠商,他們互相之間的交換電子文檔都是用XML文檔。那麼 我們可以将這些XML文檔的DTD放在某個地方,讓所有交換的XML文檔都使用此DTD,這是最友善的做法,同時也适用于公司内部的XML檔案使用。

内部DTD

内部DTD是在XML檔案的檔案序言區域中定義的。文法:

〈!DOCTYPE element-name[........

]〉

〈!DOCTYPE :表示開始設定DTD,注意DOCUTYPE是大寫。

Element-name :指定此DTD的根元素的名稱,一個XML檔案隻能有一個根元素。注意,如果 XML檔案使用了DTD,那麼檔案中的根元素就在這裡指定。

[.........]〉 :在[ ]标記裡面定義XML檔案使用元素,然後用〉結束DTD的定義。

下面,我們來看一下怎樣給XML檔案定義DTD,請見例1。

例1中的DTD定義區可以看作是一個DTD定義的大概架構,為其他XML檔案定義DTD,結構和例1的DTD差不多,隻是可能需要添加、删除或者更改一些東西而已。在DTD定義的中間是元素設定,這是一個DTD的最主要部分,其主要文法如下:

〈!ELEMENT element-name element-definition〉

〈!ELEMENT:表示開始元素設定,注意此處ELEMENT關鍵字是大寫。

element-name:表示要設定的元素的名稱。

element-definition:指明要對此元素進行怎樣的定義,就是說〈元素〉...〈/元素〉之間能夠包含什麼内容,是其他元素還是一般性的文字。

在例1中,大家可以看到,〈!ELEMENT 參考資料 (書籍)〉這個元素設定是聲明了“參考資料”這個元素,并且它是作為“書籍”這個元素的父元素。〈!ELEMENT 書籍 (名稱,作者,價格)〉這個元素設定聲明了“書籍”這個元素,并且它是作為“名稱”、“作者”、“價格”這三個元素的父元素。而〈!ELEMENT 名稱 (#PCDATA)〉這個元素設定聲明了“名稱”這個元素,但是此元素僅僅包含一般文字,是基本元素,這是由#PCDATA關鍵字定義的。

在元素設定中,如果元素包含多個子元素,如:〈!ELEMENT 書籍 (名稱,作者,價格)〉這種含多個子元素的聲明,那麼“名稱”、“作者”、“價格”這些标記在XML檔案中必須以上面排列的順序出現,每個标記必須而且隻 能夠出現一次。如果在設定元素時,按照〈!ELEMENT 書籍ANY〉,這樣在元素下就可以包含任意被設定過的元素,出現的次數和順序也不受限制,并且在該元素下,除了可以包含子元素以外,還能夠包含一般的文 字。有時候,在XML檔案中,一個标記可能多次出現(或者不出現),那麼我們除了在它們的父元素中用ANY關鍵字之外,還可以在元素的旁邊加上特定的符号 來控制标記出現的次數。這些符号見表1。

表1
符号 代表标記出現的次數
不出現或隻出現一次
* 不出現或可出現多次
+ 必須出現一次以上
無符号 隻能出現一次

例如:〈!ELEMENT 參考資料(書籍 ,報紙+,雜志?,網站)〉這個元素設定,“書籍”标記在XML檔案中可以不出現或者出現多次;“報紙”标記必須出現一次以上;“雜志”标記可以不出現或隻出現一次;而“網站”标記必須出現而且隻能出現一次。

在一些父元素的聲明中,有可能它包含的子元素是在多個子元素中選擇一個來使用,那麼我們聲明此父元素時,就可以把它聲明成選擇性元素,例如:〈!ELEMENT 配偶 (妻子|丈夫)〉。可供選擇的子元素用“|”分隔,這樣,我們在XML檔案中可以這樣寫:

〈配偶〉

〈丈夫〉張三〈/丈夫〉

〈/配偶〉

隻從中選擇一個子元素。

在我們的XML檔案中,還可能包括很多“空元素”,即:元素是單獨存在的,沒有〈/元素〉這樣的結束标記。那麼在DTD中是用EMPTY關鍵字來聲明的。 如:〈!ELEMENT 元素名 EMPTY〉。在XML檔案中,空元素不需要結束标記,但必須以〈/空元素名〉這樣的寫法。

在DTD中,還可以聲明一些稱為Entity的東西,讓DTD和XML檔案使用。我們可以把Entity看作是一個常量,它有一定的值。在DTD 中,Entity的聲明文法為:〈!ENTITY entity-name entity-definition〉。例如:我們在DTD中聲明〈!ENTITY PC "(#PCDATA)"〉 ,那麼在後面的元素設定中,就可以使用這個Entity來代替“(#PCDATA)”這個字元串,如:〈!ELEMENT 作者 (#PCDATA)〉可以寫成〈!ELEMENT 作者 &&PC;〉。引用Entity的時候,必須要在Entity名稱前面加上“&&”符号,後面加上“;”符号。

在例1中,〈!ATTLIST 價格 貨币機關 CDATA #REQUIRED〉這一句是設定元素的屬性,關于元素屬性設定的文法為:〈!ATTLIST element-name attribute-name Type Default-value〉 。其中,〈!ATTLIST是開始屬性的設定(注意大小寫)。element-name是指明此屬性設定是針對什麼元素的;attribute-name 是設定的屬性的名稱;Type是該屬性的屬性值的類别,屬性值有多種,可以是一般的文字,或從幾種屬性值中取一種等,屬性值的種類見表2。 Default-value是指該屬性的内定值種類,有四種不同的屬性内定值(見表3)。

下面我們舉幾個例子來看一下幾個常用的元素屬性的設定。例:

〈!ATTLIST 姓名 性别 (男|女) "男"〉

此元素屬性設定是為“姓名”這個元素設定一個名為“性别”的屬性,此屬性的屬性值類别是Enumerated,取值範圍為“男”或者“女”(用“|”分隔)。如果在XML檔案中沒有為此屬性指派,那麼就取值為“男”,因為屬性内定值是一個字元串“男”。

〈!ATTLIST 姓名 号碼 ID #REQUIRED〉

該屬性設定是為“姓名”元素設定一個名為“号碼”的屬性,屬性值類别是ID,意味着在XML檔案中為此屬性指派的時候,值在此XML檔案中是唯一的,如在同一份XML檔案中出現下面的XML語句:

〈姓名 号碼="1234567"〉張三〈/姓名〉

〈姓名 号碼="1234567"〉李四〈/姓名〉

注意:“号碼”屬性的值重複了,這樣,在解析過程中将會出現錯誤資訊。此屬性設定中的屬性内定值為#REQUIRED,表示這個屬性在XML檔案的〈姓名〉标記中必須出現,否則解析會發生錯誤。

〈!ATTLIST 電話号碼 國家代碼 CDATA #FIX "86"〉

該屬性設定是為“電話号碼”這個元素設定一個名為“國家代碼”的屬性,該屬性的值是一般的文字。在〈電話号碼〉标記中不能夠設定該屬性,因為這個屬性被設為具有固定值的屬性(#FIX關鍵字),解析器會自動地将該屬性以及值“86”加到〈電話号碼〉标記中。

表2
屬性值類别 描述
cdata 屬性值僅僅是一般的文字。
enumerated 列出該屬性的取值範圍,一次隻能有一個屬性值能夠賦予屬性。
nmtoken 表示屬性值隻能由字母、數字、下劃線、. 、:、-這些符号組成。
nmtokens 表示屬性值能夠由多個nmtoken組成,每個nmtoken之間用空格隔開。
id 該屬性在xml檔案中是唯一的,常用來表示人的身份證号碼。
idref 表示該屬性值是參考了另一個id屬性。
idrefs 表示該屬性值是參考了多個id屬性,這些id屬性的值用空格隔開。
entity 表示該屬性的設定值是一個外部的entity,如一個圖檔檔案。
entities 該屬性值包含了多個外部entity,不同的entity之間用空格隔開。
notation 屬性值是在dtd中聲明過的notation(聲明用什麼應用軟體解讀某些二進制檔案,如圖檔)。

在XML的規範中,還規定了兩個内定的屬性,即:xml:space和xml:lang ,内定的屬性名稱以xml:開頭,而你自己定義的屬性名不能以xml:開頭,否則在解析時會發生錯誤。

我們前面已經講過,空白格在XML檔案是有含義的,xml:space屬性就是來設定解析器将XML檔案中的空白格傳給應用程式後的處理方法。 xml:space是一個Enumerated類型的屬性,隻能夠在default和preserver之間取值。 xml:space="defaule"表示解析器将空白格傳遞給應用程式後,由應用程式内定的方法來處理這些空白格。如果沒有設定xml:space屬 性,則解析器會預設用default來設定該屬性。xml:space="preserver"是表示解析器将空白格傳遞給應用程式後,要求應用程式保留 這些空白格。

xml:lang屬性是用來設定标記中的文字資訊是使用哪種語言,ISO-639規定了不同語言的代表縮寫,如:xml: 表示英文;xml:表示拉丁文;xml: 表示中文資料;xml: 表示中文(簡體);xml: 表示中文(繁體)。系統内定是xml:,即标記中間的文字資訊都是英文。

外部DTD

外部DTD是一個獨立于XML檔案的檔案,實際上也是一個文本檔案,隻是使用.dtd為檔案擴充名。因為外部DTD獨立于XML檔案, 那麼它可以供多個XML檔案使用,就像用同一個模闆可以寫出多個不同内容的檔案一樣,這多個XML檔案因為是引用同一個外部DTD,是以它們的結構大緻相 同。

外部DTD的建立方式、文法和内部DTD是一樣的,把例1的内部DTD的例子用外部DTD來寫,檔案如下所示。檔案存為字尾名為 .dtd的檔案。

〈?xml version="1.0" encoding="GB2312" ?〉

〈!ELEMENT 參考資料 (書籍*)〉

〈!ELEMENT 書籍 (名稱,作者,價格)〉

〈!ELEMENT 名稱 (#PCDATA)〉

〈!ELEMENT 作者 (#PCDATA)〉

〈!ELEMENT 價格 (#PCDATA)〉

〈!ATTLIST 價格 貨币機關 CDATA #REQUIRED〉

除了沒有内部DTD中的〈!DOCTYPE 參考資料 [.....]〉語句外,其他都一樣。而且有關元素數目、排列順序、空元素設定、選擇性元素、Entity聲明、屬性設定等都和内部DTD是一樣的。

XML檔案使用〈!DOCTYPE element-name SYSTEM DTD-URL〉或者〈!DOCTYPE element-name PUBLIC DTD-name DTD-URL〉來引用建立好的外部DTD檔案。

表3
屬性内定值 描述
#required 表示在标記中必須出現此屬性。
#implied 标記中可以不出現此屬性。
#fix 屬性的值是固定的某個值。
字元串 标記中如沒有指定屬性的值,那麼此字元串就是此屬性的值。
此語句必須位于XML檔案的檔案序言區,其中,〈!DOCTYPE表示開始聲明應用外部DTD;element-name是指該DTD的根元素的名 稱;SYSTEM是指該外部DTD檔案是私有的,即我們自己建立的,沒有公開發行,隻是個人或在公司内部或者幾個合作機關之間使用;而PUBIC關鍵字是 指該外部DTD是公用的,經過了公開讨論,用PUBLIC的DTD都有一個邏輯名稱——DTD-name,我們必須在調用時指明這個邏輯名稱。DTD- URL是用URL的方式指明外部DTD檔案的位置。例如,我們這份DTD檔案存放在URL為:http://www.xml.com/這個地方,檔案名為 ckzl.dtd。那麼在XML檔案中的聲明如下:

〈?xml version="1.0" encoding="GB2312" ?〉

〈!DOCTYPE 參考資料 SYSTEM "http://www.xml.com/ckzl.dtd"〉

...

Schema簡介

DTD的文法相當複雜,并且它不符合XML檔案的标準,自成一個體系。上面的介紹也僅僅是作了一個簡介,目的是幫助大家能讀懂DTD檔案以及在必要時建立簡單的DTD檔案,因為現在很多的XML應用是建立在DTD之上的。

另外,一個代替DTD的就是W3C定義的Schema,Schema相對于DTD的明顯好處是XML Schema文檔本身也是XML文檔,而不是像DTD一樣使用自成一體的文法。這就友善了使用者和開發者,因為可以使用相同的工具來處理XML Schema和其他XML資訊,而不必專門為Schema使用特殊工具。Schema簡單易懂,懂得XML文法、規則的人都可以立刻了解它。Schema 的概念提出已久,但W3C的标準最近才出來,相應的應用支援尚未完善,但采用Schema已成為XML發展的一個趨勢。

例1

DTD定義區:

〈?xml version="1.0" encoding="GB2312" ?〉

〈!DOCTYPE 參考資料 [

〈!ELEMENT 參考資料 (書籍 )〉

〈!ELEMENT 書籍 (名稱,作者,價格)〉

〈!ELEMENT 名稱 (#PCDATA)〉

〈!ELEMENT 作者 (#PCDATA)〉

〈!ELEMENT 價格 (#PCDATA)〉

〈!ATTLIST 價格 貨币機關 CDATA #REQUIRED〉

]〉

〈參考資料〉

〈書籍〉

〈名稱〉XML入門精解〈/名稱〉

〈作者〉張三〈/作者〉

〈價格 貨币機關="人民币"〉20.00〈/價格〉

〈/書籍〉

〈書籍〉

〈名稱〉XML文法〈/名稱〉

〈!-- 即将出版 --〉

〈作者〉李四〈/作者〉

〈價格 貨币機關="人民币"〉18.00〈/價格〉

〈/書籍〉

〈/參考資料〉

類别:預設分類 | 添加到搜藏 | 浏覽( 1697 ) | 評論  (0) <script> var pre = [true,'赤壁,雷人的台詞。', '赤壁,雷人的台詞。','/huang0052/blog/item/204b4e06bfcdf67c020881c0.html']; var post = [true,'起航!','起航!', '/huang0052/blog/item/58eb7edf9a0cce1b4854036c.html']; if(pre[0] || post[0]){ document.write('<div style="height:5px;line-height:5px;">&nbsp;</div><div id="in_nav">'); if(pre[0]){ document.write('上一篇:<a href="' + pre[3] + '" target="_blank" rel="external nofollow" title="' + pre[1] + '">' + pre[2] + '</a>&nbsp;&nbsp;&nbsp;&nbsp;'); } if(post[0]){ document.write('下一篇:<a href="' + post[3] + '" target="_blank" rel="external nofollow" title="' + post[1] + '">' + post[2] + '</a>'); } document.write('</div>'); } </script>   上一篇: 赤壁,雷人的台詞。     下一篇: 起航!   #in_related_doc a { text-decoration:none; } 相關文章:

XML入門精解之檔案格式定義(DTD)          

  <script type="text/javascript"> function HI_MOD_IN_RELATED_DOC_CALLBACK(arg){ if(arg.length <= 1) return false; var hasMore = arg[0]; var D=function(A,B){A[A.length]=B;} if(arg.length % 2 == 0) D(arg, ["","","",""]); var html = ['<div id="in_related_doc"><div class="tit">相關文章:</div>']; D(html, '<table cellpadding="0" cellspacing="3" >'); for(var i = 1, j = arg.length; i < j; i += 2){ D(html, '<tr>'); D(html, '<td width="15px"><a style="font-size:25px" >&#8226;</a></td><td><a href="http://hi.baidu.com/' + arg[i][3] + '/blog/item/' + arg[i][2] + '.html" target="_blank" rel="external nofollow" target="_blank" title="' + arg[i][0] + '">' + arg[i][1] + '</a>'); D(html, new Array(10).join('/u3000')); D(html, '</td>'); if(arg[i + 1][0] != "") D(html, '<td width="15px"><a style="font-size:25px" >&#8226;</a></td><td><a href="http://hi.baidu.com/' + arg[i + 1][3] + '/blog/item/' + arg[i + 1][2] + '.html" target="_blank" rel="external nofollow" target="_blank" title="' + arg[i + 1][0] + '">' + arg[i + 1][1] + '</a></td>'); else D(html, '<td>&nbsp;</td><td>&nbsp;</td>'); D(html, '</tr>'); } if(hasMore) D(html, '<tr><td colspan="4"><a target="_blank" href="/sys/search?pageno=1&type=7&sort=1&word=XML%CE%C4%BC%FE%B8%F1%CA%BD%D3%EF%B7%A8%BC%B0DTD%20%20%A3%A8%D7%AA%A3%A9&item=5fb9a28b8899a9dbfd1f10b6" target="_blank" rel="external nofollow" >更多&gt;&gt;</a></td></tr>'); D(html, '</table></div><div class="line">&nbsp;</div>'); var div = document.getElementById('in_related_tmp'); if(div){ div.innerHTML = html.join(''); while(div.firstChild){ div.parentNode.insertBefore(div.firstChild, div); } div.parentNode.removeChild(div); } window.setTimeout("tracker_init('in_related_doc')",100); } if(RelatedDocData == -1){ // not supported xhr var script = document.createElement('script'); script.type = 'text/javascript'; script.src = '/sys/search?type=8&word=XML%CE%C4%BC%FE%B8%F1%CA%BD%D3%EF%B7%A8%BC%B0DTD%20%20%A3%A8%D7%AA%A3%A9&item=5fb9a28b8899a9dbfd1f10b6&t=' + new Date().getTime(); document.getElementsByTagName('HEAD')[0].appendChild(script); }else if(RelatedDocData == null){ GetAndEval = true; }else{ eval(RelatedDocData); } </script> 最近讀者: <script> var g_spAnnony=true; var g_read=[ ["cingcing127","473563696e6763696e67313237ec04","cingcing127"], ["%D4%C2%5F%D6%AE%C1%B5","c591d4c25fd6aec1b59607","月_之戀"], ["xizhilang6688","d17878697a68696c616e67363638384c00","xizhilang6688"], ["xm8cn","5bb3786d38636ebd02","xm8cn"], ["xianer0405","ed317869616e6572303430358406","xianer0405"], ["study%5Ffuture","c95973747564795f6675747572651f07","study_future"], ["shububai","b90f73687562756261696d03","shububai"], ["%C4%BE%D4%C4","f01ec4bed4c46705","木閱"], {} ]; g_read.length=g_read.length-1; var _rh1=""; var _rh2=""; function wrreader(){ _rh1 += '<table width="100%" ><tr>'; _rh2+='<tr>'; if(g_spAnnony){ _rh1+='<td align="center" width="10%" ><img width="55" height="55" src="http://img.baidu.com/hi/img/portraitn.jpg"></td>'; _rh2+='<td>&nbsp;</td>'; if(g_read.length>0){ _rh1+='<td align="left" width="12%">'; }else{ _rh1+='<td align="left" width="100%">'; } _rh1+='<a href="https://passport.baidu.com/?login&tpl=sp&tpl_reg=sp&u='+myref+'" target="_blank" rel="external nofollow" target="_self">登入</a>後,您就出現在這裡。</td>'; _rh2+='<td>&nbsp;</td>' } if(g_read.length==0){ if(!g_spAnnony){ _rh1+='<td align=left width="100%">最近還沒有登入使用者看過這篇文章……</td>'; _rh2+='<td>&nbsp;</td>'; } }else{ for(i=0,len=g_read.length;i<len;i++){ _rh1+='<td align="center" valign="bottom" width="10%" class="user"><a href="/'+g_read[i][0]+'" target="_blank" rel="external nofollow" target="_blank" rel="external nofollow" target="_blank"><img src="http://himg.baidu.com/sys/portraitn/item/'+g_read[i][1]+'.jpg"></a></td>'; _rh2+='<td align="center" valign="top" class="user"><a href="/'+g_read[i][0]+'" target="_blank" rel="external nofollow" target="_blank" rel="external nofollow" target="_blank">'+g_read[i][2]+'</a></td>'; } } _rh1+='<td width="100%"></td></tr>'; _rh2+='<td></td></tr></table>'; document.write(_rh1+_rh2); } wrreader(); </script>

XML檔案和HTML檔案一樣
登入 後,您就出現在這裡。
XML檔案和HTML檔案一樣
XML檔案和HTML檔案一樣
XML檔案和HTML檔案一樣
XML檔案和HTML檔案一樣
XML檔案和HTML檔案一樣
XML檔案和HTML檔案一樣
XML檔案和HTML檔案一樣
XML檔案和HTML檔案一樣
cingcing127 月_之戀 xizhilang6688 xm8cn xianer0405 study_future shububai 木閱

  <script> allkey=allkey+"ea5b167ab6f76aed2e73b3e3_5fb9a28b8899a9dbfd1f10b6_"; </script> 網友評論: <script> function writecmt(type,id,cmtname,cmturl,portraitId){ var html1=""; cmturl=cmturl.replace("https://","http://"); if(type==1){ html1="<a href='"+cmturl+"' target='_blank' title='"+cmturl+"'><img src='http://himg.baidu.com/sys/portraitn/item/"+portraitId+".jpg'><br>"+cmtname+"</a>"; }else{ if(cmtname=="" || cmtname=="匿名網友"){ if(cmturl==""){ html1="<a>匿名網友</a>"; }else{ html1="<a href='"+cmturl+"' target='_blank' title='"+cmturl+"'>"+cmtname+"</a>"; } }else{ if(cmturl==""){ html1="<div class='f14' style='display:inline'>網友:<a>"+cmtname+"</a></div>"; }else{ html1="<div class='f14' style='display:inline'>網友:<a href='"+cmturl+"' target='_blank' title='"+cmturl+"'>"+cmtname+"</a></div>"; } } } document.write(html1); } function filterCmtContent(n){ if(!BdBrowser.isIE){ var defaultfilter1='<span style="filter:glow(color=#000000,strength=2);height:0px;color:#000000">'; var defaultfilter2='<span style="height: 0px; color: rgb(0, 0, 0);">'; var commentDiv=document.getElementById(n); var divs=commentDiv.getElementsByTagName('div'); var d,tmp; for( var i=0,len=divs.length;i<len;i++){ d=divs[i]; if(d.getAttribute('name')=='cmtcontent'){ tmp=d.innerHTML; tmp=tmp.replace(/<span style="filter:glow/(color=#([0-9a-z]{3,6}),strength=2/);height:0px;color:#([0-9a-z]{3,6})">/ig,defaultfilter1); tmp=tmp.replace('<span style="height: 0px; color: rgb(255, 255, 255);">',defaultfilter2); d.innerHTML=tmp; } } } } </script> <script>filterCmtContent('in_comment');</script> <script> document.getElementById("spRefURL").value = window.location.href; </script> 發表評論:

姓 名: <script> document.write(&quot; &amp;nbsp;&amp;nbsp; &lt;a href='http://hi.baidu.com/st/reg.html' target='_blank'&gt;注冊&lt;/a&gt;&quot;); document.write(' | &lt;a href=&quot;https://passport.baidu.com/?login&amp;tpl=sp&amp;tpl_reg=sp&amp;u='+myref+'&quot;&gt;登入&lt;/a&gt;'); </script>    注冊 | 登入 *姓名最長為50位元組
網址或郵箱: (選填)

<script> G("spBlogCmtor").value=""; G("spBlogCmtURL").value=""; </script>

内 容:
插入表情
<script> var editor=null; try{ editor=new BdEditor("spBlogCmtText",{width:"100%",height:"155px"}); editor.onfocus = function(){hidErr(3);} editor.render(); }catch(e){ var spBlogCmtText = document.getElementById("spBlogCmtText"); var p = spBlogCmtText.previousSibling; while(p && p.nodeType != 1) p = p.previousSibling; if(p && /bdeditor_container/.test(p.id)){ p.parentNode.removeChild(p); } spBlogCmtText.style.display = ''; editor=null; } </script> <script> G("spBlogCmtor").value=G("spBlogCmtor").defaultValue; G("spBlogCmtText").value=""; </script>
驗證碼:

請點選後輸入四位驗證碼,字母不區分大小寫

<script type="text/javascript"> function f_focus(){ getVcode(); } function getVcode(){ var url="http://hi.baidu.com/sys/file/getvcode?echoback=getVcodeDone&t="+(new Date().getTime()); BdAjax.loadJS(url) } function getVcodeDone(vcode){ document.form1.spVcode.value=vcode; var imgsrc="http://hiup.baidu.com/cgi-bin/genimg?"+vcode; G('verifypic').src=imgsrc; G('yanzheng').style.display="block"; } function newverifypic(){ getVcode(); return false; } </script>

看不清?
    取消回複

<script> <!-- var hstr="/huang0052/brwstat?key1=1"; document.write("<script src='"+hstr+"&key2="+allkey+"'><//script>"); //--> </script> <script src="http://hi.baidu.com/huang0052/brwstat?key1=1&amp;key2=ea5b167ab6f76aed2e73b3e3_5fb9a28b8899a9dbfd1f10b6_"></script>

©2009 Baidu <script> if(document.getElementById("m_blog")) { var imgarray = document.getElementById("m_blog").getElementsByTagName('img'); var imgw = document.getElementById("m_blog").offsetWidth; imgw =imgw-40; for(var i=0; i<imgarray.length; i++){ if(imgarray[i].className=="blogimg" && imgarray[i].width>=imgw) imgarray[i].width=imgw; } } // Fix ff bugs var blog_text = document.getElementById('blog_text'); blog_text.innerHTML = blog_text.innerHTML.replace(/href/s*=/s*("|')?(/././//././/)/gi,"href=$1../$2"); gotoreply(); </script>

XML檔案和HTML檔案一樣