天天看點

PHP XML操作的各種方法解析

PHP提供了一整套的讀取 XML檔案的方法,很容易的就可以編寫基于 XML的腳本程式。本章将要介紹 PHP與 XML的操作方法,并對幾個常用的 XML類庫做一些簡要介紹。

XML是一種流行的半結構化檔案格式,以一種類似資料庫的格式存儲資料。在實際應用中,一些簡單的、安全性較低的資料往往使用 XML檔案的格式進行存儲。這樣做的好處一方面可以通過減少與資料庫的互動性操作提高讀取效率,另一方面可以有效利用 XML的優越性降低程式的編寫難度。 

PHP提供了一整套的讀取 XML檔案的方法,很容易的就可以編寫基于 XML的腳本程式。本章将要介紹 PHP與 XML的操作方法,并對幾個常用的 XML類庫做一些簡要介紹。 

1 XML簡介 

XML是“可擴充性辨別語言(eXtensible Markup Language)”的縮寫,是一種類似于 HTML的标記性語言。但是與 HTML不同,XML主要用于描述資料和存放資料,而 HTML主要用于顯示資料。 

XML是一種“元标記”語言,開發者可以根據自己的需要建立标記的名稱。例如,下面的 XML代碼可以用來描述一條留言。 

<thread>   

<title>Welcome</title>   

<author>Simon</author>   

<content>Welcome to XML guestbook!!</content>   

</thread>   

其中,<thread>與</thread>标簽标記了這是一段留言。在留言中有标題、作者、内容,完整的表述了一條留言資訊。 

在一個 XML檔案的頂部,通常使用<?xml version=”1.0″?>來辨別 XML資料的開始和 XML資料使用标準的版本資訊。在浏覽器中通路 XML檔案可以看到層次分明的 XML資料資訊,如圖 1所示。 

PHP XML操作的各種方法解析

XML的發展非常迅速,近些年來很多軟體開發商都開始采用 XML的開發标準進行應用程式的開發。并且,很多新興技術都架構在 XML資料之上。這意味着 XML将與 HTML一樣成為 Web技術不可或缺的一部分。 

2 簡單的 XML操作 

在實際應用中,PHP與 XML的互動操作應用非常廣泛。SimpleXML元件是 PHP5新增加的一個簡 

單的 XML操作元件,與傳統的 XML元件相比,SimpleXML元件的使用非常簡單。本節将對使用 

SimpleXML元件操作 XML的方法做一下詳細介紹。 

2.1 建立一個 SimpleXML對象 

SimpleXML對象是用來臨時存儲 XML資料的臨時變量,對 XML進行的操作都是通過操作 SimpleXML對象來完成的。SimpleXML元件提供了兩種建立 SimpleXML對象的方法。第一種方法是使用 simplexml_load_string函數讀取一個字元串型變量中的 XML資料來完成建立的,其文法格式如下所示。 

simplexml_load_string(string data) 

這裡的 data變量用于存儲 XML資料。以下代碼使用 simplexml_load_string函數建立了一個 SimpleXML對象 

<?php   

$data = <<<XML //定義 XML資料   

<?xml version='1.0′?>   

<departs>   

<depart>   

<name>production support</name>   

<employees>   

<employee>   

<serial_no>100001</serial_no>   

<name>Simon</name>   

<age>24</age>   

<birthday>1982-11-06</birthday>   

<salary>5000.00</salary>   

<bonus>1000.00</bonus>   

</employee>   

<serial_no>100002</serial_no>   

<name>Elaine</name>   

<birthday>1982-01-01</birthday>   

<salary>6000.00</salary>   

<bonus>2000.00</bonus>   

</employees>   

</depart>   

<name>testing center</name>   

<serial_no>110001</serial_no>   

<name>Helen</name>   

<age>23</age>   

<birthday>1983-07-21</birthday>   

</departs>   

XML;   

$xml = simplexml_load_string($data); //建立 SimpleXML對象   

print_r($xml); //輸出 XML   

?>   

在上面的例子中,$data變量存儲了一段 XML資料。 simplexml_load_string函數将變量$data轉化成 SimpleXML對象。通過 print_r函數的輸出可以看出該對象的結構,運作結果如下所示。 

複制代碼代碼如下:

SimpleXMLElement Object 

[depart] => Array 

[0] => SimpleXMLElement Object 

[name] => production support 

[employees] => SimpleXMLElement Object 

( [employee] => Array ( 

( [serial_no] => 100001 

[name] => Simon 

[age] => 24 

[birthday] => 1982-11-06 

[salary] => 5000.00 

[bonus] => 1000.00 

[1] => SimpleXMLElement Object 

( [serial_no] => 100002 

[name] => Elaine 

[birthday] => 1982-01-01 

[salary] => 6000.00 

[bonus] => 2000.00 

[name] => testing center 

[employee] => SimpleXMLElement Object 

[serial_no] => 110001 

[name] => Helen 

[age] => 23 

[birthday] => 1983-07-21 

從輸出結果可以看出,SimpleXML對象的結構與 XML資料的格式完全相同。 

第二種方法是使用 simplexml_load_flie函數讀取一個 XML檔案來完成建立的,其文法格式如下所示。 

simplexml_load_file(string filename) 

這裡的 filename變量是用于存儲 XML資料檔案的檔案名及其所在路徑。以下代碼使用 simplexml_load_file函數來建立了一個 SimpleXML對象。 

<?php 

$xml = simplexml_load_file('example.xml'); //建立 SimpleXML對象 

print_r($xml); //輸出 XML 

?> 

其中,example.xml存儲的資料與上面的$data完全相同,運作結果也與上面完全相同。 

上面兩種方法實作了同樣的功能,其差別就在于 XML的資料源不同。如果 XML的資料源在 PHP腳本檔案中,則需要使用 simplexml_load_string來進行建立。如果 XML的資料源在一個單獨的 XML檔案中,則需要使用 simplexml_load_file來進行建立。 

2.2 讀取 SimpleXML對象中的 XML資料 

前面介紹了使用 print_r函數來讀取 SimpleXML對象中的資料,其傳回結果與數組的結構類似。顯然,這種顯示方式在實際應用中是不可取的。在這裡将介紹其他的幾種讀取 SimpleXML對象中 XML資料的方法。 

1.var_dump函數顯示對象詳細資訊 

var_dump函數可以用于顯示 SimpleXML對象的詳細資訊,與 print_r函數相比,var_dump函數顯示的資訊更為完整,其文法如下所示。 

void var_dump(object1, object2 … ) 

以下代碼使用 var_dump函數輸出了上面例子中對象的詳細資訊。 

<?php $xml = simplexml_load_file('example.xml'); //建立 SimpleXML對象 var_dump($xml); //輸出 XML ?> 

運作結果如下所示。 

object(SimpleXMLElement)#1 (1) { ["depart"]=> array(2) { 

[0]=> 

object(SimpleXMLElement)#2 (2) { 

["name"]=> 

string(18) “production support” 

["employees"]=> 

object(SimpleXMLElement)#4 (1) { 

["employee"]=> 

array(2) { 

object(SimpleXMLElement)#5 (6) { 

["serial_no"]=> 

string(6) “100001″ 

string(5) “Simon” 

["age"]=> 

string(2) “24″ 

["birthday"]=> 

string(10) “1982-11-06″ 

["salary"]=> 

string(7) “5000.00″ 

["bonus"]=> 

string(7) “1000.00″ 

[1]=> 

object(SimpleXMLElement)#6 (6) { 

string(6) “100002″ 

string(6) “Elaine” 

string(10) “1982-01-01″ 

string(7) “6000.00″ 

string(7) “2000.00″ 

object(SimpleXMLElement)#3 (2) { 

string(14) “testing center” 

object(SimpleXMLElement)#7 (1) { 

object(SimpleXMLElement)#8 (6) { 

string(6) “110001″ 

string(5) “Helen” 

string(2) “23″ 

string(10) “1983-07-21″ 

}}}}} 

與前面 print_r輸出的結果相比較,var_dump函數的輸出結果的結構更為嚴謹,并且将對象中的每一個屬性的資料類型均作出分析。在實際應用中,var_dump函數往往用于程式調試時的對象檢測。 

2.讀取 XML資料中的标簽 

與操作數組類型的變量類似,讀取 XML也可以通過類似的方法來完成。例如,如果需要讀取上面 XML資料中每一個“ depart”标簽下的“name”屬性,可以通過使用 foreach函數來完成,如以下代碼 

所示。 

<?php $xml = simplexml_load_file('example.xml'); foreach($xml->depart as $a) 

echo “$a->name <BR>”; 

production support 

testing center 

//讀取 XML檔案 //循環讀取 XML資料中的每一個 depart标簽 

//輸出其中的 name屬性 

也可以使用方括号“ []”來直接讀取 XML資料中指定的标簽。以下代碼輸出了上面 XML資料中的第一個“depart”标簽的“name”屬性。 

$xml = simplexml_load_file('example.xml'); //讀取 XML檔案 

echo $xml->depart->name[0]; //輸出節點 

對于一個标簽下的所有子标簽,SimpleXML元件提供了 children方法進行讀取。例如,對于上面的 XML資料中的“ depart”标簽,其下包括兩個子标簽:“ name”和“employees”。以下代碼實作了對第一個“depart”标簽下的子标簽的讀取。 

$xml = simplexml_load_file('example.xml'); 

foreach ($xml->depart->children() as $depart) //循環讀取 depart标簽下的子标簽 

var_dump($depart); //輸出标簽的 XML資料 

object(SimpleXMLElement)#3 (1) { 

object(SimpleXMLElement)#5 (1) { 

object(SimpleXMLElement)#3 (6) { 

可以看出,使用 children方法後,所有的子标簽均被當作一個新的 XML檔案進行處理。 

3.基于 XML資料路徑的查詢 

SimpleXML元件提供了一種基于 XML資料路徑的查詢方法。 XML資料路徑即從 XML的根到某一個标簽所經過的全部标簽。這種路徑使用斜線“ /”隔開标簽名。例如,對于上面的 XML資料,要查詢所有的标簽“name”中的值,從根開始要經過 departs、depart、employees和 employee标簽,則其路徑 

為“/departs/depart/employees/employee/name”。 SimpleXML元件使用 xpath方法來解析路徑,其文法格式如下所示。 

xpath(string path) 

其中的 path為路徑。該方法傳回了一個包含有所有要查詢标簽值的數組。以下代碼查詢了上面 XML資料中的所有 name标簽。 

$result = $xml->xpath('/departs/depart/employees/employee/name'); //定義節點 

var_dump($result); //輸出節點 

array(3) { 

[0]=> object(SimpleXMLElement)#2 (1) { 

[0]=> string(5) “Simon” 

[1]=> object(SimpleXMLElement)#3 (1) { 

[0]=> string(6) “Elaine” 

[2]=> object(SimpleXMLElement)#4 (1) { 

[0]=> string(5) “Helen” 

可以看出,所有的 name标簽均被查詢出來。 

2.3 XML資料的修改 

對于 XML資料的修改與讀取 XML資料中的标簽方法類似。即通過直接修改 SimpleXML對象中的标簽的值來實作。以下代碼實作了對上面 XML資料中第一個“ depart”标簽的“ name”子标簽的修改。 

$xml = simplexml_load_file('example.xml'); //讀取 XML 

$xml->depart->name[0] = “Human Resource”; //修改節點 

修改後,并不會對 XML檔案有任何影響。但是,在程式中,對于 SimpleXML對象的讀取将使用修改過的值。 

2.4 标準化 XML資料 

SimpleXML還提供了一種标準化 XML資料的方法 asXML。asXML方法可以有效的将 SimpleXML對象中的内容按照 XML 1.0标準進行重新編排并以字元串的資料類型傳回。以下代碼實作了對上面 XML資料的标準化。 

$xml = simplexml_load_file('example.xml'); //讀取 XML資料 

echo $xml->asXML(); //标準化 XML資料 

2.5 XML資料的存儲 

将 SimpleXML對象中的 XML資料存儲到一個 XML檔案的方法非常簡單,即将 asXML方法的傳回結果輸出到一個檔案中即可。以下代碼首先将 XML檔案中的 depart name進行了修改,然後将修改過的 XML資料輸出到另一個 XML檔案。 

$newxml = $xml->asXML(); //标準化 XML資料 

$fp = fopen(”newxml.xml”, “w”); //打開要寫入 XML資料的檔案 

fwrite($fp, $newxml); //寫入 XML資料 

fclose($fp); //關閉檔案 

代碼運作後,可以看到在 newxml.xml檔案中的 XML資料如下所示。 

可以看出,對于 XML檔案的修改已經儲存到輸出檔案中了。 

3 XML文檔的動态建立 

在實際應用中,時而會需要動态生成 XML文檔的操作。前面介紹的 SimpleXML元件并不提供建立 XML文檔的方法。是以,如果需要動态建立 XML文檔,往往使用 DOM元件進行建立。 DOM是文檔對象模型 Document Object Model的縮寫, DOM元件提供了對 XML文檔的樹型解析模式。以下代碼使用 DOM元件建立了一個 XML文檔。 

//建立一個新的 DOM文檔 

$dom = new DomDocument(); 

//在根節點建立 departs标簽 

$departs = $dom->createElement('departs'); 

$dom->appendChild($departs); 

//在 departs标簽下建立 depart子标簽 

$depart = $dom->createElement('depart'); 

$departs->appendChild($depart); 

//在 depart标簽下建立 employees子标簽 

$employees = $dom->createElement('employees'); 

$depart->appendChild($employees); 

//在 employees标簽下建立 employee子标簽 

$employee = $dom->createElement('employee'); 

$employees->appendChild($employee); 

//在 employee标簽下建立 serial_no子标簽 

$serial_no = $dom->createElement('serial_no'); 

$employee->appendChild($serial_no); 

//為 serial_no标簽添加值節點 100001 

$serial_no_value = $dom->createTextNode('100001′); 

$serial_no->appendChild($serial_no_value); 

//輸出 XML資料 

echo $dom->saveXML(); 

輸出結果如下所示。 

<?xml version=”1.0″?> 

<departs> 

<depart> 

<employees> 

<employee> 

<serial_no>100001</serial_no> 

</employee> 

</employees> 

</depart> 

</departs> 

DOM元件除了可以用來動态建立 XML文檔外,還可以用來讀取 XML檔案。以下代碼實作了對前 

面 XML檔案的讀取。 

$dom = new DomDocument(); //建立 DOM對象 

$dom->load('example.xml'); //讀取 XML檔案 

$root = $dom->documentElement; //擷取 XML資料的根 

read_child($root); //調用 read_child函數讀取根對象 

function read_child($node) 

$children = $node->childNodes; //獲得$node的所有子節點 

foreach($children as $e) //循環讀取每一個子節點 

if($e->nodeType == XML_TEXT_NODE) //如果子節點為文本型則輸出 

echo $e->nodeValue.”<BR>”; 

else if($e->nodeType == XML_ELEMENT_NODE) //如果子節點為節點對象,則調用函數處理 

read_child($e); 

引用 

100001 

Simon 

24 

1982-11-06 

5000.00 

1000.00 

100002 

Elaine 

1982-01-01 

6000.00 

2000.00 

110001 

Helen 

23 

1983-07-21 

上面的例子使用了遞歸的方式對 XML資料進行了處理,實作了輸出 XML資料中的所有文本型标簽的功能。 

4 XML應用執行個體——留言本 

前面介紹了 XML的基本操作,本節将以設計一個 XML留言本為例來詳細說明在實際應用中如何實作 PHP與 XML資料的互動操作。 

4.1 XML檔案結構設計 

XML檔案用于存儲 XML資料,也就是留言本中的留言。這裡,對于每條留言,在 XML資料中主要包括三項内容:留言标題、留言者姓名、留言内容。是以,将 XML檔案的格式設計如下。 

<threads> 

<thread> 

<title>這裡是留言的标題</title> 

<author>這裡是留言者</author> 

<content>這裡是留言内容</content> 

</thread> 

</threads> 

4.2 送出頁面的編寫 

送出留言頁面由兩個頁面組成。一個是讓通路者用來書寫留言的表單的 HTML檔案,一個是用來處理通路者輸入的 PHP腳本。表單的 HTML代碼如下所示。 

<html> 

<head> 

<title>發表新的留言</title> 

<meta http-equiv=”Content-Type” content=”text/html; charset=gb2312″> 

</head> 

<body> 

<H1><p align=”center”>發表新的留言</p></H1> 

<form name=”form1″ method=”post” action=”Post.php”> 

<table width=”500″ border=”0″ align=”center” cellpadding=”0″ cellspacing=”0″> 

<tr> 

<td>标題</td> 

<td><input name=”title” type=”text” id=”title” size=”50″></td> 

</tr> 

<td>作者</td> 

<td><input name=”author” type=”text” id=”author” size=”20″></td> 

<td>内容</td> 

<td><textarea name=”content” cols=”50″ rows=”10″ id=”content”></textarea></td> 

</table> 

<p align=”center”> 

<input type=”submit” value=”Submit”> 

<input type=”reset” value=”Reset”> 

</p> 

</form> 

</body> 

</html> 

對于用來處理使用者輸入的 PHP腳本,其基本邏輯是首先建立一個 DOM對象,然後讀取 XML檔案中的 XML資料,接下來在 XML對象上建立新的節點并将使用者的輸入儲存起來,最後将 XML資料輸出到原來的 XML檔案中。具體實作代碼如下所示。 

$guestbook = new DomDocument(); //建立一個新的 DOM對象 

$guestbook->load('DB/guestbook.xml'); //讀取 XML資料 

$threads = $guestbook->documentElement; //獲得 XML結構的根 

//建立一個新 thread節點 

$thread = $guestbook->createElement('thread'); 

$threads->appendChild($thread); 

//在新的 thread節點上建立 title标簽 

$title = $guestbook->createElement('title'); 

$title->appendChild($guestbook->createTextNode($_POST['title'])); 

$thread->appendChild($title); 

//在新的 thread節點上建立 author标簽 

$author = $guestbook->createElement('author'); 

$author->appendChild($guestbook->createTextNode($_POST['author'])); 

$thread->appendChild($author); 

//在新的 thread節點上建立 content标簽 

$content = $guestbook->createElement('content'); 

$content->appendChild($guestbook->createTextNode($_POST['content'])); 

$thread->appendChild($content); 

//将 XML資料寫入檔案 

$fp = fopen(”DB/guestbook.xml”, “w”); 

if(fwrite($fp, $guestbook->saveXML())) 

echo “留言送出成功”; 

else 

echo “留言送出失敗”; 

fclose($fp); 

在浏覽器中運作上述 HTML檔案并填寫适當的留言内容,如圖 2所示。 

PHP XML操作的各種方法解析

圖 2 發表新留言界面 

單擊【Submit】按鈕後,XML檔案中的内容如下所示。 

可以看到 XML檔案中已經将留言存儲起來了。 

4.3 顯示頁面的編寫 

顯示頁面可以使用前面介紹的 SimpleXML元件很容易的實作,具體實作代碼如下所示。 

//打開用于存儲留言的 XML檔案 

$guestbook = simplexml_load_file('DB/guestbook.xml'); 

foreach($guestbook->thread as $th) //循環讀取 XML資料中的每一個 thread标簽 

echo “<B>标題:</B>”.$th->title.”<BR>”; 

echo “<B>作者:</B>”.$th->author.”<BR>”; 

echo “<B>内容:</B><PRE>”.$th->content.”</PRE>”; 

echo “<HR>”; 

在浏覽器中檢視運作結果如圖 3所示。 

PHP XML操作的各種方法解析

如何聯系我:【萬裡虎】www.bravetiger.cn

【QQ】3396726884 (咨詢問題100元起,幫助解決問題500元起)

【部落格】http://www.cnblogs.com/kenshinobiy/