为读取和分析xml文档的内容,需要一个xml解析器。解析器是读取文档,检查其语法是否正确并在它除了文档时完成某些工作的程序。有两种xml解析器是经常使用的。一种遵循称为SAX (xml简单api)规范,另一种遵循称为dom 规范。sax解析器是事件驱动的。只要解析器遇到某种结构(例如,开始标签<price> ),它就会调用必须提供的一个方法。相反,dom解析器则构建表示被解析文档的树。一旦解析器建树完毕,就可以分析此树。对需要大量内存来处理树结构的大型xml来说,sax解析器的效率更高。但是,对大多数应用程序来说,dom解析器更容易使用--解析树给出了数据的完成概况,而sax解析器只给出零散的信息。
在sax解析器分析文档时,会激活事件,而dom解析器则构建文档树。
Document接口描述xml文档的树结构,为了生成实现Document接口类的对象,就需要一个DocumentBuilder对象,为了得到DocumentBuilder,首先调用DocumentBuilderFactory类的静态方法newInstance方法,然后在工厂对象上调用newDocumenBuilder方法。
File f=new File(" ");
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=factory.newDocumentBuilder();
Document doc = builder.parse(f);
DocumentBuilder能够从文件,url或者输入流中读取xml文件,其结果是包含数的Document对象。
如果文档位于Internet上,就使用URL;
URL url=new URL(urlname);
也可以从任意输入流中读取文档:
InputStream in=......;
Document doc=builder.parse(in);
一旦创建了新文档或从文件中读取了文档,就可以检查并修改它。
下面是一份简单的xml文档,no是车牌号码,addr是车主地址:
<?xml version="1.0" encoding="GB2312"?>
<result>
<value>
<no>A123</no>
<addr>广东省珠海市香洲区</addr>
</value>
<value>
<no>b456 </no>
<addr>北京市朝阳区</addr>
</value>
</result>
用dom解析程序如下:
package dom;
import javax.xml.parsers.*;
import org.w3c.dom.*;
import java.io.*;
import java.util.*;
public class MyXMLReader{
public static void main(String arge[]){
long lasting =System.currentTimeMillis();
try{
File f=new File("resource/data_10k.xml");
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();
DocumentBuilder builder=factory.newDocumentBuilder();
Document doc = builder.parse(f);
NodeList nl = doc.getElementsByTagName("value");
for (int i=0;i<nl.getLength();i++)
{
System.out.print("车牌号码:" + doc.getElementsByTagName("no").item(i).getFirstChild().getNodeValue());
System.out.println("车主地址:" + doc.getElementsByTagName("addr").item(i).getFirstChild().getNodeValue());
}
}catch(Exception e){
e.printStackTrace();
}
}
}
注意 import javax.swing.text.Document;包中也有一个Document类,不要导入这个包,应导入import org.w3c.dom.Document;这个包
输出:
车牌号码:A123车主地址:广东省珠海市香洲区
车牌号码:b456 车主地址:北京市朝阳区