天天看点

java 解析 xml 文档

   为读取和分析xml文档的内容,需要一个xml解析器。解析器是读取文档,检查其语法是否正确并在它除了文档时完成某些工作的程序。有两种xml解析器是经常使用的。一种遵循称为SAX (xml简单api)规范,另一种遵循称为dom 规范。sax解析器是事件驱动的。只要解析器遇到某种结构(例如,开始标签<price> ),它就会调用必须提供的一个方法。相反,dom解析器则构建表示被解析文档的树。一旦解析器建树完毕,就可以分析此树。对需要大量内存来处理树结构的大型xml来说,sax解析器的效率更高。但是,对大多数应用程序来说,dom解析器更容易使用--解析树给出了数据的完成概况,而sax解析器只给出零散的信息。

    在sax解析器分析文档时,会激活事件,而dom解析器则构建文档树。

     Document接口描述xml文档的树结构,为了生成实现Document接口类的对象,就需要一个DocumentBuilder对象,为了得到DocumentBuilder,首先调用DocumentBuilderFactory类的静态方法newInstance方法,然后在工厂对象上调用newDocumenBuilder方法。

File f=new File(" "); 
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); 
DocumentBuilder builder=factory.newDocumentBuilder(); 
Document doc = builder.parse(f);      

    DocumentBuilder能够从文件,url或者输入流中读取xml文件,其结果是包含数的Document对象。

如果文档位于Internet上,就使用URL;

URL url=new URL(urlname);

也可以从任意输入流中读取文档:

InputStream in=......;

Document doc=builder.parse(in);

        一旦创建了新文档或从文件中读取了文档,就可以检查并修改它。

下面是一份简单的xml文档,no是车牌号码,addr是车主地址:

<?xml version="1.0" encoding="GB2312"?>
<result>
  <value>
      <no>A123</no>
      <addr>广东省珠海市香洲区</addr>
  </value>
 
  <value>
       <no>b456 </no>
       <addr>北京市朝阳区</addr>
  </value>
 
</result>      

  用dom解析程序如下:

package dom;
 
import javax.xml.parsers.*;

import org.w3c.dom.*;

import java.io.*;
import java.util.*;
public class MyXMLReader{  
      public static void main(String arge[]){  

    long lasting =System.currentTimeMillis();  
    try{
     File f=new File("resource/data_10k.xml");  
     DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();  
     DocumentBuilder builder=factory.newDocumentBuilder();  
     Document doc = builder.parse(f); 
     NodeList nl = doc.getElementsByTagName("value");  
     
      for (int i=0;i<nl.getLength();i++)
     
    {  
      System.out.print("车牌号码:" + doc.getElementsByTagName("no").item(i).getFirstChild().getNodeValue());  
      System.out.println("车主地址:" + doc.getElementsByTagName("addr").item(i).getFirstChild().getNodeValue());
    
    }  
     
    
    }catch(Exception e){  
      e.printStackTrace();  
    }
   }
 }      

  注意 import javax.swing.text.Document;包中也有一个Document类,不要导入这个包,应导入import org.w3c.dom.Document;这个包

输出:

车牌号码:A123车主地址:广东省珠海市香洲区

车牌号码:b456 车主地址:北京市朝阳区