java 解析 xml 文档

2012-05-18 13:23:00

为读取和分析xml文档的内容，需要一个xml解析器。解析器是读取文档，检查其语法是否正确并在它除了文档时完成某些工作的程序。有两种xml解析器是经常使用的。一种遵循称为SAX （xml简单api）规范，另一种遵循称为dom 规范。sax解析器是事件驱动的。只要解析器遇到某种结构（例如，开始标签<price> ),它就会调用必须提供的一个方法。相反，dom解析器则构建表示被解析文档的树。一旦解析器建树完毕，就可以分析此树。对需要大量内存来处理树结构的大型xml来说，sax解析器的效率更高。但是，对大多数应用程序来说，dom解析器更容易使用--解析树给出了数据的完成概况，而sax解析器只给出零散的信息。

在sax解析器分析文档时，会激活事件，而dom解析器则构建文档树。

Document接口描述xml文档的树结构，为了生成实现Document接口类的对象，就需要一个DocumentBuilder对象，为了得到DocumentBuilder，首先调用DocumentBuilderFactory类的静态方法newInstance方法，然后在工厂对象上调用newDocumenBuilder方法。

File f=new File(" "); 
DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance(); 
DocumentBuilder builder=factory.newDocumentBuilder(); 
Document doc = builder.parse(f);

DocumentBuilder能够从文件，url或者输入流中读取xml文件，其结果是包含数的Document对象。

如果文档位于Internet上，就使用URL;

URL url=new URL(urlname);

也可以从任意输入流中读取文档：

InputStream in=......;

Document doc=builder.parse(in);

一旦创建了新文档或从文件中读取了文档，就可以检查并修改它。

下面是一份简单的xml文档，no是车牌号码，addr是车主地址：

<?xml version="1.0" encoding="GB2312"?>
<result>
  <value>
      <no>A123</no>
      <addr>广东省珠海市香洲区</addr>
  </value>
 
  <value>
       <no>b456 </no>
       <addr>北京市朝阳区</addr>
  </value>
 
</result>

用dom解析程序如下：

package dom;
 
import javax.xml.parsers.*;

import org.w3c.dom.*;

import java.io.*;
import java.util.*;
public class MyXMLReader{  
      public static void main(String arge[]){  

    long lasting =System.currentTimeMillis();  
    try{
     File f=new File("resource/data_10k.xml");  
     DocumentBuilderFactory factory=DocumentBuilderFactory.newInstance();  
     DocumentBuilder builder=factory.newDocumentBuilder();  
     Document doc = builder.parse(f); 
     NodeList nl = doc.getElementsByTagName("value");  
     
      for (int i=0;i<nl.getLength();i++)
     
    {  
      System.out.print("车牌号码:" + doc.getElementsByTagName("no").item(i).getFirstChild().getNodeValue());  
      System.out.println("车主地址:" + doc.getElementsByTagName("addr").item(i).getFirstChild().getNodeValue());
    
    }  
     
    
    }catch(Exception e){  
      e.printStackTrace();  
    }
   }
 }

注意 import javax.swing.text.Document;包中也有一个Document类，不要导入这个包，应导入import org.w3c.dom.Document;这个包

输出：

车牌号码:A123车主地址:广东省珠海市香洲区

车牌号码:b456 车主地址:北京市朝阳区

java 解析 xml 文档

继续阅读

关于Gradle配置的小结

Java小案例——随机数猜测随机数猜测

nginx location中斜线的位置的重要性

27 Best Free Eclipse Plug-ins for Java Developer to be ProductiveCode Quality PluginsText Editor PluginsDependency ManagementVersion Control Integration PluginsFramework Development Continuous Integration Related PluginsOther Utility Plugins

Java String.format方法的简单使用

neo4j之cypher使用文档

GitHub连夜封杀！这份阿里 10W 字内部 Java 字面试手册到底有多强？

spark/scala关于【资源文件】加载方法概述外部文件加载方案测试资源文件打包入jar包中小结

mybatis_入门程序Mybatis入门

AOP编程_Android优雅权限框架(1)概念基础，2021金三银四前言正文大纲正文

Effective Java 8:通用程序设计

OOM三种类型

工厂模式-三种类型

【递归】高效率求2的n次幂

win10本地scala和spark安装安装scala安装spark

scala (3) Function 和 Method