0

0

XML—XML解析之DOM

黄舟

黄舟

发布时间:2017-02-24 15:04:53

|

1990人浏览过

|

来源于php中文网

原创

1.XML编程

XML编程,就是对XML文件进行crud操作。

页面xml解析自动赋值工具
页面xml解析自动赋值工具

页面xml解析自动赋值工具

下载

那么为什么要用java或者C/C++对XML进行crud操作呢?
1.XML作为数据传递需要解析
2.XML作为配置文件需要读取
3.XML作为小型数据库,需要进行crud操作

w3C组织为了大家解析XML方便,定义了一套规范(API)

1.1.XML解析技术介绍

1.XML解析分为:dom解析和sax解析

dom:(Document Object Model,即文档对象模型),是W3C组织推荐的处理XML的一种方式sax:(Simple API for XML),不是官方标准,但它是XML社区事实上的标准,几乎所有的XML解析器都支持它

SAX解析采用事件驱动模型边读边解析:从上到下一行一行解析,解析到某一元素,调用相应的解析方法。
DOM根据XML层级结构在内存中分配一个树形结构,把XML的标签,属性和文本等元素都封装成树的节点对象。

不同的公司和组织提供了针对DOM和SAX两种方式的解析器:

  • Sun的JAXP

  • Dom4j组织的dom4j(最常用,例如hibernate)

  • JDom组织的jdom

其中的JASP是J2SE的一部分,它分别针对DOM和SAX提供了DOM和SAX解析器。

在这里也主要介绍三种解析:dom、sax和dom4j

1.2.JAXP介绍

Sun公司提供了Java API for XML Parsing(JAXP)接口来使用SAX和DOM,通过JAXP,我们可以使用任何与JAXP兼容的XML解析器。

JAXP开发包是J2SE的一部分,它由javax.xml、org.w3c.dom、org.xml.sax包及其子包组成

在javax.xml.parsers包中,定义了几个工厂类,程序员调用这些工厂类,可以得到对xml文档进行解析的DOM或SAX的解析器对象。

2.JAXP之DOM解析

2.1.XML DOM节点树

首先说明JAXP解析XML的DOM对象的原理,XML DOM把XML文档视为一颗节点树(node-tree),树中的所有节点彼此之间都有关系。可通过这棵树访问所有的节点。可以修改或者删除它们的内容,也可以创建新的元素。

比如,现在的XML文档如下(该例子来自w3cschool在线教程):


    
        Harry Potter
        J K. Rowling
        2005
        29.99
    
    
        Everyday Italian
        Giada De Laurentiis
        2005
        30.00
    
    
        Learning XML
        Erik T. Ray
        2003
        39.95
    
    
        XQuery Kick Start
        James McGovern
        Per Bothner
        Kurt Cagle
        James Linn
        Vaidyanathan Nagarajan
        2003
        49.99
    

这棵树从根节点开始,在树的最低层级向文本节点长出枝条:

XML DOM树

【要知道的几个知识点】:
1.dom会把xml文件看做一棵树,并加载到内存
2.dom特别适合做crud操作
3.dom不太适合去操作比较大的xml文件(占用内存)
4.dom会把xml文件中每一个元素、属性、文本都映射成对应的Node对象。

2.2.获得JAXP中的DOM解析器步骤

1.调用DocumentBuilderFactory.newInstance()方法得到创建DOM解析器的工厂
2.调用工厂对象的newDocumentBuilder方法得到DOM解析器对象
3.调用DOM解析器对象的parse()方法解析XML文档,得到代表整个文档的Document对象,进行可以利用DOM特性对整个XML文档进行操作了。

2.3.JAXP之DOM解析实例:

XML文档如下:

<班级>
    <学生 地址="香港">
        <名字>周小星    
        <年龄>23
        <介绍>学习刻苦
       
    <学生 地址="澳门">
        <名字>林晓 
        <年龄>25
        <介绍>是一个好学生
       

2.3.1.读取XML文档

首先使用2.2中介绍了三个步骤得到代表整个文档的document对象,并调用我们所写的read(Document document)方法,如下:

// 1.创建一个DocumentBuilderFactoryDocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
// 2.通过工厂实例得到DocumentBuilder对象DocumentBuilder builder = factory.newDocumentBuilder();
// 3.指定要解析的xml文件,返回document对象Document document = builder.parse(new File("src/myClass.xml"));
read(document);

其中的read方法是这么写的:

/**
* 显示所有学生的所有信息
 * @param document
 */public static void read(Document document){    // 通过学生这个标签名字得到NodeList
    NodeList nodeList = document.getElementsByTagName("学生");    
    for(int i=0;i

最后的运行结果如下所示:

运行结果

2.3.2.更新XML文档

利用DOM更新XML文档一定要使用Transformer类将更改写入文件,否则只是更改了在内存中的XML文档对象。

  • javax.xml.transform包中的Transformer类用于把代表XML文件的Document对象转换为某种格式后进行输出,例如把xml文件应用样式表后转成一个html文档。利用这个对象,当然也可以把Document对象又重新写回到一个XML文件中

  • Transformer类通过transform方法完成转换操作,该方法接收一个源和一个目的地。我们可以通过:

javax.xml.transform.dom.DOMSource类来关联要转换的document对象
 用javax.xml.transform.stream.StreamResult对象来表示数据的目的地

  • Transformer对象通过TransformerFactory获得

【1】添加元素
我们可以向上述XML中添加一个学生子节点,如下:

/**
 * 添加学生
 * 
 * @param document
 * @throws Exception
 */public static void add(Document document) throws Exception {    // 创建一个新的学生节点
    Element newStudent = document.createElement("学生");    // 给新的学生添加地址属性
    newStudent.setAttribute("地址", "旧金山");    // 创建学生的子节点
    Element newStudent_name = document.createElement("名字");
    newStudent_name.setTextContent("小明");
    Element newStudent_age = document.createElement("年龄");
    newStudent_age.setTextContent("25");
    Element newStudent_intro = document.createElement("介绍");
    newStudent_intro.setTextContent("这是一个好孩子");    // 将子节点添加到学生节点上
    newStudent.appendChild(newStudent_name);
    newStudent.appendChild(newStudent_age);
    newStudent.appendChild(newStudent_intro);    // 把新的学生节点添加到根节点下
    document.getDocumentElement().appendChild(newStudent);    // 更新XML文档
    // 得到TransformerFactory
    TransformerFactory tff = TransformerFactory.newInstance();    // 通过TransformerFactory得到一个转换器
    Transformer tf = tff.newTransformer();    // 更新当前的XML文件
    tf.transform(new DOMSource(document), new StreamResult(new File(            "src/myClass.xml")));
}

【2】删除元素
同样的,我们也可以删除一个学生节点,如下:

/**
* 删除第一个学生节点
 * 
 * @param document
 */public static void delete(Document document) throws Exception {    // 首先找到这个学生,这里可以不用转为Element
    Node student = document.getElementsByTagName("学生").item(0);    // 通过它的父节点来删除
    student.getParentNode().removeChild(student);    // 更新这个文档
    TransformerFactory tff = TransformerFactory.newInstance();
    Transformer tf = tff.newTransformer();
    tf.transform(new DOMSource(document), new StreamResult(new File(            "src/myClass.xml")));
}

【3】更改元素的值
比如,我们也可以将第一个学生的名字改为松江,如下:

/**
* 把第一个学生的元素名字改为宋江
 * 
 * @param document
 */public static void update_name(Document document) throws Exception{
    Element student = (Element) document.getElementsByTagName("学生").item(0);
    Element name = (Element) student.getElementsByTagName("名字").item(0);
    name.setTextContent("宋江");    // 更新这个文档
    TransformerFactory tff = TransformerFactory.newInstance();
    Transformer tf = tff.newTransformer();
    tf.transform(new DOMSource(document), new StreamResult(new File(            "src/myClass.xml")));
}

【4】更改或删除元素的属性

/**
* 删除第一个学生节点的属性
 * 
 * @param document
 */public static void delete_attribute(Document document) throws Exception {    // 首先找到这个学生
    Element student = (Element) document.getElementsByTagName("学生").item(0);    // 删除student的地址属性
    student.removeAttribute("地址");    // 更新属性
    // student.setAttribute("地址", "新地址");

    // 更新这个文档
    TransformerFactory tff = TransformerFactory.newInstance();
    Transformer tf = tff.newTransformer();
    tf.transform(new DOMSource(document), new StreamResult(new File(            "src/myClass.xml")));
}

上述列举了几个更新元素(节点)的例子,更一般的需求是这样的:将名字是周小星的同学的年龄改为30,这时候我们需要去遍历XML文档,找到对应的节点,再进行修改。

另外,所有关于更新的方法中都用到了TransformerFactory来进行实际的更新,所以,我们可以把这三句话写成一个函数,从而避免代码冗余,如下:

public static void update(Document document, String path) throws Exception {
    TransformerFactory tff = TransformerFactory.newInstance();
    Transformer tf = tff.newTransformer();
    tf.transform(new DOMSource(document), new StreamResult(new File(path)));
}

1.XML编程

XML编程,就是对XML文件进行crud操作。

那么为什么要用java或者C/C++对XML进行crud操作呢?
1.XML作为数据传递需要解析
2.XML作为配置文件需要读取
3.XML作为小型数据库,需要进行crud操作

w3C组织为了大家解析XML方便,定义了一套规范(API)

1.1.XML解析技术介绍

1.XML解析分为:dom解析和sax解析

dom:(Document Object Model,即文档对象模型),是W3C组织推荐的处理XML的一种方式sax:(Simple API for XML),不是官方标准,但它是XML社区事实上的标准,几乎所有的XML解析器都支持它

SAX解析采用事件驱动模型边读边解析:从上到下一行一行解析,解析到某一元素,调用相应的解析方法。
DOM根据XML层级结构在内存中分配一个树形结构,把XML的标签,属性和文本等元素都封装成树的节点对象。

不同的公司和组织提供了针对DOM和SAX两种方式的解析器:

  • Sun的JAXP

  • Dom4j组织的dom4j(最常用,例如hibernate)

  • JDom组织的jdom

其中的JASP是J2SE的一部分,它分别针对DOM和SAX提供了DOM和SAX解析器。

在这里也主要介绍三种解析:dom、sax和dom4j

1.2.JAXP介绍

Sun公司提供了Java API for XML Parsing(JAXP)接口来使用SAX和DOM,通过JAXP,我们可以使用任何与JAXP兼容的XML解析器。

JAXP开发包是J2SE的一部分,它由javax.xml、org.w3c.dom、org.xml.sax包及其子包组成

在javax.xml.parsers包中,定义了几个工厂类,程序员调用这些工厂类,可以得到对xml文档进行解析的DOM或SAX的解析器对象。

2.JAXP之DOM解析

2.1.XML DOM节点树

首先说明JAXP解析XML的DOM对象的原理,XML DOM把XML文档视为一颗节点树(node-tree),树中的所有节点彼此之间都有关系。可通过这棵树访问所有的节点。可以修改或者删除它们的内容,也可以创建新的元素。

比如,现在的XML文档如下(该例子来自w3cschool在线教程):


    
        Harry Potter
        J K. Rowling
        2005
        29.99
    
    
        Everyday Italian
        Giada De Laurentiis
        2005
        30.00
    
    
        Learning XML
        Erik T. Ray
        2003
        39.95
    
    
        XQuery Kick Start
        James McGovern
        Per Bothner
        Kurt Cagle
        James Linn
        Vaidyanathan Nagarajan
        2003
        49.99
    

这棵树从根节点开始,在树的最低层级向文本节点长出枝条:

XML DOM树

【要知道的几个知识点】:
1.dom会把xml文件看做一棵树,并加载到内存
2.dom特别适合做crud操作
3.dom不太适合去操作比较大的xml文件(占用内存)
4.dom会把xml文件中每一个元素、属性、文本都映射成对应的Node对象。

2.2.获得JAXP中的DOM解析器步骤

1.调用DocumentBuilderFactory.newInstance()方法得到创建DOM解析器的工厂
2.调用工厂对象的newDocumentBuilder方法得到DOM解析器对象
3.调用DOM解析器对象的parse()方法解析XML文档,得到代表整个文档的Document对象,进行可以利用DOM特性对整个XML文档进行操作了。

2.3.JAXP之DOM解析实例:

XML文档如下:

<班级>
    <学生 地址="香港">
        <名字>周小星    
        <年龄>23
        <介绍>学习刻苦
       
    <学生 地址="澳门">
        <名字>林晓 
        <年龄>25
        <介绍>是一个好学生
       

2.3.1.读取XML文档

首先使用2.2中介绍了三个步骤得到代表整个文档的document对象,并调用我们所写的read(Document document)方法,如下:

// 1.创建一个DocumentBuilderFactoryDocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
// 2.通过工厂实例得到DocumentBuilder对象DocumentBuilder builder = factory.newDocumentBuilder();
// 3.指定要解析的xml文件,返回document对象Document document = builder.parse(new File("src/myClass.xml"));
read(document);

其中的read方法是这么写的:

/**
* 显示所有学生的所有信息
 * @param document
 */public static void read(Document document){    // 通过学生这个标签名字得到NodeList
    NodeList nodeList = document.getElementsByTagName("学生");    
    for(int i=0;i

最后的运行结果如下所示:

运行结果

2.3.2.更新XML文档

利用DOM更新XML文档一定要使用Transformer类将更改写入文件,否则只是更改了在内存中的XML文档对象。

  • javax.xml.transform包中的Transformer类用于把代表XML文件的Document对象转换为某种格式后进行输出,例如把xml文件应用样式表后转成一个html文档。利用这个对象,当然也可以把Document对象又重新写回到一个XML文件中

  • Transformer类通过transform方法完成转换操作,该方法接收一个源和一个目的地。我们可以通过:

javax.xml.transform.dom.DOMSource类来关联要转换的document对象
 用javax.xml.transform.stream.StreamResult对象来表示数据的目的地

  • Transformer对象通过TransformerFactory获得

【1】添加元素
我们可以向上述XML中添加一个学生子节点,如下:

/**
 * 添加学生
 * 
 * @param document
 * @throws Exception
 */public static void add(Document document) throws Exception {    // 创建一个新的学生节点
    Element newStudent = document.createElement("学生");    // 给新的学生添加地址属性
    newStudent.setAttribute("地址", "旧金山");    // 创建学生的子节点
    Element newStudent_name = document.createElement("名字");
    newStudent_name.setTextContent("小明");
    Element newStudent_age = document.createElement("年龄");
    newStudent_age.setTextContent("25");
    Element newStudent_intro = document.createElement("介绍");
    newStudent_intro.setTextContent("这是一个好孩子");    // 将子节点添加到学生节点上
    newStudent.appendChild(newStudent_name);
    newStudent.appendChild(newStudent_age);
    newStudent.appendChild(newStudent_intro);    // 把新的学生节点添加到根节点下
    document.getDocumentElement().appendChild(newStudent);    // 更新XML文档
    // 得到TransformerFactory
    TransformerFactory tff = TransformerFactory.newInstance();    // 通过TransformerFactory得到一个转换器
    Transformer tf = tff.newTransformer();    // 更新当前的XML文件
    tf.transform(new DOMSource(document), new StreamResult(new File(            "src/myClass.xml")));
}

【2】删除元素
同样的,我们也可以删除一个学生节点,如下:

/**
* 删除第一个学生节点
 * 
 * @param document
 */public static void delete(Document document) throws Exception {    // 首先找到这个学生,这里可以不用转为Element
    Node student = document.getElementsByTagName("学生").item(0);    // 通过它的父节点来删除
    student.getParentNode().removeChild(student);    // 更新这个文档
    TransformerFactory tff = TransformerFactory.newInstance();
    Transformer tf = tff.newTransformer();
    tf.transform(new DOMSource(document), new StreamResult(new File(            "src/myClass.xml")));
}

【3】更改元素的值
比如,我们也可以将第一个学生的名字改为松江,如下:

/**
* 把第一个学生的元素名字改为宋江
 * 
 * @param document
 */public static void update_name(Document document) throws Exception{
    Element student = (Element) document.getElementsByTagName("学生").item(0);
    Element name = (Element) student.getElementsByTagName("名字").item(0);
    name.setTextContent("宋江");    // 更新这个文档
    TransformerFactory tff = TransformerFactory.newInstance();
    Transformer tf = tff.newTransformer();
    tf.transform(new DOMSource(document), new StreamResult(new File(            "src/myClass.xml")));
}

【4】更改或删除元素的属性

/**
* 删除第一个学生节点的属性
 * 
 * @param document
 */public static void delete_attribute(Document document) throws Exception {    // 首先找到这个学生
    Element student = (Element) document.getElementsByTagName("学生").item(0);    // 删除student的地址属性
    student.removeAttribute("地址");    // 更新属性
    // student.setAttribute("地址", "新地址");

    // 更新这个文档
    TransformerFactory tff = TransformerFactory.newInstance();
    Transformer tf = tff.newTransformer();
    tf.transform(new DOMSource(document), new StreamResult(new File(            "src/myClass.xml")));
}

上述列举了几个更新元素(节点)的例子,更一般的需求是这样的:将名字是周小星的同学的年龄改为30,这时候我们需要去遍历XML文档,找到对应的节点,再进行修改。

另外,所有关于更新的方法中都用到了TransformerFactory来进行实际的更新,所以,我们可以把这三句话写成一个函数,从而避免代码冗余,如下:

public static void update(Document document, String path) throws Exception {
    TransformerFactory tff = TransformerFactory.newInstance();
    Transformer tf = tff.newTransformer();
    tf.transform(new DOMSource(document), new StreamResult(new File(path)));
}

 以上就是XML—XML解析之DOM的内容,更多相关内容请关注PHP中文网(www.php.cn)!

相关专题

更多
高德地图升级方法汇总
高德地图升级方法汇总

本专题整合了高德地图升级相关教程,阅读专题下面的文章了解更多详细内容。

43

2026.01.16

全民K歌得高分教程大全
全民K歌得高分教程大全

本专题整合了全民K歌得高分技巧汇总,阅读专题下面的文章了解更多详细内容。

84

2026.01.16

C++ 单元测试与代码质量保障
C++ 单元测试与代码质量保障

本专题系统讲解 C++ 在单元测试与代码质量保障方面的实战方法,包括测试驱动开发理念、Google Test/Google Mock 的使用、测试用例设计、边界条件验证、持续集成中的自动化测试流程,以及常见代码质量问题的发现与修复。通过工程化示例,帮助开发者建立 可测试、可维护、高质量的 C++ 项目体系。

24

2026.01.16

java数据库连接教程大全
java数据库连接教程大全

本专题整合了java数据库连接相关教程,阅读专题下面的文章了解更多详细内容。

35

2026.01.15

Java音频处理教程汇总
Java音频处理教程汇总

本专题整合了java音频处理教程大全,阅读专题下面的文章了解更多详细内容。

16

2026.01.15

windows查看wifi密码教程大全
windows查看wifi密码教程大全

本专题整合了windows查看wifi密码教程大全,阅读专题下面的文章了解更多详细内容。

56

2026.01.15

浏览器缓存清理方法汇总
浏览器缓存清理方法汇总

本专题整合了浏览器缓存清理教程汇总,阅读专题下面的文章了解更多详细内容。

16

2026.01.15

ps图片相关教程汇总
ps图片相关教程汇总

本专题整合了ps图片设置相关教程合集,阅读专题下面的文章了解更多详细内容。

9

2026.01.15

ppt一键生成相关合集
ppt一键生成相关合集

本专题整合了ppt一键生成相关教程汇总,阅读专题下面的的文章了解更多详细内容。

26

2026.01.15

热门下载

更多
网站特效
/
网站源码
/
网站素材
/
前端模板

精品课程

更多
相关推荐
/
热门推荐
/
最新课程
XML教程
XML教程

共142课时 | 5.7万人学习

XQuery 教程
XQuery 教程

共12课时 | 3.6万人学习

XLink  教程
XLink 教程

共7课时 | 1.1万人学习

关于我们 免责申明 举报中心 意见反馈 讲师合作 广告合作 最新更新
php中文网:公益在线php培训,帮助PHP学习者快速成长!
关注服务号 技术交流群
PHP中文网订阅号
每天精选资源文章推送

Copyright 2014-2026 https://www.php.cn/ All Rights Reserved | php.cn | 湘ICP备2023035733号