Apache Xerces - DOM 解析器概述



文档对象模型 (DOM) 是万维网联盟 (W3C) 的官方推荐。它定义了一个接口,使程序能够访问和更新 XML 文档的样式、结构和内容。支持 DOM 的 XML 解析器实现了该接口。

何时使用?

在以下情况下,您应该使用 DOM 解析器:

  • 您需要了解文档的很多结构信息。

  • 您需要移动文档的部分内容(例如,您可能需要对某些元素进行排序)。

  • 您需要多次使用文档中的信息。

您得到什么?

当您使用 DOM 解析器解析 XML 文档时,您将得到一个树状结构,其中包含文档的所有元素。DOM 提供了各种函数,您可以使用这些函数来检查文档的内容和结构。

优点

DOM 是操作文档结构的通用接口。其设计目标之一是,为一个符合 DOM 标准的解析器编写的 Java 代码应该无需修改即可在任何其他符合 DOM 标准的解析器上运行。

DOM 接口

DOM 定义了几个 Java 接口。以下是最常见的接口:

  • Node - DOM 的基本数据类型。

  • Element - 您将处理的大多数对象都是元素。

  • Attr - 代表元素的属性。

  • Text - 元素或属性的实际内容。

  • Document - 代表整个 XML 文档。Document 对象通常被称为 DOM 树。

常用的 DOM 方法

当您使用 DOM 时,有一些方法经常使用:

  • Document.getDocumentElement() - 返回文档的根元素。

  • Node.getFirstChild() - 返回给定节点的第一个子节点。

  • Node.getLastChild() - 返回给定节点的最后一个子节点。

  • Node.getNextSibling() - 此方法返回给定节点的下一个同级节点。

  • Node.getPreviousSibling() - 此方法返回给定节点的上一个同级节点。

  • Node.getAttribute(attrName) - 对于给定的节点,返回具有请求名称的属性。

广告
© . All rights reserved.