Java StAX 解析器 - 查询 XML 文档



Java StAX 解析器是一个 Java API,用于解析 XML 文档并查询所需信息。此 API 基于事件,因此我们无需加载整个 XML 文档即可查询它。当解析器识别每个事件时,只有当客户端程序实现该事件时才会执行相应的操作。

在本章中,我们将学习如何查询 XML 文档以获取所需信息。

使用 Java StAX 解析器查询 XML

以下是使用 Java StAX 解析器查询 XML 文档需要遵循的步骤:

  • 步骤 1:创建 XMLInputFactory 实例
  • 步骤 2:读取 XML
  • 步骤 3:解析 XML
  • 步骤 4:查询元素

有关前三个步骤,请参考本章

步骤 4:查询元素

完成前三个步骤后,我们拥有 XMLEventReader 来从 XML 文档获取事件。通过使用各种事件并实现它们,我们可以查询 XML 文档。让我们详细了解如何做到这一点。

按文本内容查询元素

我们可以使用getData()方法获取 XML 文档中任何元素的文本内容。Characters 接口的此方法以字符串的形式返回当前事件的字符数据。使用此方法,我们可以查询所有元素以查找所需的文本内容。

示例

下面显示的cars.xml文件包含许多具有不同文本内容的carname元素。让我们查询此文件以查看是否存在“Bentley 2”汽车。

<?xml version = "1.0"?>
<cars>
      <carname company="Ferarri" >Ferarri 101</carname>
      <carname company="Lamborgini">Lamborgini 001</carname>
      <carname company="Lamborgini">Lamborgini 002</carname>
      <carname company="Lamborgini">Lamborgini 003</carname>
      <carname company="Bentley">Bentley 1</carname>
      <carname company="Bentley">Bentley 2</carname>
      <carname company="Bentley">Bentley 3</carname>
</cars>

以下QueryTextContent.java程序使用 FileReader 对象读取 cars.xml 文件。当遇到 CHARACTERS 事件类型时,getData() 方法用于获取文本内容。如果该数据等于“Bentley 2”,那么我们将更新 'found' 布尔变量。在 END_DOCUMENT 事件中,我们将其打印到控制台。

import java.io.FileReader;
import javax.xml.stream.XMLEventReader;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamConstants;
import javax.xml.stream.events.Characters;
import javax.xml.stream.events.XMLEvent;

public class QueryTextContent {
   public static void main(String args[]) {
      try {
    	  
         //Creating XMLInputFactory instance
     	 XMLInputFactory factory = XMLInputFactory.newInstance();
     	 
     	 //Reading the XML
     	 FileReader fileReader = new FileReader("cars.xml");
     	 
     	 //Parsing the XML
         XMLEventReader eventReader =
          factory.createXMLEventReader(fileReader);
         
         //Querying the XML
         boolean found=false;
         while(eventReader.hasNext()) {
        	 XMLEvent event = eventReader.nextEvent();
        	 if(event.getEventType()==XMLStreamConstants.CHARACTERS) {
              Characters characters = event.asCharacters();
              String textContent = characters.getData();
              if(textContent.equals("Bentley 2"))
              	  found=true;
             }
        	 if(event.getEventType()==XMLStreamConstants.END_DOCUMENT) {
        		 if(found) 
        		    System.out.println("Bentley 2 car is found");
        		 else
        			System.out.println("Bentley 2 car is not found");
        	 }
         }
          
      } catch(Exception e) {
		   e.printStackTrace();
      }
   }
}

输出

由于 cars.xml 文件中存在 Bentley 2 汽车,因此它会打印已找到。

Bentley 2 car is found

按属性查询元素

Element 接口的getAttributeByName()方法接受 QName 对象(即属性的限定 XML 名称)并返回 Attribute 对象。此外,Attribute 接口的getValue()方法用于以字符串的形式获取属性的值。

示例 1

我们在前一个示例中使用的 cars.xml 文件在以下QueryAttributes.java程序中被解析,以计算 XML 文件中存在的 Bentley 汽车数量。每次 carname 元素的 company 属性等于 Bentley 时,计数器变量都会递增。

import java.io.FileReader;
import javax.xml.namespace.QName;
import javax.xml.stream.XMLEventReader;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamConstants;
import javax.xml.stream.events.Attribute;
import javax.xml.stream.events.StartElement;
import javax.xml.stream.events.XMLEvent;

public class QueryExample2 {
   public static void main(String args[]) {
      try {
    	  
         //Creating XMLInputFactory instance
      	 XMLInputFactory factory = XMLInputFactory.newInstance();
      	 
      	 //Reading the XML
      	 FileReader fileReader = new FileReader("cars.xml");
      	 
      	 //Parsing the XML
         XMLEventReader eventReader =
           factory.createXMLEventReader(fileReader);
         
          //Querying the XML document
          int count=0;
          while(eventReader.hasNext()) {
        	  XMLEvent event = eventReader.nextEvent();
        	  if(event.getEventType()==XMLStreamConstants.START_ELEMENT) {
              	StartElement element=event.asStartElement();
              	QName qname=new QName("company");
                Attribute attr=element.getAttributeByName(qname);
                if(attr!=null && attr.getValue().equals("Bentley"))
                   count++;
              }
          }
          System.out.println("No.of Bentley cars found : " + count);          
	  } catch(Exception e) {
		   e.printStackTrace();
      }
   }
}

显示 XML 文件中 Bentley 汽车的数量。

No.of Bentley cars found : 3

示例 2

在这个例子中,我们将根据学生的学号检索特定学生的信息。这是我们需要查询的student.xml文件:

<?xml version = "1.0"?>
<class>
   <student rollno = "393">
      <firstname>dinkar</firstname>
      <lastname>kad</lastname>
      <nickname>dinkar</nickname>
      <marks>85</marks>
   </student>
   
   <student rollno = "493">
      <firstname>Vaneet</firstname>
      <lastname>Gupta</lastname>
      <nickname>vinni</nickname>
      <marks>95</marks>
   </student>
   
   <student rollno = "593">
      <firstname>jasvir</firstname>
      <lastname>singn</lastname>
      <nickname>jazz</nickname>
      <marks>90</marks>
   </student>
</class>

在下面的QueryStudent.java程序中,我们检查了 START_ELEMENT、CHARACTERS 和 END_ELEMENT 事件,并相应地执行了操作。当学号属性等于 393 时,我们将打印学生的全部信息。

import java.io.FileReader;
import java.util.Iterator;
import javax.xml.stream.XMLEventReader;
import javax.xml.stream.XMLInputFactory;
import javax.xml.stream.XMLStreamConstants;
import javax.xml.stream.events.Attribute;
import javax.xml.stream.events.Characters;
import javax.xml.stream.events.EndElement;
import javax.xml.stream.events.StartElement;
import javax.xml.stream.events.XMLEvent;

public class QueryStudent {
   public static void main(String[] args) {
      boolean bFirstName = false;
      boolean bLastName = false;
      boolean bNickName = false;
      boolean bMarks = false;
      boolean isRequestRollNo = false;
      
      try {
    	  
    	 //Creating XMLInputFactory instance
       	 XMLInputFactory factory = XMLInputFactory.newInstance();
       	 
       	 //Reading the XML
       	 FileReader fileReader = new FileReader("student.xml");
       	 
       	 //Parsing the XML
         XMLEventReader eventReader =
            factory.createXMLEventReader(fileReader);
         
    	 //Querying the XML 
         String requestedRollNo = "393";
         while(eventReader.hasNext()) {
            XMLEvent event = eventReader.nextEvent();
            
            switch(event.getEventType()) {
               case XMLStreamConstants.START_ELEMENT:
                  StartElement startElement = event.asStartElement();
                  String qName = startElement.getName().getLocalPart();
                  
               if (qName.equalsIgnoreCase("student")) {
                  Iterator<Attribute> attributes = startElement.getAttributes();
                  String rollNo = attributes.next().getValue();
                     
                  if(rollNo.equalsIgnoreCase(requestedRollNo)) {
                     System.out.println("Start Element : student");
                     System.out.println("Roll No : " + rollNo);
                     isRequestRollNo = true;
                  }
               } else if (qName.equalsIgnoreCase("firstname")) {
                  bFirstName = true;
               } else if (qName.equalsIgnoreCase("lastname")) {
                  bLastName = true;
               } else if (qName.equalsIgnoreCase("nickname")) {
                  bNickName = true;
               }
               else if (qName.equalsIgnoreCase("marks")) {
                  bMarks = true;
               }
               break;
               
               case XMLStreamConstants.CHARACTERS:
                  Characters characters = event.asCharacters();
               
               if(bFirstName && isRequestRollNo) {
                  System.out.println("First Name: " + characters.getData());
                  bFirstName = false;
               }
               if(bLastName && isRequestRollNo) {
                  System.out.println("Last Name: " + characters.getData());
                  bLastName = false;
               }
               if(bNickName && isRequestRollNo) {
                  System.out.println("Nick Name: " + characters.getData());
                  bNickName = false;
               }
               if(bMarks && isRequestRollNo) {
                  System.out.println("Marks: " + characters.getData());
                  bMarks = false;
               }
               break;
               
               case XMLStreamConstants.END_ELEMENT:
                  EndElement endElement = event.asEndElement();
                  
               if(endElement.getName().getLocalPart().equalsIgnoreCase(
                  "student") && isRequestRollNo) {
                  System.out.println("End Element : student");
                  System.out.println();
                  isRequestRollNo = false;
               }
               break;
            }
         }
      } catch (Exception e) {
         e.printStackTrace();
      }
   }
}

显示学号为 393 的学生的全部信息。

Start Element : student
Roll No : 393
First Name: dinkar
Last Name: kad
Nick Name: dinkar
Marks: 85
End Element : student
广告