Java StAX Parser(Java StAX Parser)
StAX是一个基于Java的API,用于以与SAX解析器类似的方式解析XML文档。 但这两个API有两个主要区别 -
StAX是一个PULL API,而SAX是一个PUSH API。 这意味着在StAX解析器的情况下,客户端应用程序需要要求StAX解析器在需要时从XML获取信息。 但是在SAX解析器的情况下,当SAX解析器通知客户端应用程序信息可用时,需要客户端应用程序来获取信息。
StAX API可以读取和写入XML文档。 使用SAX API,只能读取XML文件。
环境设置 (Environment Setup)
为了使用StAX解析器,您应该在应用程序的类路径中使用stax.jar。
以下是StAX API的功能 -
从上到下读取XML文档,识别构成格式良好的XML文档的标记。
令牌的处理顺序与它们在文档中出现的顺序相同。
向应用程序报告解析器在发生时遇到的令牌的性质。
应用程序提供了一个“事件”读取器,它充当迭代器并迭代事件以获取所需信息。 另一个可用的读者是“cursor”,它充当指向XML节点的指针。
在识别事件时,可以从事件对象中检索XML元素,并可以进一步处理。
什么时候使用? (When to Use?)
你应该使用StAX解析器 -
您可以从上到下以线性方式处理XML文档。
该文档没有深层嵌套。
您正在处理一个非常大的XML文档,其DOM树将消耗太多内存。 典型的DOM实现使用10个字节的内存来表示XML的一个字节。
要解决的问题仅涉及XML文档的一部分。
解析器一看到数据就会立即可用,因此StAX适用于通过流到达的XML文档。
SAX的缺点
我们没有随机访问XML文档,因为它是以只进的方式处理的。
如果您需要跟踪解析器已经看到的数据或解析器更改项目顺序的位置,那么您必须编写代码并将数据存储在您自己的位置。
XMLEventReader类
此类提供事件的迭代器,可用于在解析XML文档时对事件进行迭代。
StartElement asStartElement() - 用于检索元素的值和属性。
EndElement asEndElement() - 在元素的末尾调用。
Characters asCharacters() - 可用于获取CDATA,空格等字符。
XMLEventWriter类
此接口指定用于创建事件的方法。
add(Event event) - 将包含元素的add(Event event)添加到XML。
XMLStreamReader类
此类提供事件的迭代器,可用于在解析XML文档时对事件进行迭代。
int next() - 用于检索下一个事件。
boolean hasNext() - 用于检查是否存在其他事件。
String getText() - 用于获取元素的文本。
String getLocalName() - 用于获取元素的名称。
XMLStreamWriter类
此接口指定用于创建事件的方法。
writeStartElement(String localName) - 添加给定名称的start元素。
writeEndElement(String localName) - 添加给定名称的结束元素。
writeAttribute(String localName, String value) - 将属性写入元素。