当前位置：首页 > 面试题库 >

Java的HTML / XML解析器

阎弘

2023-03-14

问题内容：

什么HTML解析器具有以下功能：

快速
线程安全
可靠且无错误
解析HTML和XML
处理错误的HTML
有一个DOM实现
支持HTML4，JavaScript和CSS标签
相对简单的面向对象的API

您认为哪种解析器更好？

谢谢。

问题答案：

ApacheTika是最佳选择。Apache最近从现有项目中提取了许多子项目并将其公开。提卡（Tika）是其中之一，以前是Apache
Lucene的组件。由于Apache的支持和声誉以及广泛使用的父项目Lucene，它肯定是一个很好的选择。此外，它是开源的。

Apache Tika网站的简要介绍：

Apache Tika™工具箱使用现有的解析器库从各种文档中检测并提取元数据和结构化文本内容。

支持的格式有：

HyperText Markup Language
XML and derived formats
Microsoft Office document formats
OpenDocument Format
Portable Document Format
Electronic Publication Format
Rich Text Format
Compression and packaging formats
Text formats
Audio formats
Image formats
Video formats
Java class files and archives
The mbox format

类似资料：

Java XML解析器

主要内容：什么是 XML 解析器？XML 解析是指通过 XML 文档来访问或修改数据。什么是 XML 解析器？ XML 解析器提供了一种访问或修改 XML 文档中数据的方法。Java 提供了多种选项来解析 XML 文档。以下是常用于解析 XML 文档的各种类型的解析器。 Dom解析器：通过加载文档的完整内容并在内存中创建其完整的层次树来解析 XML 文档。 SAX解析器：在基于事件的触发器上解析 XML 文档。不将完整的文
Java HTML解析

问题内容：我正在开发一个从网站上抓取数据的应用程序，我想知道应该如何获取数据。具体来说，我需要包含在使用特定CSS类的许多div标签中的数据-目前（出于测试目的）我只是在检查在HTML的每一行中-都可以，但是我不禁感到有更好的解决方案。有什么好方法可以给类添加一行HTML并提供一些好方法，例如：问题答案： “ JTidy是HTML Tidy的Java端口，HTML Tidy是HTML语法检
Java DOM4J解析器解析XML文档

主要内容：Java DOM4J解析器解析XML文档的步骤,Java DOM4J解析器解析XML文档的示例Java DOM4J解析器解析XML文档的步骤以下是使用 DOM4J Parser 解析文档时使用的步骤。导入与 XML 相关的包。创建一个 SAXReader。从文件或流创建文档。通过调用 document.selectNodes() 使用 XPath 表达式获取所需的节点提取根元素。迭代节点列表。检查属性。检查子元素。导入 XML 相关的包创建一个文档生成器从
Java XPath解析器解析XML文档

主要内容：Java XPath解析器解析XML文档的步骤,Java XPath解析器解析XML文档的示例Java XPath解析器解析XML文档的步骤以下是使用 XPath Parser 解析文档时使用的步骤。导入与 XML 相关的包。创建一个文档生成器。从文件或流创建文档。创建一个 Xpath 对象和一个 XPath 路径表达式。使用XPath.compile()编译 XPath 表达式，并通过XPath.evaluate()评估编译的表达式来获取节点列表。迭代节点列表。
Java StAX解析器解析XML文档

主要内容：Java StAX解析器解析XML文档的示例Java StAX解析器解析XML文档的示例需要解析的文件input.xml 编写Java StAX解析器解析XML文档的程序输出结果为：
Java JDOM解析器解析XML文档

主要内容：Java JDOM解析器解析XML文档的步骤,Java JDOM解析器解析XML文档的示例Java JDOM解析器解析XML文档的步骤以下是使用 JDOM解析器解析文档时使用的步骤。导入与 XML 相关的包。创建一个文档生成器。从文件或流创建文档提取根元素检查属性检查子元素导入 XML 相关的包创建一个文档生成器从文件或流创建文档提取根元素检查属性检查子元素 Java JDOM解析器解析XML文档的示例 input.xml文件： JDomParser

相关阅读

Java如何使用SAX解析器解析XML Java 如何使用SAX解析器解析XML 大型文件的Java XML解析器 JavaScript的XML解析器使用dom java解析xml

相关文章

Java SAX解析器解析XML文档 Java DOM解析器解析XML文档 XML 解析器 Java DOM4J解析器修改XML文档 Java DOM4J解析器创建XML文档

相关问答

解析Xml DocumentBuilder Java 解析 JS 生成的 html 元素 PHP xml解析器simplexml_load_string 使用DOMParser解析包含HTML字符串的XML文件 Jackson XML解析MismatchedInputException

相关工具

简单xml解析demo 解析html网页的数据 ini格式解析天气数据解析 html

相关文档

Java XML 中文文档深入解析 Go Tornado 源码解析深度解析 ECMAScript 6 HTML 宝典