我正在搜索Java库以解析XML(复杂的配置和数据文件),我用Google搜索了一下,但除了dom4j之外都找不到(似乎他们正在V2上工作)。不喜欢它,其他有关XML的Apache项目似乎处于hibernate状态。我还没有独自评估dom4j,只是想知道-Java是否有其他(良好)开源xml解析库?您对dom4j的体验如何?
在@Voo回答之后,让我再问一个-我应该使用Java的内置类还是诸如dom4j之类的任何第三方库。优点是什么?
实际上,Java支持4种开箱即用地解析XML的方法:
DOM解析器/构建器:整个XML结构都已加载到内存中,你可以使用众所周知的DOM方法进行处理。DOM还允许你使用Xslt转换来写文档。例:
public static void parse() throws ParserConfigurationException, IOException, SAXException {
DocumentBuilderFactory factory = DocumentBuilderFactory.newInstance();
factory.setValidating(true);
factory.setIgnoringElementContentWhitespace(true);
DocumentBuilder builder = factory.newDocumentBuilder();
File file = new File("test.xml");
Document doc = builder.parse(file);
// Do something with the document here.
}
SAX Parser:仅读取XML文档。Sax解析器贯穿文档并调用用户的回调方法。存在用于文档的开始/结束,元素等的方法。它们是在org.xml.sax.ContentHandler中定义的,并且有一个空的帮助程序类DefaultHandler。
public static void parse() throws ParserConfigurationException, SAXException {
SAXParserFactory factory = SAXParserFactory.newInstance();
factory.setValidating(true);
SAXParser saxParser = factory.newSAXParser();
File file = new File("test.xml");
saxParser.parse(file, new ElementHandler()); // specify handler
}
StAx读取器/写入器:与面向数据流的接口一起使用。程序会在准备好时要求下一个元素,就像游标/迭代器一样。你也可以使用它创建文档。阅读文件:
public static void parse() throws XMLStreamException, IOException {
try (FileInputStream fis = new FileInputStream("test.xml")) {
XMLInputFactory xmlInFact = XMLInputFactory.newInstance();
XMLStreamReader reader = xmlInFact.createXMLStreamReader(fis);
while(reader.hasNext()) {
reader.next(); // do something here
}
}
}
撰写文件:
public static void parse() throws XMLStreamException, IOException {
try (FileOutputStream fos = new FileOutputStream("test.xml")){
XMLOutputFactory xmlOutFact = XMLOutputFactory.newInstance();
XMLStreamWriter writer = xmlOutFact.createXMLStreamWriter(fos);
writer.writeStartDocument();
writer.writeStartElement("test");
// write stuff
writer.writeEndElement();
}
}
JAXB:读取XML文档的最新实现:是v2中Java 6的一部分。这使我们可以序列化文档中的Java对象。你使用一个实现了javax.xml.bind.Unmarshaller的接口的类来阅读文档(你可以从JAXBContext.newInstance中获得一个用于该类的类)。必须使用使用的类来初始化上下文,但是你只需要指定根类,而不必担心静态引用的类。你可以使用注释来指定哪些类应该是元素(@XmlRootElement),哪些字段应该是元素(@XmlElement)或属性(@XmlAttribute,这真是个惊喜!)
public static void parse() throws JAXBException, IOException {
try (FileInputStream adrFile = new FileInputStream("test")) {
JAXBContext ctx = JAXBContext.newInstance(RootElementClass.class);
Unmarshaller um = ctx.createUnmarshaller();
RootElementClass rootElement = (RootElementClass) um.unmarshal(adrFile);
}
}
撰写文件:
public static void parse(RootElementClass out) throws IOException, JAXBException {
try (FileOutputStream adrFile = new FileOutputStream("test.xml")) {
JAXBContext ctx = JAXBContext.newInstance(RootElementClass.class);
Marshaller ma = ctx.createMarshaller();
ma.marshal(out, adrFile);
}
}
从一些旧的演讲幻灯片中无耻地复制了示例;-)
编辑:关于“我应该使用哪个API?”。好吧,这取决于-并非所有API都具有与你看到的功能相同的功能,但是如果你可以控制用于映射XML文档的类,那么JAXB是我个人最喜欢的,非常优雅和简单的解决方案(尽管我没有将其用于非常大的文档,可能会有点复杂)。SAX也非常易于使用,如果你没有充分的理由使用它,那就不要使用DOM-我认为旧的,笨拙的API。我认为没有任何现代的第三方库具有STL所缺少的任何特别有用的功能,并且标准库具有通常的优点,即它们经过了严格的测试,记录和稳定。
问题内容: 我需要阅读较小的XML文件(最多只有几MB,UTF-8编码),四处寻找各种元素和属性,也许要修改一些并将XML重新写回磁盘(最好采用缩进格式) 。 什么是满足我需求的最佳XML解析器?有很多可供选择。我知道的一些是: JDOM Woodstox XOM dom4j VTD-XML Xerces-J Crimson 当然是JDK中的那个(我正在使用Java 6)。我对Xerces很熟悉,
问题内容: 我以前使用过XML Parser,尽管它工作正常,但总体上我并不满意,感觉好像我在使用变通办法来处理应该是基本功能的事情。 我最近看到了SimpleXML,但还没有尝试过。有没有更简单的方法?两者都有哪些优点和缺点?您使用过其他解析器吗? 问题答案: 我不得不说,SimpleXML是蛋糕,因为它首先是用C编写的扩展,并且非常快。但第二,解析后的文档采用PHP对象的形式。这样您就可以像“
问题内容: 我正在使用解析Java中的字符串。但是,没有直接解析字符串的函数,所以我改为这样做: 这是最好的方法吗?我觉得必须有一个更简单的方法…谢谢! 问题答案: 直接回答您的问题-据我所知,没有更好的方法。使用输入源是因为它比较通用,可以处理来自文件,字符串或跨线的输入,这是我的理解。 您还可以尝试使用SAX Xml解析器- 它稍微有点基础,并且使用了Visitor模式,但是可以完成工作,对于
问题内容: 任务:我有一个使用xml名称空间和xml模式的现有xml文档(UTF-8)。我需要解析到特定元素,将内容(也需要使用xml名称空间前缀)附加到该元素,然后再次写出Document。 哪个是我应该用于此任务的最佳XML解析器库? 我看过以前的线程(Java的最佳XML解析器),但是不确定dom4j或JDOM是否对命名空间/ xmlSchema有用,以及对UTF-8字符的良好支持。 一些解
问题内容: 哪种Java的CLI解析器比其他CLI解析器更易于使用和扩展? 问题答案: 这里是一些最受欢迎的。它们都是非常漂亮的功能,并且使用了前两个,我可以推荐它们。 Commons CLI http://commons.apache.org/cli/ Java宝石 http://code.google.com/p/javagems/ picocli (具有彩色使用帮助和自动完成功能) http
问题内容: 有人可以帮我为什么下面的代码不起作用吗?我正在Xcode.1 Playground中对其进行测试 问题答案: 操场是沙盒,因此您将无法仅从用户文件夹中的任何位置抓取文件。以下是将该文件添加到游乐场以使其可访问的方法: 在Finder中找到您的“ .playground”文件 右键单击并选择“显示包装内容” 您应该看到“ timeline.xctimeline”,“ contents.x