我有下一个html,我想解析它:
My input:
<div>
<span id="x1x1"> bla bla </span>
</div>
<span>
<div> bla bla </div>
</span>
My output in java:
jaxbContext = JAXBContext.newInstance(Div.class);
Unmarshaller jaxbUnmarshaller = jaxbContext.createUnmarshaller();
jaxbUnmarshaller.unmarshal(file);
System.out.println("id " + div1.getSpan().get(0).get(id) + "value " + div1.getSpan().get(0).get(id))
// should print: id = x1x1 value = bla bla
我有下一节课:
public class Span
List<Div> div;
public List<Div> getDiv() {
return div;
}
@XmlElement
public void setDiv(List<Div> div) {
for (int i = 0 ; i<div.size(); i++){
System.out.print("element")}
this.div = div;
}
和:
public class Div
List<Span> span = div1.get
@XmlElement
public void setSpan(List<Span> span) {
for (int i = 0 ; i<span.size(); i++){
System.out.print("element")}
this.span = span;
}
public List<Button> getSpan() {
return span;
}
现在,我还需要跨度的值(“bla-bla”)。因此,我将添加到类Span
中:
String value;
public String getValue() {
return value;
}
@XmlValue
public void setValue(String value) {
this.value = value;
}
位它给了我下一个错误:
If a class has '@XmlElement' property, it cannot have '@XmlValue' property.
我尝试使用@XMLMixed,但是没有成功。我会很高兴,例如代码的例子。谢了。
通常,需要用JAXB绑定的XML文档没有内容的XSD,但是如果您有XSD,有一些很棒的工具可以自动完成这项工作。这是我用来快速填补这一空白并获得高质量绑定代码的过程。希望这有助于回答这个问题,并为这类问题提供一个通用的解决方案。
这是我用来为这段随机的XML创建代码的过程:
整个过程花了我不到5分钟的时间,预装了工具,并产生了高质量的结果。这是一个非常简单的例子,但是示例XML文档的复杂性很容易上升,而不会增加过程时间或降低质量。
示例文档是此过程中最重要的部分。对于更复杂的结构,您可能需要多个文档来捕获所需的信息,但我们将坚持使用单个文档案例。我们可以通过将提供的输入包装在
<div>
<div>
<span id="x1x1"> bla bla </span>
</div>
<span>
<div> bla bla </div>
</span>
</div>
这个例子演示了
注意:此HTML片段无效,因为块级元素不能嵌套在内联元素中。“现成的”模式以及由此生成的代码可能会阻塞此输入。
这是这个过程中的巫毒步骤。手工创建XSD会带来大量工作和出错的可能性。如果没有自动化的过程,你还不如放弃生成器的复杂性,手工编码注释。幸运的是,有一个名为Trang的工具可以填补这一空白。
Trang可以做很多事情,但它擅长的一项任务是从XML文档生成XSD。对于简单的结构,它可以完全处理这一步。对于更复杂的输入,它可以帮助您完成大部分工作。
董里可从 Maven Central 在此向量处获得:
<dependency>
<groupId>com.thaiopensource</groupId>
<artifactId>trang</artifactId>
<version>20091111</version>
</dependency>
您可以下载并转换
示例。使用以下命令的xml
文档:
wget http://repo1.maven.org/maven2/com/thaiopensource/trang/20091111/trang-20091111.jar
java -jar trang-20091111.jar example.xml example.xsd
这将生成
example.xsd
:
<?xml version="1.0" encoding="UTF-8"?>
<xs:schema xmlns:xs="http://www.w3.org/2001/XMLSchema" elementFormDefault="qualified">
<xs:element name="div">
<xs:complexType mixed="true">
<xs:choice minOccurs="0" maxOccurs="unbounded">
<xs:element ref="div"/>
<xs:element ref="span"/>
</xs:choice>
</xs:complexType>
</xs:element>
<xs:element name="span">
<xs:complexType mixed="true">
<xs:sequence>
<xs:element minOccurs="0" maxOccurs="unbounded" ref="div"/>
</xs:sequence>
<xs:attribute name="id" type="xs:NCName"/>
</xs:complexType>
</xs:element>
</xs:schema>
对于简单的文档,通常只需要这么多。对于更复杂的结构,您可能需要稍微编辑一下这个文件,但是至少您有一个工作的XSD作为起点。
的代码:现在我们有了一个XSD,我们可以利用XJC工具并生成我们正在寻找的绑定代码。要运行XJC,给它传递一个XSD、您想要创建的包和一个src目录。这两个命令将在名为< code>example
的包中生成< code>example.xsd
mkdir src
xjc -d src -p example example.xsd
现在,您将在src
目录中拥有以下文件:
src/example/Div.java
src/example/ObjectFactory.java
src/example/Span.java
我已经在本文末尾包含了文件的内容,但这是我们感兴趣的部分,来自Span.java
:
@XmlElementRefs({
@XmlElementRef(name = "div", type = Div.class),
@XmlElementRef(name = "span", type = Span.class)
})
@XmlMixed
protected List<Object> content;
虽然手动编码注释可以工作,但自动创建这些文件可以节省时间并提高质量。它还使您可以访问可用于XJC工具的所有插件。
示例/Div.java:
//
// This file was generated by the JavaTM Architecture for XML Binding(JAXB) Reference Implementation, vJAXB 2.1.10 in JDK 6
// See <a href="http://java.sun.com/xml/jaxb">http://java.sun.com/xml/jaxb</a>
// Any modifications to this file will be lost upon recompilation of the source schema.
// Generated on: 2013.03.22 at 01:15:22 PM MST
//
package example;
import java.util.ArrayList;
import java.util.List;
import javax.xml.bind.annotation.XmlAccessType;
import javax.xml.bind.annotation.XmlAccessorType;
import javax.xml.bind.annotation.XmlElementRef;
import javax.xml.bind.annotation.XmlElementRefs;
import javax.xml.bind.annotation.XmlMixed;
import javax.xml.bind.annotation.XmlRootElement;
import javax.xml.bind.annotation.XmlType;
/**
* <p>Java class for anonymous complex type.
*
* <p>The following schema fragment specifies the expected content contained within this class.
*
* <pre>
* <complexType>
* <complexContent>
* <restriction base="{http://www.w3.org/2001/XMLSchema}anyType">
* <choice maxOccurs="unbounded" minOccurs="0">
* <element ref="{}div"/>
* <element ref="{}span"/>
* </choice>
* </restriction>
* </complexContent>
* </complexType>
* </pre>
*
*
*/
@XmlAccessorType(XmlAccessType.FIELD)
@XmlType(name = "", propOrder = {
"content"
})
@XmlRootElement(name = "div")
public class Div {
@XmlElementRefs({
@XmlElementRef(name = "div", type = Div.class),
@XmlElementRef(name = "span", type = Span.class)
})
@XmlMixed
protected List<Object> content;
/**
* Gets the value of the content property.
*
* <p>
* This accessor method returns a reference to the live list,
* not a snapshot. Therefore any modification you make to the
* returned list will be present inside the JAXB object.
* This is why there is not a <CODE>set</CODE> method for the content property.
*
* <p>
* For example, to add a new item, do as follows:
* <pre>
* getContent().add(newItem);
* </pre>
*
*
* <p>
* Objects of the following type(s) are allowed in the list
* {@link Div }
* {@link String }
* {@link Span }
*
*
*/
public List<Object> getContent() {
if (content == null) {
content = new ArrayList<Object>();
}
return this.content;
}
}
example/Span.java
//
// This file was generated by the JavaTM Architecture for XML Binding(JAXB) Reference Implementation, vJAXB 2.1.10 in JDK 6
// See <a href="http://java.sun.com/xml/jaxb">http://java.sun.com/xml/jaxb</a>
// Any modifications to this file will be lost upon recompilation of the source schema.
// Generated on: 2013.03.22 at 01:15:22 PM MST
//
package example;
import java.util.ArrayList;
import java.util.List;
import javax.xml.bind.annotation.XmlAccessType;
import javax.xml.bind.annotation.XmlAccessorType;
import javax.xml.bind.annotation.XmlAttribute;
import javax.xml.bind.annotation.XmlElementRef;
import javax.xml.bind.annotation.XmlMixed;
import javax.xml.bind.annotation.XmlRootElement;
import javax.xml.bind.annotation.XmlSchemaType;
import javax.xml.bind.annotation.XmlType;
import javax.xml.bind.annotation.adapters.CollapsedStringAdapter;
import javax.xml.bind.annotation.adapters.XmlJavaTypeAdapter;
/**
* <p>Java class for anonymous complex type.
*
* <p>The following schema fragment specifies the expected content contained within this class.
*
* <pre>
* <complexType>
* <complexContent>
* <restriction base="{http://www.w3.org/2001/XMLSchema}anyType">
* <sequence>
* <element ref="{}div" maxOccurs="unbounded" minOccurs="0"/>
* </sequence>
* <attribute name="id" type="{http://www.w3.org/2001/XMLSchema}NCName" />
* </restriction>
* </complexContent>
* </complexType>
* </pre>
*
*
*/
@XmlAccessorType(XmlAccessType.FIELD)
@XmlType(name = "", propOrder = {
"content"
})
@XmlRootElement(name = "span")
public class Span {
@XmlElementRef(name = "div", type = Div.class)
@XmlMixed
protected List<Object> content;
@XmlAttribute
@XmlJavaTypeAdapter(CollapsedStringAdapter.class)
@XmlSchemaType(name = "NCName")
protected String id;
/**
* Gets the value of the content property.
*
* <p>
* This accessor method returns a reference to the live list,
* not a snapshot. Therefore any modification you make to the
* returned list will be present inside the JAXB object.
* This is why there is not a <CODE>set</CODE> method for the content property.
*
* <p>
* For example, to add a new item, do as follows:
* <pre>
* getContent().add(newItem);
* </pre>
*
*
* <p>
* Objects of the following type(s) are allowed in the list
* {@link Div }
* {@link String }
*
*
*/
public List<Object> getContent() {
if (content == null) {
content = new ArrayList<Object>();
}
return this.content;
}
/**
* Gets the value of the id property.
*
* @return
* possible object is
* {@link String }
*
*/
public String getId() {
return id;
}
/**
* Sets the value of the id property.
*
* @param value
* allowed object is
* {@link String }
*
*/
public void setId(String value) {
this.id = value;
}
}
示例/ObjectFactory.java
//
// This file was generated by the JavaTM Architecture for XML Binding(JAXB) Reference Implementation, vJAXB 2.1.10 in JDK 6
// See <a href="http://java.sun.com/xml/jaxb">http://java.sun.com/xml/jaxb</a>
// Any modifications to this file will be lost upon recompilation of the source schema.
// Generated on: 2013.03.22 at 01:15:22 PM MST
//
package example;
import javax.xml.bind.annotation.XmlRegistry;
/**
* This object contains factory methods for each
* Java content interface and Java element interface
* generated in the example package.
* <p>An ObjectFactory allows you to programatically
* construct new instances of the Java representation
* for XML content. The Java representation of XML
* content can consist of schema derived interfaces
* and classes representing the binding of schema
* type definitions, element declarations and model
* groups. Factory methods for each of these are
* provided in this class.
*
*/
@XmlRegistry
public class ObjectFactory {
/**
* Create a new ObjectFactory that can be used to create new instances of schema derived classes for package: example
*
*/
public ObjectFactory() {
}
/**
* Create an instance of {@link Div }
*
*/
public Div createDiv() {
return new Div();
}
/**
* Create an instance of {@link Span }
*
*/
public Span createSpan() {
return new Span();
}
}
更新
任何可以同时包含文本和元素的子注释的元素都被称为具有混合内容。在JAXB中,这对应于@XmlMixed
注释@XmlMixed
可以单独用于集合属性(请参阅ORIGINAL ANSWER),也可以与@XmlAnyElement@XmlElementRef
或@Xml ElementRefs
结合使用。如果元素可以是您要使用的任何元素@XmlAnyElement
,如果它是一个已知元素,您将使用@XmlElementRef
跨度
如果同一 span 元素中同时存在文本和
div
元素,则可以通过使用@XmlElementRef
和@XmlMixed
来注释属性来执行以下操作。在@XmlElementRef
注释上指定的元素名称必须直接与为目标类指定的根元素相对应。
@XmlRootElement
public class Span {
List<Object> items = new ArrayList<Object>();
@XmlMixed
@XmlElementRef(type=Div.class, name="div")
public List<Object> getItems() {
return items;
}
public void setItems(List<Object> mixed) {
this.items = items;
}
}
差异
Div
的元数据几乎与为 Span
指定的元数据相同。
@XmlRootElement
public class Div {
List<Object> items = new ArrayList<Object>();
@XmlElementRef(name="span", type=Span.class)
@XmlMixed
public List<Object> getItems() {
return items;
}
public void setItems(List<Object> items) {
this.items = items;
}
}
演示
public class Demo {
public static void main(String[] args) throws Exception {
JAXBContext jc = JAXBContext.newInstance(Span.class);
Unmarshaller unmarshaller = jc.createUnmarshaller();
Span span = (Span) unmarshaller.unmarshal(new StringReader("<span>Text<div>Text2</div>Text3</span>"));
System.out.println(span.getItems());
Marshaller marshaller = jc.createMarshaller();
marshaller.setProperty(Marshaller.JAXB_FORMATTED_OUTPUT, true);
marshaller.marshal(span, System.out);
}
}
输出
[Text, forum15495156.Div@289f6ae, Text3]
<?xml version="1.0" encoding="UTF-8" standalone="yes"?>
<span>Text<div>Text2</div>Text3</span>
原始答案
您可以添加
列表
跨度
import java.util.List;
import javax.xml.bind.annotation.*;
@XmlRootElement
public class Span {
List<Div> div;
List<String> mixed;
@XmlMixed
public List<String> getMixed() {
return mixed;
}
public void setMixed(List<String> mixed) {
this.mixed = mixed;
}
public List<Div> getDiv() {
return div;
}
@XmlElement
public void setDiv(List<Div> div) {
for (int i = 0; i < div.size(); i++) {
System.out.print("element");
}
this.div = div;
}
}
演示
import java.io.StringReader;
import javax.xml.bind.*;
public class Demo {
public static void main(String[] args) throws Exception {
JAXBContext jc = JAXBContext.newInstance(Span.class);
Unmarshaller unmarshaller = jc.createUnmarshaller();
Span span1 = (Span) unmarshaller.unmarshal(new StringReader("<span>bla bla bla</span>"));
System.out.println(span1.getMixed());
Span span2 = (Span) unmarshaller.unmarshal(new StringReader("<span><div/><div/></span>"));
System.out.println(span2.getDiv());
}
}
输出
[bla bla bla]
elementelement[forum15495156.Div@1f80ce47, forum15495156.Div@4166a779]
问题内容: 我有下一个html,我想解析: 我下一堂课: 和: 现在,我还需要span的值(“ bla bla”)。所以我添加到类中: 有点给我下一个错误: 我尝试使用@XMLMixed,但没有成功。我会很高兴例如代码示例。谢谢。 问题答案: 更新 可以同时具有文本和元素的子注释的任何元素都称为混合内容。在JAXB中,这对应于注释。 可以在自家的集合属性使用(见原来的答复),或组合,或。如果该元素
问题内容: 只是对jaxb的工作方式感到好奇,我有一个注释如下的类: 字段str的访问修饰符受到保护,为什么Jaxb仍然可以编组和解组它? 问题答案: 它使用反射。甲或字段或方法可以使用反射API(使用访问在相应的或对象)。 请记住- ,并且是 默认可见性的 控件,仅此而已。它们不(也不能)使用反射阻止访问。
我正在尝试使用JAXB从遗留系统中解压XML文档。我的xml结构如下所示:
constants.xml_path=“/acquirer.xml”;
我需要在Java中生成xsd文件,该文件使用jaxb maven插件(http://mojo.codehaus.org/jaxb2-maven-plugin/xjc-mojo.html)将生成如下所示的XML: 我不想编辑jaxb自动生成的类或类似的东西。 类似的题目我已经查过了,还没有找到解决的办法。 提前道谢。
Overview JAXB的非官方文档: http://jaxb.java.net/guide/ SpringSide-Core中的JaxbMapper Jaxb中最讨厌的地方,是需要在构造JAXBContext时,预先设定可能会处理的Root Element Types。 Springside参考Spring里的做法,封装类一个静态的Map,为每一个Class维护了一个JaxbContext,这