当前位置: 首页 > 知识库问答 >
问题:

JAXB 混合内容列表包含换行符

慕承恩
2023-03-14

我希望您能帮助我解决我面临的一个关于JAXB的问题。

我有以下XML文件:

<root>
    <prop>
        <field1>
            <value1>v1</value1>
            <value2>v2</value2>
        </field1>
        <field2>
            <value1>v1</value1>
            <value2>v2</value2>
        </field2>
    </prop>
    <prop>
        text
        <field1>
            <value1>v1</value1>
            <value2>v2</value2>
        </field1>
    </prop>
    <prop>
        text
    </prop>
</root>

XML可以具有适当其他元素(字段1、字段2)、文本或两者。

和以下类:

@XmlAccessorType(XmlAccessType.FIELD)
@XmlRootElement(name = "root")
public class Root {

    protected List<Root.Element> prop;

    @XmlAccessorType(XmlAccessType.FIELD)
    public static class Element {
        @XmlMixed
        protected List<String> content;
        @XmlElement
        public Field1 field1;
        @XmlElement
        public Field2 field2;

        @XmlAccessorType(XmlAccessType.FIELD)
        public static class Field1 {
            @XmlElement
            protected String value1;
            @XmlElement
            protected String value2;
        }

        @XmlAccessorType(XmlAccessType.FIELD)
        public static class Field2 {
            @XmlElement
            protected String value1;
            @XmlElement
            protected String value2;

        }

    }

}

我想将XML解组到上面的类中。我遇到的问题是,在内容列表中,除了文本之外,还有其他字符,如换行符和制表符。更具体地说,基于上面的XML,当我尝试解组时,我得到:

  • 第一个内容为["\n\t\t","\n\t\t","\n\t"]的道具-它应该是一个空列表
  • 第二个道具的内容如["\n\t\ttext\n\t\t","\n\t"]-它应该是一个包含一个字符串的列表
  • 第三个道具的内容如["\n\t\ttext\n\t"]-它应该是一个空列表

我已经尝试创建了一个XMLAdapter,但是它应用于列表中的每个元素,所以如果我删除\n和\t并返回null(如果它是一个空字符串),我仍然会得到一个包含一些字符串和一些null值的列表。

共有1个答案

巢海
2023-03-14

具有混合上下文的元素中的空白内容被视为重要内容。

您可以将 JAXB 与 StAX 结合使用来支持此用例。使用 StAX,您可以创建一个经过筛选的 XMLStream 读取器,以便任何仅包含空格的字符串都不会报告为事件。下面是如何实现它的示例。

import javax.xml.bind.*;
import javax.xml.stream.*;
import javax.xml.transform.stream.StreamSource;

public class Demo {

    public static void main(String[] args) throws Exception {
        JAXBContext jc = JAXBContext.newInstance(Root.class);

        XMLInputFactory xif = XMLInputFactory.newFactory();
        XMLStreamReader xsr = xif.createXMLStreamReader(new StreamSource("src/forum22284324/input.xml"));
        xsr = xif.createFilteredReader(xsr, new StreamFilter() {

            @Override
            public boolean accept(XMLStreamReader reader) {
                if(reader.getEventType() == XMLStreamReader.CHARACTERS) {
                    return reader.getText().trim().length() > 0;
                } 
                return true;
            }

        });

        Unmarshaller unmarshaller = jc.createUnmarshaller();
        Root root = (Root) unmarshaller.unmarshal(xsr);
    }

}
 类似资料:
  • 问题内容: 我希望您能够为我解决有关JAXB的问题提供帮助。 我有以下XML文件: XML可以在属性下包含其他元素(field1,field2),文本或两者。 和以下类: 我想将XML解组到上述类中。我遇到的问题是,在内容列表中,除了文本之外,还有其他字符,例如换行符和制表符。更具体地说,基于上述XML,当我尝试解组时会得到: 内容为[“ \ n \ t \ t”,“ \ n \ t \ t”,“

  • 我正在寻找解决这个问题的方法,已经快三天了。我有一个带有占位符的Word文档。对于如何解析word文档模板并用内容替换占位符,我们有自己的实现。但我遇到了一个问题,段落列表并没有包含word文档中的所有内容。我得到了OpenXmlPartRootElement的所有段落类型的后代。 然后我检查特定的占位符。 文档中有3个相同的占位符,但此语句只找到其中两个。这会破坏所有文档,因此会对其进行半解析。

  • 问题内容: 这是很常见的,我遍历一个Python列表,让双方的内容 和 他们的索引。我通常会执行以下操作: 我发现这种语法有点难看,尤其是函数内部的部分。还有其他更优雅/ Python风格的方法吗? 问题答案: 使用内置函数:http : //docs.python.org/library/functions.html#enumerate

  • 通过我所做的所有搜索,我明白了使用jackson序列化/反序列化包含混合内容的xml是有问题的。有人知道用Java处理以下xml的方法吗? 我正在使用以下POJO: 如果节点有混合内容,如上例所示,我将得到以下错误: 如果节点具有纯文本,则反序列化工作。 我尝试使用JsonNode、TextNode、ObjectNode、Object代替String作为数据类型。我尝试了自定义序列化程序和反序列化

  • 问题内容: 考虑这个例子- 我有一个称为Report的类,该类具有Message类型的字段。Message类具有一个称为“ body”的字段,该字段是一个字符串。“ body”可以是任何字符串, 但有时包含格式正确的XML内容 。如何确保当“正文”包含XML内容时,序列化采用XML结构的形式而不是当前的结构? 这是带有输出的代码- 报告 类别 讯息 类别 主要 输出如下- 如您在上面的输出中看到的

  • 我正在尝试创建一个可以同时包含元素和值的java/jaxb类。 我想在A类的列表中读取一个类的属性,并作为A类本身的值输出。 这是XML: 我必须阅读: 并生产: 这是我的错误类-工作正常: 我的设备类别: Jaxb 抱怨我不能在同一类中同时拥有 xml 元素(错误 )和 xml 值 如何正确建模/注释此内容,以允许我读取 error xml 标记的属性并将其生成为设备标记的值?