当前位置: 首页 > 面试题库 >

使用JAXB解组XML而不会转义字符

罗昊明
2023-03-14
问题内容

想象以下情况:我们从某个外部工具收到一个xml文件。最近,在此xml中,节点名称中或它们的richcontent标记中可能有一些转义的字符,如以下示例所示(简化):

<map>
<node TEXT="Project">
<node TEXT="&#xe4;&#xe4;">
<richcontent TYPE="NOTE"><html>
  <head>

  </head>
  <body>
    <p>
      I am a Note for Node &#228;&#228;!
    </p>
  </body>
</html>
</richcontent>
</node>
</node>
</map>

在使用JAXB解组文件后,那些逃脱的字符将不被转义。不幸的是,我需要他们保持原样,这意味着逃脱了。有什么方法可以避免在解组时将这些字符转义?

使用JAXB甚至有可能实现这一目标,还是我们甚至必须考虑更改为其他xml阅读器API?

预先谢谢你,艾梅娜


问题答案:

你只需要更换&#&amp;#,因此呼叫

unmarshaller.unmarshal(new AmpersandingStream(new FileInputStream(...)));

import java.io.IOException;
import java.io.InputStream;

/**
* Replaces numerical entities with their notation as text.
*/
public class AmpersandingStream extends InputStream {

    private InputStream in;
    private boolean justReadAmpersand;
    private String lookAhead = "";

    public AmpersandingStream(InputStream in) {
        this.in = in;
    }

    @Override
    public int read() throws IOException {
        if (!lookAhead.isEmpty()) {
            int c = lookAhead.codePointAt(0);
            lookAhead = lookAhead.substring(Character.charCount(c));
            return c;
        }
        int c = in.read();
        if (c == (int)'#' && justReadAmpersand) {
            c = (int)'a';
            lookAhead = "mp;#";
        }
        justReadAmpersand = c == (int)'&';
        return c;
    }

    @Override
    public int available() throws IOException {
        return in.available();
    }

    @Override
    public void close() throws IOException {
        in.close();
    }

    @Override
    public synchronized void mark(int readlimit) {
        in.mark(readlimit);
    }

    @Override
    public boolean markSupported() {
        return in.markSupported();
    }

    @Override
    public int read(byte[] b) throws IOException {
        return in.read(b);
    }

    @Override
    public int read(byte[] b, int off, int len) throws IOException {
        return in.read(b, off, len);
    }

    @Override
    public synchronized void reset() throws IOException {
        in.reset();
    }

    @Override
    public long skip(long n) throws IOException {
        return in.skip(n);
    }

}


 类似资料:
  • 我试图将我下面的xml转换为java对象。 这是我的xml: 我需要在"提供者组织"下获取"name"的值。下面是我Java课。 诊所ocument.java 记录目标。JAVA 病人ole.java 供应商组织。JAVA XMLFileParserSAXUtility.java 我得到的结果是 如果我尝试打印syso(临床文件); 结果是临床文档[recordTarget=null] 请帮帮我!

  • 我已经生成java类使用从一个xsd,其中根元素是类型的。 jaxb生成的根元素是 当我尝试解组与该xsd对应的xml并强制转换JaxbElement时,它会引发一个强制转换异常: 片段:

  • 问题内容: 在Go中,我将如何解码该XML响应?我尝试在自己的结构上构建自定义方法,但是运气不高。 问题答案: 像这样两次解码(在操场上尝试)

  • 问题解决 将XmlElementRef注释更改为@XmlElementRef(name=“Option”,type=Option.class,required=false)后,将@XmlRootElement(name=“Option”)添加到选项中。班 更新: 根据laune的建议,我添加了两个类(Options和Option),并修改了GuimopProperties类,如下所示 但当我必须新

  • 所以我有几个XML,我正在尝试解封。 一个XML可以如下所示: 在我的Table类中 } 我从这个链接获取了MapAdapter:JAXB封送和反封送映射到/从 value 我的问题是:我希望能够在传入XML时将记录中的每个标记名(Doc_id/sub_id或XML中的任何内容)及其每个值作为字符串获取,但我不确定如何实现。 如果能给我指明正确的方向,我将不胜感激。 编辑: 2个新问题!我意识到我

  • 我想使用jaxb解组一个带有这个xsd定义的XML文件。 我已经用eclipse右键生成了java类,生成jaxb类等等。我对解组XML文件没有问题。 问题是我不知道如何取消列表(map?)MetadataType。下面是metadataType的xsd定义和生成的类: 为此类型生成的类是: 外部xsd for在这里 更新: 另外,我从外部 xsd 生成了类: OaiDcType类型。java元素