当前位置: 首页 > 知识库问答 >
问题:

为什么在解析XML时获取空节点值

楚志强
2023-03-14

解析下面的XML时。第一个< code > URL-formatted-exception 是在解析时出现的,所以在代码中我没有给出xml字符串,而是使用了这个代码

Document doc=dBuilder.parse(newInputSource(newByteArrayInputStream(xmlResponse.getBytes("utf-8"))));

根据这个链接

java.net.MalformedURLException:无协议

现在我得到的节点值为空。我怎么能克服这个.在 for 循环中的代码中,我提到了节点的空值出现的位置

我正在使用以下代码:

try {
    DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
    DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
    Document doc = dBuilder.parse(new InputSource(new ByteArrayInputStream(xmlResponse.getBytes("utf-8"))));
    //read this - https://stackoverflow.com/questions/13786607/normalization-in-dom-parsing-with-java-how-does-it-work
    doc.getDocumentElement().normalize();
    System.out.println("Root element :" + doc.getDocumentElement().getNodeName());
    XPath xPath =  XPathFactory.newInstance().newXPath()
    String expression = "/GetMatchingProductForIdResponse/GetMatchingProductForIdResult/Products/Product"
    System.out.println(expression)
    NodeList nodeList = (NodeList) xPath.compile(expression).evaluate(doc, XPathConstants.NODESET)
    System.out.println("the size will be of the node list ${nodeList.getLength()}");
    for (int i = 0; i < nodeList.getLength(); i++) {
            System.out.println(nodeList.item(i).getNodeValue()+"the value coming will be "); // here i am getting value null for each node
    }
} catch (Exception e) {
    e.printStackTrace(System.out);
}

解析XML:

<?xml version="1.0"?>
<GetMatchingProductForIdResponse   xmlns="http://mws.amazonservices.com/schema/Products/2011-10-01">
  <GetMatchingProductForIdResult Id="H5-9OSH-9NZ7" IdType="SellerSKU" status="Success">
    <Products xmlns="http://mws.amazonservices.com/schema/Products/2011-10-01" xmlns:ns2="http://mws.amazonservices.com/schema/Products/2011-10-01/default.xsd">
    <Product>
      <Identifiers>
        <MarketplaceASIN>
          <MarketplaceId>ATVPDKIKX0DER</MarketplaceId>
          <ASIN>B004FQLAH2</ASIN>
        </MarketplaceASIN>
      </Identifiers>
      <AttributeSets>
        <ns2:ItemAttributes xml:lang="en-US">
          <ns2:Binding>Office Product</ns2:Binding>
          <ns2:Brand>Konica-Minolta</ns2:Brand>
          <ns2:Color>Y</ns2:Color>
          <ns2:CPUSpeed Units="MHz">200</ns2:CPUSpeed>
          <ns2:Department>Printers</ns2:Department>
          <ns2:Feature>Amp Up your Output - The magicolor 3730DN business color laser printer outputs at speeds up to 25 ppm in both color and B&W which means you can keep up in just about any business environment.</ns2:Feature>
          <ns2:Feature>Unparalleled Image Quality - High resolution 2400 (equivalent) x 600 dpi printing for great color and clarity in both images and text.</ns2:Feature>
          <ns2:Feature>Happy Planet, Outstanding Printing - Simitri HD Toner with Biomass allows for outstanding printing with the environment in mind.</ns2:Feature>
          <ns2:Feature>Connect quicker - Why wait? Standard Ethernet and high-speed USB 2.0 gets you connected faster than ever before.Specifications</ns2:Feature>
          <ns2:Feature>Type - Full-Color Laser Printer</ns2:Feature>
          <ns2:ItemDimensions>
            <ns2:Height Units="inches">13.62</ns2:Height>
            <ns2:Length Units="inches">20.47</ns2:Length>
            <ns2:Width Units="inches">16.50</ns2:Width>
            <ns2:Weight Units="pounds">56.22</ns2:Weight>
          </ns2:ItemDimensions>
          <ns2:IsAutographed>false</ns2:IsAutographed>
          <ns2:IsMemorabilia>false</ns2:IsMemorabilia>
          <ns2:Label>Konica</ns2:Label>
          <ns2:ListPrice>
            <ns2:Amount>449.00</ns2:Amount>
            <ns2:CurrencyCode>USD</ns2:CurrencyCode>
          </ns2:ListPrice>
          <ns2:Manufacturer>Konica</ns2:Manufacturer>
          <ns2:Model>A0VD017</ns2:Model>
          <ns2:NumberOfItems>1</ns2:NumberOfItems>
          <ns2:OperatingSystem>Windows XP, Vista, 7</ns2:OperatingSystem>
          <ns2:OperatingSystem>Mac X 10.2.8, 10.6+</ns2:OperatingSystem>
          <ns2:PackageDimensions>
            <ns2:Height Units="inches">19.00</ns2:Height>
            <ns2:Length Units="inches">24.20</ns2:Length>
            <ns2:Width Units="inches">22.00</ns2:Width>
            <ns2:Weight Units="pounds">65.30</ns2:Weight>
          </ns2:PackageDimensions>
          <ns2:PackageQuantity>1</ns2:PackageQuantity>
          <ns2:PartNumber>A0VD017</ns2:PartNumber>
          <ns2:ProductGroup>CE</ns2:ProductGroup>
          <ns2:ProductTypeName>PRINTER</ns2:ProductTypeName>
          <ns2:Publisher>Konica</ns2:Publisher>
          <ns2:SmallImage>
            <ns2:URL>http://ecx.images-amazon.com/images/I/21qN3BU-BHL._SL75_.jpg</ns2:URL>
            <ns2:Height Units="pixels">75</ns2:Height>
            <ns2:Width Units="pixels">75</ns2:Width>
          </ns2:SmallImage>
          <ns2:Studio>Konica</ns2:Studio>
          <ns2:Title>Konica Minolta Magicolor 3730DN Color Laser Printer 24PPM 2400X600DPI ENET USB 2.0</ns2:Title>
        </ns2:ItemAttributes>
      </AttributeSets>
      <Relationships/>
      <SalesRankings/>
    </Product>
    </Products>
  </GetMatchingProductForIdResult>
  <ResponseMetadata>
    <RequestId>0b508338-3afe-4178-adc4-60c9c8448987</RequestId>
  </ResponseMetadata>
</GetMatchingProductForIdResponse>

共有1个答案

呼延庆
2023-03-14

DOM中的<code>getNodeValue(有关详细信息,请参见<code>org.w3c.DOM.Node

您在该答案的注释中添加了第二个问题,询问如何使用XPath搜索具有名称空间前缀的节点,如<code>ns2:。XPath 1.0处理名称空间的方式是,不固定的名称总是引用不在名称空间中的节点,如果要引用名称空间节点,则必须提供名称空间URI到前缀的绑定(在<code>javax.xml.XPath

因此,您正在使用的原始 XPath:

/GetMatchingProductForIdResponse/GetMatchingProductForIdResult/Products/Product

实际上不应该匹配任何东西,因为文档中的GetMatchingProductForIdResponse等元素位于命名空间中,但是您逃脱了它,因为DocumentBuilderFactory默认情况下不能识别命名空间。此处要执行的正确操作是使用命名空间感知分析器,并向 XPath 引擎提供合适的命名空间上下文。不幸的是,核心Java库中没有命名空间Context的默认实现,但是Spring提供了一个方便的SimpleNamespaceContext实现,如果你不想推出自己的实现,你可以使用它。

DocumentBuilderFactory dbFactory = DocumentBuilderFactory.newInstance();
dbFactory.setNamespaceAware(true); // parse with namespaces
DocumentBuilder dBuilder = dbFactory.newDocumentBuilder();
Document doc = dBuilder.parse(new InputSource(new ByteArrayInputStream(xmlResponse.getBytes("utf-8"))));
doc.getDocumentElement().normalize();

XPath xPath =  XPathFactory.newInstance().newXPath();
SimpleNamespaceContext nsCtx = new SimpleNamespaceContext();
xPath.setNamespaceContext(nsCtx);
nsCtx.bindNamespaceUri("prod", "http://mws.amazonservices.com/schema/Products/2011-10-01");
nsCtx.bindNamespaceUri("ns2", "http://mws.amazonservices.com/schema/Products/2011-10-01/default.xsd");
String expression = "/prod:GetMatchingProductForIdResponse/prod:GetMatchingProductForIdResult/prod:Products/prod:Product‌​/prod:AttributeSets/ns2:ItemAttributes/ns2:Binding";
// ...
 类似资料:
  • 在本章中,将学习如何获取XML DOM对象的节点值。 XML文档具有称为节点的信息单元的层次结构。 对象有一个属性 - ,它返回元素的值。 在以下部分中,将讨论学习 - 获取元素的节点值 获取节点的属性值 以下所有示例中使用的node.xml如下所示 - 1. 获取节点值 使用方法以文档顺序返回具有给定标记名称的所有元素的。 示例 以下示例(getnode example.html)将XML文档(

  • 我可以使用以下方法获取第一个

  • 问题内容: 我有下一个XML: 如何获得此节点?我试过了 但它返回一个空数组。我该怎么做? 问题答案: 您需要确保XML解析器支持名称空间。 您还应该确保关闭,最好使用try-with-resources。

  • 我有以下(很大= 我有一个文件,它定义了我要提取的字段及其路径: 因此,HotelName的路径是:。 现在我想了解每家酒店的信息。我无法为它们创建类(如这里),因为脚本必须是动态的,并且将传递具有不同定义文件的不同XML文件。 我如何通过使用路径来解决这个问题,没有类,内存使用率低(= //编辑:一切都已实现。我只需要一种方法来遍历酒店,并使用我拥有的路径获取它们的值。

  • Envelope.java 主ube.java Cube.java(直到这里它的工作) 货币ube.java