使用ElementTree示例在Python中解析XML

杜辰龙

2023-03-14

问题内容：

我很难找到一个很好的基本示例，说明如何使用元素树在python中解析XML。据我所知，这似乎是用于解析XML的最简单的库。这是我正在使用的XML的示例：

<timeSeriesResponse>
    <queryInfo>
        <locationParam>01474500</locationParam>
        <variableParam>99988</variableParam>
        <timeParam>
            <beginDateTime>2009-09-24T15:15:55.271</beginDateTime>
            <endDateTime>2009-11-23T15:15:55.271</endDateTime>
        </timeParam>
     </queryInfo>
     <timeSeries name="NWIS Time Series Instantaneous Values">
         <values count="2876">
            <value dateTime="2009-09-24T15:30:00.000-04:00" qualifiers="P">550</value>
            <value dateTime="2009-09-24T16:00:00.000-04:00" qualifiers="P">419</value>
            <value dateTime="2009-09-24T16:30:00.000-04:00" qualifiers="P">370</value>
            .....
         </values>
     </timeSeries>
</timeSeriesResponse>

我可以使用硬编码的方法来做我需要的事情。但是我需要我的代码更具动态性。这是起作用的：

tree = ET.parse(sample.xml)
doc = tree.getroot()

timeseries =  doc[1]
values = timeseries[2]

print child.attrib['dateTime'], child.text
#prints 2009-09-24T15:30:00.000-04:00, 550

这是我尝试过的几件事，但都没有奏效，报告他们找不到timeSeries（或我尝试过的其他任何东西）：

tree = ET.parse(sample.xml)
tree.find('timeSeries')

tree = ET.parse(sample.xml)
doc = tree.getroot()
doc.find('timeSeries')

基本上，我想加载xml文件，搜索timeSeries标签，并遍历value标签，返回dateTime和标签本身的值；上面示例中我正在执行的所有操作，但不对我感兴趣的xml部分进行硬编码。有人可以给我指出一些示例，或者给我一些有关如何完成此操作的建议吗？

感谢您的所有帮助。使用以下两个建议对我提供的示例文件起作用，但是，它们对整个文件不起作用。这是我使用Ed Carrel的方法时从真实文件中得到的错误：

 (<type 'exceptions.AttributeError'>, AttributeError("'NoneType' object has no attribute 'attrib'",), <traceback object at 0x011EFB70>)

我发现实际文件中有不想要的东西，所以我逐步删除了一些东西，直到它起作用为止。这是我更改的行：

originally: <timeSeriesResponse xsi:schemaLocation="a URL I removed" xmlns="a URL I removed" xmlns:xsi="a URL I removed">
 changed to: <timeSeriesResponse>

 originally:  <sourceInfo xsi:type="SiteInfoType">
 changed to: <sourceInfo>

 originally: <geogLocation xsi:type="LatLonPointType" srs="EPSG:4326">
 changed to: <geogLocation>

删除具有“ xsi：…”的属性可解决此问题。’xsi：…’是无效的XML吗？对于我而言，以编程方式将其删除非常困难。有建议的解决方法吗？

这是完整的XML文件：http :
//www.sendspace.com/file/lofcpt

当我最初问这个问题时，我没有意识到XML中的名称空间。现在我知道发生了什么，我不必删除“
xsi”属性，它们是名称空间声明。我只是将它们包括在我的xpath搜索中。请参阅此页面上的LXML命名空间的更多信息。

问题答案：

因此，我现在在盒子上安装了ElementTree 1.2.6，并针对您发布的XML块运行了以下代码：

import elementtree.ElementTree as ET

tree = ET.parse("test.xml")
doc = tree.getroot()
thingy = doc.find('timeSeries')

print thingy.attrib

并得到以下回报：

{'name': 'NWIS Time Series Instantaneous Values'}

似乎已经找到了timeSeries元素，而无需使用数字索引。

现在有用的是知道您说“不起作用”时的意思。由于在给定相同输入的情况下对我有效，因此ElementTree不太可能以某种明显的方式损坏。使用任何错误消息，回溯或任何可提供的帮助我们的帮助来更新您的问题。

使用ElementTree示例在Python中解析XML

相关阅读

相关文章

相关问答

相关工具

相关文档