当前位置：首页 > 面试题库 >

Python lxml XPath问题

卢景澄

2023-03-14

问题内容：

我正在尝试从网页中打印/保存特定元素的HTML。
我已经从萤火虫中检索了所请求元素的XPath。

我只希望将该元素保存到文件中。我似乎没有成功。
（尝试在XPath/text()的结尾加上和不结尾）

我将不胜感激，或者有以往的经验。
10x，大卫

import urllib2,StringIO
from lxml import etree

url='http://www.tutiempo.net/en/Climate/Londres_Heathrow_Airport/12-2009/37720.htm'
seite = urllib2.urlopen(url)
html = seite.read()
seite.close()
parser = etree.HTMLParser()
tree = etree.parse(StringIO.StringIO(html), parser)
xpath = "/html/body/table/tbody/tr/td[2]/div/table/tbody/tr[6]/td/table/tbody/tr/td[3]/table/tbody/tr[3]/td/table/tbody/tr/td/table/tbody/tr/td/table/tbody/text()"
elem = tree.xpath(xpath)


print elem[0].strip().encode("utf-8")

问题答案：

您的XPath显然太长了，为什么不试试较短的XPath看看它们是否匹配。一个问题可能是“ tbody”，浏览器会在DOM中自动创建“
tbody”，但HTML标记通常不包含它。

这是有关如何使用XPath结果的示例：

>>> from lxml import etree
>>> from StringIO import StringIO
>>> doc = etree.parse(StringIO("<html><body>a<something/>b</body></root>"), etree.HTMLParser())
>>> doc.xpath("/html/body/text()")
['a', 'b']

因此"".join(...)，如果需要，您可以将所有文本部分放在一起。

类似资料：

java.lang.ClassNotFoundException：org.springframework.web.context.ContextLoaderListener 问问题

问题内容：包括： all Spring libs, Apache Tomcat 7.0 library 在构建路径中但它仍然给出错误：在“ org.sprintframework.web-3.1.0.M1.jar”中，我可以看到“ org.springframework.web.context.ContextLoaderListener”。 Google上的某个人说应该包含spring.ja
java.lang.NoSuchMethodError：org.springframework.util.ClassUtils.forName（Ljava 问问题

问题内容：我使用非常简单的代码返回XML 但是，出现以下错误请帮忙。谢谢问题答案：运行时出现NoSuchMethodError表示你使用的库版本与生成代码所针对的版本不同。在你的情况下，Spring是元凶。在运行时检查类路径上的内容，并确保以下各项：版本与编译时间罐相同如果存在多个版本，请删除不需要的版本
javax.transaction.Transactional与org.springframework.transaction.annotation.Transactional 问问题

问题内容：我不明白注释和之间的实际区别是什么？扩展名还是它们具有完全不同的含义？什么时候应该使用它们？在服务层中使用Spring ，在DAO 中使用javax？谢谢回答。问题答案：几年前，Spring定义了自己的Transactional注释以使Spring bean方法具有事务性。 Java EE 7终于做了同样的事情，现在除了EJB方法外，还允许CDI bean方法是事务性的。因此，
RabbitMQ管理访问问题

我在CentOS虚拟机中安装了RabbitMQ，该虚拟机的网络适配器被定义为Bridge。我正在尝试配置RabbitMQ管理，以便通过机器的IP地址访问WebApp。配置如下：
经常问到的问题

这个FAQ的最新版本总是可以从Apache主站点得到，位于<http://httpd.apache.org/docs/2.2/faq/> 如果你的问题在这里没有找到答案，你也可以看看Apache 1.3 FAQ ，看你的问题是否在那里有了答案。主题背景关于 Apache HTTP Server 的背景知识。支持我遇到问题该怎么办？错误信息这些错误信息是什么意思？背景什么是Apac
问题

发布问题更新问题设置问题悬赏获取问题列表获取一个问题详情删除一个问题获取用户发布的问题列表发布问题 POST /questions 输入字段类型描述 subject 字符串必须，问题主题或者说标题，不能超过 255 字节，必须以？结尾。（不区分全角或者半角） topics 数组必须，绑定的话题，数组子节点必须符合 { "id": 1 } 的格式。 body 字符串
“ ”有什么作用？问问题

问题内容：我简直不敢相信我网站上正在发生的事情。当我添加此行时：一切正常。如果我不这样做，CSS就会“混乱”，一切都会变得不同，布局也会变得“丑陋”。这条线如何解决所有问题？问题答案：您正在将HTML与XHTML混合使用。通常，声明用于区分HTMLish语言的版本（在这种情况下为HTML或XHTML）。不同的标记语言将表现不同。我最喜欢的例子是。在浏览器中查看以下内容： XHTML
Hyperledger Fabric的问题和疑问

我试图在fabric rocket chat上联系，但没有得到太多帮助，因此在SO上发布了它。我有以下疑问：我们是否可以在链码内访问块高度（我知道这在客户端是可行的，但在链码内是否可能）可以从链码中的正在进行的事务调用新事务吗？想知道hyperledger Fabric中存储的数据的历史记录在哪里我们可以根据链码中的transactionid进行查询吗？在fabric链码中编写调度程序是

相关阅读

问题-java.lang.ClassNotFoundException：org.springframework.web.servlet.DispatcherServlet ArrayList问题 json_encode（）问题 pthread_detach问题 Random.nextGaussian（）问题

相关文章

迷宫问题百度问一问 Java集合必问 28问（面试题整理）Hadoop 50070 无法访问问题解决汇总产品面试秘籍（六）| 反问环节，问哪些问题才合适呢？

相关问答

javascript - 请问一个Promise 的问题？问一个简单的git问题?javascript - 问一个js正则问题?OncreateView问题 Choreogrpher问题

相关工具

冇问题问脉 stackoverflow Java top 100问题翻译深度学习500问行知问卷调查系统

相关文档

Debian GNU/Linux 常见问题 Shell 十三问 Windows 访问控制 Stack Overflow 关于 Python 的部分高分问题 Windows 访问控制帮助文档