是否有任何Python库可以让我解析类似于HTML文档的HTML文档jQuery
?
即我希望能够使用 CSS选择器语法 从文档中获取任意节点集,读取其内容/属性,等等。
我之前使用过的唯一Python HTML解析库是 BeautifulSoup
,尽管很好,但我一直认为如果可以使用jQuery语法,解析起来会更快。:D
如果您能熟练使用BeautifulSoup,则只需将soupselect添加到您的库中。
Soupselect是BeautifulSoup的CSS选择器扩展。
用法:
>>> from BeautifulSoup import BeautifulSoup as Soup
>>> from soupselect import select
>>> import urllib
>>> soup = Soup(urllib.urlopen('http://slashdot.org/'))
>>> select(soup, 'div.title h3')
[<h3><span><a href='//science.slashdot.org/'>Science</a>:</span></h3>,
<h3><a href='//slashdot.org/articles/07/02/28/0120220.shtml'>Star Trek</h3>,
..]
问题内容: 由于Java不允许将方法作为参数传递,因此您使用什么技巧来实现Python(如Java中的列表理解)? 我有一个字符串列表(ArrayList)。我需要通过使用函数来转换每个元素,以便获得另一个列表。我有几个函数,它们将一个String作为输入,并返回另一个String作为输出。如何制作一个可以将列表和函数作为参数的通用方法,这样我就可以在处理完每个元素后获取列表。从字面上看这是不可能
问题内容: 如何将HTML文件的内容分成屏幕大小的块,以在WebKit浏览器中“分页”? 每个“页面”应显示完整数量的文本。这意味着不得在屏幕的顶部或底部边界将文本行切成两半。 编辑 该问题最初被标记为“ Android”,因为我的目的是构建Android ePub阅读器。但是,看来该解决方案只能用JavaScript和CSS来实现,因此我扩大了问题的范围,使其与平台无关。 问题答案: 在Dan的
问题内容: 我一直在尝试使用.htaccess文件将.html文件处理为.PHP 文件。我已经使用了以下两种方法,但它们都不起作用,尝试访问测试页使我可以选择下载不存在的文件。我怎样才能解决这个问题? 我都尝试过 这个 想法 是允许包含在我的网页中,但仍使用.html文件。 下面是来自.htaccess文件的更多代码,我认为它与addType无关,但是我将其发布。 1&1 IONOS决定只允许我使
问题内容: 我想知道是否存在可以在C#中使用的类似jQuery的CSS选择器。 目前,我正在使用正则表达式解析一些html字符串,并认为在jQuery中使用诸如css选择器之类的东西来匹配所需元素会更好。 问题答案: 您肯定应该看到@jamietre的CsQuery。看看他对这个问题的答案! Fizzler和Sharp-Query提供了类似的功能,但是这些项目似乎被放弃了。
问题 你想把多个数组连在一起,生成一个数组的数组。换句话说,你需要实现与 Python 中的 zip 函数类似的功能。 Python 的 zip 函数返回的是元组的数组,其中每个元组中包含着作为参数的数组中的第 i 个元素。 解决方案 使用下面的 CoffeeScript 代码: # Usage: zip(arr1, arr2, arr3, ...) zip = () -> lengthArr
问题内容: 是否有像纯JavaScript 一样的功能? 我知道jQuery具有此功能来检查整数。 问题答案: 没有功能类型,但您可以添加自己的功能: 注意:由于不是检查数字的正确方法,因此不应使用它。