问题：

用漂亮的汤抓取Python数据

倪鸿禧

2023-03-14

大家好，我是Python新手。请让我知道如何使用BeautifulSoup从下面的代码部分删除数据。

<Td class=cell>
<br>
<blockquote>
<p><B>Question:</b> Which is the world's leading egg-producing         country?</p>
<p><ol><li><label for="q1824-1"><input type=radio id="q1824-1" name=q1824  onClick="check_answer('q1824correct','q1824incorrect','1','1');">China
</label><br><li><label for="q1824-2"><input type=radio id="q1824-2"  name=q1824   onClick="check_answer('q1824correct','q1824incorrect','2','1');">India
</label><br><li><label for="q1824-3"><input type=radio id="q1824-3" name=q1824 onClick="check_answer('q1824correct','q1824incorrect','3','1');">Japan
</label><br><li><label for="q1824-4"><input type=radio id="q1824-4" name=q1824  onClick="check_answer('q1824correct','q1824incorrect','4','1');">Malaysia</label><br></ol></p>

外面看起来像这样

问：哪个是世界领先的产蛋国？

中国
印度
日本
马来西亚

共有1个答案

赵智

2023-03-14

很难知道你到底想要什么，因为你的问题（就目前而言）定义非常模糊。

通常情况下，BeautifulSoup中任何HTML的模板如下所示：

response = urllib2.urlopen(url)
html_doc = response.read()
soup = BeautifulSoup(html_doc, 'html.parser')

然后，您可以根据不同的标准从HTML中提取元素，如下所示：

# this would match the top-level element in your snippet
# i.e. <td class="cell">
td_element = soup.find("td", _class="cell")

# this would match all of the <label> elements in your snippet
# (so you'll get a list as your result)
labels = soup.findAll("label")

类似资料：

漂亮的刮汤台

我有一小段代码来从web站点中提取表数据，然后以csv格式显示。问题是for循环多次打印记录。我不确定是不是因为标签。顺便说一句，我是Python新手。谢谢你的帮助！
用漂亮的汤刮多页

我已经获得了刮取第一页的代码，但是url从： https://www.expansion.com/empresas-de/ganaderia/granjas-en-general/index.html -- 如何创建从第2页到第65页的循环？非常感谢！
用漂亮的汤刮Flipkart网页

我试图刮此页上Flipkart： http://www.flipkart.com/moto-x-play/p/itmeajtqp9sfxgsk?pid=MOBEAJTQRH4CCRYM 我试图找到的div类"fk-ui-ccarousel超级容器相同的vreco部分reco-carousel-边界-顶部sameHorizontalReco"，但它返回空结果。 divs是空的。我使用inspect元
使用pip安装漂亮的汤

问题内容：我正在尝试在Python 2.7中安装BeautifulSoup 。我不断收到错误消息，无法理解原因。我按照说明安装了pip，该pip已安装到以下目录：，然后尝试将其添加到路径中并运行命令。尝试了两种不同的方法：都给我这个错误信息：该外壳突出显示“安装”一词，并说这是无效的语法。我不知道发生了什么，所以任何帮助将不胜感激。问题答案：是命令行工具，而不是Python语法
用漂亮的汤从div tag刮href

我有一个带有div标签的页面源，如下面的示例页面源。我想像下面的例子一样刮掉所有的网址，并将它们保存在列表中。示例url：来自：我尝试使用下面的代码从href中刮取网址。我试图使用span类来过滤只包含作业卡search__easy飞机的div标签。代码不返回任何网址，只是一个空列表。我对美丽的汤和硒不熟悉。如果有人能指出我的问题是什么，并提出一个解决方案，我会很高兴。特别是如果你也能给出一
用漂亮的汤刮除超过渲染的数据

我从谷歌应用商店抓取应用名称，每个网址作为输入，我只得到60个应用（因为如果用户不向下滚动，网站会呈现60个应用）。它是如何工作的，我如何才能从一个页面刮所有的应用程序使用美丽的汤和/或硒？非常感谢。这是我的密码：

用漂亮的汤抓取Python数据

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档