当前位置: 首页 > 面试题库 >

在python中使用beautifulsoup单击链接

叶英哲
2023-03-14
问题内容

在机械化中,我们可以使用follow_link或click_link单击链接。在美丽的汤中是否有类似的事情可以单击网页上的链接?


问题答案:

BeautifulSoup是HTML 解析器

进一步的讨论实际上取决于您所处的具体情况以及特定网页的复杂性。

如果您需要与网页进行交互:提交表单,单击按钮,滚动等-您需要使用利用真实浏览器的工具,例如selenium

例如,在某些情况下,如果提交表单时不涉及任何javascript
mechanize,您也可以使用。

而且,有时您可以通过简单地使用urllib2或链接来处理它requests



 类似资料:
  • 问题内容: 我在Python中使用Selenium尝试单击鼠标悬停在该下拉菜单上时出现的下拉菜单中的链接。这是下拉菜单信息: 我试图单击“ a href”标签中的“文档”链接。当我将鼠标悬停在菜单上时,代码更改如下: 您可以在第二个ul标签中看到“ visible :: hidden”部分消失了。 我使用以下代码在页面上找到了元素: 如果我尝试使用以下方法单击下载按钮: 我收到一个错误,指出该元素

  • 问题内容: 我正在使用python的机械化模块导航网站,并且无法单击下一页的javascript链接。我做了一些阅读,有人建议我需要python- spidermonkey和DOMforms。我设法通过不知道实际单击链接的语法来安装它们。 我可以将页面上的代码标识为: 有人知道如何单击吗?或者也许还有另一种工具。 谢谢 问题答案: 对于这些用例,我主要在jython下使用HtmlUnit。我还发表

  • Iam测试了以下网页:http://www.guiadosliflrinhos.com/todas-capas-disponiveis 我需要在分页信息页导航喜爱。我需要点击链接javascript下一页: JavaScript:__doPostback('CTL00$MainContent$LSTProfileview$DataPagerNumeric2$CTL02$CTL00') 我的代码返回

  • 我必须提取表列“付款日期”中提到的每个日期的报告。每个日期都是报告的链接。所以,我一个接一个地点击所有日期以下载报告。 所以,这里的过程是,当我点击一个日期,它将下载该日期的报告。然后,我将单击“下一个日期”以获取该日期的报告。所以,我做了一个for循环来循环所有的链接,并得到所有日期的报告。 但它给了我一个陈旧的元素例外。单击第一个日期后,无法单击下一个日期。我遇到了错误和代码停止。 我该怎么解

  • 问题内容: 如何检索网页链接并使用Python复制链接的URL地址? 问题答案: 这是在中使用类的一小段代码:

  • 问题内容: 我搜索了如何在中创建可点击的链接JEditorPane,然后发现了这个 问题: 是否可以用Java创建程序以创建要在 Chrome中链接的文本? 这非常有用,但是我的代码使用重复语句在 循环中添加链接: 现在,它只显示没有可点击链接的文本。我要如何纠正?我真的需要方法。 问题答案: 使用上的插入件的原始字符串; 您 要插入HTML锚标记。您可以, 自己管理原始HTML文本,如下所示,然