当前位置: 首页 > 面试题库 >

使用Python Selenium保存网页

贺波
2023-03-14
问题内容

我为python 2.7使用了selenium网络驱动程序:

  1. 启动浏览器:browser = webdriver.Firefox()

  2. 转到一些网址:browser.get('http://www.google.com')

此时,如何向浏览器发送“另存为”命令?

注意:这不是我感兴趣的网页源。我想使用实际的“将页面另存为” Firefox命令来保存页面,该命令所产生的结果与保存网页源不同。


问题答案:

不幸的是,您无法使用Selenium做您想做的事。您可以使用page_source来获取html,但这就是您将要获得的全部。

不幸的是,当您另存为时,Selenium无法与给您的对话框交互。

您可以执行以下操作来启动对话框,但随后需要诸如AutoIT之类的功能来完成该对话框

from selenium.webdriver.common.action_chains import ActionChains

saveas = ActionChains(driver).key_down(Keys.CONTROL)\
         .send_keys('s').key_up(Keys.CONTROL)
saveas.perform()


 类似资料:
  • 问题内容: 我正在寻找一个示例,该示例请求一个网页,等待JavaScript呈现(JavaScript修改DOM),然后获取页面的HTML。 这应该是一个简单的示例,并且带有明显的PhantomJS用例。我找不到合适的示例,文档似乎全部关于命令行使用。 问题答案: 根据您的评论,我猜您有2个选择 尝试找到phantomjs节点模块-https: //github.com/amir20/phanto

  • 明文保存 明文hash后保存,如md5 MD5+Salt方式,这个salt可以随机 知乎使用了Bcrypy(好像)加密

  • 我有一个应用程序,允许用户在blobstore中保存blob。我现在有一个这样做的模式,但我感兴趣的是更简单和不太扭曲的东西。关于上下文,想象一下我的应用程序允许用户上传一张动物的图片,上面有一段描述动物正在做什么的文字。 当前架构 > 用户调用我的endpointapi将动物的和保存在实体中。注意:实体实际上有4个字段(、、和作为字符串)。但endpointapi只允许保存提到的两个。 在end

  • POI释义:“Point of Interest”的缩写,中文可以翻译为“兴趣点”。在地理信息系统中,一个POI可以是一栋房子、一个商铺、一个邮筒、一个公交站等。 POI 点搜索必选先选择地区 再点击搜索框,输入关键词,回车 查询结果列表里,可将搜索到的POI点选中,在地图上,点击“保存为网点”,保存该POI点作为网点;点击“复制”按钮,可以复制该POI点的经纬度

  • 问题内容: 我用python与selenium结合编写了一个脚本,以从其着陆页中抓取不同文章的链接,并通过跟踪引向其内页的url最终获得每个文章的标题。尽管我在这里解析的内容是静态内容,但我还是使用了selenium来查看它在多处理中的工作方式。 但是,我的意图是使用多处理进行抓取。到目前为止,我知道selenium不支持多处理,但似乎我错了。 我的问题:当使用多处理运行selenium时,如何减

  • 问题内容: 我在python中有以下代码 我的问题是在test_home_page函数之后,firefox实例关闭并为下一个test_whatever函数再次打开。我该怎么做,以便所有测试用例都从同一firefox实例执行。 问题答案: 在以下位置初始化firefox驱动程序: