当前位置: 首页 > 面试题库 >

Python:Selenium与PhantomJS空页面源

葛威
2023-03-14
问题内容

当我想获取URL页面的源时,在Windows7上使用Selenium和PhantomJS时遇到麻烦。
browser.page_source返回<html><head></head></html>。我之前睡过一会儿,browser.page_source但没有帮助。

这是我的代码:

from selenium import webdriver
browser = webdriver.PhantomJS('phantomjs-1.9.7-windows\phantomjs.exe')
url = 'myurl'
browser.get(url)
print browser.page_source

在具有相同版本PhantomJS的Linux上,它可以完美运行。它还适用于Windows Server 2003。


问题答案:

默认情况下,phantomjs使用SSLv3,但ssl中的错误后许多站点都迁移到tls。这就是为什么您有空白页。用service_args=['-- ignore-ssl-errors=true', '--ssl-protocol=any']

browser = webdriver.PhantomJS('phantomjs-1.9.7-windows\phantomjs.exe', service_args=['--ignore-ssl-errors=true', '--ssl-protocol=any'])


 类似资料:
  • 我正在使用PhantomJS进行网页截图。 我看到过其他关于@font-face问题的帖子,但我页面上的字体呈现正确。我唯一的问题是,每次截图时,字体显示与前一个截图略有不同。所以尽管他们的渲染是正确的,但他们在截图上的外观是不一致的。 我已经尝试了许多修复,大多数都是基于这样的假设,即这与页面准备好之前拍摄的截图有关,但这似乎不是问题所在。例如,我已经延迟了截图,以便字体有时间加载和呈现,但这并

  • 问题内容: 我知道某些网页PhantomJS /CasperJS无法打开,我想知道这是否是其中之一:给出错误:PhantomJS无法打开页面status = fail。 我尝试忽略ssl错误并更改了用户代理,但是我不确定如何确定要使用哪个代理。 我现在正在做的只是在哪里进行Casper的基本设置; 问题答案: 该问题可能与最近发现的SSLv3漏洞(POODLE)有关。网站所有者被迫从其网站中删除S

  • Selenium Selenium是一个Web的自动化测试工具,最初是为网站自动化测试而开发的,类型像我们玩游戏用的按键精灵,可以按指定的命令自动操作,不同是Selenium 可以直接运行在浏览器上,它支持所有主流的浏览器(包括PhantomJS这些无界面的浏览器)。 Selenium 可以根据我们的指令,让浏览器自动加载页面,获取需要的数据,甚至页面截屏,或者判断网站上某些动作是否发生。 Sel

  • 问题内容: 是否可以从字符串创建页面? 例: 我已经尝试了上面的方法,但是没有运气。 另外,我认为值得一提的是我正在使用带有phantomjs-node(https://github.com/sgentle/phantomjs- node)的nodejs 谢谢! 问题答案: 查看phantomjs API,page.open需要URL作为第一个参数,而不是HTML字符串。这就是为什么您尝试的方法不

  • 问题内容: 我想知道如何在phantomjs中解析JSON。任何页面内容都包含在html()中。是否可以删除封闭标签或要求将其他Content-Type用作“ application / json”?如果不是,解析它的最佳方法是什么。包括includeJS jQuery之后是否使用jQuery? 问题答案: 由于您正在使用Webkit浏览器内置的PhantomJS,因此可以访问本机JSON库。无需

  • 问题内容: 我正在尝试抓取这一(无限)页面(www.mydealz.de),但是我无法让我的网络驱动程序向下滚动页面。我正在使用Python(3.5),Selenium(3.6)和PhantomJS。我已经尝试了几种方法,但是webdriver不会滚动- 它只给我第一页。 第一种方法(常用的滚动方法): 第二种方法(只需按下几次向下键并释放它,也尝试在两次按下之间等待): 第三种方法(在“滚动列表