我最初想让一个无头浏览器运行来动态解析一个网页。我一直有一系列的问题与此,即使在添加了等待允许网站加载。在注释掉headless选项后,我使用xming服务器作为网页的显示器,查看浏览器创建后的实际外观。
下面是我看到的屏幕截图:chrome中有一个新的选项卡,而浏览器似乎从未访问过.get()。我还会弹出“Chrome Automation Extension已经崩溃了...”
我搜索了很多,有些人建议不要以admin/root的身份运行,所以我在运行它之前没有使用sudo。这并没有改变信息。
下面是我的代码和终端输出:
options = webdriver.ChromeOptions()
# options.add_argument('--headless')
options.add_argument('--no-sandbox')
options.add_argument('--disable-dev-shm-usage')
options.add_argument('--ignore-certificate-errors')
options.add_argument('--lang=en_US')
options.add_argument('--user-data-dir')
options.add_argument("--disable-gpu")
# options.add_argument("--remote-debugging-port=9222")
browser = webdriver.Chrome(executable_path='/usr/bin/chromedriver', options=options)
browser.get("http://www.google.com")
Ubuntu终端:
回溯(最近一次调用):
文件“practice3.py”,第40行,在
浏览器=webdriver.chrome中(executable_path='/usr/bin/chromedriver',options=options)
文件“etc/anaconda3/lib/python3.8/site-packages/selenium/webdriver/chrome/webdriver.py”,第76行,在init中
remotewebdriver.init中(
文件“MMON.Exceptions.WebDriverException:消息:未知错误:DevToolsActivePort文件不存在
(驱动程序信息:Chromedriver=2.41.578700(2F1ED5F9343C13F73144538F15C00B370EDA6706),Platform=Linux 4.4.0-18362-Microsoft x86_64)
同时:
Ubuntu 20.04 LTS
Selenium版本3.141.0
Chrome版本84.0.4147.105
~$ /usr/bin/chromedriver
Starting ChromeDriver 2.41.578700 (2f1ed5f9343c13f73144538f15c00b370eda6706) on port 9515
Only local connections are allowed.
当chromedriver和chrome之间的版本不匹配时,我见过很多chrome崩溃。既然您使用的是Chrome版本84.0.4147.105,那么您应该只使用ChromeDriver 84.0.4147.30第二件事,您是从IDE启动脚本吗?如果是阳性,那也是另一个常见的根本原因。最后,我将停止使用XMimg,因为它为方程添加了另一个变量。相反,排除故障,直接从selenium代码截图,不管你是不是无头。
运行此代码时: 这导致安装chromedriver的生产线出现以下异常: TypeError:应为str、字节或os。类路径对象,而不是元组 注意,我知道关于这个主题已经有很多帖子了,但是由于webdrivermanager似乎已经被更新了,以前的解决方案不起作用。 还有一个简短的补充说明:我通过conda而不是pip安装了webdrivermager。但这不应该引起关注。 编辑:整个堆栈跟踪:
但是,对于以下所有使用chromedriver的测试,浏览器都不能成功导航到URL。 浏览器启动,瞬间显示字符数据;出现在地址栏中(就像第一个测试中一样),然后将正确的URL插入到地址栏中。但是,页面永远不会加载,你得到了标准的chrome这个网页不可用的消息,在浏览器的正文/画布上有两个按钮reload和更多。 这是已知的问题吗? 以下异常将被删除: NosuchWindowException:
问题内容: 我要在页面https://www.reddit.com/search?q=Expiration&type=link&sort=new上抓取所有问题的链接和标题。元素具有以下结构: 我习惯于获取问题,然后通过进行迭代。我很高兴使用它来获取链接。 不过,我不知道如何提取里面的标题(从)。 有谁知道如何做到这一点? 问题答案: 请尝试以下。 或简单地
这是我的代码: 当我运行代码时,我得到一个错误: Traceback(最近一次调用最后一次):文件"app.py",第10行,在驱动程序=web驱动程序中。Chrome(executable_path='chromeDrive',选项=选项)文件"C:\用户\Winsome\AppData\本地\程序\Python\Python37-32\lib\site-包\selenium\webDrier\
在最新的Windows1803更新之后。我们面临着启动chromedriver的selenium脚本的问题。 如果脚本被放置为过夜执行,则在一段时间后脚本开始失败,webdriver除外 org.openqa.selenium.WebDriverExc0019:等待驱动服务器启动超时 下面是使用的依赖项版本 Selenium:3.141 Chromedriver:2.46 Chrome版本:72
问题内容: 我在代理服务器后面。使用Selenium 2.39,Python 2.7.6和ChromeDriver 2.9,每当我在Chrome实例上调用时,都会收到HTTP 407错误。使用FirefoxDriver时,不会发生此类错误。 可以将问题简化为以下脚本,我将其另存为(如上述堆栈跟踪所示): 此脚本成功打开了Chrome并导航到Google。在随后导致上述崩溃,留下一个死ChromeD