当前位置: 首页 > 知识库问答 >
问题:

python selenium本地html源代码

华建同
2023-03-14

我想通过Selenium获得一个本地html源代码。

from selenium import webdriver
from bs4 import BeautifulSoup
driver = webdriver.Chrome('/usr/local/bin/chromedriver2')
driver.get("test.html")
html = driver.page_source
bsObj = BeautifulSoup(html)

但是,会发生此错误。

Traceback (most recent call last):
 File "test.py", line 4, in <module>
 driver.get("test.html")
File "/Users/seula/miniconda3/lib/python3.7/site- 

packages/selenium/webdriver/remote/webdriver.py“,第333行,在get self.execute(command.get,{'url':url})文件”/users/seula/miniconda3/lib/python3.7/site-packages/selenium/webdriver/remote/webdriver.py“,第321行,在execute

self.error_handler.check_response(response)

  File "/Users/seula/miniconda3/lib/python3.7/site- 

packages/selenium/webdriver/remote/errorhandler.py“,第242行,在check_response中

raise exception_class(message, screen, stacktrace)

selenium.common.exceptions.InvalidArgumentException: Message: invalid argument

(Session info: chrome=79.0.3945.130)

共有1个答案

太叔天宇
2023-03-14

您需要告诉驱动程序它是一个文件,而不是url

driver.get(r'file:\C:\folder\test.html')
 类似资料:
  • 我目前正在wpf中重新编码我的Epic-Games-Launcher一样的项目(因为它在WinForm中看起来像垃圾),但是为了制作旧版本,我硬编码了所有的游戏页面。我想通过使用webBrowser下载字符串(这是HTML代码)并加载它来绕过这个问题,但现在我有一个问题,我不知道如何从HTML文件运行C#代码。我会很乐意得到任何帮助。 编辑:我也可以考虑加载一个xaml文件。

  • 前面小节我们介绍了如何设置Locale,设置好Locale之后我们需要解决的问题就是如何存储相应的Locale对应的信息呢?这里面的信息包括:文本信息、时间和日期、货币值、图片、包含文件以及视图等资源。那么接下来我们将对这些信息一一进行介绍,Go语言中我们把这些格式信息存储在JSON中,然后通过合适的方式展现出来。(接下来以中文和英文两种语言对比举例,存储格式文件en.json和zh-CN.jso

  • phantomjs 可能会遇到无法下载的问题,建议先用 cnpm 全局安装 cnpm install -g phantomjs-prebuilt 请更新 NodeJS 版本到 v7.6.0 以上,build 命令逐步使用 async。 yarn # 使用 yarn.lock 保证依赖版本一致 yarn dev # 或者 npm run dev yarn dev -- --env.includ

  • 问题内容: 在Java中,我可以为位于硬盘驱动器本地的文件创建URI吗?如果是这样,应该如何构造? 问题答案: 查看文件文档: File具有构造函数,该构造函数将URI作为参数,并且如果您想从现有文件中获取URI ,它也具有方法。您可以玩这个游戏,以了解应该如何做。 您还可以阅读有关URI(不是Java术语)的信息。维基百科中有一个示例: 文件:///home/username/RomeoAndJ

  • 本部分下载 OpenShift 所需要的安装包,并基于http 服务器创建本地 yum 源。 绑定订阅账户注册账户 # subscription-manager register --username=<user_name> --password=<password>查找包含 OpenShift 订阅的 Pool ID # subscription-manager list --available

  • 问题内容: 我用python与selenium结合编写了一个脚本,以从其着陆页中抓取不同文章的链接,并通过跟踪引向其内页的url最终获得每个文章的标题。尽管我在这里解析的内容是静态内容,但我还是使用了selenium来查看它在多处理中的工作方式。 但是,我的意图是使用多处理进行抓取。到目前为止,我知道selenium不支持多处理,但似乎我错了。 我的问题:当使用多处理运行selenium时,如何减