当前位置: 首页 > 知识库问答 >
问题:

为什么来自Selenium的HTML源看起来与web浏览器视图中显示的不同?

郭阳泽
2023-03-14

我正在使用Python和Selenium捕获网页的HTML源,这样我就可以解析它来找到一个特定的元素。然而,它的来源与我使用浏览器的“Inspect Element”视图时得到的不同。我要找的元素不在硒提供的源中。有没有办法使用硒,或者使用另一种工具或方法获得相同的源?

共有1个答案

席安康
2023-03-14

正如selenium文档中所描述的:

getPageSource
java.lang.String getPageSource()

获取上次加载页面的源。如果页面在加载后被修改了(例如,通过Javascript),则不能保证返回的文本是修改过的页面的文本。请参考正在使用的特定驱动程序的文档,以确定返回的文本反映的是页面的当前状态还是web服务器上次发送的文本。返回的页面源是底层DOM的表示:不要期望它以与从web服务器发送的响应相同的方式格式化或转义。就当是艺术家的印象吧。

返回:当前页面的源

 类似资料:
  • 我习惯于用旧标记编码,并尝试用内联CSS来完成。 我有一张内联样式的桌子。我试图得到一个彩色的1px边框。在FFox和Opera(边框颜色#FFBF97)下看起来像是需要的,但IE11显示了不同的边框颜色(黑色) 我做错了什么? 下面是我的代码: 我尝试更改style=“border-collable:collable;table border:1px;border-color:#FFBF97;”

  • 我看了几个教程,他们所有的列表首选对话框都是这样的。 列表偏好对话框 但我的对话看起来像这样 我的对话 知道为什么我的对话框看起来不一样吗?我查看了教程,我的xml代码看起来和他们的一样。 下面是我的pref_general.xml代码。 和部分活动代码

  • 我在我的节点后端生成一个pdf,如下所示: 现在,当我调用后端和控制台时。记录响应,我得到以下输出: _正文:“%PDF-1.3↵%����↵50 obj↵ 标头:标头_headersMap:地图大小:(...)原型:地图[1] 0:{"内容类型"= 我看到我的PDF在回复的正文中。但我现在如何在浏览器中查看或下载它?如果有必要的话,我会在前端使用Angular2。 我找到的信息是以前的angul

  • 我有一个模块化的JavaFX应用程序,具有以下Java代码: 这是模块信息。java文件: 我使用以下命令编译模块化JavaFX应用程序: 我使用以下命令打包模块化JavaFX应用程序: 然后我将应用程序保存在我的/应用程序文件夹中(我在Mac OS上),然后打开应用程序。应用程序会打开一个500x500窗口,但不会渲染任何图形,也不会打开web浏览器。应用程序只打开一个白色空白500x500窗口

  • 问题内容: 我有一个关于解析在线html页面的问题。 当我从Web浏览器打开html源代码时,可以在其中看到数据。 但是,当我从Java读取此html页面时。我无法到达数据。 保存此html文件并将其读取为本地文件后, 然后我就可以从那里读取数据了。 我以eBay.com.au为例。 // - - - - 例 - - - - - 目标网页网址:http://www.ebay.com.au/sch/