当前位置：首页 > 面试题库 >

如何使用Rselenium读取html表？

裴昊阳

2023-03-14

问题内容：

我正在使用Rselenium导航到网页。以下代码正在执行此操作。我没有提供该网址，因为我在需要VPN连接的公司中使用该网址：

RSelenium::startServer()
require(RSelenium)
remDr <- remoteDriver()
remDr$navigate("some url")

导航到该网页后，在html源代码中，有下表：

<font size="2">
<table border="1">
<tbody>
<tr>
<td> item1 </td>
<td> 0 </td>
<td> 0.05 </td>
<td> 2.43 </td>
<td align="center"> Pct </td>
<td align="center"> 1 </td>
</tr>
</tbody>
</table>

现在的问题是如何提取该表的内容？请假定该URL不存在，否则我可以使用XML函数：readHTMLTable（remDr $
getCurrentUrl（））。但这出于某些原因不起作用。我只需要使用remoteDriver句柄（remDr）。非常感谢您的时间

问题答案：

就像是：

library(XML)
doc <- htmlParse(remDr$getPageSource()[[1]])
readHTMLTable(doc)

应该允许您访问html并处理包含的表。

类似资料：

如何使用Rselenium选择下拉框？

问题内容：我对英超联赛的数据感兴趣。因此，我尝试从此官方网站获取数据https://www.premierleague.com/stats/top/players/total_pass 我正在使用R和RSelenium包。但是我遇到了一些问题。有一些类别的数据，例如季节，位置，俱乐部等。因此，我认为我可以基于这些类别获取数据。但是我不知道如何在此站点中使用Rselenium在下拉框中选择特定
使用Selenium Python解析HTML并读取HTML表

问题内容：我正在将我的某些网络抓取代码从R转换为Python（我无法让geckodriver与R一起使用，但它与Python一起使用）。无论如何，我试图了解如何使用Python解析和读取HTML表。快速背景，这是我的R代码：我将HTML页面解析为doc对象。然后，我将以开始，并通过更大的数字，直到看到所需的数据。在这种情况下，我去看了想要的数据。然后，我将读取该HTML表并将其分配给WebEl
如何使用PHP读取此JSON？

问题内容：我是JSON格式的新手，在阅读的教程中，我不太了解如何使用php进行解析。所以我有这个：我想回显坐标和 reverseGeocode 。谁能请我朝正确的方向前进？问题答案：尝试跑步您的示例JSON作为字符串在哪里。
如何使用scanner.next（）读取空白

问题内容：我有一台扫描仪，并将定界符设置为“”，但是它仍然不会使用next（）方法读取空格。我知道nextline（）可以工作，但是我需要单独检查输入中的每个字符，包括空格；这是一个复杂的数据分析问题。不过我很困惑。谷歌什么也没发现。谁能帮我这个？我正在考虑将空格反转为一个特殊字符，然后出于分析该字符的目的，将其反转回一个包含在字符串中的空格……这似乎有些过头了！有没有更优雅的方式做到这一点？
如何使用Apache Flink读取Cassandra？

我的flink程序应该为每个输入记录做一个Cassandra查找，并根据结果做一些进一步的处理。但问题是，每次查找需要将近10秒，换句话说，这个循环需要50秒来执行。我如何加快这个操作？或者，在Flink中有没有其他的方法可以查到Cassandra呢？
如何使用html

我不熟悉html 但是，我只想在没有水平滚动条的情况下有足够的水平空间来包装元素。否则，我希望一个垂直滚动条和项目是在一个单一的列。

相关阅读

如何使用Selenium Python读取表数据？如何使用JSP读取表单数据？如何使用PHP读取json属性如何使用EMF读取XML文件？如何使用Java读取Android属性

相关文章

Jsoup 使用DOM解析HTML Firebase读取数据 Cassandra读取数据 PDFBox读取文档 OpenCV读取图像

相关问答

如何只使用FileReader读取多行？如何使用HttpClient读取XML响应？如何使用InputStream从ZIP读取文件？如何使用 Apache POI 读取特定行？如何使用spring webflux读取请求体

相关工具

读取txt并实现翻页效果 html 实用rss阅读器 HTML Purifier HTML Tidy

相关文档

如何使用 Gitbook 来做笔记 HTML 宝典 HTML Canvas Deep Dive HTML 基础教程 HTML 入门教程