当前位置: 首页 > 知识库问答 >
问题:

检索包含``

蔺山
2023-03-14

当我用R在web上抓取研究文章时,我遇到了HTML代码,其中a

然而,我希望在<代码>

如果我简单地执行以下操作,无论结束语之后出现什么文本

在下面的示例中,我要检索的是“text 1text 3”,而不仅仅是“text 1”。

> library("rvest"); library("tidyverse")
> x <- read_html("<p>text1<div>text2</div>text3</p>")
> x %>% html_nodes("p") %>% html_text()
[1] "text1"
> x
{xml_document}
<html>
[1] <body>\n<p>text1</p>\n<div>text2</div>text3</body>

有没有办法做到这一点?任何指针都将不胜感激。

澄清:

我想做的是检索


共有1个答案

秦俊发
2023-03-14

这是纯xpath解决方案,以获取text 2text 3text 4作为输出。

string-join(//p/descendant-or-self::*/text(),'')

屏幕截图:

 类似资料:
  • 上面的XPath查询捕获了我正在查看的特定部分中的所有文本,这很棒。但是,我只需要知道testuser是否在那个部分。

  • 它要求geolocator包不能检索位置。他们最近发布了一个新的3.0.0版本,在那之后我只剩下了余波。 我正在使用正确的依赖关系: 扑扑医生给我这个: 一旦我调用,代码就不会返回任何东西,我在终端中有以下输出: I/DynamiteModule(4233):考虑本地模块com.Google.Android.gms.maps_Dynamite:0和远程模块com.Google.Android.gm

  • 我正在使用google_sign_in包将Google Sign In集成到我的flutter应用程序中,我注意到一旦用户登录,您就可以看到显示名称,但不能看到名字和姓氏: 我还注意到,用于Google登录的Android和iOS库确实包括和字段,但出于某种原因,它被排除在flutter库之外。 我是不是漏掉了什么?是否有一种方法可以使用额外的api调用来检索这些字段? 注意:请不要响应,只需通过

  • 我正在处理一个作为可执行jar运行的Spring Boot应用程序。在我的代码中,我试图检索运行的jar文件所在的文件夹。但是我发现了一些困难。我这样做了: 问题是,通过这种方式,打印输出是这样的: 这不是我所需要的,因为我需要包含jar文件的目录路径,int这个例子是这样的:/home/andrea/git/notartel-api-batch/target/ 怎么了?我错过了什么?如何尝试修复

  • 我是动态规划新手,已经尝试了我的第一个DP问题。问题陈述是 给定一个尺寸为C的背包,以及n个尺寸为s[]且值为v[]的物品,最大化可放入背包的物品的容量。一个物品可以重复任意次数。(允许重复物品)。 虽然我能够建立递归关系并创建DP表,最终得到背包中可以放入的最大值,但我无法设计一种方法来检索必须选择哪些值才能得到所需的和。 以下是我的解决方案: 在我的解决方案中,我尝试将选择的最大值项的位置存储

  • SELECT 语句 是最常用的SQL语句了,用来索引一个或者多个表信息。 关键字(keyword) 作为SQL组成部分的字段,关键字不能作为表或者列的名字。 使用SELECT索引数据,必须至少给出两条信息,想要什么? 从什么地方获取? 检查单个列 SELECT prod_name FROM Products; 解释:使用SELECT 语句从 Products 表中检索一个名为prod_name