我使用Scopus上的高级搜索将文章缩小到适合特定主题的文章;搜索返回了24609个文档。我希望将所有文章下载为XML,然后使用“tm”R包进行文本挖掘,以进一步减少论文数量。
在R中使用Scopus API下载XML文件时遇到了问题。理想情况下,我希望通过Scopus API使用rscopus包从搜索中下载所有24609个XML。下面是我用来尝试下载一篇文章的一些代码:
api_key = get_api_key(NULL, error = FALSE)
if (!is.null(api_key)){
x = article_retrieval("2-s2.0-50949114517", identifier = "eid",
verbose = FALSE, view = "FULL")
gen = x$content$`full-text-retrieval-response`
ot = gen$originalText
} else {
x = article_retrieval("2-s2.0-50949114517",
identifier = "eid",
api_key_error = FALSE)
这将返回"未找到资源"的错误。我也尝试过使用DOI的这种方法,但也失败了。
虽然这段代码只找到一篇文章,但有没有一种方法可以使用raspus包从一次搜索中下载所有文章?我有点不知道如何使用这个包运行它。我可以下载所有文章的CSV文件中的引用信息,其中包括EID和DOI的列,因此可以对该列应用文章检索功能。
使用R版本3.5.1,Mac OS X 10.13.6
GitHub上有一个脚本
https://github.com/ElsevierDev/get_sd_oa
标识SciextDirect中的所有OpenAccess文章,并将其URI存储在文本文件中。
该脚本包含一些通过ISSN循环的逻辑。你也许可以把剧本改编成适合你需要的剧本。
问题内容: 我有以下代码,用于使用JSoup在Java中解析HTML。 问题是我只能检索首页搜索结果链接。我应该怎么做才能从Google搜索结果的其余页面获得链接。 问题答案: 如果要从第二页获得结果,请添加到URL。对于第三页使用,依此类推。
文档建议使用以下函数删除特定索引: 我已经适应了: 但这给了我以下错误: 我找了几个小时都没有结果,有人有什么想法吗?
我正在尝试学习与php composer包的帮助。我有一个,其名称为,其中包含、、、字段。我想有基于以上字段的过滤器,它应该在操作符。我当前的查询代码是: 我的问题是: > 我无法获取数据。但是如果我执行下面的代码: 我在运算符中获取值,但需要在其中包含操作。
问题内容: 如何在SQL Server中搜索表的所有列? 问题答案: 如果您正在寻找完全的全场比赛。如果要查找子字符串匹配项,则必须进行很长的路要走:
问题内容: 我使用XPather浏览器检查HTML页面上的XPATH表达式。 我的最终目标是在Selenium中使用这些表达式来测试用户界面。 我得到了一个HTML文件,其内容类似于以下内容: 我想选择一个包含字符串“ ” 的文本的节点。 使用“ abc”这样的普通字符串不会有问题。我使用类似于的XPATH 。 当我尝试使用类似的XPATH时,不会返回任何内容。关于带有“ ”的文本是否有特殊规定?
我目前有一个这样的包结构: 我想用util编写一个函数。py检索a.py、b.py、c.py中的所有函数 我可以成功导入模块。 比我以前 但是它返回了许多不需要的信息。从这里,我如何检索a.py、b.py、c.py?
我有一个neo4j实例,其中有多种类型的节点(标签),每种节点都有自己的一组属性。所以,说我有: 我的问题是,是否有一个单一的‘高效’密码查询可以进行盲搜索。基本上,它应该能够搜索所有标签和所有属性,并给我匹配的节点。因此,一个单一的查询来匹配'XYZ'与我的数据库中的Person,Location,Event和其他标签的所有属性。 我理解一种方法是使用一个非常长的where子句,在其中我硬编码我
问题内容: 考虑有一个名为的表: 该表在PeopleDb数据库中 现在,我想找到“ Mike”关键字。情况 : 我不知道要搜索哪个数据库,表。 我需要一个查询,它在所有数据库和表中进行搜索, 并向我显示以下内容: | Id | DatabaseName | TableName | ColumnName | Pk | SearchValue | 1 | ‘PeopleDb’ | ‘People’ |