当前位置: 首页 > 知识库问答 >
问题:

有没有办法使用Reddit提取R仅查看帖子标题并排除评论?

姚善
2023-03-14

标题:我希望自2021年1月1日起使用Reddit ExtractoR从特定的子reddit中提取所有帖子标题。我不知道如何引导函数只查看帖子标题而不拉入任何评论。我在下面发布了当前版本的代码:

reddit_test <- get_reddit(search_terms = NA, regex_filter = "", subreddit = "subreddit_name",
           cn_threshold = 1, page_threshold = 12000, sort_by = "new",
           wait_time = 2)

共有1个答案

皇甫智明
2023-03-14

似乎< code>get_reddit()函数总是返回注释。

看看github https://github.com/ivan-rivera/RedditExtractoR

reddit_urls() 函数将返回较少的属性,title 是其中之一:

> reddit_links <- reddit_urls(   search_terms   = "cute_cats", page_threshold = 1 )
> 
> 
> str(reddit_links) 'data.frame':   25 obs. of  5 variables:  
> $ date      : chr  "05-02-15" "24-02-14" "03-09-13" "20-05-14" ...  
> $ num_comments: num  214 26 221 36 44 41 93 199 20 175 ...  
> $ title     : chr  "My brother's cat is insanely cute!" "...  
> $ subreddit  : chr  "cats" "cats" "cats" "cats" ...  
> $ URL         : chr "http://www.reddit.com/r/cats/comments/2uv9q5/my_brothers_cat_is_insanely_cute/?ref=search_posts" ...
 类似资料:
  • 我试图抓取Reddit的subreddits帖子,其中有很多问题: < code>s2 = "我的(22m)和我的搭档(21m)是酒吧和foo" 我想做一个函数,可以解析每个字符串,然后返回年龄和性别对。所以: 从本质上讲,每个年龄/性别标签都是一个两位数,后跟。

  • 我知道有一种方法可以将链接帖子提交到reddit。 它会弹出一个这样的页面,其中填写了标题和URL 有没有办法发起文本帖子的提交?它真的只需要到达“文本”选项卡并填写此页面中的“文本”字段 需要明确的是,我知道Reddit API。我不想采取需要设置reddit帐户、reddit应用程序和管理用户身份验证的方法。我实际上已经尝试过这种方法,但将其用于我网站的其他方面存在问题。我正在寻找一些简单的东

  • 我有一个多边形的形状文件,我想用它来将光栅值提取到数据帧中。所以我在下面的代码中这样做。 这为我提供了一个由两列组成的数据框:每个多边形的数字ID和关联的提取光栅值。现在,我想为每个提取的光栅值添加x,y坐标。我已经看到对点形状文件执行此操作,但我不确定如何将其应用于多边形形状文件几何体。

  • 我在本地计算机上将一条太大的消息推送到Kafka消息主题中,现在我收到一个错误: 增加在这里并不理想,因为我实际上不想接受那么大的消息。

  • 我正在寻找一种方法,当React-Router v4更改位置时修改页面标题。我曾经在 Redux 中侦听位置更改操作,并根据 对象检查该路由。 当使用React Router v4时,列表中没有固定的路由。事实上,站点周围的各个组件可以使用<code>路由 当某些主要路线发生变化时,是否有一种方法可以通过调用操作来更新页面标题,或者是否有更好的方法来更新站点的元数据?

  • 问题内容: 说我有这样的代码: 通常,仅当所有其他调用a()-d()返回true时,才调用e()。是否可能有一些编译器或JVM选项来禁用短路评估,所以无论其他函数的结果如何,都将始终调用e()? 基本上我正在做一个大型系统的UAT,需要测试e(),但是设置确保所有a(),b()等返回true的环境和场景都是非常痛苦的… 编辑:好的,我猜想使用位AND代替逻辑可以提供某种解决方法,但是理想情况下,我