当前位置: 首页 > 知识库问答 >
问题:

如何使用推特 API 收集所有英文推文?

能远
2023-03-14

我想使用tweepy收集所有英文推文。这里可以用Twitter搜索api,但是不知道API的‘查询’部分要给什么。根据文件,我知道这部分是必需的。

如何处理此查询部分并收集所有英文推文?

共有2个答案

皇甫雨华
2023-03-14

我不确定如何使用Tweepy来实现这一点,但是如果您可以直接调用Twitterendpoint,您只需添加< code>lang参数,如下所示:

https://api.twitter.com/1.1/search/tweets.json?q =你的搜索

颜志业
2023-03-14

如果你想用英语收集所有的推文,如果没有Twitter的GNIP平台,这是不可能的。

你能做的就是使用流媒体API获取所有英语推文的样本。

 类似资料:
  • 我用Flume收集推文,并存储在HDFS上。收集部分工作正常,我可以在我的文件系统中找到我所有的推文。 正如我们所看到的,推文存储在128MB的块中,但只使用几个Ko,这是HDFS的正常行为,如果我错了,请纠正我。 然而,我如何在一个文件中获取所有不同的推文? 这是我使用以下命令运行的conf文件: flume ng agent-n TwitterAgent-f./my flume files/t

  • 我可以用简单的代码发布一条推文: 问题是,这条推文将发布在我的个人资料上。我的问题是,我可以在其他帐户上发布推文,但使用我的密钥和令牌吗?像这样:

  • 我正在尝试使用tweepy(用于twitter的python api)发布推文。我有一个很长的url,使用itty bitty来承载一个降价页面。该链接可以通过twitter网站(此处为tweet)发布,但不能通过api发布。返回的错误表明tweet太长: 我已经确保tweet低于字符限制,减去t.co缩短的URL限制使用的字符(目前每个URL 23个)。不确定下一步要尝试什么?

  • 我正在使用Twitter4J检索用户时间线,但它停止了工作。接受请求的数量很好,但我遇到了自动验证问题,可能与时钟同步有关? 信息:查询Twitter时出错:401:身份验证凭据(https://dev.twitter.com/pages/auth)丢失或不正确。确保已设置有效的使用者密钥/密码、访问令牌/密码,并且系统时钟同步。{“请求”:“/1.1/statuses/user_timeline

  • 我正在尝试使用Twitter API实时收听许多用户(特定用户)的推文,但我无法找到任何关于此的留档。我发现了很多关于收听使用某个主题标签或关键字的推文的信息,但没有关于实时收听来自某些用户的所有推文的信息。 使用Twitter4J API,我能够指定多个用户,创建一个流,然后在其中一个用户发推文时运行一段代码。我如何使用PHP完成这一点?

  • 有没有一种简单的方法可以“$推送”文档的所有字段?例如: 假设我有一本Mongo藏书: 我想按作者对它们进行分组-对于每个作者,列出他的整本书对象: 我可以通过显式推送所有字段来实现这一点: 但是有没有什么捷径,比如: