当前位置: 首页 > 知识库问答 >
问题:

Tweepy流行动真的很慢

王锐
2023-03-14

我正试图使用Tweepy从twitter流推一个特定的标签。我面临的问题是,获取500条推文大约需要10-15分钟。我认为不应该这么慢?我错过了什么吗?它与API比率限制有关吗?我的tweepy监听器看起来像这样:

class MyListener(StreamListener):" " "流数据的自定义StreamListener。"""

def __init__(self, lim):
    self.count = 0
    self.limit = lim

def on_data(self, data):
    global tweets
    if self.count < self.limit:
        try:
            self.count += 1
            tweets.append(data)
            return True
        except BaseException, e:
            print 'failed ondata,', str(e)
            time.sleep(5)
            pass
    else:
        return False

def on_error(self, status):
    print(status)
    return True

共有1个答案

况明贤
2023-03-14

您正在尝试获取实时推文。这意味着你收集推文的速率是人们发布带有该标签的推文的速率。您可以使用流行或趋势主题标签尝试您的代码,您将更快地获得输出。

 类似资料:
  • 我使用的代码类似于下面的代码,来自:https://github.com/tweepy/tweepy/blob/master/examples/streaming.py 该API允许您跟踪多个过滤器术语,在本例中track=['usa','canada']。这基本上意味着该流将收集提到“加拿大”或“美国”的推文。 问题是函数on_data()打印数据,但是它没有指定数据属于哪个过滤条件。当您只按一

  • 我试图用tweepy和textblob分析推特的情绪。我确实安装了pip tweepy,并且安装成功,但是我得到了以下错误。 错误消息:导入tweepy文件“C:\Users\joshey\Desktop\sent.py”第2行中的文件“C:\Users\joshey\AppData\Local\Programs\Python\Python37\lib\site packages\tweepy\u

  • 问题内容: 已锁定 。该问题及其答案被锁定,因为该问题是题外话,但具有历史意义。它目前不接受新的答案或互动。 Java 因其速度慢而享有一定的声誉。 Java真的很慢吗? 如果是,为什么?瓶颈在哪里?是因为JVM效率低下吗?垃圾收集?纯字节码库而不是JNI包装的C代码?许多其他语言都具有这些功能,但是它们并没有因速度慢而享有盛誉。 问题答案: 现代Java是最快的语言之一,即使它仍然是内存消耗大的

  • 我正在尝试使用TkinterGUI使用python/tweepy来流式传输推文。理想情况下,我会有一个启动流的“开始”按钮和一个停止流的“停止”按钮。下一个示例(来自stackoverflow)以一种简化的方式展示了我试图实现的目标: 我试图将此应用到我的代码中,开始按钮工作正常,完成了它应该做的所有事情,但停止按钮没有做任何事情。窗口没有冻结或任何东西,只是停止按钮没有效果。由于什么事也没有发生

  • 我正在尝试使用python库Tweepy来传输twitter数据。我设置了工作环境,谷歌了一下这些东西,但是我不知道它们是如何工作的。我想在python (tweepy)中使用spark streaming(DStream-Batch processing)。我至少经历了以下环节: < li >如何获取tweepy中某个位置的特定标签的推文? < Li > http://spark . Apach

  • 我想用python和tweepy流我自己的twitter时间线,并使用下面的代码,但它只是打印我一些数字,我没有打印我的时间线twitts。你能帮我吗?