当前位置: 首页 > 知识库问答 >
问题:

用python编写Kafka消费者投票消息

吕高昂
2023-03-14

我在使用者组中轮询来自 Kafka 的消息时遇到问题。我的使用者对象分配给给定的分区

self.ps = TopicPartition(topic, partition )

之后,消费者向该分区分配:

self.consumer.assign([self.ps])

之后,我可以计算分区内的消息

self.consumer.seek_to_beginning(self.ps)
pos = self.consumer.position(self.ps)

self.consumer.seek_to_end(self.ps) .....

在我的主题中有超过30000条消息。问题是我只收到一条消息。

具有< code > max _ poll _ records = 200 < code > AUTO _ OFFSET _ RESET 的消费者配置是最早的

这是我的函数,我正在尝试获取消息:

 def poll_messages(self):


    data = []

    messages = self.consumer.poll(timeout_ms=6000)


    for partition, msgs in six.iteritems(messages):

        for msg in msgs:

            data.append(msg)

    return data

即使我在开始轮询消息之前转到第一个可用的偏移量,我也只会收到一条消息。

self.consumer.seek(self.ps, self.get_first_offset())

我希望有人能解释我做错了什么。提前感谢。

最好的祝愿Jörn

共有1个答案

沈子昂
2023-03-14

我相信你误解了max_poll_records——这并不意味着你每次投票会得到200条,只是你可能得到的最多的一个限制。您需要多次调用轮询。我可以参考文档中的简单示例:http://kafka-python.readthedocs.io/en/master/usage.html

我认为更标准的实现是:

for message in self.consumer:
  # do stuff like:
  print(msg)
 类似资料:
  • 假设我的使用者从一个代理轮询,该代理有多个主题,每个主题有多个分区。我在同一个消费群体中总共有5个消费者。如果我的每个消费者都进行投票,将返回的数据顺序是什么? topicD-分区5 我的问题是,在这个单一的1轮询中,在按顺序移动到下一个主题/分区之前,我会收到来自该主题/分区的所有可用消息吗?意思例如: 在一次投票循环中,我收到了这个... 或者在那个单一的1轮询循环中,有可能接收到这个消息顺序

  • 我想在特定时间停止对特定主题的轮询。 Spring防尘套2.X Springkafka 2.5.5 Kafka版本2.5.1 比如即使有消息进来测试题目分区,消息也是从00到01堆在分区里,没有消耗。 01点之后,我想再次使用有关TEST主题的消息。 如何暂停和恢复?

  • Kafka 消费者在每个投票中轮询 500 条消息。我们禁用了, 假设我们已成功处理 100 条消息,偏移量也为 100 现在在第101条消息中,我们遇到了一个错误,我们没有提交偏移量 但是因为我们已经有了500条消息,所以我们处理了第102条消息,我们成功地处理了它,并且我们还提交了第102条消息的偏移量。 雀: 第 101 条消息会发生什么。 如何克服这个问题。

  • 我试图在我的spring boot项目中使用spring kafka来阅读来自我的kafka的消息。我正在使用@KafkaListener,但问题是我的消费者总是在运行。只要我从控制台生成一条消息,它就会在我的应用程序中弹出。我想定期投票。我怎样才能做到这一点? } 这是我的消费者配置:

  • Kafka consumer有一个配置< code>max.poll.records,它控制对poll()的单次调用中返回的最大记录数,其默认值为500。我将它设置为一个很高的数字,这样我就可以在一次轮询中获得所有的消息。然而,即使这个主题有更多的信息,在一次呼叫中,民意调查只返回几千条信息(大约6000条)。< br> 如何进一步增加单个消费者阅读的邮件数量?

  • 我的问题是,我无法足够快地轮询我的队列,以保持我的队列为空或接近空。我最初的想法是,我可以让使用者以x/s的速率通过Camel从SQS接收消息。从那里,我可以简单地创建更多的消费者,以达到我需要的消息处理速度。 我的消费者: 如图所示,我设置了和以提高消息的速率,但是我无法生成具有相同endpoint的多个使用者。 我在文档中读到,我相信SQSendpoint也是如此,因为生成多个使用者将只给我一