我有一个kafka主题,有25个分区,集群已经运行了5个月。
根据我对给定主题的每个分区的理解,偏移量从0,1,2开始...(无界)
我看到log-end-offset值很高(现在-
我创建了一个新的消费群体,偏移设置为最早;因此,我预期该消费者组的客户端将从偏移量0开始的偏移量。
我用来创建一个偏移量为最早的新消费者组的命令:
kafka-consumer-groups --bootstrap-server <IP_address>:9092 --reset-offsets --to-earliest --topic some-topic --group to-earliest-cons --execute
我看到正在创建消费者组。我预计当前偏移量为0;然而,当我描述消费者组时,当前偏移量非常高,目前-
设置的记录保留期限为7天(标准值)。
我的问题是,为什么我们没有看到第一个偏移量,来自这个消费者组的消费者将从该偏移量读取0?它与数据保留有关吗?
有人能帮我理解吗?
正是数据保留。Kafka很可能已经从您的分区中删除了偏移量为0的旧消息,因此从0开始没有意义。相反,Kafka会将offset设置为分区上最早的可用消息。您可以使用以下方法检查这些偏移:
./kafka-run-class.sh kafka.tools.GetOffsetShell --broker-list <IP_address>:9092 --topic some-topic --time -2
您可能会看到非常接近您所看到的新消费者抵消的值。
您还可以尝试将偏移量显式设置为0:
./kafka-consumer-groups.sh --bootstrap-server <IP_address>:9092 --reset-offsets --to-offset 0 --topic some-topic --group to-earliest-cons --execute
但是,您会看到警告,指出偏移量0不存在,它将使用更高的值(前面提到的最早的可用消息)
New offset (0) is lower than earliest offset for topic partition some-topic. Value will be set to 1143755193
我们在Kubernetes中基于<code>gcr.io/google_containers/Kubernetes-Kafka:1.0-10.2.1</code>docker映像运行一个Kafka集群,使用<code>gcr.io/google_containers/Kubernetes-zookeeper:1.0-3.4.10</code>,使用三个Kafka和zookeer实例。 我们有几个不
在一个消费者群体中的所有消费者都失败后,kafka会将该消费者群体的补偿存储多长时间?是否有此配置变量?
在Kafka中创建主题后,您可以创建任意数量的消费者组,只需尝试使用这些组来阅读主题。 我想创建一个额外的消费者组来监控真实消费者组的消息内容——一个用来偷看他们消息的组。因此,GUI会让您单击任何消费者组的“偷看”,“偷看”组的偏移量将更新为被监控组的偏移量,然后它会向您显示该偏移量中的消息。 不过我很困惑,因为你不能在第一次就明确地创建一个消费者群体。您似乎必须阅读一条消息才能获得在动物园管理
试图理解Kafka中的消费者群体行为。示例4分区可用。在消费者方面,消费者群体控制着4个消费者。在这种情况下,在消费者组中的4个消费者中,只有一个消费者始终收到消息。其他人总是无所事事。可能的原因是什么? 是否所有分区都保存相同的消息?或者所有分区都有相同的消息?或者我们可以认为分区不是均匀分布的吗?
我是Kafka的新手,正在学习Kafka内部知识。请根据需要随时更正我的理解。。 这是我的实时场景..感谢所有的回复: 我有一个接收数据文件的实时FTP服务器…比如索赔文件。 我将把这些数据发布到一个主题中.让我们把这个主题称为claims_topic(2个分区). 我需要订阅这个claims_topic,阅读消息并将它们写入Oracle和Postgres表。让我们将oracle表称为Otable
我在使用Kafka时遇到了一些问题。非常感谢任何帮助!我在docker swell中分别有zookeeper和kafka集群3个节点。您可以在下面看到Kafka代理配置。 我的情况: < li > 20x位制片人不断向Kafka主题传达信息 < li>1x消费者读取和记录消息 < li >终止kafka节点(docker容器停止),因此现在群集有2个Kafka代理节点(第3个节点将自动启动并加入群