问题：

Kafka在一个主题中重新平衡数据由于缓慢（er）消费者

潘宸

2023-03-14

例如，假设我有一个包含4个分区的主题。我给这个主题发4K消息。每个分区获得1K条消息。由于外部因素，3个消费者分别处理了他们所有1K的消息。但是，第四个分区只能通过200条消息，剩下800条消息需要处理。是否有一种机制允许我“重新平衡”主题中的数据，也就是说，给分区1-3 200个分区4s的数据，让所有带有200条消息的分区成为一个进程？

当前分区副本分配

{
  "version": 1,
  "partitions": [
    {
      "topic": "MyTopic",
      "partition": 0,
      "replicas": [
        0
      ],
      "log_\ndirs": [
        "any"
      ]
    },
    {
      "topic": "MyTopic",
      "partition": 1,
      "replicas": [
        0
      ],
      "log_dirs": [
        "any"
      ]
    },
    {
      "topic": "MyTopic",
      "partition": 4,
      "replicas": [
        0
      ],
      "log_dirs": [
        "any"
      ]
    },
    {
      "topic": "MyTopic",
      "partition": 3,
      "replicas": [
        0
      ],
      "log_dirs": [
        "any"
      ]
    },
    {
      "topic": "MyTopic",
      "p\nartition": 2,
      "replicas": [
        0
      ],
      "log_dirs": [
        "any"
      ]
    },
    {
      "topic": "MyTopic",
      "partition": 5,
      "replicas": [
        0
      ],
      "log_dirs": [
        "any"
      ]
    }
  ]
}

建议的分区重新分配配置

{
  "version": 1,
  "partitions": [
    {
      "topic": "MyTopic",
      "partition": 3,
      "replicas": [
        0
      ],
      "log_ dirs": [
        "any"
      ]
    },
    {
      "topic": "MyTopic",
      "partition": 0,
      "replicas": [
        0
      ],
      "log_dirs": [
        "any"
      ]
    },
    {
      "topic": "MyTopic",
      "partition": 5,
      "replicas": [
        0
      ],
      "log_dirs": [
        "any"
      ]
    },
    {
      "topic": "MyTopic",
      "partition": 2,
      "replicas": [
        0
      ],
      "log_dirs": [
        "any"
      ]
    },
    {
      "topic": "MyTopic",
      "p artition": 4,
      "replicas": [
        0
      ],
      "log_dirs": [
        "any"
      ]
    },
    {
      "topic": "MyTopic",
      "partition": 1,
      "replicas": [
        0
      ],
      "log_dirs": [
        "any"
      ]
    }
  ]
}

共有1个答案

岳阳文

2023-03-14

当产生消息时分配分区。它们永远不会在分区之间自动移动。通常，对于每个分区，可以有多个消费者（具有不同的消费者组id）以不同的速度消费，因此代理不能根据消费者（组）的速度在分区之间移动消息。不过，您可以尝试以下几点：

更多的分区，希望负载分配更公平（您可以拥有比使用者更多的分区）
让生产者显式地在每个消息上设置分区，以便在分区之间生成使用者可以更好地处理的分发
让使用者监视它们的延迟，并在它们落后时主动取消对分区的订阅，以便让其他使用者接收负载。

类似资料：

多个Kafka制作人都在写同一个主题-如何平衡消费

所以我有一个设计，其中我有多个生产者P1、P2、P3、P4... PN写入单个主题T1，它有32个分区。另一方面，我在一个消费者组中最多有32个消费者。我想负载平衡我的消息消耗阅读文档时，我可以看到3个选项： 1。自己定义分区（缺点是我必须知道最后一条消息发送到哪里，或者为每个生产者定义分区范围P） 2。定义一个密钥并将分区决定权交给Kafka哈希算法（缺点-负载平衡将在运气好的情况下定义）
Kafka总是一个消费者在一个组中消费主题消息

我有两个组id相同的消费者服务器订阅了相同的主题。kafka服务器仅使用一个分区运行。据我所知，消息应该在这两个消费者服务器中随机使用。但现在似乎总是同一个消费者服务器A消费消息，另一个不消费消息。如果我停止消费者服务器A，另一个将正常工作。我所期望的是，他们可以随机消费信息。
Kafka消费群体中只有一个消费者的再平衡

当一个组中只有一个消费者，并且认为消费者无法在session.time.out内进行轮询时，将触发重新平衡，但是在这种情况下，组中只有一个消费者，现在假设session.time.out是30秒和消费者民意调查后50秒组协调员将识别消费者后50秒，并允许它提交偏移或协调员将断开消费者和没有偏移得到提交，并将重新平衡消费者与新的消费者标识？如果上次提交的偏移量是345678，在下一次轮询中，它处理了
Kafka消费者正在重新消费来自主题的消息

生产者发送消息到一个有四个分区的主题。我们有一个消费者在消费来自这个主题的消息。应用程序在工作日一直运行周末例外：它不会在周末期间调用poll方法。使用者配置：自动提交，自动提交时间为5s（默认）。应用程序一直运行良好，直到一个星期天，当它重新开始调用poll方法。我们看到有数百万条消息从这个话题中被轮询出来。消费者基本上是轮询来自主题的所有消息。将新的偏移量与它在周末停止之前的偏移量进行比较
在同一消费阶层中消费多个Kafka主题

我有一个spring boot项目，我是spring-kafka来连接底层的kafka事件枢纽。我不得不在同一节消费者课上听2个不同的话题。我有两种方法可以这样做。一个是要有两个这样的Kafka听众：另一种方法是在同一个kafkaListener中有两个主题，如下所示 ===================edit===============application.yml中的Kafka属性
在重新平衡后，同一组下的Kafka消费者正在消费相同的分区

根据Kafka的文件： kafka保证主题分区只分配给组中的一个消费者。但我在服务中观察到了不同的行为。以下是一些细节：我用的是Kafka2.8和SpringKafka2.2.13。最初我有一个Kafka主题包含5个分区，这个主题在我的服务中使用了Spring和ConcurrentKafkAlisterContainerFactory中的注释，并发性=5。这个配置对我来说很好。后来，我开始

Kafka在一个主题中重新平衡数据由于缓慢（er）消费者

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档