当前位置: 首页 > 知识库问答 >
问题:

Kafka分区和吞吐量

楚方伟
2023-03-14

无论从什么角度来看,它都不是。

假设我有两个消费者,它们以每秒“10”条消息的速度从给定主题中消耗数据。现在,不管它们是从单个分区还是从两个不同的分区进行消耗;我的吞吐量将保持不变,每秒20条消息。

我觉得我一定漏了一些内部工作的细节,你能帮我解释一下kafka分区(多个)是如何帮助提高固定用户数量的吞吐量的,而不是单个kafka分区。

共有1个答案

饶骁
2023-03-14

https://kafka.apache.org/intro

当我开始学习Kafaka的时候;我也有同样的问题。下面的解释将帮助您回答您的问题:

假设你有一个主题a,有三个分区:X,Y&Z。

  1. 如果您的消费者组有3个消费者,而您添加了一个新的消费者,那么它将是理想的。使用者组中的使用者数<=分区数。
  2. 如果您的消费者组有2个消费者,而您添加了一个新的消费者,则将触发重新平衡。Kafka将为您的使用者分配一个分区。
  3. 如果这是全新的消费者组,那么kafka将把所有分区分配给这个新的消费者。

现在让我们假设;您的使用者是单线程的,处理一条消息大约需要1秒,那么在第三种情况下,您的吞吐量将是1消息/秒。

在情况2中;每秒3味精。因为每个使用者都在监听不同的分区和处理数据。

 类似资料:
  • 在幕后,Azure Cosmos DB提供了服务T请求/S所需的分区。如果T高于每个分区的最大吞吐量T,那么Azure Cosmos DB提供N=T/T分区。

  • 我们有一个Kafka集群,由3个节点组成,每个节点有32GB内存和6个内核2.5 CPU。 我们写了一个 kafka 制作人,它接收来自 Twitter 的推文,然后分批发送给 Kafka,每批 5000 条推文。 在生产者中,我们使用

  • 来自AWS Lambda常见问题解答: Q: 我一次可以执行的AWS Lambda函数的数量是否有限制? 不需要。AWS Lambda旨在并行运行多个函数实例。然而,AWS Lambda的默认安全限制为每个区域每个帐户100次并发执行。如果您希望提交请求以增加100次并发执行的限制,您可以访问我们的支持中心,单击“打开新案例”,然后提交服务限制增加请求。 Q: 如果我的帐户超过并发执行的默认限制,

  • 在大数据存储中,IOPS和吞吐量之间的关键区别是什么

  • 我正在做一个研究项目,我在谷歌云平台上安装了一个完整的数据分析管道。我们使用Spark上的HyperLogLog实时估计每个URL的唯一访问者。我使用Dataproc来设置Spark集群。这项工作的一个目标是根据集群大小来度量体系结构的吞吐量。Spark集群有三个节点(最小配置) 使用Java编写的数据生成器模拟数据流,其中我使用了kafka producer API。体系结构如下所示: 我用一个

  • 问题内容: 我为Apache Flink写了一个非常简单的Java程序,现在我对测量统计信息感兴趣,例如吞吐量(每秒处理的元组数)和等待时间(程序需要处理每个输入元组的时间)。 我知道Flink公开了一些指标: https://ci.apache.org/projects/flink/flink-docs- release-1.2/monitoring/metrics.html 但是我不确定如何使