问题：

Kafka分区和吞吐量

楚方伟

2023-03-14

无论从什么角度来看，它都不是。

假设我有两个消费者，它们以每秒“10”条消息的速度从给定主题中消耗数据。现在，不管它们是从单个分区还是从两个不同的分区进行消耗；我的吞吐量将保持不变，每秒20条消息。

我觉得我一定漏了一些内部工作的细节，你能帮我解释一下kafka分区（多个）是如何帮助提高固定用户数量的吞吐量的，而不是单个kafka分区。

共有1个答案

饶骁

2023-03-14

https://kafka.apache.org/intro

当我开始学习Kafaka的时候；我也有同样的问题。下面的解释将帮助您回答您的问题：

假设你有一个主题a，有三个分区:X，Y&Z。

如果您的消费者组有3个消费者，而您添加了一个新的消费者，那么它将是理想的。使用者组中的使用者数<=分区数。
如果您的消费者组有2个消费者，而您添加了一个新的消费者，则将触发重新平衡。Kafka将为您的使用者分配一个分区。
如果这是全新的消费者组，那么kafka将把所有分区分配给这个新的消费者。

现在让我们假设；您的使用者是单线程的，处理一条消息大约需要1秒，那么在第三种情况下，您的吞吐量将是1消息/秒。

在情况2中；每秒3味精。因为每个使用者都在监听不同的分区和处理数据。

类似资料：

单分区的CosmosDB吞吐量限制？

在幕后，Azure Cosmos DB提供了服务T请求/S所需的分区。如果T高于每个分区的最大吞吐量T，那么Azure Cosmos DB提供N=T/T分区。
测试Kafka生产者吞吐量

我们有一个Kafka集群，由3个节点组成，每个节点有32GB内存和6个内核2.5 CPU。我们写了一个 kafka 制作人，它接收来自 Twitter 的推文，然后分批发送给 Kafka，每批 5000 条推文。在生产者中，我们使用
AWS Lambda吞吐量

来自AWS Lambda常见问题解答： Q：我一次可以执行的AWS Lambda函数的数量是否有限制？不需要。AWS Lambda旨在并行运行多个函数实例。然而，AWS Lambda的默认安全限制为每个区域每个帐户100次并发执行。如果您希望提交请求以增加100次并发执行的限制，您可以访问我们的支持中心，单击“打开新案例”，然后提交服务限制增加请求。 Q：如果我的帐户超过并发执行的默认限制，
IOPS与吞吐量

在大数据存储中，IOPS和吞吐量之间的关键区别是什么
GCP/Dataproc上Kafka、Spark、Elasticsearch堆栈的吞吐量

我正在做一个研究项目，我在谷歌云平台上安装了一个完整的数据分析管道。我们使用Spark上的HyperLogLog实时估计每个URL的唯一访问者。我使用Dataproc来设置Spark集群。这项工作的一个目标是根据集群大小来度量体系结构的吞吐量。Spark集群有三个节点（最小配置）使用Java编写的数据生成器模拟数据流，其中我使用了kafka producer API。体系结构如下所示：我用一个
Apache Flink的吞吐量和延迟

问题内容：我为Apache Flink写了一个非常简单的Java程序，现在我对测量统计信息感兴趣，例如吞吐量（每秒处理的元组数）和等待时间（程序需要处理每个输入元组的时间）。我知道Flink公开了一些指标： https://ci.apache.org/projects/flink/flink-docs- release-1.2/monitoring/metrics.html 但是我不确定如何使

Kafka分区和吞吐量

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档