问题：

阿帕奇Storm三叉戟与Kafka喷口集成

太叔涵亮

2023-03-14

我无法找到正确集成Kafka和Apache Storm Trident的好文档。我试图查看相关的问题之前张贴在这里，但没有充分的信息。

GlobalPartitionInformation globalPartitionInformation  = new GlobalPartitionInformation(properties.getProperty("topic", "mytopic"));
Broker brokerForPartition0 = new Broker("IP1",9092);
Broker brokerForPartition1 = new Broker("IP2", 9092);
Broker brokerForPartition2 = new Broker("IP3:9092");

globalPartitionInformation.addPartition(0, brokerForPartition0);//mapping from partition 0 to brokerForPartition0
globalPartitionInformation.addPartition(1, brokerForPartition1);//mapping from partition 1 to brokerForPartition1
globalPartitionInformation.addPartition(2, brokerForPartition2);//mapping from partition 2 to brokerForPartition2
StaticHosts staticHosts = new StaticHosts(globalPartitionInformation);
TridentKafkaConfig tridentKafkaConfig = new TridentKafkaConfig(hosts,properties.getProperty("topic", "mytopic"));
tridentKafkaConfig.scheme = new SchemeAsMultiScheme(new StringScheme());
OpaqueTridentKafkaSpout kafkaSpout = new OpaqueTridentKafkaSpout(tridentKafkaConfig);

这样，我就可以为我的拓扑生成流，如下面的代码所示

TridentTopology topology = new TridentTopology();
Stream analyticsStream  = topology.newStream("spout", kafkaSpout).parallelismHint(Integer.valueOf(properties.getProperty("spout","6")))

虽然我提供了并行性和我的分区，但是只有一个Kafka Spout的执行器在运行，因此我无法很好地扩展它。

有谁能指导我更好地将Apache Storm Trident(2.0.0)与Apache Kafka(1.0)集成，每个集成3个节点集群吗？

2018-04-09 14:17:34.119 o.a.s.k.KafkaUtils Thread-15-spout-spout-executor[79 79] [INFO] Metrics Tick: Not enough data to calculate spout lag.  2018-04-09 14:17:34.129 o.a.s.k.KafkaUtils Thread-21-spout-spout-executor[88 88] [INFO] Metrics Tick: Not enough data to calculate spout lag.

共有1个答案

杜烨伟

2023-03-14

如果你是在Storm2.0.0，我认为你应该切换到Storm-Kafka-客户端三叉戟喷口。storm-kafka模块只打算支持较旧的Kafka版本，因为底层的Kafka API（SimpleConsumer）正在被删除。新模块支持Kafka from 0.10.0.0和Forward。

您可以在这里找到新喷管的示例Trident拓扑https://github.com/apache/storm/blob/master/examples/storm-kafka-client-examples/src/main/java/org/apache/storm/kafka/Trident/tridentkafkaclienttopologynamedtopics.java。

类似资料：

阿帕奇Storm中的JSON Kafka喷口
带有Kafka喷口瓶颈的阿帕奇Storm

我正在尝试用我的Storm设置实现最大的性能。我正在通过Kafka发送数以万计的消息，这些消息将被Storm拓扑接收。当我在Storm UI中查看时，我注意到所有消息都流向一个执行器，而不是在所有执行器之间进行负载平衡。（见附件截图）。
失败的Kinesis喷口（阿帕奇Storm）

我在Apache Storm拓扑上运行了一个性能测试，并注意到kinesis-spout中的“failed”计数非常高（几乎占了元组的1/3）。这个数值是多少？
阿帕奇Kafkavs阿帕奇Storm

Apache Kafka：分布式消息传递系统 Apache Storm：实时消息处理我们如何在实时数据管道中使用这两种技术来处理事件数据？在实时数据管道方面，我觉得两者做的工作是一样的。如何在数据管道上同时使用这两种技术？
阿帕奇Storm-喷口和螺栓不存在于StormUI

我正在本地开发一个Storm拓扑。我正在使用Storm 0.9.2孵化，并开发了一个简单的拓扑。当我使用LocalCluster（）选项部署它时，它工作得很好，但它不会显示在我的Storm UI中，它只是执行而已。当我定期部署它时，它会在我的Storm UI中显示拓扑结构，但当我单击它时，不会看到喷口或螺栓。我还尝试了许多Storm启动项目中的示例WordCountTopology。同样的行为
Storm大战三叉戟：什么时候不用三叉戟？

null 既然我问了这个问题，我的公司决定先买三叉戟。我们只会在性能出现问题时使用纯Storm。可悲的是，这不是一个积极的决定，它只是成为默认的行为（我当时不在）。他们的假设是，在大多数用例中，我们需要状态处理或只需一次处理，或者我们将在不久的将来需要它。我理解他们的推理，因为从Storm到Trident或返回并不是一个容易的转换，但在我个人看来，没有状态的流处理的概念并不被所有人理解，这是使用

阿帕奇Storm三叉戟与Kafka喷口集成

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档