问题：

ack引起的Storm潜伏期

金阳曜

2023-03-14

我用Kafka-Storm来连接Kafka和Storm。我有3台服务器运行zookeeper，kafka和Storm。Kafka中有一个主题“测试”，它有9个分区。

在storm拓扑中，KafkaSpout执行器的数量是9，默认情况下，任务的数量也应该是9。“提取”螺栓是唯一连接到KafkaSpout的螺栓，即“原木”喷口。

从用户界面来看，喷口的失败率很高。但是，bolt中执行的消息数=发出的消息数-bolt中失败的mesage数。当失败的消息一开始为空时，这个等式几乎是匹配的。

共有1个答案

慕宜民

2023-03-14

如果您设置的数量为0，那么Storm将自动ack每一个样本。

config.setNumAckers(0);

请注意，UI只测量并显示5%的数据流。除非你设置

config.setStatsSampleRate(1.0d);

尝试增加螺栓的超时时间并减少topology.max.spout.pending的数量。

    config.put(Config.TOPOLOGY_TRANSFER_BUFFER_SIZE,32);
    config.put(Config.TOPOLOGY_EXECUTOR_RECEIVE_BUFFER_SIZE,16384);
    config.put(Config.TOPOLOGY_EXECUTOR_SEND_BUFFER_SIZE,16384);

类似资料：

监测Storm螺栓的潜伏期

我正在尝试测量拓扑中每个bolt的延迟。Storm给出的延迟数是不够的，因为我们想要计算百分位数。在我当前的设置中，我通过测量完成execute方法（包括发出调用）所需的时间来测量bolt的延迟。该方法的假设是,即使当前bolt实例和下一个bolt实例在拓扑结构中共享同一个执行器,收集器的emit也会立即返回,而不需要调用下一个bolt实例执行方法。
Storm，螺栓潜伏期和总潜伏期之间的巨大差异？

下面是我的拓扑Storm UI的截图。这是在拓扑完成处理10K消息之后拍摄的。（拓扑配置为4个工作者并使用KafkaSpout）。我的螺栓的“进程延迟”之和约为8100ms，而拓扑的完整延迟要长得多，为115881ms。 *请注意，在进程和执行延迟之间有很大差异的一个bolt实现了ticking bolt，批处理模式。因此这种差异是预料到的。 *编辑。我怀疑这种差异可能涉及到消息在完全处理后被
14.1 加载和潜伏

加载和潜伏绘图实际消耗的时间通常并不是影响性能的因素。图片消耗很大一部分内存，而且不太可能把需要显示的图片都保留在内存中，所以需要在应用运行的时候周期性地加载和卸载图片。图片文件加载的速度被CPU和IO（输入/输出）同时影响。iOS设备中的闪存已经比传统硬盘快很多了，但仍然比RAM慢将近200倍左右，这就需要很小心地管理加载，来避免延迟。只要有可能，试着在程序生命周期
潜伏式漏洞测试 (OTG-INPVAL-015)

Summary Also often refered to as persistent attacks, incubated testing is a complex testing method that needs more than one data validation vulnerability to work. Incubated vulnerabilities are typical
Storm+Kafka：理解ack、失败和延迟

我正在使用从2个Kafka主题中消费，每个主题都有6个分区。喷口进入单个螺栓以解压缩相关字节，然后进入第二个螺栓以进一步处理。当我看到storm-ui的时候，这些数字没有多大意义，我希望有人能给我一些启示。 > Kafka的口水说它“收集”了3600个元组，失败了73M个元组。再看下一组的螺栓，我看到有的已经顶起了73米，有的已经顶起了1.3米（没有出现故障），而有的已经顶起了1.3米（没有出现
潜在语义索引(LSI)

　　　　在数据分析中，我们经常会进行非监督学习的聚类算法，它可以对我们的特征数据进行非监督的聚类。而主题模型也是非监督的算法，目的是得到文本按照主题的概率分布。从这个方面来说，主题模型和普通的聚类算法非常的类似。但是两者其实还是有区别的。　　　　聚类算法关注于从样本特征的相似度方面将数据聚类。比如通过数据样本之间的欧式距离，曼哈顿距离的大小聚类等。而主题模型，顾名思义，就是对文字中隐含主题的一种

ack引起的Storm潜伏期

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档