当前位置: 首页 > 知识库问答 >
问题:

Apache STORM-元组在工作人员中的分布

冯良才
2023-03-14
                                      Spout --> BoltA --> BoltB

对于我的拓扑--我在一个任务上的负载为90%,而第二个任务的负载为0%。

为什么对多个工人来说这是不同的。

共有1个答案

越霖
2023-03-14

如果在Spout和BoltA之间有shuffle连接,则元组应该均匀分布。

正如Stig Rohde Døssing所提到的,您提到的行为与“本地或shuffle分组”(参见Storm Concepts)相匹配,后者将优先向本地工作者进程上的任务发送元组。

因此,如果Spout的并行度为1,并且其中一个BoltA任务位于同一工作进程上,则来自Spout的元组将优先路由到该本地下游任务。

 类似资料:
  • 我试图用一个服务人员使用Workbox制作一个非常基本的PWA,但是我有一个问题。我正在使用命令行界面来生成服务工作人员,一切正常,完美的亮点,但我不能将我的index.html添加到运行时缓存中。我必须将其添加到全局模式,以便我的网站在离线模式下工作,但当我更新index.html文件时,除非我清除缓存,否则不会更新。我想要和我的js和css一样的东西。当我升级这些文件时,它们会更新。这是我的工

  • 创建部门表 到目前为止,我已经收到了下面的查询,我无法得到该部门工作的员工人数。我怎么能那么做?

  • 我一直在使用python中的docplex解决rcpsp问题。我考虑了10个具有指示性成本的任务和一个必须在10个时间框架内完成这些任务的工人(可以是周、天等)。 我的限制之一是工作人员可以在每个时间帧(worker_availability列表)中执行一组特定的任务。如果我考虑下面链接上的示例,可以将辅助角色的可用性限制为不超过特定点,即mdl.sum(资源) 我希望使用符合worker_可用性

  • 我正在学习使用可拆分DOFN。我预计我的工作将分配给500名员工,但Dataflow只运行了1或2名员工。我是否错误地理解或实现了可拆分DoFn? 我的beam版本是2.16.0

  • 我正在玩Kafka-Connect。我让 在独立模式和分布式模式下工作。 他们宣传工人(负责运行连接器)可以通过 进行管理 但是,我还没有看到任何描述如何实现这一目标的文档。 我如何着手让< code>YARN执行工人?如果没有具体的方法,是否有通用的方法来让应用程序在< code>YARN中运行? 我已经使用< code>spark-submit将< code>YARN与SPARK一起使用,但是

  • 问题内容: a和b的值交换在内部如何工作?它绝对不使用临时变量。 问题答案: Python将右侧表达式与左侧赋值分开。首先评估右侧,并将结果存储在堆栈中,然后使用再次从堆栈中获取值的操作码分配左侧名称。 对于具有2或3个项目的元组分配,Python只是直接使用堆栈: 在两个操作码(将一个变量中的值推入堆栈)之后,堆栈顶部保持。该ROT_TWO操作码交换顶部的堆栈上的两个位置,使堆积现在有在顶部。然