你可以,但我不推荐。
在Storm当前的设计中,nimbus是一个单点故障(有解决这个问题的计划),但是在与nimbus相同的节点上运行supervisor会使nimbus节点更有可能发生糟糕的事情,这对Storm集群来说将是灾难性的。
此外,Storm的部分设计是工人和主管节点应该能够死亡,而Storm应该能够恢复。如果除了nimbus服务器之外,还使用node-1作为supervisor,那么就会失去一些灵活性。
问题内容: 我正在开发用于执行物理模拟的科学应用程序。所使用的算法为O(n3),因此对于大量数据而言,需要很长时间才能处理。该应用程序将在大约17分钟内运行一次模拟,而我必须运行大约25,000次模拟。大约一年的处理时间。 好消息是,模拟彼此完全独立,因此我可以轻松地更改程序,以在多台计算机之间分配工作。 我可以看到实现此目的的多种解决方案: 获得一台多核计算机,然后在所有核之间分配工作。我需要做
并编写下面的查询,它是只在我的master上运行,还是将所有10个节点都用作worker? 如果不是,我必须做什么才能让我的Spark Sql使用完整的集群?
我在我选择的dataDir中观察它的zookeeper_server.pid文件,当我运行jps时,我看到以下内容: 上面的QuorumPeerMain与zookeeper_server.PID中的PID匹配,正如我所料。这样的预期正确吗?从我所做的到目前为止,是否应该期望在这里显示更多的过程? 我安装了hbase-1.1.2。我配置了hbase-site.xml。我将hbase.rootdir设
我在试着运行硒网格, 详细信息:win 7,selenium 2.4.5,selenium-server-独立-2.46.0,java 8,我得到一个错误: 无法启动新会话。可能的原因是远程服务器地址无效或浏览器启动失败。生成信息:版本:'2.45。0',修订版:'5017cb8e7ca8e37638dc3091b2440b90a1d8686f',时间:'2015-02-27 09:10:26'系
spark集群有2个工作节点。节点1:64 GB,8个内核。节点2:64 GB,8个内核。 现在,如果我在集群模式下使用spark-submit提交一个spark作业,其中有2个执行器,每个执行器内存为32 GB,则为4个内核/执行器。现在我的问题是,由于上面的配置可以容纳在单个节点中,那么spark将使用2个工作节点还是只在一个节点中运行它?
问题内容: 我尝试在Google Container Engine的群集节点上安装ElasticSearch(最新版本),但是ElasticSearch需要变量:>> 262144。 如果我ssh到每个节点并手动运行: 一切正常,但是任何新节点将没有指定的配置。 所以我的问题是: 有没有办法在引导时在每个节点上加载系统配置?Deamon Set并不是一个好的解决方案,因为在Docker容器中,系统