当前位置: 首页 > 知识库问答 >
问题:

Hazelcast:为集群中具有临时网络故障的节点调优属性

申屠恺
2023-03-14

我们嵌入了10个aws实例的hazelcast集群。hazelcast的版本是3.7.3,现在我们对hazelcast有以下设置

hazelcast.max.no.heartbeat.seconds=30
hazelcast.max.no.master.confirmation.seconds=150                
hazelcast.heartbeat.interval.seconds=1
hazelcast.operation.call.timeout.millis=5000
hazelcast.merge.first.run.delay.seconds=60

除上述设置外,其他属性值为默认值。

下面是我们在Hazelcast日志中看到的例外。

[3.7.2]由于Operation-Heartbeat超时,PartitionIteratingOperation调用无法完成。当前时间:2017-05-30 16:12:52.442。总运行时间:10825毫秒。上次手术心跳:从来没有。会员最近一次操作心跳:2017-05-30 16:12:42.166。调用{op=com.hazelcast.spi.impl.operationservice.impl.operations.partitioniteratingoperation{serviceName='hz:impl:mapservice',identityhash=1798676695,partitionid=-1,replicaIndex=0,callid=0,invocationtime=1496160761670(2017-05-30 16:12:41.670),waittimeout=-1,calltimeout=5000,operationfactory=com.hazelcast.map.impl.operationFactory@2afbcab7},

有没有人可以建议对hazelcast的正确设置,这样一个节点临时不可达就不会降低整个集群的速度?

共有1个答案

杜弘光
2023-03-14

操作调用超时不应设置为低值。最好将其保留为默认值。某些内部机制(如心跳)依赖于调用超时。

 类似资料:
  • 我们在生产环境中广泛使用redis集群。我们目前有一个30个节点的集群(15个主服务器,15个从服务器)我们正在尝试增加集群,为此我们创建了新的服务器 接下来-我们试图重新加载插槽到新的主人。我们编写了一个脚本来实现这一点,使用命令。 但是-迁移中途失败(但距离开始不远),出现以下错误:

  • 常见网络故障 我们在开发或者网络管理中,经常碰到各种各样的网络故障。掌握处理常见的网络故障,就成为了网络运维工程师和开发工程师的基础技能。 常见以下两个故障: 服务器无法登录了 服务访问不了 这两个故障背后的原因有很多种,列举如下: 服务器无法登录 你的电脑断网了 服务器关闭了 服务器没关闭,但是访问端口关闭了(例如关闭了远程桌面的3389端口或者ssh的22端口) 服务器没关闭,访问端口也没关闭

  • 我正在尝试用6台机器实现一个Redis集群。我有一个由六台机器组成的流浪集群: 运行redis服务器 我编辑了上述所有服务器的/etc/redis/redis.conf文件,添加了这个 然后我在六台机器中的一台上运行了这个程序; Redis集群已启动并运行。我通过在一台机器上设置值手动检查它显示在其他机器上。 我的问题是,当我关闭或停止任何一台主机上的redis server时,整个集群都会停止运

  • 由于未知的原因,在生产和测试中通常每周几次,我们无法与 Kafka 代理通信,并且此消息在日志中重复出现:无法建立与节点 nnnn 的警告连接。经纪人可能不可用。(org.apache.kafka.clients.NetworkClient) 奇怪的是,这反过来又阻止了Kafka的工作(我们不能生产/消费)。 OpenShift没有意识到它不起作用,Kafka也没有识别它。 如果没有执行Broke

  • * *刚刚下载并安装了SDK Net 7.0.100,它破坏了现有的应用程序,它们不会在VS 2022或Rider中加载任何更多的应用程序。 复制了以下错误:** 错误:SDK解析程序失败。试图解析SDK“Microsoft . net . MSBuildSdkResolver”时失败。NET.Sdk”。例外:“微软。NET . SDK . workloadmanifestreader . wor

  • 因此,如果我理解正确的话,在检测并重新启动失败代理的环境中运行Artemis代理集群将提供与运行每个活动服务器都与备份配对的集群相同的语义(以及类似的可用性)。对吗?