当前位置: 首页 > 知识库问答 >
问题:

Apache Ignite 2.9.0群集发现错误

苏坚成
2023-03-14

我们在AKS有一个阿帕奇点火集群。我们设置了3个节点的ignite集群。我可以看到这3个节点显示在sys.nodes和sys.baseline_nodes中。下面是1个节点的缓存配置-

    <property name="discoverySpi">
        <bean class="org.apache.ignite.spi.discovery.tcp.TcpDiscoverySpi">
            <property name="ipFinder">
                <bean class="org.apache.ignite.spi.discovery.tcp.ipfinder.kubernetes.TcpDiscoveryKubernetesIpFinder">
                    <property name="namespace" value="ignite"/>
                    <property name="serviceName" value="ignite-service"/>
                </bean>
            </property>
        </bean>
    </property>
    
    <property name="addressResolver">
            <bean class="org.apache.ignite.configuration.BasicAddressResolver">
                <constructor-arg>
                    <map>
                        <entry key="127.0.0.1" value="52.2XX.X.XX"></entry>
                    </map>
                </constructor-arg>
            </bean>
        </property>

但是为什么日志文件中充满了下面的消息呢?

[16:56:11,649][Strice][Grid-Nio-Worker-TCP-Comm-0-#23][TcpCommunicationSpi]无法处理选择器键[SES=GridSelectorNiosessionImpl[Worker=DirectNioclientWorker[Super=AbstractNioclientWorker[IDX=0,BytesRCVD=42792440,BytesSent=867699,BytesRCVD0=0,BytesSent0=0,Select=True,808,hashcode=1382623580,interrupted=false,runner=grid-nio-worker-tcp-comm-0-#23]]],writebuf=java.nio.directbytebuffer[pos=0 lim=32768 cap=32768],readbuf=java.nio.directbytebuffer[pos=0 lim=32768 cap=32768],readbuf=java.nio.directbybuffer[pos=0 lim=32768 cap=32768],100,rmtaddr=/10.240.05:44211,createtime=1610470564646,closetime=0,bytessent=18,bytesRCVD=0,bytesRCVD0=0,sndschedtime=1610470564646,lastsndtime=1610470564646,lastrcvtime=1610470564646,readspaused=false,filterchain=filterchain[filters=[GridNioCodecFilter[parser=o.a.i.i.util.nio.griddirectparser@f7f9f74,directmode=true],GridConnectionBytesVerifyFilter],accepted=true,markedforclose=false]]java.io.ioException:sun.nio.ch.socketdispatcher.read(本机方法),O.ch.ioutil.read(IOUTIL.java:192)在sun.nio.ch.socketchannelimpl.read(SocketChannelimpl.java:380)在org.apache.ignite.internal.util.nio.gridnioServer$directnioclientworker.processread(GridnioServer.java:1330)在dnioserver.java:2239)位于org.apache.ignite.internal.util.nio.gridnioserver$abstractnioclientworker.body(GridNiOServer.java:1880)在org.apache.ignite.internal.util.worker.gridworker.run(gridworker.java:120)在java.lang.thread.run(thread.java:748)[16:56:11,688][thread.java:748][tcp-disco-sock-reader-[]-#12734-#14234][TcpDiscoverySpi]未能初始化连接(这可能是由于短期网络问题造成的,如果不影响节点发现,可以忽略)[sock=socket[addr=/10.240.0.5,socketInputStream.socketRead0(本机方法)在java.net.socketInputStream.java:116)在java.net.socketInputStream.Read(SocketInputStream.java:171)在java.net.socketInputStream.Read(SocketInputStream.java:141)在java.io.BufferedInputStream.fill(BufferedInputStream.java:246)在java.io.BufferedInputStream.java:286)在serverimpl$socketreader.body(serverimpl.java:6757)在org.apache.ignite.spi.igniteSpithRead.run(igniteSpithRead.java:58)

共有1个答案

经昱
2023-03-14

看起来您的网络正在关闭非活动连接,因此“由对等点重置连接”。

Apache Ignite不会影响连接重置,但它可以通过重新建立连接来解决问题。

 类似资料:
  • Cluster Cluster.EdsClusterConfig Cluster.OutlierDetection Cluster.LbSubsetConfig Cluster.LbSubsetConfig.LbSubsetSelector Cluster.LbSubsetConfig.LbSubsetFallbackPolicy (Enum) Cluster.RingHashLbConfig C

  • { "cluster": "{...}", "refresh_delay_ms": "..." } clusters (required, object) 承载群集发现服务的上游群集的定义。群集必须实现并运行CDS HTTP API的REST服务。 refresh_delay_ms (optional, integer) 每次从CDS API刷新的延迟(以毫秒为单位)。Envoy将在0-

  • 群集发现服务(CDS)是一个可选的API,Envoy将调用该API来动态获取群集管理器成员。 Envoy还将根据API响应协调集群管理,根据需要完成添加,修改或删除已知的群集。 v1 CDS API v2 CDS API 统计 CDS的统计树以cluster_manager.cds.为根,统计如下: Name Type Description config_reload Counter 因配置不同

  • 在集群调用失败时,Dubbo 提供了多种容错方案,缺省为 failover 重试。 各节点关系: 这里的 Invoker 是 Provider 的一个可调用 Service 的抽象,Invoker 封装了 Provider 地址及 Service 接口信息 Directory 代表多个 Invoker,可以把它看成 List<Invoker> ,但与 List 不同的是,它的值可能是动态变化的,比

  • 我正在使用hazelcast集群的两个成员运行一个POC,使用3.4.1版本的hazelcast。我观察到一个奇怪的行为,其中一个成员不断抛出WrongTargetException。这是一个罕见的场景,我能够通过以下事件序列复制: 假设我运行的集群有两个成员,比如X和Y。 从集群中拔出Y,使其变得无响应。 X认为Y没有响应,因此将其从集群中删除。 再次插入Y,Y假设它没有收到来自X的任何响应/心

  • 我创建了一个AWS密钥对。 我在这里逐字逐句地遵循指示:https://aws.amazon.com/articles/4926593393724923 当我键入“aws emr创建集群——名称SparkCluster——ami版本3.2——实例类型m3.xlarge——实例计数3——ec2属性KeyName=MYKEY——应用程序名称=Hive——引导操作路径=s3://support.elas