当前位置: 首页 > 知识库问答 >
问题:

雪花Kafka连接器疑惑与疑问

嵇永望
2023-03-14

我正在使用 3 个服务器集群进行 Kafka 配置,使用 Snowflake 连接器 REST API 将数据推送到 Snowflake 数据库:所有这些都是在 AWS 上运行的 3 个不同的虚拟机

1.在这种情况下,我们是否需要3个kafka单独的服务器zookeeper服务需要在集群中启动和运行,否则只有1个就足够了,就像它需要在所有3个服务器zookerper服务中执行一样,它是否需要不同的端口配置,例如:

1.a:zookeeper.connect=xx.xx.xx.xxx:2181,xx.xx.xx.xxx:2182,xx.xx.xx.xxx:2183 否则在所有服务器属性html" target="_blank">文件中它应该是 2181

1.b:明文://localhost:9091在server1中,明文://localhost:9092和明文://localhost:9093(即使在这也应该是localhost else IP地址)需要给?

1.c:server.1=

1. d:Clientport=2181在所有3个VM中的服务之间需要相同,否则需要不同?

1. e:每个服务器上的侦听器=PLAINTEXT://your.host.name:9092是否应该有单独的端口,如VM-Server1:9092、VM-Server2:9093、VM-Server3:9094。否则主服务器IP应该在Server2和Server3的工作节点中给出,否则该工作节点的自己的服务器IP

对于配置项“任务.max”:“1”,连接器的 REST-API 应该配置什么。由于我将为 Kafka 使用 3 个服务器集群,并将在所有 3 台机器上启动 3 个分发连接器

如果我在第二台服务器上启动分布式连接器的服务,我会得到重复的记录,那么如何避免这些重复的记录。但是,如果它只有一个分布式连接器在运行服务,那么就没有重复。请注意,如果只有1个分布式连接器服务启动并运行,则延迟会增加。

创建/data/zookeeper/myid文件,并为zookeeper1赋值1,为zookeeper2赋值2,为zookeeper3赋值3。当你在不同的虚拟机中时,这是必要的吗?

分布式连接器服务一旦开始执行一段时间,然后就会断开连接

需要遵循的3服务器集群架构和最佳实践的任何其他参数

共有1个答案

邢博涛
2023-03-14

您只需要一个Kafka代理和Zookeeper服务器,尽管拥有更多的代理可以提供容错性。您不需要在Zookeeper中手动创建任何文件,例如myid文件。

端口不需要相同,但如果是,绘制网络图并自动配置显然更容易。

关于Kafka的听众,请阅读这篇文章。对于Zookeeper,如果您想创建一个集群,请遵循它的文档。

或者使用Amazon MSK/ConFluent Cloud等而不是EC2,这一切都为您完成。

任务。max可以根据您的需要而定,但是如果您有一个源连接器,那么多个线程可能会导致重复,是的。

 类似资料:
  • 问: 程序中出现[WARN] Can not find [logging.properties], use [%JRE_HOME%/lib/logging.properties] as default!这行警告,请问这个问题如何解决? 答: 这是因为你没有引入任何第三方日志框架。Hutool默认会使用JDK Logging做为其日志实现。出现这句话的意思是你没有在你的ClassPath下放logg

  • 最近看react fiber的文章,大致了解了fiber的一些原理,但也有个疑惑, 因为diff对比可以中断,假设在diff对比过程中用户有输入行为,这时候会优先执行输入这个任务,这个任务又会导致第二次diff对比,那么就有2次diff了,假设第一次diff要把输入框的内容改为1,第二次diff是要把输入框内容改为2,因为第二次diff优先级高,那么最终经过2次渲染,输入框的内容变成了1,和正常预

  • 我对莫基托有疑问。我想测试这个简单的类: 我写了这个简单的测试: 此测试运行时没有错误。我等待它没有编译,因为没有任何对userService方法的调用…

  • 我想了解以下关于火花概念的RDD的事情。 > RDD仅仅是从HDFS存储中复制某个节点RAM中的所需数据以加快执行的概念吗? 如果一个文件在集群中被拆分,那么对于单个flie来说,RDD从其他节点带来所有所需的数据? 如果第二点是正确的,那么它如何决定它必须执行哪个节点的JVM?数据局部性在这里是如何工作的?

  • 分布式服务已成功启动:[2021 10月17日18:04:29693]信息已启动o.e.j.s.ServletContextHandler@1422ac7f{/,null,AVAILABLE}(org.eclipse.jetty.server.handler.ContextHandler:916)[2021 10月17日18:04:29693]初始化信息REST资源;服务器已启动并准备好处理请求(

  • 执行命令 ts-node **.ts 正常输出this 执行命令 ts-node **.ts 输出undefined 这是为什么?可以避免吗?