当前位置: 首页 > 知识库问答 >
问题:

如何推荐AWS MSK和合流模式注册表和合流Kafka连接一起使用?

袁玮
2023-03-14

我们计划使用AWS MSK服务来管理Kafka和Schema注册表和Confluent的Kafka Connect服务来运行我们的连接器(Elasticsearch Sink Connector)。我们计划在EC2中运行模式、注册表和连接器。

根据Confluent团队的说法,如果我们对Kafka使用MSK,他们无法正式支持Confluent模式注册表和Kafka Connect。

那么,任何人都可以分享他们的经验?比如,如果有哪个Buddy在生产环境中使用了MSK和Confluent服务的组合?

使用这种组合有风险吗?

请提前分享您的想法和感谢。

谢谢

共有1个答案

西门山
2023-03-14

客观地回答你的问题,这是可行的,但这取决于你的主要痛苦在哪里。

从许可的角度来看,没有什么可以强迫您仅仅为了使用Kafka Connect或Schema Registry而使用Confluent订阅,因为它们分别基于Apache License 2.0和Confluent Community License。

从技术角度来看,您可以在EC2上运行Kafka Connect和Schema Registry;只要它们运行在MSK集群的同一个VPC中,它们就可以完美无缺地工作。

从成本的角度来看,您必须评估由您和/或您的团队管理Kafka Connect和Schema Registry的成本。不仅要考虑安装和设置阶段,还要考虑管理和发展阶段。软件可能没有任何成本,但操作这些组件的努力可以转化为成本。

如果我们将面临连接器的任何问题,合流社区支持如何?

无论您是在Apache Kafkahtml" target="_blank">用户组还是在Confluent在Slack中拥有的社区中寻求帮助,Kafka社区通常都非常有帮助。当然,这一切都是最大的努力,你不能依赖他们来获得支持。可能需要几天时间,直到某个好心人决定帮助你。这也转化为成本:有多少成本正在下降和/或等待解决方案?

我不再是合流的员工,因此我甚至不会试图说服你从他们那里购买。但是您应该评估成本的这个组成部分,并检查使用Confluent Cloud是否不能为您提供更具成本效益的解决方案,因为它包含Kafka、Kafka Connect和Schema Registry的托管版本。根据我的经验,Confluent Cloud上的managed Kafka成本并不高,而且managed Schema Registry是“免费的”,但是使用managed connector成本可能非常高,而且根据在managed connector中配置的任务数量,成本可能会更高。这是你唯一应该提防的陷阱。

 类似资料:
  • 我正在了解Confluent的模式注册表,以满足所有模式管理需求。 我不太理解他们的版本控制方法...有一个的概念,我将其视为一个名称空间。据我所知,subject在模式注册表中必须是唯一。 然后是模式id,或者只是,它也是唯一的。 最后,还有一个。 以下是文档中的片段: :此主题的架构版本,每个主题从1开始 :全局唯一的架构版本id,在所有主题中的所有架构中都是唯一的 因此,一旦我想修改特定主题

  • 我试图使用Confluent_Kafka的AvroProducer类生成Avro格式的消息。Kafka和Schema-Registry在同一个网络中作为3个节点的集群运行。 我得到的是 我没有使用Docker容器。集群由3个独立的VM组成,其中安装和运行Kafka和Registry Schema,所以它也不是独立的。Python代码从具有网络访问和防火墙异常的第四个VM执行。事实上,我可以在没有a

  • 我使用的是Azure HDInsight的托管Apache Kafka解决方案,因为不幸的是Azure上没有托管汇流Kafka解决方案。是否可以运行汇合模式注册表并将其连接到HDInsight Apache Kafka集群的代理? 我希望只在单个VM上安装模式注册表,然后使用schema-registry.properties文件中的这一行,将其指向HDInsight集群的代理列表: kafkas

  • 我希望即使服务器重新启动,也能保持一个具有固定id的模式。 是否可以在模式注册表中保存模式,以便在服务器崩溃后使用相同的id? 否则,是否有可能在模式注册表服务器启动时用固定的id硬编码一个模式?

  • 我正在尝试设置一个Beam管道,以便使用python API读取Kafka的内容。我能够设置消费者配置和主题。如何更新管道以使用合流模式注册表并定义Avro消息值反序列化器?

  • 我想连接两个主题流(左连接),并在连接的流上进行基于窗口的聚合。然而,聚合将某些消息计数两倍,因为在连接期间,根据正确主题中的延迟,某些消息将发出两倍。以下是POC的代码。 它是否可以修复以避免因连接而重复?