当前位置: 首页 > 知识库问答 >
问题:

向Kafka主题发送XML数据的最佳方式是什么?

曹旭东
2023-03-14

我试图使用Kafka 0.9.0版本Java API将XML数据发送到Kafka主题,因为从0.9.0版本开始,他们建议使用Java API而不是Scala API来获得更好的性能。

http://kafka.apache.org/090/documentation.html#ProducerAPI

我的XML文件有大约5 MB的数据,我可以使用什么XML API来读取XML文件并转换为字符串,然后将该字符串发送到Kafka主题。

或者,我可以将XML转换为JSON数据并将其发送给Kafka吗?另外,我是否应该考虑将我的XML数据拆分为多个少量数据并发送到Kafka主题?

共有1个答案

宗政鸿志
2023-03-14

读/写XML的API取决于程序员/环境。此外,Apache Kafka除了简单的键/值模型之外,不会对事件数据强制任何特定的格式。它将同样适用于XML、JSON、Avro或任何其他数据格式。建议使用任何格式,不管是XML、JSON,只要它应该以一致的方式使用。如果你用Kafka开始一个新的项目,在选择和使用正确的序列化格式之前,有一些事情要考虑,比如性能、易用性、编程语言支持等。Avro是流数据最成功的格式之一。

 类似资料:
  • 我有一个问题与产生的消息Kafka的主题。 我使用来自外部供应商的Kafka管理服务,所以我问他经纪人的状况,他说一切都好。顺便说一句,它发生在三个不同的Kafka实例上。Kafka客户端版本也无关紧要-0.11.0.0和2.0.1都有。

  • 我在c中有一个存储字节的结构,如下所示: 我需要通过节俭将这些数据发送到用C编写的远程服务。我发现了三种方法如何将此结构映射到节俭idl: > 使用二进制键入: 以类型存储数据: 最好的办法是什么?

  • 问题内容: 我有一个kafka stream应用程序,等待有关topic的记录被发布。它将接收json数据,并根据我想将该流推送到不同主题的键的值来确定。 这是我的流应用程序代码: 在此代码中,我要检查操作类型,然后根据需要将流推送到相关主题中。 我该如何实现? 编辑: 我已将代码更新为: 问题答案: 您可以使用方法来拆分流。此方法使用谓词将源流分成几个流。 以下代码取自kafka-streams

  • 我是Cassandra的新手,我正在努力弄清楚如何存储数据,以便能够并行执行快速读取。我听说分区数据会给性能带来问题?是否可以并行读取同一分区中Cassandra表中的数据?

  • 我是Kafka的新手,当我试图发送信息到我得到的主题下面的错误。有人能帮我一下吗? [2018-09-23 13:37:56,613]警告[Producer Clientid=Console-Producer]无法建立到节点-1的连接。代理可能不可用。(org.apache.kafka.clients.NetworkClient)

  • 我们有一个kafka事件流,我们希望使用一些驻留在MySQL DB中的元数据来丰富它。 元数据每隔几个小时就会发生变化。本质上,我们希望定期读取数据库,并使用新的元数据不断丰富事件。 一种方法是将广播状态与每隔几分钟/小时读取一次 DB 的定期源一起使用。广播此流并使用它来加入。但问题可能是广播流的首次读取可能晚于从Kafka Stream读取的某些消息。 有没有更好的方法?