当前位置: 首页 > 知识库问答 >
问题:

用于使用消息文本文件的Kafka

马坚
2023-03-14

我需要订阅实时消息文件,这些消息文件可能是在pub-sub模型上从客户端已有的MQ设置发布的。当我订阅MQ的主题以接收消息文件时,我是否应该使用Kafka只获取文件,然后处理它们并使用任何更好的API(如Python)存储在我的文件系统中?我期待一个如下的设置:-

客户的MQ---->Kafka Setup<-----API接收和处理(Python)---->文件系统

当文件发布到Kafka时,我是否应该使用Python与Kafka经纪人对话以接收文件进行进一步处理?

注意:我不希望消息文件内容在不同的分区中被打破。相反,我希望完整的文件被发布和使用。

共有1个答案

齐招
2023-03-14

我想要完整的文件发布和消费。

Kafka不是用来传送文件的。它的默认最大消息大小仅为1MB(如果将其设置得比5MB高得多,则只会使代理连接和存储过载)。

相反,您应该设置一个共享文件系统(如FTP、NAS、HDFS、S3等),然后只通过Kafka发送文件的URI,然后在用户中读取消息后连接到该文件系统。这样,您就有了小消息,并且不需要处理分区和排序,因为您只需要对存储整个文件的外部系统进行引用。

任何语言都行得通。

 类似资料:
  • 根据网页 activemq-性能-模块-用户-手册 中的建议,我尝试过(在配备 Windows 7 操作系统和固态盘驱动器的英特尔 i7 笔记本电脑上)在 ActiveMQ 队列上生成持久消息的性能: 针对活动 mq 5.12.1 的默认安装 我得到的性能大约是每秒300-400条消息。在激活性能页面上,我一直在阅读更高的数字: 当在一个机器上运行服务器,在另一个机器上的单独虚拟机中运行单个生产者

  • 我从几天以来一直对我的问题感到震惊。实际上,我想要做的是创建一个通知服务,即使用户不在应用程序中,也为用户提供警报。并且该服务应每5分钟检查传入消息。并且通知应该与通知抽屉中的通知收件箱样式完全相同。我需要通过单击通知来调用特定的活动。有人能建议我怎么做吗?谢谢你的帮助....

  • 问题内容: 通过运行此… 我一直收到这个错误,我真的不知道该如何解决。该文件当前与.java文件位于我的源包中。通过指定路径,我可以很容易地读取文件,但是我打算在多台计算机上运行该文件,因此我需要文件可以随程序一起移植。这个问题不是关于读取文本文件,而是指定其位置而不使用绝对路径。香港专业教育学院寻找答案,但我得到的答案只是“指定名称”和“指定绝对路径”。ID张贴图像,使其更清晰,但我没有10代表

  • 问题内容: 我正在使用以下方法比较junit中的文本文件: 这是比较文本文件的好方法吗?什么是首选? 问题答案: junit-addons对它有很好的支持:FileAssert 它为您提供了如下异常:

  • 问题内容: 我如何阅读像android app中的文本文件: 所以我可以返回一个字符串,如: 我想到的是(伪代码): 问题答案: 试试这个

  • 问题内容: 我在使用BufferedReader时遇到问题 我想打印一个文本文件的6行: 现在,从每次调用readLine()方法可以收集到的信息开始,它都会自动前进到下一行。 所以我不能使用条件br.readLine()!= null,因为它已经将其前进了一行,并且我得到了输出: 我使用什么条件来检查文本字段中是否还有新行。 提前致谢! 问题答案: 这就是问题: 您有两次调用-第一个 仅 检查是