当前位置: 首页 > 知识库问答 >
问题:

kafka-elasticsearch集成的logstash/不logstash?

曹骞仕
2023-03-14

我读到elasticsearch Rivers/River插件不推荐使用。所以我们不能直接进行elasticsearch-kafka积分。如果我们想这样做,那么我们需要在两者之间有一个java(或任何语言)层,使用它的API将数据从kafka放到弹性搜索。

另一方面,如果我们有kafka-logstash-elasticsearch,那么我们可以去掉上面的中间层,并通过logstash来实现,只需配置即可。但我不确定在两者之间设置logstash是否是一种开销?

我的理解对吗?提前感谢您的投入。

问候你,Priya

共有1个答案

狄玮
2023-03-14

你的问题相当笼统。理解你的体系结构、它的目的和你所做的假设是很好的。

正如在其文档中所述,Kafka是一个大规模可伸缩的发布-订阅消息传递系统。我的假设是,您将它用作体系结构中的数据代理。

另一方面,Elasticsearch是一个搜索引擎,因此我假设您将它用作数据访问/搜索/聚合层。

另一种方法是使用Kafka连接器,构建自定义工具,例如基于Kafka流或消费者,但这实际上取决于您的体系结构的概念--用途、堆栈、数据需求等等。

 类似资料:
  • 我们希望使用logstash获取日志并将其传递给Kafka。 我们已经为logstash1.5.0beta1和kafka 2.9.2_0.8.1.1编写了以下conf文件 ** ** 运行以下命令后:bin/logstash代理-ftest.conf--logex.log test.conf是我们的conf文件。ex.log是我们为要存储的日志创建的空白文件。 我们得到以下输出 发送logstas

  • null 在没有任何测试的情况下,我会说第二种选择更好/更干净、更可靠?

  • 因此,当使用logstash中的JDBC导入器并导出到elasticsearch时,我试图对文档类型与文档id进行思考。 我终于把我的头缠在索引上了。但让我们假设我正在从传感器数据表(如温度/湿度等)中提取数据有传感器id的。。。温度/湿度(与天气相关的数据),并记录时间。(所以这是一张大桌子) 而且我希望每隔X频繁地轮询数据库。 在这个例子中,document_type和document_id是

  • 我的结构是这样的:日志文件 但我卡在Kafka到Logstash部分。 首先,Filebeat可以向Kafka生成消息,我可以使用以下方式检查它: 也可以由命令使用: 但是,当我尝试使用logstash来消费主题时,没有任何东西可以被检索到,Zoomaster一直在抛出: 2017-11-13 16:11:59205[myid:]-信息[NIOServerCxn.工厂:0.0.0.0/0.0.0.

  • 问题内容: 我想要一个集中式日志服务器。 我已经基于此iso创建了两个Ubuntu 12.04 LTS服务器。 在成功并严格按照本教程步骤进行操作之后,我有: 一台Logstash + ElasticSearch + Kibana的日志服务器。 一个带有Logstash-Forwarder的应用程序服务器,Tomcat 6和另一个应用程序,这些日志已在catalina.out文件中注册。 我的问题

  • EdIndexBolt,EsPercolateBolt和Estate允许用户将storm中的数据直接传输到Elasticsearch。 详细说明请参考以下内容。 EsIndexBolt (org.apache.storm.elasticsearch.bolt.EsIndexBolt) EsIndexBolt将tuples直接流入Elasticsearch索。 Tuples以指定的索引和类型组合进行