当前位置: 首页 > 知识库问答 >
问题:

从apache nutch索引到elasticsearch时的问题

董鸣
2023-03-14

remoteTransportException:未能从流中反序列化异常响应,原因是:org.elasticSearch.transport.transportSerializationException:未能从流中反序列化异常响应,原因是:org.elasticSearch.transport.netty.messageChannelHandler.handlerResponseError(MessageChannelHandler.java:173)在org.elasticSearch.transport.netty.MessageChannelHandler.messageChannelHandler.java:125),在search.common.netty.channel.defaultChannelPipeline.SendupStream(DefaultChannelPipeline.java:564)在org.elasticSearch.common.netty.channel.defaultChannelPipeline.java:564)在org.elasticSearch.common.netty.channel.defaultChannelPipeline$defaultChannelContext.SendupStream(DefaultChannelPipeline.java:791)在在org.elasticsearch.common.netty.handler.codec.frame.decoder.calldecode(framedecoder.java:443),在org.elasticsearch.common.netty.handler.codec.frameDecoder.messageReceed(framedecoder.java:303),在org.elasticsearch.common.netty.channel.common.netty.channel.simpleChannelhandler.java:70,在.netty.channel.defaultchannelpipeline.sendupstream(defaultchannelpipeline.java:559)在org.ellasticsearch.common.netty.channels.firemessageReceed(channels.java:268)在org.ellasticsearch.common.netty.channels.firemessageReceed(channels.java:255)在org.ellasticsearch.common.netty.channel.socket.nio.nioworker.read(arch.common.netty.channel.socket.nio.abstractnioselector.run(abstractnioselector.java:318)在org.elasticsearch.common.netty.channel.socket.nio.abstractnioworker.run(abstractnioworker.java:89)在org.elasticsearch.common.netty.channel.socket.nio.nioworker.run(abstractnioworker.java(nioworker.java:178)在proofworker.java:42)在java.util.concurrent.threadpoolexecutor.java:1142在java.util.concurrent.threadpoolexecutor$worker.run(threadpoolexecutor.java:617)在java.lang.thread.run(threadpoolexecutor.java:745)在java.lang.thread.run(threadpoolexecutor.java:617)在java.lang.thread.run(threadpoolexecutor.javer.run.ThrowableObjectInPutStream.(ThrowableObjectInPutStream.java:38)at org.elasticsearch.transport.netty.MessageChannelHandler.HandlerResponseError(MessageChannelHandler.java:170)...23个以上

通过进一步的研究,我知道我应该在客户端和ES服务器上有相同的jvm版本。参考资料:http://jontai.me/blog/2013/06/elasticsearch-remoteTransportException-failed-to-deserialize-exception-responsion-from-stream/

我使用的是ES版本2.3.2,我的JVM版本是“1.8.0_91”。当我检查/plugins/indexer-ellastic/plugin.xml时,指定的版本是1.4.1。我想知道这可能是一个问题和一个可能的解决方案,而不是降级ES集群版本。我想继续讨论ES 2.3.2。请帮帮我。

PS:我用于索引的命令是bin/nutch index crawl/crawldb/-linkdb crawl/linkdb/crawl/segments/20160801174223/

共有1个答案

董子航
2023-03-14

从进一步的研究中,我得到了解决办法。错误的出现是因为nutch的索引器插件版本不匹配(它是ES 1.4.1)。

解决这个问题的一个方法是从https://github.com/apache/nutch/blob/master/下载源代码,然后按照src/plugin/indexer-ellastic/howto_upgrade_es.txt中给出的说明,用弹性服务器版本定制插件版本。

>

  • 在src/plugin/indexer-ellastic/ivy.xml中升级elasticsearch依赖项

    在src/plugin/indexer-ellasty/plugin.xml中升级Elasticsearch特定的依赖项,以获取依赖项列表及其版本执行:$ant-f./build-ivy.xml
    $ls lib/

    使用ant或任何其他构建工具从nutch源文件夹构建。

    然后我们就可以索引到ElasticSearch而不需要这个问题。干杯:)

  •  类似资料:
    • 问题内容: 这个问题似乎与在Couchbase中使用XDCR有关。如果我有以下简单对象 并设置一个Elasticsearch索引 然后,我可以使用REST API将两个对象添加到该索引中 它们现在都可以搜索(尽管“年龄”是一个人和另一个人的事实。 但是,如果我将这两个对象存储在一个沙发基存储桶中(而不是直接存储到elasticsearch中)并设置了XDCR,则第一个对象可以很好地复制,但是第二个

    • 问题内容: 我正在尝试为Elasticsearch中的一些文档建立索引并出现一些错误。但是我不知道原因,所以我无法解决它。错误如下: 什么会导致此错误?感谢帮助。 问题答案: 如果您的Elasticsearch服务器和索引应用程序正在运行不同的计算机,并且这些计算机包含不同的jvm版本,则可能会出现此问题。您必须安装相同的Java版本。希望能帮助到你。

    • 问题内容: 我必须索引包含“时间”字段的文档,该字段的值是一个整数,表示自纪元以来的秒数(又称为Unix时间戳)。 我一直在阅读ES文档,发现了这一点: http://www.elasticsearch.org/guide/reference/mapping/date- format.html 但是似乎如果我要提交unix时间戳并将其存储在“日期”字段中(整数字段对我没有用),我只有两个选择: 实

    • 问题内容: 希望不使用Logstash将CSV文件索引到ElasticSearch。我正在使用高级库。 给定带有标题的CSV例如: 按字段索引所有数据的最佳方法是什么?最终我希望让每一行看起来像这样 问题答案: 使用较低级的库,这种任务比较容易:

    • curl-xdelete“http://localhost:9200/index-consumo_react_mysql/_doc/_query”-d'{“query”:{“match_all”:{}}}‘ 错误: {“错误”:“不支持Content-Type header[application/x-www-form-urlencoded]”,“status”:406}

    • 主要内容:创建索引,删除索引,获取索引,测试索引存在,打开/关闭索引API,索引别名,索引设置,分析,索引模板,索引统计,刷新清除数据, 刷新索引这些API负责管理索引的所有方面,如设置,别名,映射,索引模板。 创建索引 此API可用于创建索引。 当用户将对象传递到任何索引时,可以自动创建索引,也可以在此之前创建索引。 要创建索引,只需要发送包含设置,映射和别名的发布请求,或者只发送一个没有正文的简单请求。 例如, 响应 或者,加上一些设置 - 请求正文 响应 或使用映射 - 请求正文 响应 或