当前位置: 首页 > 面试题库 >

使用Elasticsearch计算文档数

松烨烨
2023-03-14
问题内容

如果要计算索引(Elasticsearch的索引)中的文档数,则有​​(至少?)两种可能性:

  • 直接count

POST my_index / _count

应该返回中的文档数my_index

  • 使用search

在这里,可以将count用作search_type或其他类型。无论哪种情况,都可以从现场提取总计数['hits']['total']

我的问题是:

  • 不同方法之间有什么区别?我应该选哪一个?

  • 我提出这个问题是因为根据所选择的方法,我会遇到不同的结果。我现在正在调试问题,此问题突然出现。


问题答案:

可能_count会更快一些,因为它不必执行带有排名和结果获取的完整查询,并且只需返回大小即可。

了解更多有关如何获得不同结果的知识会很有趣。为此,我需要更多信息,例如您要发送的确切查询以及索引上是否正在进行任何索引。

但是假设您执行以下操作

  1. 索引一些文件
  2. 刷新索引

_search_count(匹配所有查询)应返回相同的总数。如果没有,那将很奇怪。



 类似资料:
  • 如果一个人想要计算一个索引中的文档数量(Elasticsearch的),那么有(至少?)两种可能性: > 直接 发布my_index/_count 应该返回中的文档数。 使用 这里可以使用作为或其他类型。在这两种情况中,总计数都可以从字段中提取 我的问题是: > 不同的方法有什么不同?我更喜欢哪一个? 我提出这个问题是因为我正在经历不同的结果取决于所选择的方法。我现在正在调试问题的过程中,突然出现

  • 问题内容: 我是相当新的elasticsearch,使用6.5版。我的数据库包含网站页面及其内容,如下所示: 我已经能够执行一个简单的查询,该查询返回所有内容中包含“汽车”一词的文档(使用Python): 结果看起来像这样: “ _id”指的是一个域,所以我基本上回来了: abc.com def.com jkl.com 但我现在想知道如何往往是搜索关键词(“汽车”)出现 在 每个文档,如: abc

  • 我有一个word文件,我想数一下里面有多少页。 已使用Docx4Java创建该文件。 以前有人这么做过吗? 谢谢!

  • 问题内容: 我有一个Java代码,可从excel文档中获取数据。我想计算列数和行总数(在特定列中)。我该如何实现?下面提供了Java代码和所需的o / p (编辑):我应该进行哪些修改以获得所需的O / P,例如,我应该编写一个循环以获取列和行的计数,或者有一种方法可以做到这一点 所需的O / P (编辑):-在这里回答-计算Excel工作表一列中的行数(提供Java代码) 我的Java代码: 我

  • 主要内容:索引API,自动索引创建,版本控制,操作类型Elasticsearch提供单文档API和多文档API,其中API调用分别针对单个文档和多个文档。 索引API 当使用特定映射对相应索引发出请求时,它有助于在索引中添加或更新JSON文档。 例如,以下请求将JSON对象添加到索引学校和学校映射下。 请求正文 响应 自动索引创建 当请求将JSON对象添加到特定索引时,如果该索引不存在,那么此API会自动创建该索引以及该特定JSON对象的基础映射。

  • 问题内容: 有什么方法可以使用Logstash和csv文件从ElasticSearch删除文档?我阅读了Logstash文档,却一无所获,并尝试了一些配置,但是使用操作“删除”却没有任何反应 有人尝试过吗?我应该在配置的输入和过滤器部分添加一些特殊的东西吗?我使用文件插件作为输入,使用csv插件作为过滤器。 问题答案: 绝对可以按照您的建议去做,但是如果您使用的是Logstash 1.5,则需要使