问题：

elasticsearch聚合-桶的精确计数

子车飞鹏

2023-03-14

Elasticsearch新手问题。我上了莎士比亚的课。json转换为Elastic，我正试图找出如何进行类似于按说话人从行组中计数（1）的聚合。（“Line”是文档的类型，“speaker”是属性之一。）

现在我有一个这样的查询：

{
  "size": 0,
  "query": {
    "query": {
      "match": {
        "play_name": "HAMLET"
      }
    }
  },
  "aggs": {
    "line_count": {
      "terms": {
        "field": "speaker.speaker_raw"
      }
    }
  }
}

结果看起来不错，但ElasticSearch文档指定术语聚合的文档计数是近似值(https://www.elastic.co/guide/en/elasticsearch/reference/current/search-aggregations-bucket-terms-aggregation.html). 有没有其他魔法可以在一个桶内精确计数？

另外，我已经发现我必须在索引上预先定义一个字段，以拥有一个未分析的“扬声器”版本，以确保我可以聚合原始字段值，而不是标记化。（请参阅Elasticsearch-基数大于全字段值）

共有2个答案

林修真

2023-03-14

根据留档，术语聚合中近似计数的原因是由于分片计数对“顶x”结果有“偏见”。

如果您设置"size"： 0我很确定Elasticsearch会返回准确的结果。

蒋培

2023-03-14

由于在具有高基数字段值的集群上造成的内存问题，现在不建议使用设置大小：0。您只能使用1到2147483647之间的数字。

资料来源：https://github.com/elastic/elasticsearch/issues/18838

类似资料：

Elasticsearch中的模糊桶聚合

Elasticsearch支持模糊搜索查询：https://www.elastic.co/guide/en/elasticsearch/guide/2.x/fuzzy-match-query.html 和按术语的桶聚合：https://www.elastic.co/guide/en/elasticsearch/reference/current/search-aggregations-bucket
elasticsearch聚合桶排序顺序

在elasticsearch中，是否有方法使用自定义分数对聚合桶进行排序/排序？我正在按客户姓名进行扣球。每个客户都有多个订单，其中有一个交货日期字段（DeliveDate）。我想根据与当前日期的距离（接近程度）对桶进行排序。例如，对交货日期更接近今天日期的客户名进行排序。非常感谢。
Elasticsearch桶聚合返回错误的doc_count

我正在使用Elasticsearch bucket聚合。我有一组文档，每个文档都有一个类别字段，它是一个数组。我需要获得每个类别的数量以及搜索结果。但目前，我得到了错误的doc\u计数。这是我的聚合查询 } 下面是我得到的错误doc\u计数的结果。
按桶键值过滤Elasticsearch聚合

我有一个Elasticsearch文档索引，其中有一个包含URL列表的字段。如预期的那样，在该字段上聚合会给我唯一URL的计数。然后，我想过滤掉其键不包含特定字符串的桶。我已经尝试使用Bucket选择器聚合来实现这一点。此尝试：失败原因：名为[links\u key\u filter]且类型为[bucket\u selector]的管道聚合无效。顶层仅允许同级管道聚合将bucket选择器
应用聚合后过滤elasticsearch中的术语聚合桶

以下是数据集的快照：我想获得员工名单以及employeeStatus和employeeAddr。所以我在employeeId上使用术语聚合，然后使用employeeStatus和employeeAddr的子聚合来获得这些详细信息。下面的查询正确返回结果。现在我只想要永久身份的员工。所以我正在应用过滤器聚合。现在的问题是雇员地址聚合没有为雇员地址返回存储桶，因为记录2在聚合完成之前就被过滤掉
Elasticsearch-如何过滤嵌套的聚合桶？

问题内容：我正在尝试过滤存储桶中的嵌套聚合。对应：索引数据：我正在使用此查询和聚合定义我从聚合结果中得到的是：我在筛选存储桶列表时遇到了麻烦，因为它们只能提供所提供的事件ID，因此结果应类似于：问题答案：您快到了，只需要在聚合中添加过滤器即可，如下所示：原因是您的查询将正确选择具有指定事件ID的嵌套事件的所有文档，但是，汇总将对所有选定文档中的所有嵌套事件进行处理。因此，您还需要

elasticsearch聚合-桶的精确计数

共有2个答案

相关问答

相关文章

相关阅读

相关工具

相关文档