当前位置: 首页 > 知识库问答 >
问题:

ElasticSearch:度量聚合和文档值/字段数据

湛嘉歆
2023-03-14

ES如何在内部实现度量聚合?

假设索引中的文档具有以下结构:

{
  category: A,
  measure: 20
}

对于以下对类别进行术语聚合并计算总和(度量)的查询,“度量”字段值

  • 从文档中提取(即\u源)并求和或

查询:

{
  size: 0,
  aggs: {
     cat_aggs: {
       terms: {
          field: 'category'
       },
       aggs: {
          sumAgg: {
             sum: {field: 'measure'}
          }
       }
    }

  }
}

共有1个答案

何兴邦
2023-03-14

来自度量聚合的官方留档(重点已添加):

此族中的聚合基于以某种方式从正在聚合的文档中提取的值来计算度量。这些值通常从文档的字段中提取(使用字段数据),但也可以使用脚本生成。

如果您使用的是较新的ES 2. x版本,那么doc_values已成为字段数据的规范。

默认情况下,所有支持doc值的字段都启用了它们。如果您确定不需要对字段进行排序或聚合,或者从脚本访问字段值,您可以禁用doc值以节省磁盘空间

因此,为了清楚地回答您的问题,度量聚合是基于索引时存储的字段数据或文档值计算的,即不是基于查询时的源解析计算的,除非您从访问的脚本中进行计算_source直接。

 类似资料:
  • 我看到一些关于嵌套字段和聚合的帖子,但它们似乎都没有回答我的问题。所以,如果这是一个重复的问题,请原谅,如果有任何帮助,我们将不胜感激。 我们建立了一个讲座索引,讲座具有以下特点: 讲座可以是面对面(现场)或预先录制(在线) 每个讲座可以有多个章节 这些章节中的每一个都可以由不同的讲师讲解(例如:量子物理的第一章可以由五个不同的讲师讲解,其中三个可能是现场直播,另外两个可能在线) 在线讲座每个讲师

  • 问题内容: 我将此数据插入了Elasticsearch: 旁注:重现: 1)下载:http://wmo.co/20160928_es_query/bulk.json 2)执行:卷曲-s -XPOST ‘ 的http://本地主机:9200 /测试/外部/ _bulk漂亮 ‘ -数据二进制@ bulk.json 问题: 获取每个“位置”有多少记录的计数。 解决方案1:存储桶聚合..没有得到期望的结果

  • 我是Elasticsearch的新手,我希望在Elasticsearch 5的字段上执行某些聚合。x索引。我有一个索引,其中包含带有字段(具有嵌套结构)和字段(具有嵌套结构)的文档。这些是动态映射的字段。以下是示例文档 文件2: DOC 3: 我想在langs字段上执行总和聚合,这样对于每个键(X/Y)和每种语言,我都可以获得索引中所有文档的总和。此外,我还想从docLang字段生成每种语言类型的

  • 问题内容: 我正在尝试创建一个脚本字段,该脚本字段将计算两个时间戳之间的时间差,然后在该脚本字段上聚合一个。 我首先尝试: 在合计平均值下产生价值。 然后我尝试了: 生成了一条错误消息,内容为:“在映射中找不到[timedifference]的字段” 问题答案: 简单地将脚本移到聚合上怎么样?

  • 我想从引用的文档中获取字段值。Mongodb版本是3.4。 假设我有两个收藏foo和bar。Foo提到bar: 相应的条形码文档看起来像这样: 我尝试了以下聚合函数来归档此结果: 聚合功能: 但我的结果是这样的: 我试着用谷歌搜索它,我查看了mongodb文档,但没有找到解决方案。 是我错过了什么还是这不可能? 谢谢

  • 问题内容: 我想将数据汇总到另一个字段中,也想根据名称以排序方式获取汇总数据。 我的数据是: 我的查询: 我的映射是: 我正在根据分组记录的相关性平均值来获取数据。现在,我想要的是第一个基于groupid的记录,然后在每个存储桶中根据名称字段对数据进行排序。 我想对一个字段进行分组,然后在对分区进行分组之后,对另一个字段进行排序。这是样本数据。 还有其他字段,例如created_on,update