问题：

Elasticsearch聚合：如何使用术语聚合的“其他”结果获取bucket？

干子瑜

2023-03-14

我使用聚合从嵌套字段收集数据并卡住了一点

文件示例：

{
  ...
  rectangle: {
    attributes: [
      {_id: 'some_id', ...}
    ]
}

ES允许通过rectangle.attributes._id来分组数据，但是有没有办法让一些“其他”桶把没有添加到任何组中的文档放在那里？或者，也许有一种方法可以通过{"rectangle.attributes._id"：{$ne："{电流文档}.rectangle.attributes._id"}}创建查询来为文档创建桶。我认为桶将是完美的，因为我需要使用“其他”文档进行进一步的聚合。或者也许有一些很酷的解决方法

我使用这样的查询进行聚合

"aggs": {
  "attributes": {
    "nested": {
      "path": "rectangle.attributes"
    },
    "aggs": {
      "attributesCount": {
        "cardinality": {
          "field": "rectangle.attributes._id.keyword"
        }
      },
      "entries": {
        "terms": {
          "field": "rectangle.attributes._id.keyword"
        }
      }
    }
  }
}

然后得到这个结果

"buckets" : [
  {
    "key" : "some_parent_id",
    "doc_count" : 27616,
    "attributes" : {
      "doc_count" : 45,
      "entries" : {
        "doc_count_error_upper_bound" : 0,
        "sum_other_doc_count" : 0,
        "buckets" : [
          {
            "key" : "some_id",
            "doc_count" : 45,
            "attributeOptionsCount" : {
              "value" : 2
            }
          }
        ]
      }
    }
  }
]

这样的结果将是完美的：

"buckets" : [
  {
    "key" : "some_parent_id",
    "doc_count" : 1000,
    "attributes" : {
      "doc_count" : 145,
      "entries" : {
        "doc_count_error_upper_bound" : 0,
        "sum_other_doc_count" : 0,
        "buckets" : [
          {
            "key" : "some_id",
            "doc_count" : 45
          },
          {
            "key" : "other",
            "doc_count" : 100
          }
        ]
      }
    }
  }
]

共有1个答案

赵俊晤

2023-03-14

您可以利用缺少的值参数。更新聚合如下：

"aggs": {
  "attributes": {
    "nested": {
      "path": "rectangle.attributes"
    },
    "aggs": {
      "attributesCount": {
        "cardinality": {
          "field": "rectangle.attributes._id.keyword"
        }
      },
      "entries": {
        "terms": {
          "field": "rectangle.attributes._id.keyword",
          "missing": "other"
        }
      }
    }
  }
}

类似资料：

ElasticSearch术语聚合

问题内容：我正在尝试使用以下查询对以下数据进行elasticsearch来执行术语聚合，输出将名称分解为标记（请参见下面的输出）。因此，我尝试将os_name映射为multi_field，但现在无法通过它查询。是否可以有没有令牌的索引？例如“ Fedora Core”？查询：数据：输出：映射：问题答案：实际上，您应该像这样更改映射并且您的aggs应该更改为：
向ElasticSearch术语聚合添加其他字段

问题内容：索引文件如下：我想要的是按平台计数和输出统计信息。为了进行计数，我可以将术语聚合作为字段进行计数：这样，我就可以像预期那样将统计数据作为多个存储桶接收到。现在，我还能以某种方式添加到这些存储桶中吗（以及用于统计的漂亮输出）？我附带的最好的看起来像：实际上，它可以工作，并且在每个存储桶中返回非常复杂的结构：当然，可以从此结构中提取平台的名称和网址（例如），但是是否有更干净，更简
向ElasticSearch术语聚合添加其他字段

索引文档如下：我想要的是按平台计数和输出统计信息。对于计数，我可以使用带有的术语聚合作为字段进行计数：通过这种方式，我以多个bucket的形式接收统计数据，看起来就像预期的那样{key:8，doc\u count:162511}。现在，我可以以某种方式将和（用于漂亮的统计输出）添加到这些桶中吗？我带来的最好的看起来像：实际上，它可以工作，并在每个桶中返回非常复杂的结构：当然，平台的名称和
获取最大术语桶聚合（使用管道聚合）

我想知道如何在Elasticsearch中使用聚合时获得具有最高doc_count的存储桶。我正在使用Kibana示例数据kibana_sample_data_flights：如果有一个存储桶具有最大文档计数，我可以将术语聚合的大小设置为1，但是如果有两个存储桶具有相同的最大文档计数，则这不起作用。自从我涉足管道聚合以来，我觉得应该有一种简单的方法来实现这一点。最大桶聚合似乎能够处理多个最大桶
ElasticSearch在另一个聚合结果上使用聚合

问题内容：有一个对话列表，每个对话都有一个消息列表。每个消息都有一个不同的字段和一个字段。我们需要考虑的是，在对话的第一条消息中使用了动作，在几条消息中使用了动作之后，过了一会儿，依此类推（有一个聊天机器人意图列表）。将对话的消息动作分组将类似于：问题：我需要使用ElasticSearch创建一个报告，该报告将返回每次会话的；接下来，我需要对类似的东西进行分组并添加一个计数；最终将导致as
Elasticsearch术语聚合排序

我们目前正在开发一个多语言文档CMS。因此，我们有翻译成不同语言的文件。对于使用Elasticsearch进行搜索，我们目前使用每种语言（德语、英语、法语……)一个索引，其中同一文档的所有翻译共享相同的ID。当用户搜索特定术语时，我们希望在所有语言中搜索，但只返回不同ID的列表。据我所知，只有使用以下术语聚合才能做到这一点：这很好，但是作为弹性搜索文档https://www.elastic.

Elasticsearch聚合：如何使用术语聚合的“其他”结果获取bucket？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档