当前位置：首页 > 面试题库 >

ElasticSearch-带有数组字段的子术语聚合的问题

凌朗

2023-03-14

问题内容：

我有以下两个文件：

{  
"title":"The Avengers",
"year":2012,
"casting":[  
    {  
    "name":"Robert Downey Jr.",
    "category":"Actor",
    },
    {  
    "name":"Chris Evans",
    "category":"Actor",
    }
]
}

和：

{  
"title":"The Judge",
"year":2014,
"casting":[  
    {  
    "name":"Robert Downey Jr.",
    "category":"Producer",
    },
    {  
    "name":"Robert Duvall",
    "category":"Actor",
    }
]
}

我想基于两个字段执行聚合：casting.name和casting.category。

我尝试使用基于Cast.name字段的termsaggregation和子聚合，这是另一个基于casting.category字段的termsaggregation。

问题在于，对于“ Chris Evans”条目，ElasticSearch为所有类别（演员，生产者）设置了存储桶，而应仅设置1个桶（演员）。

似乎所有casting.category事件与所有casting.name事件之间都存在笛卡尔积。对于数组字段（广播），它的行为类似于此，而对于简单字段（如标题或年份），我没有问题。

我也尝试使用嵌套的聚合，但可能不正确，ElasticSearch抛出错误，告知casting.category不是嵌套字段。

这里有什么主意吗？

问题答案：

Elasticsearch将扁平化嵌套对象，因此在内部您将获得：

{  
"title":"The Judge",
"year":2014,
"casting.name": ["Robert Downey Jr.","Robert Duvall"],
"casting.category": ["Producer", "Actor"]
}

如果要保留关系，则需要使用嵌套对象或父子关系

要进行嵌套映射，您需要执行以下操作：

  "mappings": {
    "movies": {
      "properties": {
        "title" : { "type": "string" },
        "year" : { "type": "integer" },
        "casting": {
          "type": "nested", 
          "properties": {
            "name":    { "type": "string" },
            "category": { "type": "string" }
          }
        }
      }
    }
  }

类似资料：

ElasticSearch术语按整个字段聚合

问题内容：如何编写一个将整个字段值而不是单个标记考虑在内的ElasticSearch术语聚合查询？比如，我想通过城市名聚集，但下面的回报，，并作为单独的水桶，不和的水桶预期。问题答案：您应该在映射中解决此问题。添加一个not_analyzed字段。如果您还需要分析的版本，则可以创建多字段。现在在city.raw上创建聚合
Elasticsearch术语按数组中的字符串聚合

如何编写Elasticsearch术语聚合，将存储桶按整个术语而不是单个标记拆分？例如，我想按州进行聚合，但以下返回的是纽约、纽约、泽西和加利福尼亚作为单个桶，而不是纽约、新泽西和加利福尼亚作为预期的桶：我的用例就像这里描述的那样https://www.elastic.co/guide/en/elasticsearch/guide/current/aggregations-and-analysi
Elasticsearch排序术语聚合热门子聚合中字段后的存储桶

我想根据top hits聚合中第一个元素所拥有的属性，从terms聚合中订购Bucket。我的尽力而为查询如下（有语法错误）：有人知道如何做到这一点吗？例子：按“a”分组，按“id”（desc）排序存储桶，并按“b”（desc）排序最热门的内容，将给出：
ElasticSearch术语聚合

问题内容：我正在尝试使用以下查询对以下数据进行elasticsearch来执行术语聚合，输出将名称分解为标记（请参见下面的输出）。因此，我尝试将os_name映射为multi_field，但现在无法通过它查询。是否可以有没有令牌的索引？例如“ Fedora Core”？查询：数据：输出：映射：问题答案：实际上，您应该像这样更改映射并且您的aggs应该更改为：
向ElasticSearch术语聚合添加其他字段

问题内容：索引文件如下：我想要的是按平台计数和输出统计信息。为了进行计数，我可以将术语聚合作为字段进行计数：这样，我就可以像预期那样将统计数据作为多个存储桶接收到。现在，我还能以某种方式添加到这些存储桶中吗（以及用于统计的漂亮输出）？我附带的最好的看起来像：实际上，它可以工作，并且在每个存储桶中返回非常复杂的结构：当然，可以从此结构中提取平台的名称和网址（例如），但是是否有更干净，更简
向ElasticSearch术语聚合添加其他字段

索引文档如下：我想要的是按平台计数和输出统计信息。对于计数，我可以使用带有的术语聚合作为字段进行计数：通过这种方式，我以多个bucket的形式接收统计数据，看起来就像预期的那样{key:8，doc\u count:162511}。现在，我可以以某种方式将和（用于漂亮的统计输出）添加到这些桶中吗？我带来的最好的看起来像：实际上，它可以工作，并在每个桶中返回非常复杂的结构：当然，平台的名称和

相关阅读

ElasticSearch：_score字段上的聚合？Elasticsearch：聚合，按字段计数 Elastic Search中嵌套字段的术语聚合 Elasticsearch术语聚合和查询 Elasticsearch-聚合脚本字段

相关文章

Python Pandas聚合函数 SQL Server聚合函数 MySQL 数据同步 Elasticsearch 的技术方案选型 DBMS聚合 Maven聚合

相关问答

elasticsearch术语聚合不正确应用聚合后过滤elasticsearch中的术语聚合桶 Elasticsearch字段上的总和和计数聚合在ElasticSearch中聚合范围0计数术语 ElasticSearch：嵌套字段和聚合

相关工具

2048游戏聚合版（CocosEditor）语音数字键盘汉字炼金术接吻的艺术开源数据访问组件DAC

相关文档

elasticsearch-rest-plus 组件区块链技术智能合约 Solidity 编程语言中文文档命令行的艺术 SQL 合计函数中文技术文档的写作规范