问题：

合并多个聚合的结果

班安平

2023-03-14

我有电影索引，其中每个文档都有这样的结构：

{
                    "color": "Color",
                    "director_name": "Sam Raimi",
                    "actor_2_name": "James Franco",
                    "movie_title": "Spider-Man 2",
                    "actor_3_name" : "Brad Pitt",
                    "actor_1_name": "J.K. Simmons"
}

我需要计算每个演员对应的电影数量（演员可以在actor_1_name、actor_2_name或actor_3_name字段中）

这3个字段的映射是：

"mappings": {
            "properties": {
                "actor_1_name": {
                    "type": "text",
                    "fields": {
                        "keyword": {
                            "type": "keyword",
                            "ignore_above": 256
                        }
                    }
                },
                "actor_2_name": {
                    "type": "text",
                    "fields": {
                        "keyword": {
                            "type": "keyword",
                            "ignore_above": 256
                        }
                    }
                },
                 "actor_3_name": {
                "type": "text",
                "fields": {
                    "keyword": {
                        "type": "keyword",
                        "ignore_above": 256
                    }
                }
            }
       }
}

有没有一种方法，我可以聚合的结果，可以结合所有3个演员领域的条款，并给出一个单一的聚合。

目前，我正在为每个actor字段创建单独的聚合，并通过我的JAVA代码将这些不同的聚合合并成一个。

通过创建不同的聚合搜索查询：

{
    "aggs" : {
        "actor1_count" : {
            "terms" : {
                "field" : "actor_1_name.keyword"
            }
        },
        "actor2_count" : {
            "terms" : {
                "field" : "actor_2_name.keyword"
            }
        },
        "actor3_count" : {
            "terms" : {
                "field" : "actor_3_name.keyword"
            }
        }
    }
}

示例结果是：

"aggregations": {
"actor1_count": {

            "buckets": [

                {
                    "key": "Johnny Depp",
                    "doc_count": 2
                }
            ]
},

"actor2_count": {

            "buckets": [
                {
                    "key": "Johnny Depp",
                    "doc_count": 1                   }
      ]
},
"actor3_count": {

            "buckets": [

                {
                    "key": "Johnny Depp",
                    "doc_count": 3
                }

           ]
    }
 }

所以，我可以通过Elasticsearch将所有3个聚合的结果合并到一个聚合中，而不是创建不同的聚合吗。

基本上这就是我想要的：

"aggregations": {
    "actor_count": {

                "buckets": [

                    {
                        "key": "Johnny Depp",
                        "doc_count": 6
                    }
                ]
    }
}

（Johnny Deppdoc_count应显示所有3个字段actor_1_name、actor_2_name和actor_3_name的总和，无论它在哪里）

我试过剧本，但效果不好。

{
    "aggregations": {
        "name": {
            "terms": {
                "script": "doc['actor_1_name.keyword'].value + ' ' +  doc['actor_2_name.keyword'].value + ' ' + doc['actor_2_name.keyword'].value"
            }
        }
    }
}

它是组合演员姓名，然后给出结果。

"buckets": [

                {
                    "key": "Steve Buscemi Adam Sandler Adam Sandler",
                    "doc_count": 6
                },
                {
                    "key": "Leonard Nimoy Nichelle Nichols Nichelle Nichols",
                    "doc_count": 4
                }

            ]

共有1个答案

冯德佑

2023-03-14

这在使用术语时是行不通的。我想应该求助于scripted_metric：

GET actors/_search
{
  "size": 0,
  "aggs": {
    "merged_actors": {
      "scripted_metric": {
        "init_script": "state.actors_map=[:]",
        "map_script": """
          def actor_keys = ['actor_1_name', 'actor_2_name', 'actor_3_name'];

          for (def key : actor_keys) {

            def actor_name = doc[key + '.keyword'].value;

            if (state.actors_map.containsKey(actor_name)) {
              state.actors_map[actor_name] += 1;
            } else {
              state.actors_map[actor_name] = 1; 
            }
          }
        """,
        "combine_script": "return state",
        "reduce_script": "return states"
      }
    }
  }
}

生产的

...
"aggregations" : {
    "merged_actors" : {
      "value" : [
        {
          "actors_map" : {
            "Brad Pitt" : 5,
            "J.K. Simmons" : 1,
            "James Franco" : 3
          }
        }
      ]
    }
  }

类似资料：

MongoDB聚合分组多个结果

本文向大家介绍MongoDB聚合分组多个结果，包括了MongoDB聚合分组多个结果的使用技巧和注意事项，需要的朋友参考一下要聚合多个结果，请在MongoDB中使用$group。让我们创建一个包含文档的集合- 在find()方法的帮助下显示集合中的所有文档- 这将产生以下输出- 以下是汇总组多个结果的查询- 这将产生以下输出-
jQuery：合并多个JSON结果

问题内容：情况：用户想使用Youtube的JSON API在JQuery网站中导入Youtube播放列表。问题： Youtube仅返回前50个条目，但是播放列表的长度可能超过100个条目（长度由JSON响应中的“ totalItems”给出）。所有条目都需要合并为1个对象，最后需要将其推入到输出函数中。条目1-50：http : //gdata.youtube.com/feeds/api/
ElasticSearch在另一个聚合结果上使用聚合

问题内容：有一个对话列表，每个对话都有一个消息列表。每个消息都有一个不同的字段和一个字段。我们需要考虑的是，在对话的第一条消息中使用了动作，在几条消息中使用了动作之后，过了一会儿，依此类推（有一个聊天机器人意图列表）。将对话的消息动作分组将类似于：问题：我需要使用ElasticSearch创建一个报告，该报告将返回每次会话的；接下来，我需要对类似的东西进行分组并添加一个计数；最终将导致as
聚合子查询结果上的 JPA 聚合

我有以下JPA实体(getter、setter和非相关字段省略): 我的目标是使用JPQL或criteriaAPI实现查询，它将返回每天的平均事务量和最大事务量。产生预期结果的原生SQL查询(MySQL数据库)如下所示: 遗憾的是，不鼓励使用本机 SQL 查询，并且 JPQL 不允许在 where 子句中使用子查询。提前谢谢你。附加：我从以下Spring数据查询开始：但显然没有用：我可
子聚合多层嵌套复合聚合

我正在尝试设置一个搜索查询，该查询应通过多级嵌套字段复合聚合集合，并从该集合中提供一些子聚合指标。我能够按预期使用其存储桶获取复合聚合，但所有存储桶的子聚合指标都带有。我不确定我是否未能正确指出子聚合应考虑哪些字段，或者它是否应放置在查询的不同部分中。我的收藏看起来类似于以下内容：贝娄，你可以找到我已经尝试了。尽管所有文档都有一个设置的点击值，但所有存储桶都带有点击总数。到目前为止，我的回应
MongoDB聚合并返回多个文档值

假设我有以下JSON结构，我希望按性别分组，并希望在同一字段中返回多个文档值：现在我知道我可以做这样的事情，但是我需要把年龄和名字合并到一个字段中。

合并多个聚合的结果

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档