当前位置: 首页 > 知识库问答 >
问题:

弹性搜索:深度嵌套聚合下的reverse_nested聚合不起作用

凌智
2023-03-14

Elasticsearch版本:2.3.3

基本上,标题说明了一切。如果在第二个嵌套聚合下使用reverse_nested,尽管文档似乎通过reverse_nested限定范围(请参阅结果中的最后一个“doc_count”字段),但其后面的聚合不会以某种方式工作。

这里我准备了一个例子——一个文档是一个学生的注册日期和考试历史。

映射:

{
    "mappings": {
        "students": {
            "properties": {
                "name": {
                    "type": "string"},
                "enrollment": {
                    "type": "date"},
                "exam_histories": {
                    "type": "nested",
                    "properties": {
                        "date": {
                            "type": "date"},
                        "subjects": {
                            "type": "nested",
                            "properties": {
                                "name": {
                                    "type": "string"},
                                "score": {
                                    "type": "short"}}}}}}}}}

试验文件:

{
    "name": "John",
    "enrollment": "2012-09-01T00:00:00+00:00",
    "exam_histories": [
        {
            "date": "2016-05-05T00:00:00+00:00",
            "subjects": [
                {
                    "name": "math",
                    "score": 90}]}]}

聚合查询(无实际意义):

{
    "aggs": {
        "nested_exam_histories": {
            "nested": {
                "path": "exam_histories"},
            "aggs": {
                "date_buckets": {
                    "date_histogram": {
                        "field": "exam_histories.date",
                        "interval": "day"},
                    "aggs": {
                        "this_reverse_nested_does_work": {
                            "reverse_nested": {},
                            "aggs": {
                                "newest_enrollment": {
                                    "max": {
                                        "field": "enrollment"}}}},
                        "deep_nested_subjects": {
                            "nested": {
                                "path": "exam_histories.subjects"},
                            "aggs": {
                                "score_buckets": {
                                    "terms": {
                                        "field": "exam_histories.subjects.score"},
                                    "aggs": {
                                        "this_reverse_nested_doesnt_work": {
                                            "reverse_nested": {},
                                            "aggs": {
                                                "newest_exam_date": {
                                                    "max": {
                                                        "field": "exam_histories.date"}}}}}}}}}}}}}}

结果是:

...
"aggregations" : {
    "nested_exam_histories" : {
      "doc_count" : 1,
      "date_buckets" : {
        "buckets" : [ {
          "key_as_string" : "2016-05-05T00:00:00.000Z",
          "key" : 1462406400000,
          "doc_count" : 1,
          "this_reverse_nested_does_work" : {
            "doc_count" : 1,
            "newest_enrollment" : {
              "value" : 1.3464576E12,
              "value_as_string" : "2012-09-01T00:00:00.000Z"
            }
          },
          "deep_nested_subjects" : {
            "doc_count" : 1,
            "score_buckets" : {
              "doc_count_error_upper_bound" : 0,
              "sum_other_doc_count" : 0,
              "buckets" : [ {
                "key" : 90,
                "doc_count" : 1,
                "this_reverse_nested_doesnt_work" : {
                  "doc_count" : 1,
                  "newest_exam_date" : {
                    "value" : null
                  }
...

...您可以在其中看到聚合“newest_exam_date”不起作用。是错误还是我做错了什么?

共有1个答案

红鸿运
2023-03-14

您需要使用path选项显式指定要“反向聚合”的嵌套对象,否则它假定该字段位于根级别。

从留档:

path - 定义应连接回哪个嵌套对象字段。默认值为空,这意味着它将联接回根/主文档级别。该路径不能包含对嵌套对象字段的引用,该字段位于嵌套聚合的嵌套结构之外,reverse_nested所在的嵌套对象字段。例:

{
     "size":0,
   "aggs": {
      "nested_exam_histories": {
         "nested": {
            "path": "exam_histories"
         },
         "aggs": {
            "date_buckets": {
               "date_histogram": {
                  "field": "exam_histories.date",
                  "interval": "day"
               },
               "aggs": {
                  "this_reverse_nested_does_work": {
                     "reverse_nested": {},
                     "aggs": {
                        "newest_enrollment": {
                           "max": {
                              "field": "enrollment"
                           }
                        }
                     }
                  },
                  "deep_nested_subjects": {
                     "nested": {
                        "path": "exam_histories.subjects"
                     },
                     "aggs": {
                        "score_buckets": {
                           "terms": {
                              "field": "exam_histories.subjects.score"
                           },
                           "aggs": {
                              "this_reverse_nested_doesnt_work": {
                                 "reverse_nested": {
                                    "path": "exam_histories"
                                 },
                                 "aggs": {
                                    "newest_exam_date": {
                                       "max": {
                                          "field": "exam_histories.date"
                                       }
                                    }
                                 }
                              }
                           }
                        }
                     }
                  }
               }
            }
         }
      }
   }
}

结果:

 {
   "took": 5,
   "timed_out": false,
   "_shards": {
      "total": 5,
      "successful": 5,
      "failed": 0
   },
   "hits": {
      "total": 2,
      "max_score": 0,
      "hits": []
   },
   "aggregations": {
      "nested_exam_histories": {
         "doc_count": 2,
         "date_buckets": {
            "buckets": [
               {
                  "key_as_string": "2016-05-05T00:00:00.000Z",
                  "key": 1462406400000,
                  "doc_count": 2,
                  "this_reverse_nested_does_work": {
                     "doc_count": 2,
                     "newest_enrollment": {
                        "value": 1377993600000,
                        "value_as_string": "2013-09-01T00:00:00.000Z"
                     }
                  },
                  "deep_nested_subjects": {
                     "doc_count": 2,
                     "score_buckets": {
                        "doc_count_error_upper_bound": 0,
                        "sum_other_doc_count": 0,
                        "buckets": [
                           {
                              "key": 90,
                              "doc_count": 2,
                              "this_reverse_nested_doesnt_work": {
                                 "doc_count": 2,
                                 "newest_exam_date": {
                                    "value": 1462406400000,
                                    "value_as_string": "2016-05-05T00:00:00.000Z"
                                 }
                              }
                           }
                        ]
                     }
                  }
               }
            ]
         }
      }
   }
}

请注意第二个“反向聚合”中的path选项:

reverse_nested": {
    "path": "exam_histories"
 }
 类似资料:
  • 我已经为一个问题挣扎了一段时间,所以我想我应该通过stackoverflow来解决这个问题。 “我的文档类型”有一个标题、一个语言字段(用于筛选)和一个分组id字段(我省略了所有其他字段以保持重点) 搜索文档时,我希望找到包含标题中文本的所有文档。对于每个唯一的分组id,我只需要一个文档。 我一直在关注tophits聚合,从我所看到的情况来看,它应该能够解决我的问题。 对我的索引运行此查询时: 我

  • 我是ES新手,正在努力解决嵌套聚合问题。这是我的虚拟数据对象([这是我的数据对象][1][1]:https://i.stack.imgur.com/X7oaM.png). 我只是想把“现代”领域的成本降到最低。 我已经阅读了以下关于我试图解决的问题的帖子。他们都没有帮助我解决问题 -弹性搜索6嵌套查询聚合-https://www.elastic.co/guide/en/elasticsearch/

  • 我在Elasticsearch中获得了大量数据。我的douments有一个名为“records”的嵌套字段,它包含一个包含多个字段的对象列表。 我希望能够从记录列表中查询特定的对象,因此我在查询中使用了inner_hits字段,但是这没有帮助,因为聚合使用大小0,所以没有返回结果。 我没有成功地使一个聚集只对inner_hits有效,因为无论查询是什么,聚集都返回记录中所有对象的结果。 这是我正在

  • 我正在使用聚合来根据其他字段的总和对一个字段进行分组。 它正在工作,但输出与我从数据库查询得到的结果不相似。 ES查询: 输出: "domain_agg":{"doc_count_error_upper_bound": 9,"sum_other_doc_count": 1442,"存储桶": [ { "key":"doc_count","doc_count": 2,"domain_store_co

  • 这是我的示例文档,我在kibana的帮助下为类似文档编制索引。 现在在文件中,“体验”下的关键“品牌”是主集团“公司”的子集团。正如您在文档中看到的,“品牌”可能有类似于“其他”的条目,但由“公司”键分隔。类似的结构可以在文档内部和文档之间出现。我打算根据“品牌”和“公司”来汇总文档。我尝试的查询是- 我得到的错误为- 这是我的文档的映射- 我知道我的经验字段没有嵌套,可能是这个错误的原因。我对e

  • 问题内容: 示例文档中有一个简化的文档。这对我理解非嵌套类型与嵌套类型的聚合差异很有帮助。但是,这种简化掩盖了进一步的复杂性,因此我不得不在这里扩展这个问题。 所以我的实际文件更接近以下内容: 因此,我保留了,和的关键属性,但隐藏了许多其他使情况复杂化的内容。首先,请注意,与引用的问题相比,有很多额外的嵌套:在根和“项目”之间,以及在“项目”和“ item_property_1”之间。此外,还请注