Elasticsearch版本:2.3.3
基本上,标题说明了一切。如果在第
二个嵌套聚合下使用reverse_nested,尽管文档似乎通过reverse_nested
限定范围(请参阅结果中的最后一个“doc_count”
字段),但其后面的聚合不会以某种方式工作。
这里我准备了一个例子——一个文档是一个学生的注册日期和考试历史。
映射:
{
"mappings": {
"students": {
"properties": {
"name": {
"type": "string"},
"enrollment": {
"type": "date"},
"exam_histories": {
"type": "nested",
"properties": {
"date": {
"type": "date"},
"subjects": {
"type": "nested",
"properties": {
"name": {
"type": "string"},
"score": {
"type": "short"}}}}}}}}}
试验文件:
{
"name": "John",
"enrollment": "2012-09-01T00:00:00+00:00",
"exam_histories": [
{
"date": "2016-05-05T00:00:00+00:00",
"subjects": [
{
"name": "math",
"score": 90}]}]}
聚合查询(无实际意义):
{
"aggs": {
"nested_exam_histories": {
"nested": {
"path": "exam_histories"},
"aggs": {
"date_buckets": {
"date_histogram": {
"field": "exam_histories.date",
"interval": "day"},
"aggs": {
"this_reverse_nested_does_work": {
"reverse_nested": {},
"aggs": {
"newest_enrollment": {
"max": {
"field": "enrollment"}}}},
"deep_nested_subjects": {
"nested": {
"path": "exam_histories.subjects"},
"aggs": {
"score_buckets": {
"terms": {
"field": "exam_histories.subjects.score"},
"aggs": {
"this_reverse_nested_doesnt_work": {
"reverse_nested": {},
"aggs": {
"newest_exam_date": {
"max": {
"field": "exam_histories.date"}}}}}}}}}}}}}}
结果是:
...
"aggregations" : {
"nested_exam_histories" : {
"doc_count" : 1,
"date_buckets" : {
"buckets" : [ {
"key_as_string" : "2016-05-05T00:00:00.000Z",
"key" : 1462406400000,
"doc_count" : 1,
"this_reverse_nested_does_work" : {
"doc_count" : 1,
"newest_enrollment" : {
"value" : 1.3464576E12,
"value_as_string" : "2012-09-01T00:00:00.000Z"
}
},
"deep_nested_subjects" : {
"doc_count" : 1,
"score_buckets" : {
"doc_count_error_upper_bound" : 0,
"sum_other_doc_count" : 0,
"buckets" : [ {
"key" : 90,
"doc_count" : 1,
"this_reverse_nested_doesnt_work" : {
"doc_count" : 1,
"newest_exam_date" : {
"value" : null
}
...
...您可以在其中看到聚合“newest_exam_date”不起作用。是错误还是我做错了什么?
您需要使用path
选项显式指定要“反向聚合”的嵌套对象,否则它假定该字段位于根级别。
从留档:
path - 定义应连接回哪个嵌套对象字段。默认值为空,这意味着它将联接回根/主文档级别。该路径不能包含对嵌套对象字段的引用,该字段位于嵌套聚合的嵌套结构之外,reverse_nested所在的嵌套对象字段。例:
{
"size":0,
"aggs": {
"nested_exam_histories": {
"nested": {
"path": "exam_histories"
},
"aggs": {
"date_buckets": {
"date_histogram": {
"field": "exam_histories.date",
"interval": "day"
},
"aggs": {
"this_reverse_nested_does_work": {
"reverse_nested": {},
"aggs": {
"newest_enrollment": {
"max": {
"field": "enrollment"
}
}
}
},
"deep_nested_subjects": {
"nested": {
"path": "exam_histories.subjects"
},
"aggs": {
"score_buckets": {
"terms": {
"field": "exam_histories.subjects.score"
},
"aggs": {
"this_reverse_nested_doesnt_work": {
"reverse_nested": {
"path": "exam_histories"
},
"aggs": {
"newest_exam_date": {
"max": {
"field": "exam_histories.date"
}
}
}
}
}
}
}
}
}
}
}
}
}
}
结果:
{
"took": 5,
"timed_out": false,
"_shards": {
"total": 5,
"successful": 5,
"failed": 0
},
"hits": {
"total": 2,
"max_score": 0,
"hits": []
},
"aggregations": {
"nested_exam_histories": {
"doc_count": 2,
"date_buckets": {
"buckets": [
{
"key_as_string": "2016-05-05T00:00:00.000Z",
"key": 1462406400000,
"doc_count": 2,
"this_reverse_nested_does_work": {
"doc_count": 2,
"newest_enrollment": {
"value": 1377993600000,
"value_as_string": "2013-09-01T00:00:00.000Z"
}
},
"deep_nested_subjects": {
"doc_count": 2,
"score_buckets": {
"doc_count_error_upper_bound": 0,
"sum_other_doc_count": 0,
"buckets": [
{
"key": 90,
"doc_count": 2,
"this_reverse_nested_doesnt_work": {
"doc_count": 2,
"newest_exam_date": {
"value": 1462406400000,
"value_as_string": "2016-05-05T00:00:00.000Z"
}
}
}
]
}
}
}
]
}
}
}
}
请注意第二个“反向聚合”中的path
选项:
reverse_nested": {
"path": "exam_histories"
}
我已经为一个问题挣扎了一段时间,所以我想我应该通过stackoverflow来解决这个问题。 “我的文档类型”有一个标题、一个语言字段(用于筛选)和一个分组id字段(我省略了所有其他字段以保持重点) 搜索文档时,我希望找到包含标题中文本的所有文档。对于每个唯一的分组id,我只需要一个文档。 我一直在关注tophits聚合,从我所看到的情况来看,它应该能够解决我的问题。 对我的索引运行此查询时: 我
我是ES新手,正在努力解决嵌套聚合问题。这是我的虚拟数据对象([这是我的数据对象][1][1]:https://i.stack.imgur.com/X7oaM.png). 我只是想把“现代”领域的成本降到最低。 我已经阅读了以下关于我试图解决的问题的帖子。他们都没有帮助我解决问题 -弹性搜索6嵌套查询聚合-https://www.elastic.co/guide/en/elasticsearch/
我在Elasticsearch中获得了大量数据。我的douments有一个名为“records”的嵌套字段,它包含一个包含多个字段的对象列表。 我希望能够从记录列表中查询特定的对象,因此我在查询中使用了inner_hits字段,但是这没有帮助,因为聚合使用大小0,所以没有返回结果。 我没有成功地使一个聚集只对inner_hits有效,因为无论查询是什么,聚集都返回记录中所有对象的结果。 这是我正在
我正在使用聚合来根据其他字段的总和对一个字段进行分组。 它正在工作,但输出与我从数据库查询得到的结果不相似。 ES查询: 输出: "domain_agg":{"doc_count_error_upper_bound": 9,"sum_other_doc_count": 1442,"存储桶": [ { "key":"doc_count","doc_count": 2,"domain_store_co
这是我的示例文档,我在kibana的帮助下为类似文档编制索引。 现在在文件中,“体验”下的关键“品牌”是主集团“公司”的子集团。正如您在文档中看到的,“品牌”可能有类似于“其他”的条目,但由“公司”键分隔。类似的结构可以在文档内部和文档之间出现。我打算根据“品牌”和“公司”来汇总文档。我尝试的查询是- 我得到的错误为- 这是我的文档的映射- 我知道我的经验字段没有嵌套,可能是这个错误的原因。我对e
问题内容: 示例文档中有一个简化的文档。这对我理解非嵌套类型与嵌套类型的聚合差异很有帮助。但是,这种简化掩盖了进一步的复杂性,因此我不得不在这里扩展这个问题。 所以我的实际文件更接近以下内容: 因此,我保留了,和的关键属性,但隐藏了许多其他使情况复杂化的内容。首先,请注意,与引用的问题相比,有很多额外的嵌套:在根和“项目”之间,以及在“项目”和“ item_property_1”之间。此外,还请注