问题：

在elasticsearch中，如何在嵌套数组中按值分组

邵赞

2023-03-14

我有以下文件：

第一份文件：

{
  productName: "product1",
  tags: [
    {
      "name":"key1",
      "value":"value1"
    },
    {
      "name":"key2",
      "value":"value2"
    }
  ]
}

第二份文件：

{
  productName: "product2",
  tags: [
    {
      "name":"key1",
      "value":"value1"
    },
    {
      "name":"key2",
      "value":"value3"
    }
  ]
}

我知道如果我想按产品名称分组，我可以使用terms聚合

"terms": {
    "field": "productName"
}

这将给我两个桶，两个不同的键“product1”，“product2”。

但是，如果我想按标记键分组，查询应该是什么？i、 e.我想按name==key1的标记分组，然后我希望有一个key=“value1”的bucket；而如果我按name==key2的标记分组，我希望结果是两个bucket，其键为“value2”、“value3”。

如果我想在嵌套数组中按“值”分组，而不是按“键”分组，那么查询应该是什么样子？有什么建议吗？

共有1个答案

经炜

2023-03-14

听起来，您需要的是嵌套术语聚合。

对于您发布的两个文档，此查询：

POST /test_index/_search
{
   "size": 0,
   "aggs": {
      "product_name_terms": {
         "terms": {
            "field": "product_name"
         }
      },
      "nested_tags": {
         "nested": {
            "path": "tags"
         },
         "aggs": {
            "tags_name_terms": {
               "terms": {
                  "field": "tags.name"
               }
            },
            "tags_value_terms": {
               "terms": {
                  "field": "tags.value"
               }
            }
         }
      }
   }
}

返回以下内容：

{
   "took": 67,
   "timed_out": false,
   "_shards": {
      "total": 5,
      "successful": 5,
      "failed": 0
   },
   "hits": {
      "total": 2,
      "max_score": 0,
      "hits": []
   },
   "aggregations": {
      "product_name_terms": {
         "doc_count_error_upper_bound": 0,
         "sum_other_doc_count": 0,
         "buckets": []
      },
      "nested_tags": {
         "doc_count": 4,
         "tags_name_terms": {
            "doc_count_error_upper_bound": 0,
            "sum_other_doc_count": 0,
            "buckets": [
               {
                  "key": "key1",
                  "doc_count": 2
               },
               {
                  "key": "key2",
                  "doc_count": 2
               }
            ]
         },
         "tags_value_terms": {
            "doc_count_error_upper_bound": 0,
            "sum_other_doc_count": 0,
            "buckets": [
               {
                  "key": "value1",
                  "doc_count": 2
               },
               {
                  "key": "value2",
                  "doc_count": 1
               },
               {
                  "key": "value3",
                  "doc_count": 1
               }
            ]
         }
      }
   }
}

下面是我用来测试它的一些代码：

http://sense.qbox.io/gist/a9a172f41dbd520d5e61063a9686055681110522

编辑：按嵌套值筛选

根据您的评论，如果您想通过（嵌套结果的）值过滤嵌套结果，您可以使用过滤器聚合添加另一个“层”聚合，如下所示：

POST /test_index/_search
{
   "size": 0,
   "aggs": {
      "nested_tags": {
         "nested": {
            "path": "tags"
         },
         "aggs": {
            "filter_tag_name": {
               "filter": {
                  "term": {
                     "tags.name": "key1"
                  }
               },
               "aggs": {
                  "tags_name_terms": {
                     "terms": {
                        "field": "tags.name"
                     }
                  },
                  "tags_value_terms": {
                     "terms": {
                        "field": "tags.value"
                     }
                  }
               }
            }
         }
      }
   }
}

{
   "took": 10,
   "timed_out": false,
   "_shards": {
      "total": 5,
      "successful": 5,
      "failed": 0
   },
   "hits": {
      "total": 2,
      "max_score": 0,
      "hits": []
   },
   "aggregations": {
      "nested_tags": {
         "doc_count": 4,
         "filter_tag_name": {
            "doc_count": 2,
            "tags_name_terms": {
               "doc_count_error_upper_bound": 0,
               "sum_other_doc_count": 0,
               "buckets": [
                  {
                     "key": "key1",
                     "doc_count": 2
                  }
               ]
            },
            "tags_value_terms": {
               "doc_count_error_upper_bound": 0,
               "sum_other_doc_count": 0,
               "buckets": [
                  {
                     "key": "value1",
                     "doc_count": 2
                  }
               ]
            }
         }
      }
   }
}

以下是更新的代码：

http://sense.qbox.io/gist/507c3aabf36b8f6ed8bb076c8c1b8552097c5458

类似资料：

如何在Elasticsearch脚本中访问嵌套数组的doc值？

问题内容：给定以下索引，我如何在嵌套数组中选择适当的项目并访问其中的一个值？目的是在内的值中使用它。我的查询按skill_id过滤，效果很好。然后，我希望能够针对给定的skill_id 使用更高的分数来提高文档的分数。（<-这是关键）。如何从中访问数组，在数组中找到’skill_id：100’项目，然后使用其值？在上述目前不工作（比分始终是0，而不管数据的，所以我想在正确的地方是不看。
在嵌套数组中按键查找

问题内容：假设我有一个对象：我想找到一个id为1的对象。是否有类似这样的功能？我可以使用Underscore的方法，但必须从顶部开始然后向下过滤。问题答案：递归是您的朋友。我更新了该函数以说明属性数组：
ElasticSearch：在嵌套数组中搜索字段

问题内容：我对ES还是相当陌生，并正在将其用于我的新项目。首先，我为客户提供了一个简单的映射，其中包含名字和姓氏以及付款信息对象列表。如果我在SQL中执行此操作，那将类似于客户表和具有1：许多关系的付款信息表。这是我要执行的操作的一个简单示例：https : //gist.github.com/anonymous/6109593 我希望根据payInfos嵌套数组中的任何匹配项找到任何客户，即
如何在JavaScript中展平嵌套数组？

问题内容：如我们所知，通过使用方法将数组展平那么如何将此数组展平到？问题答案：这是递归的一种替代方法，并且应接受任何深度级别，以避免堆栈溢出。
如何用筛选器脚本在elasticsearch中迭代嵌套数组？

我需要在嵌套字段上应用一个脚本，在那里我可以遍历用户数组。例如，我尝试了以下方法：我得到这个错误
Elasticsearch在嵌套字段中排序值

Sup社区。我有个问题。我正在使用Elasticsearch 6.4 我的数据结构的一部分：我需要得到按成本排序的文档desc，我需要排序dirs字段中的值date_by字段与nulls-first。如何对嵌套字段内的值进行排序，而不按此嵌套字段对文档进行排序？

在elasticsearch中，如何在嵌套数组中按值分组

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档