当前位置: 首页 > 面试题库 >

elasticsearch按ID字段分组并在日期字段上执行最大值

微生俊健
2023-03-14
问题内容

我的索引具有如下所述的数据。

Id    version_number groupId   indexDate
1    v1                 1    2016-11-15T12:00:00
2    v1                 2    2016-11-20T12:00:00
3    v2                 2    2016-12-01T12:00:00
4    v1                 3    2016-13-01T12:00:00
5    v1                 4    2016-11-01T12:00:00
6    v2                 4    2016-13-01T12:00:00
7    v1                 5    2016-14-01T12:00:00

如何在Java中编写Elasticsearch查询。如果我按日期搜索2016-13-01T12:00:00我希望看到每个groupId的最新版本,其indexDate小于或等于搜索日期?

预期输出:

Id    version_number   groupId   indexDate
1    v1                  1       2016-13-01T12:00:00
2    v2                  2       2016-11-20T12:00:00
6    v3                  3       2016-10-01T12:00:00
7    v2                  4       2016-10-01T12:00:00

我没有在Elasticsearch的日期字段中看到max函数来实现这一点。


问题答案:

我将首先进行汇总version_number,然后使用top_hits子汇总,以降序排序indexDate并返回该存储区的第一个文档的ID。

{
  "size": 0,
  "aggs": {
    "by_version": {
      "terms": {
        "field": "version_number"
      },
      "aggs": {
        "max_date": {
          "top_hits": {
            "size": 1,
            "sort": {
              "indexDate": "desc"
            },
            "_source": [
              "id"
            ]
          }
        }
      }
    }
  }
}


 类似资料:
  • 问题内容: 我发现的唯一接近的事情是:Elasticsearch中的多个分组方式 基本上,我试图获得与以下查询等效的ES : 年龄和性别本身很容易获得: 这使: 但是现在我需要这样的东西: 请注意,这是针对年龄范围的“映射”,因此它们实际上表示的是:)而不是数字。例如,性别[1](“男性”)细分为[246]的年龄范围[0](“18岁以下”)。 问题答案: 由于您只有2个字段,因此一种简单的方法是使

  • 问题内容: 在下面的表格中,我需要获取状态日期等于2的最大日期的行 我需要使用此请求获取具有最大日期和按REMUN_ID分组的行 结果 : 我需要调整请求以从此结果中仅获取statut = 2的行 我的目的是获取以下结果,这是第一个查询的子查询,以仅获取具有状态2的子查询。 PS:如果我使用了将从中得到这些结果的子句: 那不是我想要的。 有什么建议?谢谢 问题答案: SQLFiddle:http

  • 问题内容: 我有一些文件: 如何按地区过滤/选择不同的文档? 在SQL中,我可以使用GROUP BY。我尝试了条件聚合,但返回的计数却不同。 感谢您的帮助!:-) 问题答案: 如果您的ElasticSearch版本为1.3或更高版本,则可以使用top_hits类型的子聚合,默认情况下,它将为您提供按查询分数排序的前三个匹配文档(此处为1,因为您使用match_all查询)。 您可以将参数设置为3以

  • 我正在和Kafka经纪人联系阿帕奇·Flink。 我随机收到了以下消息: 消息(时间戳=[…],索引=1,someData=[…]) 消息(时间戳=[…],索引=2,someData=[…]) 消息(时间戳=[…],索引=3,某些数据=[…]) 消息(时间戳=[…],索引=2,someData=[…]) 消息(时间戳=[…],索引=3,某些数据=[…]) 消息(时间戳=[…],索引=1,someD

  • 我使用的是Spring Boot 2.1.6和Elasticsearch 6.2.2 编辑以更好地澄清我的问题: 当我让Spring在我的存储库中使用以下方法为我生成查询时: 我想这意味着它将从索引中选择,然后按创建的降序排列结果,最后它将只返回第一个(最新)结果。 但索引中只有两个条目,相同的条目减去创建日期,该查询返回两个结果。我认为这意味着它不会转化为我所想的,而是会选择具有该ID的所有帐户

  • 问题内容: 我正在尝试从tblimage中提取与每个用户的tblimage中的maxid对应的照片。目前,我正在从消息表中获取所有消息,并为发布消息的用户提供了一张随机照片,我希望该照片是最新上传的照片。按照现在的书写方式,它只是从桌子上拉出一张随机照片。有什么建议? 表结构是这样的: 消息:msgid,消息,user_id,event_id tblimage:id,照片,userid 问题答案: