当前位置: 首页 > 面试题库 >

如何在Elasticsearch Aggregation中获得最小和最大日期之间的小时数?

廖华翰
2023-03-14
问题内容

如何在Elasticsearch中计算最大和最小日期之间的小时数(最大和最小相同树级别)?

我的查询:

{
    "size": 0,
    "query": {
        "bool": {
            "must": []
        }
    },
    "aggs": {
        "group_by_areaId": {
            "terms": {
                "size": 100000,
                "field": "areaId.keyword"
            },
            "aggs": {
                "4m": {
                    "date_histogram": {
                        "field": "timestamp",
                        "format": "yyyy-MM-dd'T'HH:mm:ssZZ",
                        "interval": "4m",
                        "order": {
                            "_key": "asc"
                        }
                    },
                    "aggs": {
                        "maxDate": {
                            "max": {
                                "field": "timestamp"
                            }
                        },
                        "minDate": {
                            "min": {
                                "field": "timestamp"
                            }
                        }
                    }
                }
            }
        }
    }
}

响应(简短)为

"aggregations": {
        "group_by_areaId": {
            "doc_count_error_upper_bound": 0,
            "sum_other_doc_count": 0,
            "buckets": [
                {
                    "key": "key1",
                    "doc_count": 15,
                    "4m": {
                        "buckets": [
                            {
                                "key_as_string": "2020-02-12T06:08:00+0000",
                                "key": 1581487680000,
                                "doc_count": 3,
                                "minDate": {
                                    "value": 1.581487847E12,
                                    "value_as_string": "2020-02-12T06:10:47Z"
                                },
                                "maxDate": {
                                    "value": 1.58148791E12,
                                    "value_as_string": "2020-02-12T06:11:50Z"
                                },                             
                                 *// Need hours between maxDate and minDate here
                                 //{
                                 //    "hours" : "0.0175" (maxDate-minDate)
                                 //}*
                            }
                        ]
                    }
                }
            ]
        }
    }

任何人都可以帮助我找出解决方案吗?提前致谢。


问题答案:

您可以利用bucket_script管道聚合来计算每个存储区的最小值和最大值之间的差异。

只需在同一级别添加以下minDatemaxDate

            "hours": {
                "bucket_script": {
                    "buckets_path": {
                      "min": "minDate",
                      "max": "maxDate"
                    },
                    "script": "(params.max - params.min) / 3600000"
                }
            }

对于上面的示例数据,在这种情况下,结果将为0.0175(即大约1分钟)



 类似资料:
  • 我有一个rdd类型为rdd[String]的示例,下面是它的一部分: 结果:(1982,52)(2006,64)(1962,32)(1966,32)(1986,52)(2002,64)(1994,52)(1974,38)(1990,52)(2010,64)(1978,38)(1954,26)(2014,64)(1958,35)(1998,64)(1970,32)

  • 问题内容: 我想知道哪个是Javascript 对象允许的最小和最大日期。我发现最小日期大约是200000 BC,但是我没有得到任何参考。 有人知道答案吗?我只是希望它不依赖于浏览器。 最好以“纪元时间”(= 1970-01-01 00:00:00 UTC + 00的毫秒数)回答。 问题答案: 根据规范§15.9.1.1: Date对象包含一个数字,该数字指示毫秒内的特定时间点。这样的数字称为时间

  • 初始数据: 使用此查询: 我得到: 但我需要分组“quotite”时,下一行是相同的,并显示第一行的开始日期和最后一行的日期。 预期结果: gordon提供的解决方案: 选择agenhi,tacthi,min(dtfihi)作为start_date,lead(max(dtfihi))over(按agenhi分区,seqnum-seqnum_2按max(dtfihi)排序)作为end_date,fr

  • 问题内容: 我有一个数据框,看起来像: 我希望按年份分组,然后总结sum_col。此外,我需要查找一周的最早日期和最新日期。第一部分很简单: 我试图用这个来找到最小/最大日期,但是没有成功: 如何找到最早/最新出现的日期? 问题答案: 您需要组合适用于同一列的函数,如下所示:

  • 问题内容: 我想返回该数字,只要它在限制范围内,否则返回限制的最大值或最小值。我可以结合使用和和。 我想知道,如果有一个现有的或我俯瞰功能。 如果第三方库很常见(例如Commons或Guava),则欢迎它们 问题答案: 从版本21开始,Guava包括(以及其他原语的等效方法)。从发行说明中: 添加了将给定值限制在和值定义的封闭范围内的方法。如果值在范围内,则返回值本身,如果值在范围内,则返回值,如

  • 我有一个熊猫DataFrame看起来像这样: 我的目标是能够为每个项目计算每个日期之间的价值差异。例如,我想找到A项: 12(32-20,因为最大年份是2012年,最小年份是2010年)和B项:20 (40 - 20,因为最大年份是2019年,最小年份是2016年)。 我使用以下代码获取每个项目的年最大值和年最小值: 然后,我找到每个项目的年份最小值和年份最大值。然而,我坚持做我想要的。