问题：

ApacheFlink-基于事件时间计算最后一个窗口

郜昊苍

2023-03-14

我的工作是做以下事情：

根据事件时间使用Kafka主题中的事件
计算7天的窗口大小，以1天的幻灯片显示
将结果放入Redis

我有几个问题：

如果它从最近的记录中消耗Kafka事件，在作业存活1天后，作业关闭窗口并计算7天窗口。问题是作业只有1天的数据，因此结果是错误的。
如果我尝试让它从7天前的时间戳中消耗Kafka事件，当作业开始时，它从第一天开始计算整个窗口，并且花费了很多时间。另外，我只想要最后一个窗口的结果，因为这对我来说很重要。

我错过什么了吗？有更好的方法吗？

共有1个答案

佟高澹

2023-03-14

Flink将时间窗口与时代对齐。因此，如果你有一个小时长的窗口，它们从一个小时的顶端运行到另一个小时的顶端。白天的窗户从午夜开到午夜。同样的原则也适用于七天长的窗户，因为新纪元开始于周四（1970年1月1日），七天长的窗户应该在周三晚上/周四早上的午夜关闭。

如果要将窗口移到其他时间启动，可以向窗口构造函数提供偏移量。

类似资料：

计算事件之间的时间

问题内容：我有一条流经多个系统的消息，每个系统都会记录消息的进入和退出以及时间戳和uuid messageId。我通过以下方式提取所有日志：结果，我现在有以下事件：我想生成一个报告（最好是堆积的条或列），用于每个系统的时间：做这个的最好方式是什么？Logstash过滤器？kibana计算字段？问题答案：您只能使用Logstash 过滤器来实现此目的，但是，您必须实质性地重新实现该过滤器
使用Flink和基于事件时间的流计算平均值

我想用基于历史事件的流计算Flink中基于窗口的平均值（或我定义的任何其他函数），因此流必须是事件时间（而不是基于处理时间）：我已经了解了如何在摄入时添加时间戳：但是当我进行计算（应用函数）时，当我只是以与没有EventTime时相同的方式进行计算时，它就不起作用了。我读过一些关于我必须设置的水印的东西：有没有人举一个简单的Scala例子？尊敬的安德烈亚斯
基于事件时间的Flink时间窗口不输出任何内容

在流处理问题中，我们有3个传感器，每个传感器每8毫秒生成一个时间戳样本（传感器的时间是同步的）。所以我想合并每个时间戳的数据（对于3个传感器，我们应该为每个时间戳输出3个合并的样本数据）。此外，我们有一个160毫秒的时间限制，这样每个数据在生成时间戳后最多应该在160毫秒后输出。所以我决定使用Flink事件时间概念和时间窗口。因为时间戳在每个传感器的样本中都是唯一的，所以我们认为它是数据流的关键。
正在计算事件间隔时间
Flink事件时间会话窗口的最大总时间

我想知道是否可以创建类似于以下内容的WindowAssigner：但我不希望窗口在每个元素的事件时间中保持增长。我希望在接收到的第一个元素（对于该键）处定义窗口的开头，并在1秒后精确结束，无论有多少元素到达该秒。所以它可能看起来像这样的假设：谢谢
一个月的最后一天计算

问题内容：我在计算本月下一个最后一天何时发送预定的通知时遇到问题。这是我的代码：这是导致问题的线，我相信：如何使用日历正确设置下个月的通知的最后一天？问题答案：这将返回当前月份的实际最大值。例如，现在是leap年的2月，因此它返回29作为。

ApacheFlink-基于事件时间计算最后一个窗口

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档