当前位置: 首页 > 知识库问答 >
问题:

Flink大尺寸/小高级滑动窗口性能

夹谷承安
2023-03-14

我的用例

    null
env.setStreamTimeCharacteristic(TimeCharacteristic.EventTime)

val oneDayCounts = joins
  .keyBy(keyFunction)
  .map(t => (t.key, 1L, t.timestampMs))
  .keyBy(0)
  .timeWindow(Time.days(1))

val sevenDayCounts = oneDayCounts
  .keyBy(0)
  .timeWindow(Time.days(7), Time.minutes(10))
  .sum(1)

// single reducer
sevenDayCounts
  .windowAll(TumblingProcessingTimeWindows.of(Time.minutes(10)))

问题

然而,如果我没有理解错的话,这将意味着由于滑动窗口的性质,单个事件将产生7*24*6=1008个记录。所以我的问题是,我如何才能减少纯粹的数额?

共有1个答案

邹玄裳
2023-03-14

有一张JIRA票--Flink-11276--和一张google文档,主题是如何更有效地执行此操作。

我还建议您看一看本文,并讨论使用流切片的高效窗口聚合。

 类似资料:
  • 描述 (Description) 如果大小类未包含在列中,则它会自行扩展并填充列中的剩余空间。 多列也保持相等的空间。 shrink类用于使列缩小,即它占用内容所需的水平空间。 例子 (Example) 以下示例演示了在Foundation中使用advanced sizing - <!DOCTYPE html> <html> <head> <meta name = "viewpo

  • 我正在尝试flink的一些网络监控工作。我的目标是计算每个的不同。 我下面的代码工作,但性能真的很糟糕。似乎每个滑动窗口都重新计算所有事件,但这不应该是必要的。 例如,我们有时间秒1-600的事件。Flink可以得到每秒的累加器,所以我们每秒有600个累加器。当第一个滑动窗口过期时,flink只合并1-300的累加器,并销毁第二个1的累加器。此窗口还可以在最后一秒前预合并1-299。当第二个滑动窗

  • 本文向大家介绍C#实现Winform鼠标拖动窗口大小时设定窗口最小尺寸的方法,包括了C#实现Winform鼠标拖动窗口大小时设定窗口最小尺寸的方法的使用技巧和注意事项,需要的朋友参考一下 本文实例讲述了C#实现Winform鼠标拖动窗口大小时设定窗口最小尺寸的方法。分享给大家供大家参考,具体如下: winform 程序运行过程中,用户用鼠标拖动窗体大小时,如将窗体调整得极小,可能窗体上的控件就面目

  • NowCoder 题目描述 给定一个数组和滑动窗口的大小,找出所有滑动窗口里数值的最大值。 例如,如果输入数组 {2, 3, 4, 2, 6, 2, 5, 1} 及滑动窗口的大小 3,那么一共存在 6 个滑动窗口,他们的最大值分别为 {4, 4, 6, 6, 6, 5}。 解题思路 // java public ArrayList maxInWindows(int[] num, int size)

  • 一、题目 给定一个数组和滑动窗口的大小,请找出所有滑动窗口里的最大值。 举例说明 例如,如果输入数组{2,3,4,2,6,2,5,1}及滑动窗口的大小为3,那么一共存在6个滑动窗口,它们的最大值分别为{4,4,6,6,6,5}。 二、解题思路 如果采用蛮力法,这个问题似乎不难解决:可以扫描每一个滑动窗口的所有数字并找出其中的最大值。如果滑动窗口的大小为k,需要O(k)时间才能找出滑动窗口里的最大值

  • 假设我有一个每1分钟开始的2小时窗口。下一步是应用GroupBy转换。 如果能解释这一点,我将不胜感激。无法真正找到相关信息