当前位置: 首页 > 知识库问答 >
问题:

waterwark对基于事件时间的间隔连接有什么影响

昝晗昱
2023-03-14

我知道,如果延迟且其所属窗口关闭,则默认情况下将删除延迟事件<我想问一下,基于事件时间的连接间隔如何?水印的确切行为/效果是什么?最近的活动会取消吗?

共有1个答案

尹兴生
2023-03-14

一般情况下:水印向Flink表示,水印时间戳以上的所有记录都已到达。所有时间戳低于水印(双方最小水印)的元素都被视为“迟到”。

对于Flink SQL和DataStream API(KeyedStream#intervalJoin)中的间隔连接,有两种不同的实现[1,2],但答案是相同的:延迟事件将被删除。

有趣的是,Flink SQL操作符有一个允许的lateness字段,但是它总是用< code>0L [2]初始化。所以看起来,可能会有扩展这个功能的计划。

[1] https://github.com/apache/flink/blob/master/flink-streaming-java/src/main/java/org/apache/flink/streaming/api/operators/co/IntervalJoinOperator.java#L230

[2]https://github . com/Apache/flink/blob/master/flink-table/flink-table-planner-blink/src/main/Scala/org/Apache/flink/table/planner/nodes/physical/stream/streamexcintervaljoin . Scala # L313

 类似资料:
  • 我偶然发现了这个不错的教程https://github.com/manashmndl/DeadSimpleSpeechRecognizer其中数据是基于由文件夹分隔的样本进行训练的,所有mfcc都是一次计算的。 我正试图以不同的方式实现类似的目标。 基于此:https://librosa.github.io/librosa/generated/librosa.feature.mfcc.html l

  • 问题内容: 在这里使用新的logstash jdbc连接器: https://www.elastic.co/guide/zh-CN/logstash/current/plugins-inputs- jdbc.html 后续logstash运行如何影响已经编入ElasticSearch的内容?是在ES索引中创建新文档,还是更新与已经被索引的行匹配的文档?我尝试解决的用例是将带有时间戳的行索引到ela

  • 我正在用chartjs绘制一个图形,其中x轴表示时间,y轴表示相应的数据。 现在我得到了今天、上周、上月和去年的数据。 }; 当我绘制图形时,每个点之间的距离是相同的。但这是不正确的,因为时间间隔不相同。 “去年”和“上月”之间的距离应大于“上周”和“上个月”之间的间隔。 任何人一个想法如何我可以实现这与chartjs,当我看留档我没有看到任何选项。

  • # interval(date) Alias for interval.floor(date). For example, d3.time.day(new Date()) returns midnight (12:00 AM) on the current day, in local time. # interval.floor(date) Rounds down the specified da

  • 试图找出一种方法来分割pandas/numpy矩阵中非连续和非等长的行,以便将这些值设置为公共值。有没有人想出一个优雅的解决方案? 我要寻找的是一种基于y行有效选择不同长度x切片的方法