当前位置: 首页 > 知识库问答 >
问题:

使用闪烁间隔连接状态清理行为

乔望
2023-03-14

我正在阅读

https://ci.apache.org/projects/flink/flink-docs-release-1.13/docs/dev/table/sql/queries/joins/#interval-连接,

它有以下例子:

SELECT *
FROM Orders o, Shipments s
WHERE o.id = s.order_id
AND o.order_time BETWEEN s.ship_time - INTERVAL '4' HOUR AND s.ship_time

我有以下两个问题:

> < li>

如果< code>o.order_time和< code>s.ship_time是正常时间列,而不是事件时间属性,那么所有状态都将保存在Flink中,就像正常的常规内部联接一样?所以,也许大的州会被保留在Flink

如果o.order_time和s.ship_time是事件时间属性,那么 flink 会依靠水印来做状态清理吗?以便小尺寸状态将保留在 Flink 中

共有1个答案

杜河
2023-03-14

是的,没错。Flink SQL具有时间属性概念的原因是,合适的流查询可以自动清除它们的状态,间隔连接就是这种查询的一个例子。版本化表上的时间窗和时态连接也以类似的方式工作。

 类似资料:
  • 感谢任何能帮助你回答问题的人。

  • 我正在开发一个简单的聚合,它对给定资源上发生的事件总数进行汇总(请参阅:在flink中计算总数并定期发射)。在一些人的帮助下,我成功地完成了这项工作,但现在我遇到了另一个问题。 我试图计算资源生命周期的总数,但我正在从保留期为24小时的kinesis流中读取事件。因为这意味着我无法访问在此之前发生的事件,所以我需要从一个每天计算一次总数的遗留(批处理)系统引导我的状态。 基本上,我希望以某种方式从

  • 我的目标是有一个Flink流程序,保留最后的N个id,其中id是从事件中提取的。接收器是一个Cassandra存储区,因此可以随时获取ID列表。重要的是,卡桑德拉在每一次事件发生时都要立即得到最新消息。

  • 2)我研究了循环分区的重新平衡。假设我建立了一个集群,如果我的源的并行度为1,如果我进行了重新平衡,我的数据是否会在机器之间进行重排以提高性能?如果是这样,是否有一个特定的端口将数据传送到集群中的其他节点? 3)状态维护有什么限制吗?我计划维护一些用户id相关的数据,这些数据可能会变得很大。我读到flink使用rocks db来维护状态。只是想检查一下是否有限制可以维护多少数据? 4)同样,如果数

  • 我正在做一个选择工具,我已经带来了这些解决方案,在第一次使用J面板getGraphics方法,我在鼠标被拖动的任何地方绘制一个椭圆形,在第二次我覆盖了油漆组件方法来绘制椭圆形。 当我执行第一个时,拖动鼠标会闪烁,绘图很差,而第二个方法运行完美。为什么会发生这种情况?,如果我在第一个解决方案中退出重新绘制,它会绘制椭圆形并且不会“删除”它们。 这样做的最佳实践是什么?,当我用getGraphics绘

  • 问题内容: 我为创建的每个对象都有一个名称。每个对象在表格视图中填充一行。现在,我希望在表行持续闪烁的橙色是。 只要属性为true,如何使表格行一直 闪烁? 问题答案: 要使内容闪烁,请使用: 在这种情况下,更改颜色的最好方法是使用CSS: 然后在外部CSS文件中,您可以配置Flash高亮显示的样式: 要将其绑定到布尔属性,只需使用该属性创建一个侦听器: 要将其应用于表格行,您必须编写一个。您只需