Flink中两个流的连接和状态管理

和光启

2023-03-14

我在flink中有两个nifi流源，我需要对这两个源执行连接。哪种方法更好？它是数据流提供的联接api还是表api（https://ci.apache.org/projects/flink/flink-docs-release-1.5/dev/table/streaming.html#streaming-concepts）？

共有1个答案

孙俊彦

2023-03-14

这在很大程度上取决于您希望对连接的数据应用什么计算。如果您能用StreamSQL（或表api）来表达您的计算。我建议使用它，因为它抽象了实现的低层细节的所有负担，例如状态维护。

如果表API不够，那么切换到DataStream API。

类似资料：

Flink动态表和流连接

我试图从动态表和基于某些字段的流中派生新表。有没有人能为你提供最好的指导。我对flink和尝试新事物是陌生的。书籍 ============================ BookId， Instruments， Quantity Book1， Goog，100 Book2， Vod，10 Book1， Appl，50 Book2， Goog，60 Book1， Vod，130 Book3，
如何在Apache Flink中连接两个流

例如，我想在单个中组合和的流，因此结果应该是：。换句话说：如果第一个源已耗尽-从第二个源获取元素。我最近的尝试是：也对datetime进行了类似的尝试，但结果相同。
Flink在会话窗口中连接两个流

我有两个流，希望将第二个流连接到窗口内的第一个流，因为我需要对与会话相关的两个流的连接进行一些计算（流的连接控制会话）。实际上，当从留档读取时，（会话）窗口只允许在单个流上进行计算，而不允许在连接中进行计算。我曾尝试使用会话窗口和协处理器函数的组合，但结果并不完全符合我的预期。有没有办法合并Flink中与会话窗口相关的两个流？
Flink窗口状态大小和状态管理

在阅读了Flink的文档并四处搜索后，我无法完全理解Flink的句柄在其窗口中的状态。假设我有一个每小时滚动的窗口，其中包含一个聚合函数，该函数将消息累积到某个java pojo或scala case类中。该窗口的大小将与一小时内进入该窗口的事件数量相关联，还是仅仅与POJO/Case类相关联，因为我将事件累加到该对象中。（例如，如果将10000个味精数成一个整数，大小会接近10000*味精大小还
Apache Flink RocksDB状态管理

我在同一份flink jobs中读了两个Kafka主题。：来自第一个主题的消息被保存到rocksdb，然后它将与Stream2联合。：来自第二个主题的消息被Stream1保存的状态所丰富，然后它将与Stream1联合。主题1和主题2是不同的来源，但两个来源的输出基本相同。我必须用topic1的数据来充实topic2的数据。这里是流动；这里是问题；那个流量好吗？可以访问由保存的相同的状
如何在Flink中连接两个流并进行操作？

我有一个

Flink中两个流的连接和状态管理

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档