当前位置: 首页 > 知识库问答 >
问题:

FlinkSQL实时数据和历史数据

曾航
2023-03-14

我正在开发一个应用程序,希望在实时事件和过去事件上运行Flink SQL。我尝试了一个POC,其中Flink在Kafka等流源上运行SQL,SQL查询只返回新的事件/更改。但是,我想对所有数据运行SQL,有些数据可能会随着时间的推移而改变。基本上我的要求就是连续查询整个数据。如何通过Flink或其他流媒体解决方案实现这一点?

共有2个答案

季森
2023-03-14

如果您想要一个随着历史记录的增长而扩展的全状态后端,那么查看可用的连接器可能会很好。

最有可能的候选人似乎是Hbase。

到目前为止,一般答案。

最好从这里开始,但如果您希望使用S3,最好知道Cloudera数据平台将很快包含S3支持的Hbase解决方案。

免责声明:我是Cloudera的员工,是Kafka,Hbase和Flink背后的推动力

江凯风
2023-03-14

Flink SQL还没有提供合适的文件系统连接器,所以这使得这成为问题,至少现在是这样。另一方面,Kafka得到了很好的支持。

 类似资料:
  • 我是Android开发的新手,我正在从firebase Realtime数据库中检索所有的子节点,这些节点的约会状态为“已完成”,并且子节点具有当前用户id,但当我移到历史记录时,它没有显示任何内容。有人能帮我解决这个问题吗。我需要尽快解决问题。 Firebase数据库模型

  • 本文向大家介绍数据模型和数据库的历史,包括了数据模型和数据库的历史的使用技巧和注意事项,需要的朋友参考一下 数据模型的历史已有三代DBMS- 分层系统是第一代DBMS。第一代还带有CODASYL系统。他们两个都是在1960年代推出的。 第二代包括关系模型。EFCodd博士于1970年将其引入。 在第三代包括对象关系数据库管理系统和面向对象的数据库管理系统。 数据库的历史时间表如下所示- 基于文件的

  • 任何push到open-falcon中的数据,事后都可以通过api组件提供的restAPI,来查询得到。 具体请参考API文档

  • 我有一组用于应用程序配置的域对象及其相关表。经过验证的用户可以通过表示层更改这些域对象数据。这些域对象有非常重要的数据,我需要找到谁和何时改变了他们的数据。我的应用程序的数据访问层是使用JPA、Hibernate和Spring实现的。我需要有每个变化的记录,包括:用户操作日期操作类型以前的值。 例如,让我们考虑一个简单的域对象(简化为这个问题的目的): 假设存在具有以下值的实例: 用户(如John

  • 任何push到open-falcon中的数据,事后都可以通过api组件提供的restAPI,来查询得到。 具体请参考API文档

  • 有没有办法将修订版直接添加到_AUD表中作为历史修订版? 据我所知,当实体被持久化时,envers会在_AUD表中创建修订记录,并将当前记录保留在实体表中。假设我想添加历史修订而不影响实体表,这可能吗? 例如,我有一个人实体 我想在PERSON_AUD中添加以下内容,而不修改PERSON表,因为SMITH是当前姓名。