当前位置: 首页 > 知识库问答 >
问题:

如何处理AWS Kinesis中的再处理场景?

田骁
2023-03-14

我正在探索AWS Kinesis的数据处理要求,该要求用基于流的方法取代旧的批处理ETL处理。

该项目的关键要求之一是在以下情况下重新处理数据的能力:

  • 发现并修复错误,然后重新部署应用程序。数据需要从一开始就重新处理

这里很好地记录了Kafka-https://cwiki.apache.org/confluence/display/KAFKA/Kafka流数据(重新)处理场景的场景。

我在Kinesis中看到了基于时间戳的ShardIterator,我认为可以使用Kinesis API构建类似Kafka的resetter工具,但如果这样的东西已经存在,那就太好了。即使没有,也可以向那些解决过类似问题的人学习。

那么,有没有人知道任何现有的资源、模式和工具可以在Kinesis中做到这一点?

共有1个答案

倪鸿禧
2023-03-14

我遇到过这样的情况,我想重新处理经过动画片处理的记录,我使用了动画片录像机来重新处理动画片生成的记录。

运动-录像机记录运动流并维护运动在给定时间处理的文件的元数据。

稍后,我们可以使用在任何给定的时间范围内重新处理/重播事件。

这里是同样的github链接。

https://github.com/scopely/kinesis-vcr

如果这对你有用,请告诉我。

谢谢

 类似资料:
  • 我们使用和作为Spring 5.1.9的一部分,使用方法发出请求。此方法的文档强调了以下内容: ...使用exchange()时,应用程序有责任使用任何响应内容,而不管场景如何(成功、错误、意外数据等)。不这样做会导致内存泄漏。 如果我理解实现,那么如果请求被成功调度,将始终给我们一个响应,而不管响应代码是什么(例如4xx、5xx)。在这个场景中,我们只需要调用来使用响应。我关心的是错误场景(例如

  • 我喜欢BDD开发方法,但我遇到了一个问题,那就是要走多远。来自ThoughtWorks最新雷达的这条评论让我停顿了一下: “像Cucumber这样的行为驱动设计(BDD)测试框架的出现,加上像Selenium这样的浏览器自动化工具,鼓励了在浏览器级别广泛使用验收测试。不幸的是,这鼓励了在运行测试的成本最大的地方进行大部分测试。相反,我们应该在适当的级别进行测试,尽可能接近代码,这样测试才能以最大的

  • 问题内容: 在开发高度基于XML的Java应用程序时,我最近在Ubuntu Linux上遇到了一个有趣的问题。 我的应用程序使用Java Plugin Framework ,似乎无法将dom4j创建的XML文档转换为Batik的 SVG规范实现。 在控制台上,我了解到发生了错误: 我认为问题是由来自JVM的原始类加载器与插件框架部署的类加载器之间的冲突引起的。 据我所知,不可能为框架指定一个类加载

  • 问题内容: 在开发一个高度基于XML的Java应用程序时,我最近在Ubuntu Linux上遇到了一个有趣的问题。 我的应用程序使用Java Plugin Framework ,似乎无法将dom4j创建的XML文档转换为Batik的 SVG规范实现。 在控制台上,我了解到发生了错误: 我认为问题是由JVM的原始类加载器与插件框架部署的类加载器之间的冲突引起的。 据我所知,不可能为框架指定一个类加载

  • 问题内容: 背景 我刚刚将熊猫从0.11升级到0.13.0rc1。现在,该应用程序会弹出许多新警告。其中之一是这样的: 我想知道这到底是什么意思?我需要改变什么吗? 如果我坚持使用该如何警告quote_df[‘TVol’] = quote_df[‘TVol’]/TVOL_SCALE? 产生错误的功能 更多错误讯息 问题答案: 在SettingWithCopyWarning被创造的标志可能造成混淆的

  • 本文向大家介绍如何处理硒中的帧?,包括了如何处理硒中的帧?的使用技巧和注意事项,需要的朋友参考一下 我们可以借助以下方法来处理Selenium中的帧- switchTo()。frame(frameNumber) 此方法使用帧ID作为参数。框架ID的索引从0开始。如果未找到框架,则会引发NoSuchFrameException。 switchTo()。frame(frameName) 此方法使用开发