当前位置: 首页 > 知识库问答 >
问题:

有没有办法从运动中消耗样本记录?

韩禄
2023-03-14

我使用KCL编写了一个Amazon Kinesis消费者,KCL管理我的记录处理任务。它当前正在处理记录而不进行筛选。我正在寻找一种方法来处理样本记录,同时跳过其中的一些记录。

例如,如果总共有100条记录,我只想处理其中的1/10(10个样本记录)。

谢谢

共有1个答案

淳于乐池
2023-03-14

据我所知,无法告诉Kinesis只返回一个随机的记录子集。所以,一旦记录返回给您,您就可以忽略这些记录。

在processRecords方法中,只需随机忽略9/10条记录:

public void processRecords(ProcessRecordsInput processRecordsInput) {
    processRecordsInput.records()
            .forEach(r -> if (generateRandomNumber()%10 == 0) process(r));
}

private int generateRandomNumber() {
    Random random = new Random();
    return random.nextInt(10);
}
 类似资料:
  • 我们正在考虑从MySQL迁移到AWS Aurora。我们正在为开发人员运行vagrant,因此每个虚拟盒子都有自己的mysql实例。有没有办法在本地运行极光?如果不是,处理这种情况的最佳方法是什么?

  • 我笔记本中的一个单元执行很长时间,而机器中的另一个CPU处于空闲状态。是否可以并行运行其他单元?

  • 我正在编写一个JavaFractal Explorer,分形计算是多线程完成的。以前,我只是创建了一堆线程(系统有多少处理器内核就有多少)并将它们保存在一个数组中,但这会导致一些问题,而且不是很优雅,现在我想切换到执行器。 我需要的功能是: 用户可以随时选择要放大的分形图像的新区域,因此应该可以随时取消计算,并立即重新插入新任务 我的问题是Java ExecutorService(我使用Execu

  • 问题内容: 有没有办法在nodejs应用中设置版本?我想要这样的东西 问题答案: 我发现以下代码片段最适合我。由于它用于加载,因此无论当前工作目录如何,它都可以工作。 @Pathogen提供的警告: 使用Browserify这样做会带来安全隐患。 注意不要将您的信息公开给客户端,因为这意味着您的所有依赖项版本号,构建和测试命令以及更多信息都将发送给客户端。 如果要在同一项目中构建服务器和客户端,则

  • 问题内容: 在我的项目中,我们使用了许多批注,这些批注在javadoc API文档中非常有用。 有谁知道在生成的javadocs中包含注释的简单方法?我不想编写自己的javadoc插件。有什么解决办法吗? 问题答案: 参见java.lang.annotation.Documented 表示默认情况下,javadoc和类似工具将记录带有类型的注释。此类型应用于注释其注释会影响其客户端对已注释元素的使

  • 问题内容: 我知道您可以通过执行 node.requestFocus(); 来将焦点集中在javafx中的一个节点上 。 但是有没有办法从javafx中的节点上夺走焦点或阻止对某个对象的焦点? 问题答案: 我不认为有任何保证将始终有效,但是您可以尝试将焦点设置为本质上不接受键盘输入的内容(例如布局窗格):