当前位置：首页 > 专题 >

《flink》专题

Apache Flink中的端到端精确一次处理
Apache Flink通过从检查点恢复作业，确保故障和恢复时只进行一次处理，检查点是分布式数据流和操作员状态的一致快照（分布式快照的Chandy Lamport算法）。这保证了故障切换时只需一次。在正常集群操作的情况下，Flink如何保证只进行一次处理，例如给定一个从外部源读取的Flink源（例如Kafka），Flink如何保证从源读取一次事件？事件源和Flink源之间是否有任何类型的应用程序
Flink：在DataStream和“一组规则”之间实现“连接”
以下用例的最佳实践建议是什么？我们需要将流与一组“规则”相匹配，这些规则本质上是Flink数据集的概念。可以对此“规则集”进行更新，但并不频繁。必须根据“规则集”中的所有记录检查每个流事件，并且每个匹配将生成一个或多个事件到接收器数据流中。规则集中的记录数在6位数范围内。目前，我们只是将规则加载到本地规则列表中，并在传入的数据流上使用flatMap。在flatMap中，我们只是在一个列表上迭代，
Flink显示一个作业正在UI中运行，但该作业实际上不工作
这是关于一个flink作业，它有一个简单的源来从url中获取数据，然后过滤数据，然后在一个进程函数中收集数据一段时间（keyBy），最后在一个映射中处理收集到的数据。由于某些原因，即使flinkUI显示它正在运行，作业在几天后也会停止运行。有没有办法知道为什么会有这样的行为，也有没有办法知道一个作业实际上是否已经停止，即使UI显示它正在运行。附言：我怎么知道工作已经停止了？？答：它没有执行它正在
无法通过curl请求使用post请求在Flink中提交作业（请求不匹配…）
我试图向运行在Kubernetes集群上的Flink作业管理器发送post请求。当为不需要任何命令行参数的类发送/jar/run的post请求时，它工作得很好。但是，当尝试在同一个jar中提交需要命令行参数的不同类时，会出现以下错误。-：<代码>{“errors”：[“请求与预期格式JarRunRequestBody不匹配。”]} 但是，在传递命令行参数并直接提交作业时，请执行以下操作-：要将上
Flink SQL客户端如何区分批处理模式和流模式？
众所周知，Flink有两个核心API（数据流/数据集），但当我使用Flink Sql客户端提交作业时，我不需要选择流或批处理模式。所以，Flink SQL客户机是如何决定使用批处理模式和流模式的。我在官方文件中没有找到答案。所以，我想知道Flink SQL客户端如何区分批处理模式和流模式？
Flink日志记录限制：如何将日志记录配置传递给flink作业
我有一个flink作业，它使用logback作为日志框架，因为日志需要发送到logstash，logback有一个logstash appender（logstash logback appender）。appender工作正常，当flink作业从Eclipse这样的IDE运行时，我可以在logstash中看到应用程序日志。日志记录配置文件logback。xml放在src/main/resourc
Flink datastream-使用windows处理文件中的数据
我正在学习Flink框架并从事流式作业，该作业将从csv文件中读取数据并使用DataStream API执行一些聚合。数据字段包括城市、州代码、人口值。数据将由州代码键控，并计算每个键的人口总和。输出将采用该格式：（州代码，人口总和）。我当前的实现使用KeyedStream上的reduce函数来聚合总体。这给了我每个关键点的滚动减少。我只想打印每个键的最后一个和。我的理解是，为了在每个窗口中发出
我们可以从Postgres表创建Flink数据流吗
我必须从Postgres表中读取配置并广播它，以使用它过滤主数据流。我正在使用Flink广播状态进行此操作。当我从本地套接字获取配置时，它工作得很好。用例是在Flink作业中从Postgres读取最新配置，而无需重新启动作业。我们可以从Postgres表创建Flink数据流吗？如果可能的话，它是否有效，因为它将永远保持JDBC连接的活性？
如何将数据从Cassandra加载到Apache Flink数据流
尝试使用Apache Flink从Cassandra获取数据，引用本文，我可以读取数据，但我不知道如何将其加载到DataStream对象中。代码如下：我试过了将变量中的数据加载到数据流中
使用Flink获取数据流的文件名
我有一个flink在单个路径中处理csv文件的流式处理。我想知道每个处理文件的文件名。我目前正在使用此功能将csv文件读取到路径（dataPath）中。并使用此函数获取TupleCsvInputFormat。进程运行正常，但我找不到方法来获取每个csv文件的文件名。提前谢谢
如何在flink的readFile方法中提到FileInputFormat？
我正在使用flink从定期附加数据的文件中连续读取数据。我尝试在flink中使用readFile方法。但对如何在该方法的参数中提及FileInputFormat感到困惑。我的文件格式是json。有人能帮我吗？。谢谢
Flink DataStream排序程序不输出
我用Flink编写了一个小测试用例代码来对数据流进行排序。代码如下：然而，代码只输出执行计划和其他几行。但它不会输出实际排序的数字。我做错了什么？
Flink Table API和DataStream ProcessFunction
我想加入一个大表，不可能包含在TM内存和流（kakfa）中。我在测试中成功加入了这两个表，将table-api与datastream api混合在一起。我做了以下操作：它正在工作，但我从未见过这种类型的实现。可以吗？缺点是什么？
Flink DataStream是否有类似mapPartition的api？
我想像这样在中使用一个不可序列化的对象它非常低效，因为我创建了许多实例。实际上，它只能在每个工作器中创建一次。在Spark中，我可以使用mapPartition来执行此操作。但在flink stream api中，我不知道。
为什么在Flink with Java中运行scala REPL时会出现“缺少参数类型错误”？
在java中运行flink scala REPL脚本时无法编译。我尝试了这段java代码来运行Flink scala REPL进行测试，bug总是异常。 scala文字结果1 结果2 结果3

首页

31

32

33

34

35

36

37

38

39

尾页

最新发布

日常实习百度sre一二三面滴滴-运维开发工程师-面经分析（已意向，还愿贴）4399游戏策划管培一面（也是终面😭拼多多招商运营实习面实习生面试~龙湖数科产品

推荐文章

算法是什么 java学习路线架构师需要哪些素质？C/C++进阶路线 JavaScipt进阶之路

相关问答

element-plus - 如何自定义el-select的样式？amh - 如何解决安装maccms10后台路径异常自动添加/admin/index/index.html的问题？求一份 django4.2 或 django5.x 中文文档 pdf 版?amh - 如何在AMWAF中优化流量防护以减少MySQL CPU占用至100%？c++ , 关于复制构造函数的一个问题？

推荐题库

小牛知识库超值大礼包总结C语言和Python区别 Python和C语言优劣势对比 JWT介绍？为什么JWT可以防止篡改？HBase数据表查询操作和获取多版本数据

工具软件

Dialect App HomeScript PassJava blockchain-thunder money-legos Joomla pyui4win CRGradientNavigationBar

文档资料

用 Jersey 构建 RESTful 服务 Element Angular 组件帮助中文文档 Python 进行机器学习 Linux C 编程一站式学习阿里云 Link Develop 开发指南 V1.6.1