我在课堂上收到了一个CSV,我需要获取用于装箱POJO的值。我不必在目录中打开“file.csv”,由Flink将逗号分隔的元素传递给EventDeserializationSchema,这个元素用于“Event Class”来处理每个事件。 以下是一个示例: 在:“‘亚当’、‘史密斯’,66,….‘12:01:00.000’”- 为此,我正在使用:https://github.com/Faste
所以,我试图在我的Flink Kafka流媒体工作中启用EXACTLY_ONCE语义以及检查点。 但是我没有让它工作,所以我尝试从Github下载测试示例代码:https://github.com/apache/flink/blob/c025407e8a11dff344b587324ed73bdba2024dff/flink-end-to-end-tests/flink-streaming-kaf
我们可以看到,当将Flink指标暴露给外部系统(如Prometheus)时,Flink使用Push网关而不是Prometheus通常用于一般指标收集的拉取模型。 https://github.com/apache/flink/blob/master/flink-metrics/flink-metrics-prometheus/src/main/java/org/apache/flink/metri
我检查apache Flink代码如何创建连接客户端:https://github.com/apache/flink/blob/master/flink-runtime/src/main/java/org/apache/flink/runtime/io/network/netty/PartitionRequestClientFactory.java#L55-L108 我正在考虑2秒后超时的wait
接收器的方法似乎没有办法使异步io?例如返回? 例如,redis连接器使用jedis lib同步执行redis命令: https://github.com/apache/bahir-flink/blob/master/flink-connector-redis/src/main/java/org/apache/flink/streaming/connectors/redis/RedisSink.j
根据下面的文档“全局窗口赋值器将具有相同密钥的所有元素分配给同一个全局窗口” https://ci.apache.org/projects/flink/flink-docs-release-1.2/dev/windows.html 然后我检查了源代码,发现GlobalWindows的assignWindows方法只返回全局窗口,没有对参数元素执行任何操作,那么如何将具有相同键的所有元素都返回到同一
Flink源函数引入水印,这些水印向下传递给下游操作符,根据这些操作符可以执行不同的基于时间的操作。对于使用多个流的操作员,将传入水印的最小值视为此时操作员的水印。 将源流拆分为多个逻辑流,然后将这些逻辑流传递给下游操作员(例如处理函数)。 Eg. 假设Process函数有4个子任务(例如),并且有100个关键组(假设),每个子任务处理25个关键组,即,等等。 如果从下午5点开始DriverStr
我正在试用Flink的新Python流API,并尝试使用<代码>运行我的脚本/flink-1.6.1/bin/pyflink-stream。sh示例/阅读Kafka的\u。py 。python脚本相当简单,我只是尝试使用现有主题并将所有内容发送到stdout(或日志目录中的*.out文件,默认情况下,输出方法在该目录中发出数据)。 我从maven repos中抓取了一些jar文件,即、和并将它们复
我试图连接到我的本地机器上的Kafka(2.1),并在Flink(1.7.2)附带的scalashell中读取。 下面是我正在做的: 之后,最后一条语句我得到了以下错误: 我已经创建了一个名为“topic”的主题,我能够通过另一个客户端正确地生成和读取来自它的消息。我正在使用java版本1.8.0\u 201,并遵循https://ci.apache.org/projects/flink/flin
我有一个用例:stepA- 但是我还能做什么呢?谢谢
我们使用带有水印的周期事件时间窗口。我们目前在Flink应用程序中有4个并行任务。 在流式处理过程中,所有4个任务的水印值都必须接近触发窗口事件。 例如 任务1水印值=8 任务2水印值=1 任务3水印值=8 任务4水印值=8 任务2正在等待日志更新其水印。但是,这种情况可能发生在任务2更新之前,我们希望在更新之前触发窗口事件。 是否有任何机制可以在不等待其他任务的情况下对齐所有并行任务的水印或触发
我正在尝试使用Apache Flink CEP(复杂事件处理)库捕获模式。我从以下结构开始,我希望看到id[1,2]和[3,4]的2个匹配项。但是我没有看到任何结果。 方法正在打印源流,对于接收器,我尝试了和方法,但都无法打印结果。此外,我的过滤器或匹配方法的日志根本没有打印出来。我的印象是过滤器功能甚至没有使用。和对象是简单的pojos,如下所示: 我还尝试将其更改为过滤其他字段,例如,使用温度
我正在使用Apache Flink进行流处理。 订阅源消息(例如:Kafka、AWS Kinesis数据流)后,然后使用Flink操作符对流数据应用转换、聚合等,我想缓冲最终消息(例如:1000条),并在单个请求中将每个批发布到外部REST API。 如何在Apache Flink中实现缓冲机制(将每1000条记录创建为批处理)? Flink Pipiline:流媒体源-- 感谢您的帮助!
有人能正确解释事件时间戳和水印吗。我从文件中理解了,但不太清楚。一个真实的例子或外行的定义会有所帮助。此外,如果可能,请给出一个示例(以及一些可以解释它的代码片段)。提前感谢
我正在尝试了解Apache Flink CEP程序,该程序用于监控数据中心中的机架温度,如Flink官方文档所述。但是当我按照步骤使用mvn clean package创建jar并尝试使用命令执行包时 但我有以下错误, 我尝试了给出这里描述的类路径的不同变体,但得到了相同的错误。有人能指出我在运行程序时的错误吗?