问题：

从Spark结构流中的Kafka消息中读取换行分隔的json

余信然

2023-03-14

我开发了一个Python Kafka生成器，它将多个json记录作为nd-json二进制字符串发送到一个Kafka主题。然后，我尝试用PySpark在Spark结构化流媒体中读取这些消息，如下所示：

events_df=select(from_json(col("value“）.cast（”string“）,schema).alias（”value“））

共有1个答案

寇开畅

2023-03-14

我设法用这种方式完成了我想要的工作，用换行符拆分全文字符串，然后将数组分解成要用模式解析的行：

    events = spark.readStream \
        .format("kafka") \
        .option("kafka.bootstrap.servers", "localhost:9092") \
        .option("subscribe", "quickstart-events") \
        .option("startingOffsets", "earliest")\
        .load()\
        .selectExpr("CAST(value AS STRING) as data")
    
    events = events.select(explode(split(events.data, '\n')))
    events = events.select(from_json(col("col"), event_schema).alias('value'))
    events = events.selectExpr('value.*')```

类似资料：

使用Spark 2.0.2（结构化流媒体）从Kafka读取Avro消息

我有一个 spark 2.0 应用程序，它使用火花流（使用火花流-kafka-0-10_2.11）从 kafka 读取消息。结构化流看起来很酷，所以我想尝试迁移代码，但我不知道如何使用它。在常规流中，我使用kafkaUtils创建Dstrean，在我传递的参数中，它是值deserializer。在结构化流中，文档说我应该使用DataFrame函数进行反序列化，但我不知道这到底是什么意思。我
Scala:从spark结构化流媒体读取Kafka Avro消息时出错

我一直在用Scala 2.11阅读spark structured streaming（2.4.4）中Kafka的avro序列化消息。为此，我使用了spark avro（下面的dependency）。我使用合流Kafka库从python生成Kafka消息。Spark streaming能够使用模式来使用消息，但无法正确读取字段的值。我准备了一个简单的例子来说明这个问题，代码在这里可用：https:
为最后一个Kafka分区获取消息的Spark结构化流

我正在使用Spark结构化流媒体阅读Kafka主题。我错过什么了吗？
在spark流媒体/结构化流媒体中阅读来自Kafka的avro消息

我第一次使用pyspark。Spark版本：2.3.0Kafka版本：2.2.0 我有一个Kafka制作人，它以avro格式发送嵌套数据，我正试图在pyspark中编写spark流/结构化流的代码，它将来自Kafka的avro反序列化为数据帧，并进行转换，将其以拼花格式写入s3。我在spark/scala中找到了avro转换器，但pyspark中的支持尚未添加。如何在pyspark中转换相同的值。
分散Kafka流中的消息

我试图找出最好的方式将我的数据扇出到单独的占位符中，以供其他处理的数据使用用例我正在接收Kafka主题中几个脚本（约2000只股票）的股票数据。我希望能够单独在所有脚本上运行KPI（KPI就像应用于输入数据以获取KPI值的公式）。我能想到的选项 > 将所有刻度数据保存在一个主题中，并使用Custom分区器按脚本名称对其进行分区。这有助于保持低主题计数和系统易于管理。但是所有消费者都需要丢弃大量
无法读取Kafka-Avro架构消息

有没有解决这个问题的方法？？？我无法读取KAFKA-AVRO架构消息。我正在尝试将消息从logstash发送到KAFKA到hdfs。以下是技术堆栈： LogStash 2.3-当前生产版本汇流3.0。插件：A。Logstash-kafka-Output插件B。logstash-codec-avro。动物园管理员:3.4.6 Kafka:0.10.0.0 Logstash配置文件如下所示：

从Spark结构流中的Kafka消息中读取换行分隔的json

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档