当前位置: 首页 > 知识库问答 >
问题:

Spark SQL:处理模式演化

弓泰
2023-03-14

我想读取相同数据集的2个avro文件,但与模式演化

    null

提前谢谢:)

共有1个答案

孙玺
2023-03-14

使用联合,如

{string,string, [int, long]} 

对你来说是一个有效的解决方案吗?它应该允许读取新的和旧的文件。

 类似资料:
  • 我有两个问题: > 我曾尝试使用模式V1编写记录,并使用模式V2读取记录,但出现以下错误: org.apache.avro。AvroTypeException:找到foo,应为foo 我使用avro-1.7.3和: 以下是这两种模式的示例(我也尝试过添加命名空间,但没有成功)。 架构V1: 架构V2: 提前谢谢。

  • 幕布支持将文档用演示模式展现,演示模式能够简单而有条理地展示你的想法。 点击右上角「演示模式」按钮,即可开启演示模式。 演示模式下,文档不可编辑,但仍可展开/收缩节点。 右上角菜单栏分别为: 切换日间/夜间模式; 放大; 缩小; 退出演示模式。

  • 我正试图了解更多关于我们在Kafka主题中使用的Avro模式的信息,我对这一点相对来说比较陌生。 我想知道是否有一种方法可以在特定情况下发展模式。我们用一个不能为null的新字段或任何默认值来更新模式,因为这些新字段是标识符。解决这个问题的方法是创建新主题,但是有没有更好的方法来改进现有模式?

  • 问题内容: 这是一种常见的模式,我看到与异常关联的错误代码存储为静态最终整数。当创建要抛出的异常时,将使用这些代码之一以及错误消息来构造该异常。这导致该方法要抓住它,必须先查看代码,然后决定采取的措施。 替代方法似乎是-为每个异常错误情况声明一个类(尽管相关的异常会从通用基类中删除) 有中间立场吗?推荐的方法是什么? 问题答案: 这是一个很好的问题。我相信绝对有中间立场。 我认为错误代码对于显示质

  • 图片载入 图片载入 在交错的期间,插图和照片可以在三个维度下载入和过渡,而不是只依靠透明度的改变。调节等级是为了达到曝光上的低对比度和颜色上的低饱和度。在最后的阶段,图片只有在透明度已经达到 100% 之后,才会达到一个全彩色的饱和度。较暗图像的低对比度的效果是伽马值的升高和黑色通道输出的升高组合产生的。 低透明度和低对比度 全透明度和完全曝光 全色彩饱和度 光圈 vs 显影 不要用那种会把白色部

  • 一些批处理任务可以使用spring batch现成的组件完全的组装.例如ItemReader和ItemWriter实现可配置覆盖范围广泛的场景,然而,对于大多数情况下,必须编写自定义代码。应用程序开发人员的主要API人口点是Tasklet,ItemReader ItemWriter和各种各样的监听器接口.最简单的批处理任务能够使用Spring BatchItemReader现成的输出,但通常情况下