当前位置: 首页 > 知识库问答 >
问题:

当加载到AWS雅典娜时,如何使csv文件的第一行成为列名?

敖毅
2023-03-14

我正在使用Glue将CSV的从S3 bucket到AWS的Athena进行流水线处理,列的标题只是默认的'col0'、'col1'等,而列的真正标题是在第一行条目中找到的。在管道过程中或早期的postgreSQL查询中,是否有一种方法可以使第一行条目成为列名?最好避免在胶水爬行器中直接硬编码列名。

共有1个答案

漆雕原
2023-03-14

https://docs.aws.amazon.com/glue/latest/dg/aws-glue-programming-etl-format.html

使用Glue Api读取数据时使用WithHeader=True

 类似资料:
  • 如何使用雅典娜查询编辑器将字符串类型的列转换为日期类型。我正在尝试使用date_parse(字符串,格式),但在尝试以下操作时遇到以下问题: 有没有更简单的方法做到这一点?还是我错过了什么?感谢任何帮助!

  • 我在AWS雅典娜中使用以下查询: 如果我加上一个限制10,它就行了。但当我尝试对所有记录执行此操作时,我得到以下错误:处格式不正确 string type列中的所有日期都像这样-2/22/2020并且它正确地转换了。我不明白为什么它不会对其余的人做同样的事。

  • 我想将字符串的数据类型(例如:'2018-03-27T00:20:00.855556Z')转换为时间戳(例如:'2018-03-27 00:20:00')。 但我错了: syntax_error:line 1:100:无法检查varchar是否介于带时区的时间戳和带时区的时间戳之间 该查询针对“vf_aws_metrices”数据库运行,除非由查询限定。请在我们的论坛上发布错误信息或联系客户支持,

  • 问题内容: 我有一个笨拙的csv文件,我需要跳过第一行来阅读它。 我正在使用python / pandas轻松做到这一点 但是我不知道如何在Go中做到这一点。 错误: : 问题答案: 读取csv文件时跳过第一行 例如, 输出:

  • 问题内容: 我正在尝试创建以下视图: 它给了我以下错误: 您的查询具有以下错误:不支持的配置单元类型:带有时区的时间戳 但是,当我自己运行查询时,它可以正常工作,并且在这里提到From_iso8601_timestamp作为有效的日期函数。 谁能告诉我我在做什么错? 问题答案: 不幸的是,雅典娜并不完全支持Presto的所有功能,它具有局限性,并且在技术上比Presto落后几个版本。有一些尝试使A