问题：

配置单元导出到架构中没有列名的AVRO

和魁

2023-03-14

我尝试在Hive中创建一个表，并希望将其导出为Avro格式。

create table if not exists test_txt (id int, name varchar(40)); 
insert into test values (1, "AK");
insert overwrite directory "/tmp/test" stored as avro select * from test;
!sh hadoop fs -cat /tmp/test/*;

谢谢,

共有1个答案

赵光赫

2023-03-14

如果一个avro二进制文件需要导出到一个单独的文件以便进一步摄取（在我的上下文中是BigQuery)，那么不要使用hadoop cat/insert overwrite语句。使用avro-tools并concat到一个大的avro文件。

hadoop jar avro-tools-1.8.2.jar concat/tmp/test_avro/*big_avro_table.avro

类似资料：

没有数据的MySQL导出架构

问题内容：我正在使用带有Java程序的MySql数据库，现在我想将该程序提供给其他人。如何导出MySql数据库结构而不包含数据，仅导出结构？问题答案：您可以通过mysqldump命令使用该选项
导出为直线配置单元中的csv

此时，我已使用以下命令成功连接到数据库。查询在控制台上输出正确的结果。另外，不是很清楚文件的最终位置。应该是hdfs中的文件路径正确吗？
Sqoop将配置单元字符串导出到Oracle CLOB

错误：java.io.ioException：无法导出数据，请在org.apache.sqoop.mapreduce.textexportMapper.map（textexportMapper.java:112)在org.apache.sqoop.mapreduce.textexportMapper.map（textexportMapper.java:39)在org.apache.sqoop.ma
将csv文件inport到配置单元表中，列名为null

我是hadoop蜂巢的新手。我使用的是开源的hadoop 2.7.1配置单元1.2.2。它安装在ubuntu上，一个单一的节点集群。我在csv文件中有106行30列数据。我使用以下代码将其导入到配置单元表中: 然后我得到了null列名：返回的前半部分，返回的后半部分请帮我怎么解决。提前感谢！
使用beeline从配置单元服务器2导出ORC文件时的列名

正在连接：创建测试表并插入示例值：正在运行测试查询：
AWS EMR未使用AWS Glue找到正确的配置单元架构

所以我对通过AWS EMR执行Presto查询有一个问题。我已经启动了一个EMR运行Hive/Presto，并使用AWS胶水作为转移物。当我SSH到主节点并运行hive时，我可以运行“show schemas；”它向我展示了我们在AWS胶水上拥有的3个不同的数据库。我确实设置了以下配置 AWS文档http://docs.AWS.amazon.com/emr/latest/releasegui

配置单元导出到架构中没有列名的AVRO

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档