配置单元表（ORC类型）所指向的ORC文件是否应该包含配置单元表中的所有属性？

逑禄

2023-03-14

共有1个答案

王建华

2023-03-14

ORC表的No incase只是根据表中列的顺序读取数据。

如果不能保证属性的顺序，那么配置单元orc表根据表模式读取数据（如果数据类型匹配），然后显示值(or)，将值转换为该类型（或者）为NULL。

您可能需要创建一个AVRO表，然后根据AVRO模式表来指向正确的值。

类似资料：

配置单元-替换ORC表中的列

我有一个配置单元表保存在ORC文件中，这是“create”命令中的定义：我想从末尾删除一个列，所以我尝试了“alter table-replace columns”命令，在这里我没有写列名--但是得到了这个错误:
配置单元中的排序表（ORC文件格式）

我有一些困难，以确保我利用已排序的数据在一个配置单元表。（使用ORC文件格式）我知道我们可以通过在create DDL中声明子句来影响数据从配置单元表中读取的方式。这意味着每次查询该表时，数据将通过在各个映射器之间分发，然后对其进行排序。我的问题是：我不希望数据被拆分为文件（桶），因为卷不是那么多，我会保留小文件。但是，我确实想利用排序插入。我真的需要在create DLL语句中使用吗
配置单元ORC表空字符串

我有一个Hive表，它的数据存储为ORC。我在某些字段中写入空值（空白,‘“”）,但有时当我对该表运行select查询时,空字符串列在查询结果中显示为NULL。我想看看我输入的空值，这怎么可能？
从其他服务器的ORC文件创建配置单元ORC表

我已经从Map R集群复制了所有orc文件，并遵循了相同的文件夹结构创建了位置为#1的orc格式表然后执行此命令“msck REPAIR TABLE<>” 上面的步骤通过时没有出错，但当我查询分区时，作业失败，出现以下错误有人能告诉我，我们可以直接从ORC文件创建配置单元ORC分区表吗？我的存储是蔚蓝数据湖。
从ORC文件创建外部配置单元表的方法

我正在尝试在ORC文件上创建外部配置单元表。但当我试图在创建的表上执行select操作时,会出现以下错误：有什么建议吗？？
如何将分区配置单元ORC表中的多个ORC文件（属于每个分区）组合成单个大ORC文件

我在Hive有一个分区的兽人表。加载所有可能的分区后，我在HDFS上得到多个ORC文件，即HDFS上的每个分区目录中都有一个ORC文件。我需要将每个分区下的所有这些ORC文件组合成一个大的ORC文件，用于某些用例。有人能给我建议一个方法，把这些多个ORC文件（属于每个分区）组合成一个单一的大ORC文件。我试着从分区表创建一个新的非分区ORC表。它确实减少了文件的数量，但不会减少到单个文件。 p

配置单元表（ORC类型）所指向的ORC文件是否应该包含配置单元表中的所有属性？

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档