当前位置: 首页 > 知识库问答 >
问题:

配置单元插入覆盖到分区表中

李开宇
2023-03-14

共有1个答案

丁阳炎
2023-03-14

真奇怪。我尝试了上面的场景,但看到了不同的结果。首先插入覆盖创建了a、b、c、d、e分区。能够通过SHOW PARTITIONS命令看到它们,并且能够执行返回数据的选择查询。

然后,我做了另一个插入覆盖,创建了五个新的部分f,g,h,I,j。当我显示分区时,我会看到从a到J的所有分区。此外,数据在所有分区中都是完整的,m能够通过select语句获取它。

作为下一步,我尝试将数据加载到一个现有的分区中,比如a,我可以看到数据覆盖了该分区中的现有数据。这是预期的行为。

 类似资料:
  • 非常感谢任何帮助。

  • 我使用,但这给我带来了partitionBy和intsertInto不能同时使用的问题。

  • 我正在与AWS工作,我有使用Spark和Hive的工作流。我的数据是按日期分区的,所以每天我的S3存储中都有一个新分区。我的问题是,当有一天加载数据失败时,我不得不重新执行那个分区。接下来编写的代码是: 在我的流动中发生了什么?如果我使用savemode.overwrite,完整的表将被删除,并且只保存分区。如果我使用savemode.append,我可能会有重复的数据。 我想要的是:在表中,分区

  • 我正在编写一个将HBASE-0.98.19与HIVE-1.2.1集成的示例。我已经使用以下命令在hbase中创建了一个表 然后创建了'testemp'用于将数据导入到'hbase_table_emp'。下面的代码显示了创建'testemp'表的方法 到现在,一切正常。但当我运行命令时 ps:类路径中包含了hbase.jar、zookeeper.jar和guava.jar。 提前道谢。

  • 插入覆盖失败,出现空指针异常- 失败:NullPointerException为空

  • 查询示例: 典型错误消息: 处理语句时出错:失败:执行错误,从org.apache.hadoop.hive.ql.exec.mr.MapredTask返回代码2 问题2:当我运行命令?我是否只运行相同的命令,但使用STRING而不是bigint?**完整错误消息:**