问题：

Nifi PutHiveStreaming将数据写入HDFS但无法看到配置单元表中的数据

云霖

2023-03-14

我使用的是HDF Nifi 1.5和Hdp Hive 3.1。

在配置单元中创建分区和分段表：

创建表default.client_tbl(client_key int,clt_name varchar(45),clt_description varchar(200),version int）,该表由(client_key)分区,由(client_status varchar(8))群集到3个存储为ORC TBLPROPERTIES('transaction'='true')的桶中；

共有1个答案

水铭晨

2023-03-14

如果您使用的是HDP Hive3.1，那么您将需要PutHive3Streaming而不是puthiveStreaming。前者用于配置单元3，后者用于配置单元1.2.x。

话虽如此，Hive3组件从NIFI1.7.0+开始可用。此外，如果您使用的是Apache NiFi发行版，则默认情况下它不包含Hive3 NAR（由于其大小）。您必须自己构建它，或者使用为HDF构建的（针对HDP Hive3使用），您可以在这里获得HDF3.2版本(NIFI1.7.0)。

类似资料：

无法从配置单元orc表的spark beeline中看到数据

我创建了一个兽人蜂巢表，如下所示：但是在spark jobs控制台中：它显示了与上述查询跳过的阶段（1）相关的一个作业--spark JDBC服务器查询
无法使用pyspark将数据加载到配置单元中

无法通过jupyter笔记本使用pyspark将数据写入hive。给我下面的错误 Py4JJavaError：调用o99.saveAsTable时发生错误。：org.apache.spark.sql.分析异常：java.lang.运行时异常：java.lang.运行时异常：无法实例化org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreCl
无法使用select*命令查看配置单元管理的表数据

我已经创建了一个Hive托管表，并使用hadoop commnad在托管表位置复制数据。这样做之后，每当我从表中选择*时，它都不会显示任何数据。我也尝试过msck修复命令。但我仍然无法看到任何数据使用选择逗号我有检查在托管表位置文件是可用的，但使用选择命令我不能数据。有人能告诉我为什么我不能使用选择命令查看数据吗？注意：我的hive表是在月份列上分区的。在复制数据之前，我已经启用了下面的属性。
HDFS数据上的配置单元查询异常

我在执行配置单元查询时遇到异常。我关注以下链接：http://www.thecloudavenue.com/2013/03/analysis-tweets-using-flume-hadoop-and.html 终端数据在这里：
配置单元：如何将数据从分区表插入到分区表中？

查询示例：典型错误消息：处理语句时出错：失败：执行错误，从org.apache.hadoop.hive.ql.exec.mr.MapredTask返回代码2 问题2：当我运行命令？我是否只运行相同的命令，但使用STRING而不是bigint？**完整错误消息:**
加载数据后无法读取配置单元表

我在Hive（beeline）中创建了一个表，下面的命令是：我还有一个小的自定义文件，其中包含示例记录，如：有什么想法吗？

Nifi PutHiveStreaming将数据写入HDFS但无法看到配置单元表中的数据

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档