当前位置: 首页 > 知识库问答 >
问题:

Nifi PutHiveStreaming将数据写入HDFS但无法看到配置单元表中的数据

云霖
2023-03-14

>

  • 我使用的是HDF Nifi 1.5和Hdp Hive 3.1。

    在配置单元中创建分区和分段表:

    创建表default.client_tbl(client_key int,clt_name varchar(45),clt_description varchar(200),version int),该表由(client_key)分区,由(client_status varchar(8))群集到3个存储为ORC TBLPROPERTIES('transaction'='true')的桶中;

  • 共有1个答案

    水铭晨
    2023-03-14

    如果您使用的是HDP Hive3.1,那么您将需要PutHive3Streaming而不是puthiveStreaming。前者用于配置单元3,后者用于配置单元1.2.x。

    话虽如此,Hive3组件从NIFI1.7.0+开始可用。此外,如果您使用的是Apache NiFi发行版,则默认情况下它不包含Hive3 NAR(由于其大小)。您必须自己构建它,或者使用为HDF构建的(针对HDP Hive3使用),您可以在这里获得HDF3.2版本(NIFI1.7.0)。

     类似资料:
    • 我创建了一个兽人蜂巢表,如下所示: 但是在spark jobs控制台中:它显示了与上述查询跳过的阶段(1)相关的一个作业--spark JDBC服务器查询

    • 无法通过jupyter笔记本使用pyspark将数据写入hive。 给我下面的错误 Py4JJavaError:调用o99.saveAsTable时发生错误。:org.apache.spark.sql.分析异常:java.lang.运行时异常:java.lang.运行时异常:无法实例化org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreCl

    • 我已经创建了一个Hive托管表,并使用hadoop commnad在托管表位置复制数据。这样做之后,每当我从表中选择*时,它都不会显示任何数据。我也尝试过msck修复命令。 但我仍然无法看到任何数据使用选择逗号我有检查在托管表位置文件是可用的,但使用选择命令我不能数据。 有人能告诉我为什么我不能使用选择命令查看数据吗?注意:我的hive表是在月份列上分区的。在复制数据之前,我已经启用了下面的属性。

    • 我在执行配置单元查询时遇到异常。我关注以下链接:http://www.thecloudavenue.com/2013/03/analysis-tweets-using-flume-hadoop-and.html 终端数据在这里:

    • 查询示例: 典型错误消息: 处理语句时出错:失败:执行错误,从org.apache.hadoop.hive.ql.exec.mr.MapredTask返回代码2 问题2:当我运行命令?我是否只运行相同的命令,但使用STRING而不是bigint?**完整错误消息:**

    • 我在Hive(beeline)中创建了一个表,下面的命令是: 我还有一个小的自定义文件,其中包含示例记录,如: 有什么想法吗?