问题：

Nifi中的PutHiveStreaming处理器抛出NPE

乌和畅

2023-03-14

我正在调试一个HiveProcessor，它遵循官方的PutHiveStreaming处理器，但它写入的是Hive2.x，而不是3.x。该流在Nifi cluster 1.7.1中运行。尽管发生此异常，但数据仍被写入配置单元。

例外情况是：


java.lang.NullPointerException: null
    at org.apache.hadoop.hive.ql.security.authorization.plugin.AuthorizationMetaStoreFilterHook.getFilteredObjects(AuthorizationMetaStoreFilterHook.java:77)
    at org.apache.hadoop.hive.ql.security.authorization.plugin.AuthorizationMetaStoreFilterHook.filterDatabases(AuthorizationMetaStoreFilterHook.java:54)
    at org.apache.hadoop.hive.metastore.HiveMetaStoreClient.getDatabases(HiveMetaStoreClient.java:1147)
    at org.apache.hive.hcatalog.common.HiveClientCache$CacheableHiveMetaStoreClient.isOpen(HiveClientCache.java:471)
    at sun.reflect.GeneratedMethodAccessor1641.invoke(Unknown Source)
    at sun.reflect.DelegatingMethodAccessorImpl.invoke(DelegatingMethodAccessorImpl.java:43)
    at java.lang.reflect.Method.invoke(Method.java:498)
    at org.apache.hadoop.hive.metastore.RetryingMetaStoreClient.invoke(RetryingMetaStoreClient.java:169)
    at com.sun.proxy.$Proxy308.isOpen(Unknown Source)
    at org.apache.hive.hcatalog.common.HiveClientCache.get(HiveClientCache.java:270)
    at org.apache.hive.hcatalog.common.HCatUtil.getHiveMetastoreClient(HCatUtil.java:558)
    at org.apache.hive.hcatalog.streaming.AbstractRecordWriter.<init>(AbstractRecordWriter.java:95)
    at org.apache.hive.hcatalog.streaming.StrictJsonWriter.<init>(StrictJsonWriter.java:82)
    at org.apache.hive.hcatalog.streaming.StrictJsonWriter.<init>(StrictJsonWriter.java:60)
    at org.apache.nifi.util.hive.HiveWriter.lambda$getRecordWriter$0(HiveWriter.java:91)
    at java.security.AccessController.doPrivileged(Native Method)
    at javax.security.auth.Subject.doAs(Subject.java:422)
    at org.apache.hadoop.security.UserGroupInformation.doAs(UserGroupInformation.java:1657)
    at org.apache.nifi.util.hive.HiveWriter.getRecordWriter(HiveWriter.java:91)
    at org.apache.nifi.util.hive.HiveWriter.<init>(HiveWriter.java:75)
    at org.apache.nifi.util.hive.HiveUtils.makeHiveWriter(HiveUtils.java:46)
    at org.apache.nifi.processors.hive.PutHive2Streaming.makeHiveWriter(PutHive2Streaming.java:1152)
    at org.apache.nifi.processors.hive.PutHive2Streaming.getOrCreateWriter(PutHive2Streaming.java:1065)
    at org.apache.nifi.processors.hive.PutHive2Streaming.access$1000(PutHive2Streaming.java:114)
    at org.apache.nifi.processors.hive.PutHive2Streaming$1.lambda$process$2(PutHive2Streaming.java:858)
    at org.apache.nifi.processor.util.pattern.ExceptionHandler.execute(ExceptionHandler.java:127)
    at org.apache.nifi.processors.hive.PutHive2Streaming$1.process(PutHive2Streaming.java:855)
    at org.apache.nifi.controller.repository.StandardProcessSession.read(StandardProcessSession.java:2211)
    at org.apache.nifi.controller.repository.StandardProcessSession.read(StandardProcessSession.java:2179)
    at org.apache.nifi.processors.hive.PutHive2Streaming.onTrigger(PutHive2Streaming.java:808)
    at org.apache.nifi.processors.hive.PutHive2Streaming.lambda$onTrigger$4(PutHive2Streaming.java:672)
    at org.apache.nifi.processor.util.pattern.PartialFunctions.onTrigger(PartialFunctions.java:114)
    at org.apache.nifi.processor.util.pattern.RollbackOnFailure.onTrigger(RollbackOnFailure.java:184)
    at org.apache.nifi.processors.hive.PutHive2Streaming.onTrigger(PutHive2Streaming.java:672)
    at org.apache.nifi.controller.StandardProcessorNode.onTrigger(StandardProcessorNode.java:1165)
    at org.apache.nifi.controller.tasks.ConnectableTask.invoke(ConnectableTask.java:203)
    at org.apache.nifi.controller.scheduling.TimerDrivenSchedulingAgent$1.run(TimerDrivenSchedulingAgent.java:117)
    at java.util.concurrent.Executors$RunnableAdapter.call(Executors.java:511)
    at java.util.concurrent.FutureTask.runAndReset(FutureTask.java:308)
    at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.access$301(ScheduledThreadPoolExecutor.java:180)
    at java.util.concurrent.ScheduledThreadPoolExecutor$ScheduledFutureTask.run(ScheduledThreadPoolExecutor.java:294)
    at java.util.concurrent.ThreadPoolExecutor.runWorker(ThreadPoolExecutor.java:1149)
    at java.util.concurrent.ThreadPoolExecutor$Worker.run(ThreadPoolExecutor.java:624)
    at java.lang.Thread.run(Thread.java:748)

有人做过类似的事吗？或者有没有更简单的方法来调试自定义处理器？

共有1个答案

金令

2023-03-14

这是一个转移注意力的错误，在配置单元端有一些问题，它无法获得自己的IP地址或主机名，因此周期性地发出这个错误。然而，我不认为它会导致任何真正的问题，正如您所说的，数据会被写入Hive。

为了完整起见，在Apache NiFi中，PutHiveStreaming是针对Hive 1.2.x而不是Hive 2.x构建的。目前没有特定的Hive2.x处理器，我们从未确定Hive1.2.x处理器是否适用于Hive2.x。

对于调试，如果您可以在容器中运行Hive并公开metastore端口（我认为9083是默认值），那么您应该能够使用TestRunners之类的东西创建集成测试，并从IDE本地运行NiFi。这就是为MongoDB或Elasticsearch等外部系统执行其他集成测试的方式。

在Hive测试套件中有一个用于集成测试的MiniHS2类，但它不在已发布的工件中，因此不幸的是，我们不得不针对真实的Hive实例运行测试。

类似资料：

在NiFi 1.2.0中使用NiFi 1.5.0处理器

有一个特定的处理器，正如下面提到的，我对它感兴趣，与1.2.0相比，1.5.0中有一个额外的特性，所以我想使用它。我看到有两种方法。以上处理器存储为nifi-standard-nar-x.x.x.nar-unpacked文件。所以只需从1.5.0复制Nar，并将其放在1.2.0上即可。在此之后，我不确定nifi是否会识别这个新的处理器版本？上面的处理器是下面文件的一部分，因此从它中创建一个新
Apache Nifi ExecuteSQL处理器

我正在尝试使用ExecuteSQL处理器从oracle数据库中提取数据。我有一些查询，例如假设在我的oracle数据库中有15条记录。在这里，当我运行ExecuteSQL处理器时，它将作为一个流进程连续运行，并将整个记录作为一个文件存储在HDFS中，并且重复这样做。因此，在HDFS位置中会有许多文件，这些文件将从oracle db中提取已经提取的记录，并且这些文件包含相同的数据。我如何使该处理器以
TailFile处理器-Apache Nifi

我正在使用Tailfile处理器从计划每分钟运行的集群（3个节点）中获取日志。日志文件名每小时都会发生变化，我不知道应该使用哪种跟踪模式。如果我使用单个文件，它不会获取1小时后生成的新文件。如果我使用多文件，它是在文件名更改第三分钟后获取文件，这增加了文件的大小。我的文件的滚动文件名应该是什么，我应该使用哪种模式。你能让我知道吗。谢谢。 tail：retrieve-${now（）：format（“
自定义Nifi处理器抛出构建错误：Nifi nar maven插件的空指针异常

我试图建立自定义的nifi处理器与控制器服务，我已配置项目设置，以建立nar文件，而建立得到以下错误，这看起来是从nifi库，plz让我知道有任何解决方案或变通办法退出。这看起来是nif-nar-maven-plugin问题，可能是版本的问题！！
fetchelasticsearch处理器的Nifi错误

我在运行FetchElasticSearch处理器时出现了奇怪的错误，下面是错误。 FetChelasticSearch[ID=F2B2FEE3-B940-4A73-8A28-0436E765C9A2]无法读取到Elasticsearch中，原因是没有配置的节点可用:[{#Transport#-1}{127.0.0.1}{localhost/127.0.0.1:9500}]，这可能表示配置错误（主
NIFI：编写新处理器

我想做一个新的处理器，它将是GetFile和EvaluateXpath的重聚。有几个主题我感兴趣： > 现在我的nar文件超过20KB，而我的nifi无法运行它，我该如何缩小它？我想从文件夹中获取文件，读取它的数据并将其作为一个atribute放入新的flowfile中，然后将配置xml回滚到它的原始文件夹，如何将配置文件回滚到文件夹b代码？下面是我用来从xml配置文件中获取属性的简单代码：

Nifi中的PutHiveStreaming处理器抛出NPE

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档