当前位置: 首页 > 知识库问答 >
问题:

使用NiFi将Avro大容量加载到HBase

阴飞星
2023-03-14

共有1个答案

郭胤
2023-03-14

有一个新的PutHBaseRecord处理器,它将成为下一个版本的一部分(目前正在对1.4.0版本进行表决)。

使用这个处理器,您将避免拆分您的流文件,您只需将数百万条Avro记录发送给PutHBaseRecord,PutHBaseRecord将使用Avro读取器配置。

使用这种方法应该会获得更好的性能。

 类似资料:
  • 问题内容: 我想知道是否有人对我即将从事的工作有任何经验。我有几个csv文件,它们的大小都在一个GB左右,我需要将它们加载到oracle数据库中。虽然加载后我的大部分工作都是只读的,但我仍需要不时加载更新。基本上,我只需要一个很好的工具即可一次将多行数据加载到数据库中。 到目前为止,这是我发现的内容: 我可以使用SQL Loader来完成很多工作 我可以使用批量插入命令 某种批量插入。 以某种方式

  • 我试图通过火花流(jdbc)将avro文件的数据集加载到Teradata表中。配置设置正确,加载在一定程度上成功(我可以验证数据行是否已插入表中),但中途我开始出现异常,加载失败。堆栈跟踪如下。关于可能导致这种情况的原因有什么线索吗?

  • 问题内容: 几天前,我发布了一个有关如何在我正在开发的自定义Wordpress模板中滚动到“单个帖子 ”的问题。我需要的是在单击特定链接时将单个帖子加载到定义的DIV中,然后向下滚动到包含新加载内容的DIV。考虑到Wordpress或任何其他CMS的动态内容性质,该链接的URL不能是绝对的。 不幸的是,那时没有任何具体的答案,所以我决定稍作观察。由于主要问题是动态加载内容,因此我决定放大如何在Wo

  • 我创建了一个avro配置单元表,并使用配置单元插入覆盖命令将数据从另一个表加载到avro表中。我可以在avro配置单元表中看到数据,但当我尝试将其加载到bigQuery表中时,会出现错误。表架构:- 我收到的错误:- 我使用以下命令将数据加载到bigquery中:-

  • 使用Java代码,过程太慢了。我使用了这个技巧:“将.trig文件加载到tdb中?”但是我的trig文件相当大,所以这个解决方案对我来说不是很好。 所以我尝试使用大容量加载器,控制台命令'tdbloader'。这一次似乎一切都很好,但在webapp中,仍然没有数据。 你可以看到这个过程在这里进行得很好:四边形添加得很好 我添加了代码来链接(使用ja:namedgraph)我通过tdbloader添