当前位置: 首页 > 知识库问答 >
问题:

使用get_json_object在配置单元中创建视图后的查询性能?

董法
2023-03-14

即使在JSON数据之上创建了一个视图,Hive get_json_object函数是否会解析每个JSON对象以进行字段解析?

我们在使用Serde读取JSON数据时遇到了问题。出于这个原因,我们希望使用这个udf并在数据上创建视图。

问题是担心使用该路径以后对数据的查询可能会很慢。

蜂巢到底支持不支持这个?

蜂巢专家对此有什么想法吗?

共有1个答案

吕自明
2023-03-14

我相信蜂巢确实支持观点。不过,如果担心它的速度,可以加载Impala。它使用与hive相同的元数据和表,但是对于用户查询来说要快得多。

 类似资料:
  • 为了提高配置单元查询的性能,有哪些优化参数 配置单元版本:-Hive 0.13.1-cdh5.2.1 配置单元查询:- 设置hive.exec.parallel=true; 您能建议任何其他设置,除了以上,以提高配置单元查询的性能,我正在使用的类型查询。

  • 我想创建一个名为的视图,该视图显示个人的所有信息,除了他们的客户ID之外,还列出每个人在他/她的帐户中有多少余额。 我的疑问是: 现在,这个查询将创建视图,但当我想通过以下命令查看该视图中的信息时: 它将返回一个错误: 如何走出这个误区?

  • 本文向大家介绍Drupal 8:在视图中创建子查询,包括了Drupal 8:在视图中创建子查询的使用技巧和注意事项,需要的朋友参考一下 您以前可能去过那里。您正在使用的Drupal View看起来很棒,并且具有您需要的所有数据和字段,但是当您仔细查看结果时,您会发现有些问题。查看生成的SQL查询后,您会发现其中一个联接存在问题,这会导致计数减少。最终,您需要删除此联接,但实际上您需要包含在结果中的

  • 我有一个用CTE (WITH子句)创建的Hive视图,它联合两个表,然后计算只显示每个id的最新记录。在我的env中,我有一个浏览hive数据库的工具(DBeaver,非datalake dev浏览数据的必备工具)。 查看代码 问题是: (这是我们在Hive中创建表和视图的主要方式)< br >我可以很容易地在DBeaver上浏览,但是,当运行spark process来读取它时,它会失败,并出现

  • 添加/home/cloudera/date.jar到类路径添加资源:/home/cloudera/date.jar 请有人帮帮我,因为我是新来蜂巢的。有人能告诉我要遵循的步骤吗

  • 您的回应将不胜感激。谢了!