当前位置: 首页 > 知识库问答 >
问题:

与hive相比,impala如何提供更快的查询响应

魏宸
2023-03-14

我想知道是否有一些类型的查询/用例仍然需要Hive,而Impala不太适合。

对于HDFS上的相同数据,Impala如何提供比Hive更快的查询响应?

共有1个答案

韦辰钊
2023-03-14

您应该将Impala视为“HDFS上的SQL",而Hive更像是”Hadoop上的SQL“。

换句话说,Impala甚至根本不使用Hadoop。它只是在所有节点上运行守护进程,这些守护进程缓存HDFS中的一些数据,这样这些守护进程就可以快速返回数据,而不必经历整个map/reduce作业。

原因是运行map/reduce作业涉及一定的开销,所以通过短路map/reduce,您可以在运行时获得相当大的收益。

 类似资料:
  • 问题内容: 我有两张表。这是100,000行,也就是10,000行。 我需要将它们加入到一个名为的列上,这两个列都是VARCHAR(50)。order_number在出站表中不是唯一的。 这是我的初始查询,运行时间超过60秒: 此查询得到相同的结果,并且运行时间不到一秒钟: 这使我感到惊讶,因为通常子查询要慢得多。 运行(我仍在学习如何理解)显示,子查询版本使用表,使用索引,并且索引为。我不够聪明

  • 我正在尝试更新数据库表。如果表单中的密码为空,我如何通过提供一个条件来防止表单中的密码(“memberpassword”,$pass)被sql代码更新?有可能吗?

  • 已定义查询的Dao: 来自Hibernate调试日志的SQL: 当我在数据库上执行这个查询时,大约需要15ms,从代码上执行大约需要1.5秒。我在代码中注释掉了这一行,滞后消失了,所以问题肯定是这个jpql选择。 数据库连接配置: 更新1: debug.log:

  • 问题内容: 我是hive的新手,想知道是否有像在SQL中一样将数据插入到hive表中的方法。我想像我的蜂巢中插入我的数据 我已经读过您可以将文件中的数据加载到配置单元表中,也可以将数据从一个表导入到配置单元表中,但是有什么方法可以像在SQL中那样附加数据吗? 问题答案: 自Hive 0.14起,此处的某些答案已过时 https://cwiki.apache.org/confluence/displ

  • 文档: 操作: 合作伙伴: HQL(“INCASAT”=“兑现”,“VANDUT”=“出售”):

  • 问题内容: Docker和OpenShift都是用于实现PaaS服务的框架。 他们如何比较架构和功能? 问题答案: 主要区别在于,Docker作为一个项目仅专注于运行时容器,而OpenShift(作为系统)既包含运行时容器也包括REST API,协调和Web界面,以部署和管理各个容器。 仅比较运行时容器,OpenShift和Docker都使用内核隔离功能将租户进程分开。对于主要通过LXC实现的Do