当前位置：首页 > 软件库 > 大数据 > 其他 >

Hive HA

授权协议 GPL

开发语言 PHP

所属分类大数据、其他

软件类型开源软件

地区国产

投递者范浩荡

操作系统跨平台

开源组织无

适用人群未知

软件概览

hive让大数据飞了起来，不再需要专人写MR。平常我们都可以用基于thrift的任意语言来调用hive。

不过爱恨各半，hive的thrift不稳定也是出了名的。很容易就出问题，让人无计可施。唯一的办法就是不断kill,不断restart。当然，我们可以用haproxy来解决这个问题，关键，haproxy不管hive是否逻辑可用，不能执行逻辑的hive也“死马当活马”。当然，搞的好的可以用 zookeeper,不过，它太“重”，而且不管hive的重启。

Hive HA横空出世。只要指明它可以管理的服务器ip,端口，启动一个主控服务器，在其他服务器上启动节点服务，它就一切搞定。

Hive HA原理是:

将若干hive 实例纳入一个资源池，然后对外提供一个唯一的接口，进行proxy relay。

对于程序开发人员，就把它认为是一台超强“hive"就可以。每次它接收到一个HIVE查询连接后，都会轮询资源池里可用的hive 资源。这样，能充分使用每个hive server，减少压力。在拿到hive 连接后，Hive HA会首先进行逻辑可用测试,这个逻辑规则可自行配置。如果逻辑可用，则直接把客户端的HIVE 查询连接 relay到该hive server。若逻辑不可用，则将该hive server放入黑名单，然后继续读取池里其他hive server进行连接测试。 Hive Ha每隔一段时间(可配置），对黑名单中的hive server进行处理，通过和节点管理服务器通讯，重启该hive server。如果重启后可用，则将该hive从黑名单中移除，加入资源池。

使用案例

Hive HA使用说明

hive让大数据飞了起来，不再需要专人写MR。平常我们都可以用基于thrift的任意语言来调用hive。不过爱恨各半，hive的thrift不稳定也是出了名的。很容易就出问题，让人无计可施。唯一的办法就是不断kill,不断restart。当然，我们可以用haproxy来解决这个问题，关键，haproxy不管hive是否逻辑可用，不能执行逻辑的hive也“死马当活马”。
hive HA

1、修改hive-site.xml <?xml version="1.0" encoding="UTF-8" standalone="no"?> <?xml-stylesheet type="text/xsl" href="configuration.xsl"?> <configuration> <property> <name>javax.jdo.option.ConnectionURL</na
hive HA配置

1、zookeeper、hadoop安装好，启动 2、hive-site.xml增加，分发  <property> <name>hive.server2.support.dynamic.service.discovery</name> <value>true</value> </property> <property> <name>hive.server2.zoo
Hadoop 2.6.0+ZooKeeper+Hive HA高可用集群安装

版本描述系统版本为 CentOS release 6.5 (Final) Hadoop版本：hadoop 2.6.0 64 bit 版本 Zookeeper 版本：zookeeper-3.4.6 Hive版本：apache-hive-1.1.0 JDK版本哦openjdk 1.8.0 说明：apache社区上发布的是32位的编译版本，直接安装在64位上会出现库的问题至于如何获取64位的版本，
Hive HA 分布式安装

Mysql安装 1. 配置 yum 源 # 挂载光盘 mount /dev/cdrom /media # 查看挂载点 df 2. 配置 yum 仓库 cd /etc/yum.repos.d rm -rf CentOS-Base.repo vi CentOS-Media.repo [c5-media] name=CentOS-$releasever - Media baseurl=file:
Hadoop集群之Hive HA 安装配置

Hive是基于Hadoop构建的一套数据仓库分析系统，它提供了丰富的SQL查询方式来分析存储在Hadoop 分布式文件系统中的数据。其在Hadoop的架构体系中承担了一个SQL解析的过程，它提供了对外的入口来获取用户的指令然后对指令进行分析，解析出一个 MapReduce程序组成可执行计划，并按照该计划生成对应的MapReduce任务提交给Hadoop集群处理，获取最终的结果。元数据——如表模式
基于 Hadoop HA 的 Hive 搭建

前言环境介绍虚拟机软件：VirtualBox Linux 发行版本：Ubuntu 20.04.4 虚拟机核心数：1 core 虚拟机内存：2 GB JDK 版本：1.8.0_202 Hadoop 版本：3.2.3 ZK 版本：3.8.0 Hive 版本：3.1.3 MySQL 版本：8.0.28 Hadoop HA 搭建集群规划 Hive 默认使用的元数据库为 derby，开启 Hive 之
Hive的HA（未完待续）

利用HAProxy实现Hive Server负载均衡 https://www.cnblogs.com/smartloli/p/4368676.html 下载 https://src.fedoraproject.org/repo/pkgs/haproxy/ http://download.openpkg.org/components/cache/haproxy/ https://pan.baidu.

Hive HA

同类工具

相关阅读

相关文章

相关问答

相关文档