当前位置：首页 > 软件库 > 企业应用 > BI商业智能 >

Apache Druid

高性能实时分析数据库

授权协议 Apache

开发语言 Java

所属分类企业应用、 BI商业智能

软件类型开源软件

地区不详

投递者曹鹏海

操作系统跨平台

开源组织 Apache

适用人群未知

软件官网

软件文档

官方下载

软件概览

Druid 是一个高性能实时分析数据库。它是为大型数据集上实时探索查询的引擎，提供专为 OLAP 设计的开源分析数据存储系统，它的设计意图是在面对代码部署、机器故障以及其他产品系统遇到不测时能保持100%正常运行。它也可以用于后台用例，但设计决策明确定位线上服务。

数据流：

集群架构：

主要特性：

为分析而设计——Druid 是为 OLAP 工作流的探索性分析而构建。它支持各种 filter、aggregator 和查询类型，并为添加新功能提供了一个框架。用户已经利用 Druid 的基础设施开发了高级K查询和直方图功能。
交互式查询——Druid 的低延迟数据摄取架构允许事件在它们创建后毫秒内查询，因为 Druid 的查询延时通过只读取和扫描优必要的元素被优化。Aggregate 和 filter 没有坐等结果。
高可用性——Druid 是用来支持需要一直在线的 SaaS 的实现。你的数据在系统更新时依然可用、可查询。规模的扩大和缩小不会造成数据丢失。
可伸缩——现有的 Druid 部署每天处理数十亿事件和 TB 级数据。Druid 被设计成 PB 级别。

使用案例

Apache Druid安装部署手册

一 Apache Druid架构 1. Coordinator 监控Historical处理，负责分配segments到指定的服务，确保存在HIstorical中是自平衡的 2. Overlord 监控MiddleManager处理和控制数据加载进druid集群；对分配给MiddleManager的摄取任务和协调segments的发布负责 3. Broker 处理来自客户端的查询，解析将查询重定向
apache druid安装

Apache druid运行需要依赖其他一些软件环境，所以需要先安装依赖环境，最后再安装druid。这些依赖的环境包括： jdk zookeeper kafka 1.1 jdk安装将jdk包下载下来进去下面操作，如果有可以用最下面的命令查看一下版本 # 解压命令 tar -zxf jdk-8u191-linux-x64.tar.gz -C /usr/local/ # 修改配置命令 vi /et
Apache Druid的数据删除

1. 加载测试数据从quickstart/tutorial/wikiticker-2015-09-12-sampled.json.gz数据文件读取wikipedia数据，创建一个名称为deletion-tutorial的数据源 deletion-index.json内容如下，创建的segment为小时粒度 [root@bigdata001 apache-druid-0.22.1]# cat qu
Apache druid 配置项

此文是根据Apache druid官网资料进行编写，英语不是很好，而且本人还是菜鸟对一些原理和特性还有周边的工具不是很了解，所以很多的内容可能是错误的，如有人看了此文，发现错误的（翻译和理解的错误），请帮忙指正，万分感谢。 jvm配置 -Duser.timezone=UTC 时区设置，默认的，更改可能会有问题，跟北京时间有8小时差。换算为北京时间要+8小时 -Dfile.encoding=UTF-
Apache Druid的SQL查询

Apache Druid还支持原生的Json格式查询，这里我们只讲解SQL查询。Druid的数据查询底层是通过发送HTTP请求 1. 通过dsql 查询2015年9月12日被编辑最多的10个维基百科页面 [root@bigdata001 apache-druid-0.22.1]# [root@bigdata001 apache-druid-0.22.1]# pwd /opt/apache-dru

Apache Druid

主要特性：

同类工具

相关阅读

相关文章

相关问答

相关文档