当前位置：首页 > 软件库 > 企业应用 > BI商业智能 >

Pinot

OLAP 存储和分析系统

授权协议 Apache

开发语言 Java

所属分类企业应用、 BI商业智能

软件类型开源软件

地区不详

投递者唐渊

操作系统跨平台

开源组织 LinkedIn

适用人群未知

软件官网

软件文档

官方下载

软件概览

Pinot 是一个实时分布式的 OLAP 数据存储和分析系统。LinkedIn 使用它实现低延迟可伸缩的实时分析。Pinot 从离线数据源（包括 Hadoop 和各类文件）和在线数据源（如 Kafka）中攫取数据进行分析。Pinot 被设计是可以进行水平扩展的。

Pinot 特别适合这样的数据分析场景：分析模型固定，数据只追加以及低延迟，以及分析结果可查询。

关键特性：

面向列的数据库，提供多种压缩模式，如运行长度、固定比特长度
可插入式的索引技术，包括可排序索引、Bitmap 索引和反向索引
可根据查询和段元数据对查询和执行进行优化
近乎实时的从 Kafka 获取数据，以及批量从 Hadoop 获取数据
类 SQL 的语言支持查询、聚合、过滤、分组、排序和去重
支持多值字段
水平伸缩以及容错

Pinot 非常使用用来查询时许数据以及大维度的数组。

Pinot 的组件架构：

Pinot 核心概念：

示例查询：

/*Total number of documents in the table*/
select count(*) from baseballStats limit 0

/*Top 5 run scorers of all time*/ 
select sum('runs') from baseballStats group by playerName top 5 limit 0

/*Top 5 run scorers of the year 2000*/
select sum('runs') from baseballStats where yearID=2000 group by playerName top 5 limit 0

/*Top 10 run scorers after 2000*/
select sum('runs') from baseballStats where yearID>=2000 group by playerName limit 0

/*Select playerName,runs,homeRuns for 10 records from the table and order them by yearID*/
select playerName,runs,homeRuns from baseballStats order by yearID limit 1

使用案例

实时OLAP（二）Apache Pinot快速入门

一、编译代码 git clone git@github.com:apache/incubator-pinot.git cd incubator-pinot mvn install package -DskipTests -Pbin-dist -DdownloadSources -DdownloadJavadocs -Drat.numUnapprovedLi
Ubuntu部署Pinot集群（docker版）

1、安装docker（分步执行，有些命令需要确认） apt-get remove docker docker-engine docker.io containerd runc apt-get update apt-get install ca-certificates curl gnupg lsb-release
Pinot 简介

1. Introduction to Pinot Pinot 是一个实时分布式的 OLAP 数据存储和分析系统。LinkedIn 使用它实现低延迟可伸缩的实时分析。Pinot 从离线数据源（包括 Hadoop 和各类文件）和在线数据源（如 Kafka）中攫取数据进行分析。Pinot 被设计是可以进行水平扩展的。 2. What is it for (and not)? 2.1 Pinot 适用于这
pinot的table配置

下面的配置由官网说明翻译过来： Table Config 示例表配置和描述下面显示了一个示例表配置，其中的子节被重新排序。这些小节将在下面的小节中分别进行描述。功能特定文档的进一步链接到可用的地方。 tableName ：应该只包含字母数字字符、连字符(' - ')或下划线(' _ ')。虽然使用双下划线(' __ ')是不允许的，并保留在Pinot的其他功能。 tableType ：指示表
pinot伪分布式搭建

本文中的伪分布式指的是pinot架构中每个组件controller、server、broker分别启动组成集群 1、进入linux 的pinot目录的bin文件夹下 2、pinot启动controller，使用自己的zookeeper集群非pinot中的zookeeper nohup ./start-controller.sh -clusterName PinotCluster -control

Pinot

同类工具

相关阅读

相关文章

相关问答

相关文档