当前位置：首页 > 软件库 > 服务器软件 > 存储系统 >

Apache Kudu

Hadoop 数据存储系统

授权协议 Apache

开发语言 Java

所属分类服务器软件、存储系统

软件类型开源软件

地区不详

投递者曾航

操作系统跨平台

开源组织 Apache

适用人群未知

软件官网

软件文档

官方下载

软件概览

Apache Kudu 简介

为了应对先前发现的这些趋势，有两种不同的方式：持续更新现有的Hadoop工具或者重新设计开发一个新的组件。其目标是：

    对数据扫描(scan)和随机访问(random access)同时具有高性能，简化用户复杂的混合架构；
    高CPU效率，最大化先进处理器的效能；
    高IO性能，充分利用先进永久存储介质；
    支持数据的原地更新，避免额外的数据处理、数据移动

我们为了实现这些目标，首先在现有的开源项目上实现原型，但是最终我们得出结论：需要从架构层作出重大改变。而这些改变足以让我们重新开发一个全新的数据存储系统。于是3年前开始开发，直到如今我们终于可以分享多年来的努力成果：Kudu，一个新的数据存储系统。

使用案例

Apache kudu 的DML、DQL以及DDL java api示例

马上过年了，抢了两天的火车票都没抢到。果断叫黄牛了，希望明天能帮我抢到…. apache的kudu是Cloudera开源的存储引擎，可以结合impala做实时的一些查询，小米那边就用了kudu。具体的一些东西，自己去google或者baidu吧。由于这边后面会用到kudu的一些东西，就看了下它的文档。在网上kudu java api这一部分貌似没看到别人给demo，只有官方的github上面有小
Apache Kudu概述

数据模型 kudu集群所存储的表，看起来就像是关系型数据库中的表。这个表可以简单的像一个键值对，也可以复杂的像上百个不同类型的属性。像关系表一样，每张表有一个主键，这个主键可以由一个或者多个列组成。比如可以用用户ID作为单个列的主键，或者(host, metric, timestamp)作为一个组合主键。通过主键，表中的行记录可以被高效的读，更新，删除。 kudu简单的数据模型使其能够轻易的移植
Apache Kudu的Schema设计(column数据类型)

1. 表Schema介绍 Kudu的表是一种结构化数据模型，包含3个方面：分区设计、primary key设计、column设计 2. Column设计 2.1 支持的列数据类型支持的列数据类型如下： boolean 8-bit有符号integer 16-bit有符号integer 32-bit有符号integer 64-bit有符号integer date(32-bit days since
Apache Kudu 学习

一、背景 HDFS：吞吐能力极强，但是随机读写能力差，适合进行批处理数据分析 HBase：随机读写能力极强，但是吞吐能力差，适合做随机分析处理。 kudu：它是一个介入HDFS 和 Hbase之间的存储引擎。可以同时提供低延迟的随机读写和高效的数据分析能力。此外，kudu支持水平扩展，并且与 Impala 和 Spark 等当前流行的大数据查询和分析工具结合紧密。二、kudu架构与HDFS
Apache Kudu的Java/Scala API操作

1. 使用Java/Scala API进行表创建、插入数据、alter表、scan表、删除表 1.1 pom.xml 添加如下依赖 <dependency> <groupId>org.apache.kudu</groupId> <artifactId>kudu-client</artifactId> <vers

Apache Kudu

同类工具

相关阅读

相关文章

相关问答

相关文档