Alibaba Wasp

分布式关系数据库
授权协议 Apache
开发语言 Java
所属分类 数据库相关、 数据库服务器
软件类型 开源软件
地区 国产
投 递 者 蓟清野
操作系统 跨平台
开源组织 阿里巴巴
适用人群 未知
 软件概览

Wasp 是类Google MegaStore & F1的分布式关系数据库。

最近几年随之Bigtable和NoSQL的兴起,社区产品HBase逐步走向NoSQL系统的主流产品,优势明显然而缺点也明显,大数据平台下的业务由 SQL向NoSQL的迁移比较复杂而应用人员学习成本颇高,并且无法支持事务和多维索引,使得许多业务无法享用来自NoSQL系统中线性拓展能力。 Google内部MegaStore就作为Bigtable的一个补充而出现,在Bigtable的上层支持了SQL,事务、索引、跨机房灾备,并成为大 名鼎鼎的Gmail、APPEngine、Android Market的底层存储。近期Google在MegaStore的基础上升级了F1的系统,因此我们决定以MegaStore&F1为理论模型进 行探索如何在HBase系统上不牺牲线性拓展能力的同时又能提供跨行事务、索引、SQL的功能。通过简单的用户入口SQL,用户可以不需要关注hbase 的schema设计,极大的简化了用户的数据迁移和学习成本。理论设计详情见MegaStoreF1

Wasp是分布式的、支持SQL的、事务型数据库:

  1. 支持索引类型:本地索引、全局索引

  2. 支持分区(分区可再分区、合并、移动部署),可线性拓展

  3. 支持数据类型:int64、int32、string、double、float、datetime

  4. SQL语法特性:select、update、delete、insert、create table、delete table、create index、drop index等

  5. 支持跨行事务,支持NoSQl之上的索引与实体的ACID

  6. 支持MVCC

  7. JDBC访问接口

  8. 易用的监控:Ganglia - metrics

未来的规划

  • SQL分析性统计型函数

  • 资源隔离

  • 权限


  • 阿里巴巴73款开源产品列表,值得收藏 一、框架 react-web:Readt Web 是为那些使用 React Native 兼容的 API 构建的 Web 应用而提供的一个框架。React Web 的目的及意义非常明确: 让 React Native 代码跑在 Web 上让一套代码运行在各个移动终端,对前端及业务来说,这是开发效率中一个质的提升。 Jstrom:”JStorm 是参考 stor

  • 一、框架 react-web:Readt Web 是为那些使用 React Native 兼容的 API 构建的 Web 应用而提供的一个框架。React Web 的目的及意义非常明确: 让 React Native 代码跑在 Web 上让一套代码运行在各个移动终端,对前端及业务来说,这是开发效率中一个质的提升。 Jstrom:”JStorm 是参考 storm 的实时流式计算框架,在网络 IO、

  • 摘要: 云栖社区特在2018年年末,将阿里巴巴的一些重要的开源项目进行整理,希望对大家有所帮助。 开源展示了人类共同协作,成果分享的魅力,每一次技术发展都是站在巨人的肩膀上,技术诸多创新和发展往往就是基于开源发展起来的,没有任何一家网络公司可以不使用开源技术,仅靠自身技术而发展起来。阿里巴巴各个团队都是发自内心地将踩过的坑和总结的经验融入到开源项目中,供业界所有人使用,希望帮助他人解决问题。 云栖

  • 阿里巴巴73款开源产品列表,值得收藏 一、框架 react-web:Readt Web 是为那些使用 React Native 兼容的 API 构建的 Web 应用而提供的一个框架。React Web 的目的及意义非常明确: 让 React Native 代码跑在 Web 上让一套代码运行在各个移动终端,对前端及业务来说,这是开发效率中一个质的提升。 Jstrom:”JStorm 是参考 stor

  • 阿里云优惠:最高¥2000云产品通用代金券 https://promotion.aliyun.com/ntms/yunparter/invite.html?userCode=dansrwg4 开源展示了人类共同协作,成果分享的魅力,每一次技术发展都是站在巨人的肩膀上,技术诸多创新和发展往往就是基于开源发展起来的,没有任何一家网络公司可以不使用开源技术,仅靠自身技术而发展起来。阿里巴巴各个团队都是发

  • 前端 1.数据驱动的高交互可视化图形语法 AntV - G2 G2 是一套基于可视化编码的图形语法,以数据驱动,具有高度的易用性和扩展性,用户无需关注各种繁琐的实现细节,一条语句即可构建出各种各样的可交互的统计图表。 同时,G2 也是 AntV 最重要的组成,始于《The Grammar of Graphics》一书描述的视觉编码语法系统(这也是 G2 项目命名的由来)。 项目地址:https:/

  • 程序员的语言是代码,程序员的交流工具就是开源软件。 通过开源软件,程序员不仅贡献了改变世界的工具,还向同行展示了自己的作品,期望得到交流和反馈, 进一步提高软件的功能和质量。开源已经成为程序员文化的一部分。 作为软件大厂,阿里巴巴集团为开源社区贡献了大量软件,无偿提供包含了无数工程师智慧和汗水的海量代码。在今天这个 1024 程序员节的特殊日子,语雀为大家整理了近十年来阿里巴巴集团的开源软件,希望

 相关资料
  • 分布式支持 数据访问层支持分布式数据库,包括读写分离,要启用分布式数据库,需要开启数据库配置文件中的deploy参数: return [ // 启用分布式数据库 'deploy' => 1, // 数据库类型 'type' => 'mysql', // 服务器地址 'hostname' => '192.168.1.1,19

  • 每当我读到有关NoSQL分布式数据库的内容时,他们都会提到CAP定理,这意味着在分区系统中,您可以具有完全一致性,完全可用性或两者兼而有之,但不能完全两者兼而有之。 我不太清楚他们在谈论什么类型的一致性: 是数据新鲜度的一致性,其中一些客户端可能会获得比其他客户端更旧的数据吗? 或者是一致性,即事务可能仅部分完成,这可能会使数据处于不一致的状态? 第二种解释对我来说听起来很危险,不能真正接受。第一

  • 一种是关系数据库,典型代表产品:DB2;   另一种则是层次数据库,代表产品:IMS层次数据库。   非关系型数据库有MongoDB、memcachedb、Redis等。

  • 一个成功的技术,现实的优先级必须高于公关,你可以糊弄别人,但糊弄不了自然规律。 ——罗杰斯委员会报告(1986) 在本书的第一部分中,我们讨论了数据系统的各个方面,但仅限于数据存储在单台机器上的情况。现在我们到了第二部分,进入更高的层次,并提出一个问题:如果多台机器参与数据的存储和检索,会发生什么? 你可能会出于各种各样的原因,希望将数据库分布到多台机器上: 可扩展性 如果你的数据量、读取负载、写

  • 问题内容: 在数据库中建立适当的关系对数据完整性以外的其他功能没有帮助吗? 它们会改善还是阻碍性能? 问题答案: 我不得不说,适当的关系将比省略它们更好地帮助人们理解数据(或数据的意图),特别是因为维护它们的总成本非常低。 它们的存在不会影响性能,除非是在体系结构方面(正如其他人指出的那样,数据完整性有时会导致外键冲突,这可能会产生某些影响),但是IMHO的许多好处(如果正确使用,则不胜枚举)。

  • 这里我的疑问是,如果我使用多个分布式数据库,cam如何在配置(application.properties)中提到不同的DB源URL?目前我正在使用以下结构来使用一个数据库, 就像上面那样。 所以,如果我使用多个DB用于多个区域,我如何在这里给出有条件的配置?我是微服务世界和分布式数据库设计模式的新手。

  • 主要内容:一、从一个新闻门户网站案例引入,二、推算一下你需要分析多少条数据?,三、黄金搭档:分布式存储+分布式计算这篇文章聊一个话题:什么是分布式计算系统? 一、从一个新闻门户网站案例引入 现在很多同学经常会看到一些名词,比如分布式服务框架,分布式系统,分布式存储系统,分布式消息系统。 但是有些经验尚浅的同学,可能都很容易被这些名词给搞晕。所以这篇文章就对“分布式计算系统”这个概念做一个科普类的分析。 如果你要理解啥是分布式计算,就必须先得理解啥是分布式存储,现在我们从一个小例子来引入。 比如说

  • 被别人指出问题时,别管别人能不能做到,看别人说的对不对,然后完善自己。别人能不能做到是别人的事情,自己能不能做到关系到自己能否发展的更好。——hustlihaifeng Go语言号称是互联网时代的C语言。现在的互联网系统已经不是以前的一个主机搞定一切的时代,互联网时代的后台服务由大量的分布式系统构成,任何单一后台服务器节点的故障并不会导致整个系统的停机。同时以阿里云、腾讯云为代表的云厂商崛起标志着