当前位置：首页 > 软件库 > 数据库相关 > 数据库服务器 >

HadoopDB

分布式大规模数据库系统

授权协议 Apache

开发语言 Java

所属分类数据库相关、数据库服务器

软件类型开源软件

地区不详

投递者莘光华

操作系统跨平台

开源组织无

适用人群未知

软件官网

软件文档

官方下载

软件概览

HadoopDB是Abadi领导的开发团队利用不同的组件，包括开源数据库、PostgreSQL、Apache Hadoop数据分类技术和Hive（Facebook公司开发的内部Hadoop项目）开发出的新型数据库。

HadoopDB的查询是利用MapReduce或常规的SQL语言完成的。MapReduce是Google公司发明的Hadoop的祖先，这一软件架构用于大规模数据集（大于1TB）的并行计算。Hadoop是Apache软件基金会所研发的开源并行运算编程工具和分布式文件系统，与MapReduce和Google档案系统的概念类似。

另一方面，HadoopDB的数据处理部分是利用Hadoop完成的。Abadi表示，其中部分是利用了分布在无分享计算机群集中的许多节点上的不同的PostgreSQL实例完成的。“实质上，HadoopDB是MapReduce和并行数据库管理系统技术的混血儿。但是与Aster Data、Greenplum或Hive等已经开发出的项目和厂商不同，HadoopDB不是简单地在语言/接口层面上的混合，它是更深的系统实现层面上的集成。”Abadi说。

因为集两种技术的精华于一身，HadoopDB可以取得MapReduce等大规模并行数据基础设施的容错性。在这些基础设施中，服务器故障对整个网络的影响非常小。Abadi表示，HadoopDB可以执行复杂的分析，速度几乎与已有的商用并行数据库一样快。

HadoopDB的源代码现已公布。虽然其目前的解决方案还是试验性的，但对Web 2.0企业和方兴未艾的“NoSQL”运动的其他成员却非常具有吸引力。有专家认为，它最终可能吸引那些寻找代替甲骨文数据库、IBM DB2或微软SQL Server的更便宜、更具伸缩性数据库的企业。

Abadi在2009年4月曾参与撰写了一篇论文，该论文指出对于大多数的用户和应用而言，关系型数据库仍然超过MapReduce和Hadoop。Abadi日前表示，目前的研究并没有否认以前的看法，但是随着数据库技术的演进，HadoopDB这样的新兴数据库系统将具有比并行数据库更好的可伸缩性。

另外，HadoopDB虽然基于PostgreSQL构建，但同样可以使用其他数据库作为引擎。Abadi表示，其团队已经成功地使用了MySQL，并计划尝试使用像Infobright、MonetDB等柱状数据库来改进处理分析性工作负载时的性能。

使用案例

关注HadoopDB，一个分布式并行数据库系统

研究云计算的两个多月之后，脑子确实‘晕’了。云计算在我看来就是用mapReduce思想实践于大量廉价的Linux机器上的解决方案，主要涉及存储和处理两方面，当然以上观点都是我固执的偏见罢了。传统的基于行的关系型数据库里名声最大的要数Oracle了，其分布式集群的RAC解决方案在负载均衡等方面做的也不错。但是它的处理速度确实有限，还没听说过哪个集群解决方案应用到了上百个节点，因为不管集群中有多少个
[转]关注HadoopDB，一个分布式并行数据库系统

http://hi.baidu.com/dalier/item/a12c0878406a6a3c704423e4 研究云计算的两个多月之后，脑子确实‘晕’了。云计算在我看来就是用mapReduce思想实践于大量廉价的Linux机器上的解决方案，主要涉及存储和处理两方面，当然以上观点都是我固执的偏见罢了。传统的基于行的关系型数据库里名声最大的要数Oracle了，其分布式集群的RAC解决方案在负载均
HadoopDB混合数据库问世

众目期待之下，首款集关系型数据库的数据处理能力与Hadoop、MapReduce等下一代技术的可伸缩性于一身的开源并行数据库HadoopDB正式发布。 7月20日，美国耶鲁大学计算机科学教授Daniel J. Abadi 在其博客中公布了HadoopDB推出的消息。HadoopDB是Abadi领导的开发团队利用不同的组件，包括开源数据库、PostgreSQL、Apache Hadoop数据分类技术
认识HadoopDB

来自耶鲁的一篇论文 http://db.cs.yale.edu/hadoopdb/hadoopdb.pdf 学习下。简要介绍的PPT，很经典http://www.slideshare.net/cloudera/hw09-hadoop-db 附其他资源，来自首页 HadoopDB An Architectural Hybrid of MapReduce and DBMS Technologi
HadoopDB集群配置方法

Author:谢本文介绍在2个节点上安装配置HadoopDB方法。各节点的名称分别为Cluster01(192.168.0.1)，Cluster02(192.168.0.2)。以下若是用 hadoop@Cluster0X:~ 代表 Cluster01 ~ Cluster02 都要做的. 参考资料1：HadoopDB Quick Start Guide 参考资料2：HadoopDB安装使用
HadoopDB : Hadoop + RDBMS

HadoopDB 是耶鲁大学的一些研究人员在进行的一个Opensource项目，类似GreenPlum,Aster Data，描述如下： A hybrid of DBMS and MapReduce technologies that targets analytical workloads Designed to run on a shared-nothing cluster of commod
在运行hadoopdb\hive\hadoop源码时不能正确调用自定义core-site.xml等配置文件

一前言在hadoopdb\hive\hadoop源码中，会有很多的测试主程序，而这些测试主程序通常都要用到configuration,即 new JobConf(conf)时初始化configuration对象，如果直接运行这些程序，可能会出现只读取jar包中的配置文件，并不读取在conf路径下重新定义的新配置文件。二解决方案记得在项目的classpath中添加conf文件路径

HadoopDB

同类工具

相关阅读

相关文章

相关问答

相关文档