当前位置：首页 > 软件库 > 服务器软件 > 分布式应用/网格 >

MongoDB Hadoop Connector

授权协议 Apache

开发语言 Scala

所属分类服务器软件、分布式应用/网格

软件类型开源软件

地区不详

投递者戎志勇

操作系统跨平台

开源组织无

适用人群未知

软件官网

软件文档

官方下载

软件概览

Hadoop擅长分析和处理大型数据集，而MongoDB擅长存储应用程序的大型数据集，这两者结合到一起，就诞生了Mongo-Hadoop——MongoDB主要负责存储和查询，Hadoop主要负责批处理。

Mongo-Hadoop可以很容易地使用Mongo数据库库以及.bson格式的mongoDB备份文件，并将此作为Hadoop Map/Reduce任务的数据输入源或者输出目标。Mongo-Hadoop先检测数据并计算数据分割，然后交给Hadoop并行处理，这样非常大的数据集就可以快速被处理。

Mongo-Hadoop支持Pig和Hive，这两个开源项目允许编写非常简单的脚本来执行非常复杂的MapReduce工作流。

Mongo-Hadoop还支持Hadoop streaming，这样你可以使用Java以及其他任何编程语言来编写map/reduce函数。目前Mongo-Hadoop支持Ruby、Node.js和Python中的streaming。

Mongo-Hadoop的工作流程如下：

Mongo-Hadoop首先检查MongoDB Collection，并计算数据分割
每个分割部分被分配到Hadoop集群中的一个节点
同时，Hadoop节点从MongoDB（或BSON）获取数据，并进行本地处理
Hadoop合并结果，并输出到MongoDB或BSON

介绍内容来自 iteye

使用案例

MongoDB Connector for Hadoop(一)

1.MongoDB连接器 The MongoDB Connector for Hadoop is a library which allows MongoDB (or backup files in its data format, BSON) to be used as an input source, or output destination, for Hadoop MapReduce ta
MongoDB Connector for Hadoop(二)

I 问题在上一篇文章中介绍了Connecting to MongoDB - MongoStorageHandler。这种方式是将mongodb中的表和hive表建立连接(映射关系)，从而可以在hive中用HSQL操作mongodb的数据。但是另一个问题出现了： 1.删除表操作是很危险的，没有做好权限管理的话，在Hive中删除表，也会将mongodb的表一并删除。 2.MongoDB的表数据量很
MongoDB Hadoop Connector的1.0版本

10gen刚刚发布了MongoDB Hadoop Connector的1.0版本，它是一个中间件产品，用于将MongoDB和Hadoop连接起来，让MongoDB可以方便的使用Hadoop的分布式计算能力。MongoDB Hadoop Connector的主要流程是让Hadoop从MongoDB中读取原始数据，在通过Hadoop计算完成后，再将结果导入到MongoDB中。原始数据的读取和结果写入可
MongoDB Hadoop Connector发布

10gen刚刚发布了MongoDB Hadoop Connector的1.0版本，它是一个中间件产品，用于将MongoDB和Hadoop连接起来，让MongoDB可以方便的使用Hadoop的分布式计算能力。 MongoDB Hadoop Connector的主要流程是让Hadoop从MongoDB中读取原始数据，在通过Hadoop计算完成后，再将结果导入到MongoDB中。原始数据的读取和结果写
MongoDB Connector for Hadoop

MongoDB Connector for Hadoop Purpose The MongoDB Connector for Hadoop is a library which allows MongoDB (or backup files in its data format, BSON) to be used as an input source, or output destination,
关于使用 MongoDB Connector for Hadoop 的经验和教训

参考文章： Mongo hadoop connector https://github.com/mongodb/mongo-hadoop wiki https://github.com/mongodb/mongo-hadoop/wiki ppt http://www.slideshare.net/mongodb/hadoop-webinar?from_embed_lead_cta=true&tr
MongoDB与Hadoop技术栈的整合应用

一般场景处理 [MongoDB Connector for Hadoop](#MongoDB Connector for Hadoop) 部署安装 [Hive Usage](#Hive Usage) MongoDB-based方式 BSON-based方式数据序列化如何选择BSON还是直连MongoDB? 最近在研究Mongo和Hadoop技术栈结合使用的场景，抽空整理一下. 文章内容比较适用
Elasticsearch、MongoDB和Hadoop比较

T界在过去几年中出现了一个有趣的现象。很多新的技术出现并立即拥抱了“大数据”。稍微老一点的技术也会将大数据添进自己的特性，避免落大部队太远，我们看到了不同技术之间的边际的模糊化。假如你有诸如Elasticsearch或者Solr这样的搜索引擎，它们存储着JSON文档，MongoDB存着JSON文档，或者一堆JSON文档存放在一个Hadoop集群的HDFS中。你可以使用这三种配置完成很多同养的事情。
CentOS 7 下MongoDB connector for BI 2.7 测试验证

MongoDB对对于开发人员比较友好，但是对于数据分析则比较麻烦，一个简单的SQL语句可以搞定的，而用mongo shell或者mongodb的客户端则比较麻烦，甚至对于etl这类工具又不少都不支持，若有批量的collections进行分析会是比较麻烦的事情。有么有一种将mongodb中的json数据转为可供SQL语句查询分析的工具呢？可喜的是MongoDB意识到这些问题了，官方提供了连接
Hadoop与MongoDB整合（Hive篇）

1.背景公司希望使用MongoDB作为后端业务数据库，使用Hadoop平台作为数据平台。最开始是先把数据从MongoDB导出来，然后传到HDFS，然后用Hive/MR处理。我感觉这也太麻烦了，现在不可能没有人想到这个问题，于是就搜了一下，结果真找到一个MongoDB Connector for Hadoop 2.MongoDB简介–摘自邹贵金的《mongodb》一书 NoSQL数据库与传统的关系

MongoDB Hadoop Connector

同类工具

相关阅读

相关文章

相关问答

相关文档