RHadoop

基于 R 语言的 Hadoop
授权协议 未知
开发语言 Java
所属分类 服务器软件、 分布式应用/网格
软件类型 开源软件
地区 不详
投 递 者 云洋
操作系统 跨平台
开源组织
适用人群 未知
 软件概览

RHadoop 是由 Revolution Analytics 发起的一个开源项目,它可以将统计语言 R 与 Hadoop 结合起来。目前该项目包括三个R packages,分别为支持用R来编写MapReduce应用的rmr、用于R语言访问HDFS的rhdfs以及用于R语言访问HBASE的rhbase。

  • 1)    RHadoop安装 下载RHadoop相关的2个程序包: https://github.com/RevolutionAnalytics/RHadoop/wiki/Downloads rmr-3.3.1 rhdfs-1.0.8 安装依赖库: 安装上面的两个库之前,我们需要先安装这两个库的依赖库。 首先是rJava,由于我们已经配置好JDK1.8的环境,运行R CMD javareconf

  • 入门 andrie/RHadoop-tutorial: A tutorial on R and Hadoop, using the RHadoop project

  • 原文地址:http://wanghaisheng.github.io/2014/12/20/run-rhadoop-on-docker-cn/ Docker 玩转 RHadoop 网络上已经有了太多的 RHadoop 的安装使用的教程,鉴于其中的配置配置繁复,对软件版本的要求又极其苛刻,故笔者想用时下热门的 docker 来尝尝鲜,以下是心路历程,供看客参考,希望能给大家一些帮助。 1、软硬件环境

  • 1. R Language Install 安装相关依赖 yum install -y perl* pcre-devel tcl-devel zlib-devel bzip2-devel libX11-devel tk-devel tetex-latex *gfortran* compat-readline5 yum install libRmath-* rpm -Uvh --force --n

 相关资料
  • 主要内容:R命令提示符,R脚本文件,注释学习一个新编程语言的惯例是什么?,当然是编写一个“Hello,World!”,下面我们将演示如何使用R编程编写一个“Hello,World!”程序。根据需要,您可以在R命令提示符下编程,也可以使用R脚本文件编写程序。 R命令提示符 当安装好了R开发环境以后,那么通过在命令提示符下键入以下命令,就可以启动R命令提示符 - 或者,在Windows系统下 - 这将启动R解释器,您将获得一个提示您可以在以

  • 主要内容:检查可用的R包,获取所有安装的软件包列表,安装新软件包,加载包到库R包是R函数,编码和样本数据的集合。 它们存储在R环境中的名为“”的目录下。 默认情况下,R在安装过程中安装一组软件包。当需要某些特定的目的时,也可根据需要添加更多的包。 当我们启动R控制台时,默认情况下只有默认软件包可用。 已经安装的其他软件包必须明确加载才能被要使用的R程序使用。 R语言中提供的所有软件包均列在R软件包中。 以下是用于检查,验证和使用R包的命令列表。 检查可用的R包 获取包含R

  • 注意:本文中实际使用的样本数据是根据具体命令任意挑选某组样本数据,不具有针对性,因此自己试验可以随意找样本尝试 一个table引发的血案 table函数就是用来输出指定字段的统计表格,可以用来分析数据比例情况,像下面的样子: > table(full$Title, full$Survived) 0 1 Master 17 23 Miss

  • 主要内容:在数据帧中的因子,改变级别顺序,产生因子级别因子是用于对数据进行分类并将其存储为级别的数据对象。它们可以存储字符串和整数。 它们在具有有限数量的唯一值的列中很有用。 像“男”,“女”,“真”,“假”等。它们在统计建模的数据分析中很有用。 因子可通过函数使用向量作为输入来创建。 示例 当我们执行上述代码时,会产生以下结果 - 在数据帧中的因子 在使用一列文本数据创建数据帧时,R将文本列视为分类数据并在其上创建因子。参考以下示例代码 - 当我们

  • 主要内容:例子,命名列和行,访问数组元素,操纵数组元素,跨数组元素的计算数组是可以在二维及以上存储数据的R数据对象。 例如 - 如果创建一个维数组,那么它将创建个矩形矩阵,每个矩阵具有行和列。数组只能存储数据类型。 数组可通过使用函数来创建。 它将向量作为输入,并使用参数中的值来创建数组。 例子 以下示例创建两个矩阵的数组,每个矩阵具有行和列。 当我们执行上述代码时,会产生以下结果 - 命名列和行 可以使用参数为数组中的行,列和矩阵命名。 当我们执行上述代码时,会产生

  • 主要内容:语法,例子,访问矩阵的元素,矩阵计算矩阵是其中元素以二维矩形布局排列的R对象。它们包含相同原子类型的元素。 虽然我们可以创建一个仅包含字符或仅包含逻辑值的矩阵,但它们没有太多用处。 我们使用包含数学元素的矩阵来在数学计算中使用。 矩阵可通过使用函数来创建。 语法 在R中创建矩阵的基本语法是 - 以下是使用的参数的描述 - data - 是将要转为矩阵元素的输入向量。 nrow - 是要创建的行数。 ncol - 是要创建的列数。 b

  • 主要内容:创建列表,命名列表元素,访问列表元素,操纵列表元素,合并列表,将列表转换为向量列表是包含不同类型的元素的R对象,如数字,字符串,向量,以及列表中也可包含另一个列表。 列表还可以包含矩阵或函数作为其元素。列表是使用函数来创建的。 创建列表 以下是创建包含字符串,数字,向量和逻辑值的列表的示例。 当我们执行上述代码时,会产生以下结果 - 命名列表元素 列表元素可以被赋予名字,并且可以使用这些名称访问列表元素。 当我们执行上述代码时,会产生以下结果 - 访问列表元素 列表的元素可

  • 主要内容:创建矢量,访问向量元素,向量操作向量是最基本的R数据对象,有六种类型的原子向量。它们分别是逻辑,整数,双重,复杂,字符和原始。 创建矢量 1.单元素矢量 即使在R中只写入一个值,它也会被认为是一个长度为的向量,属于上述向量类型之一。 当我们执行上述代码时,会产生以下结果 - 2.多元素向量 使用冒号运算符与数字数据 - 当我们执行上述代码时,会产生以下结果 - 使用序列(Seq.)运算符 当我们执行上述代码时,会产生以下结果 -