当前位置: 首页 > 工具软件 > SparkR > 使用案例 >

Centos 安装R和sparkR

周睿范
2023-12-01

安装环境

centos6.5 64位

jdk 1.7

spark1.50

第一步 安装依赖

yum install gcc

yum install gcc-c++

yum install gcc-gfortran

yum install pcre-devel

yum install tcl-devel

yum install zlib-devel

yum install bzip2-devel

yum install readline-devel

yum install libXt-devel

yum install tk-devel

yum install tetex-latex

为了防止devtools包装不上先安装这几个依赖

yum install libcurl-devel

yum install openssl-devel

yum install libxml2-devel

yum install libcurl libcurl-devel

安装R

下载R:https://cran.r-project.org/src/base/R-3/

解压R:tar -zxvf R-3.2.2.tar.gz
重命名:mv R-3.2.2 R

进入R文件中:./configure –enable-R-shlib

make$$make install

验证方式:输入R后,进入R的命令行界面即可

安装Rstdiuio

下载Rstduio的rpm版本 下载地址:http://www.rstudio.com/products/rstudio/download-server/

双击即可 在浏览器上输入: 192.168.219.156:8787
进入登录界面 ,用户名和账号是你登录linux的用户名和账号 (注意Root用户不能登录)

选择Rstduio的原因是,界面友好。操作非常方便

安装包

安装包的命令有以下几种:
install.packages(“包名/包的目录”)

R CMD INSTALL 包名
在R上装的包Rstduio也可用
>用Rstduio安装包方便很多,所以我建议大家使用这个软件会省去很多不必要的麻烦。

常用包

常用的包有rJava(先装jdk) devtools 特别是devtools这个包你可以直接从github上获取开源的包(如果在CRAN上安装不上的话)

SparkR 使用这个包时我建议大家把别的包也都装上(之前的俩个)我不知道有没有关联关系,总之是装上比较好。

因为我用的是spark1.5.0 在spark1.4的时候已经在spark上内置了sparkR了,所以我没有按照网上spark1.4以前的文档自己从网上下载sparkR编译,而是直接用自身的sparkR 。方法很简单(我是借鉴的一个博客)http://blog.csdn.net/moonpure/article/details/47173595

libpath <- .libPaths()

libpath <- c(libpath, “/opt/spark/R/lib”)

.libPaths(libpath)

rm(libpath)

library(SparkR)

把以上代码写入一个R的脚本执行就可以了。

总结

这是这几天安装sparkR的小总结,感很多。特别提醒大家R的安装时必须保障依赖要装好,否则很麻烦。大家使用的时候记得去网上搜索不同的资料对比着看。这样可以避免很多问题。

 类似资料: