起初,我有一个通过 ubuntu 访问的 VM,这个 VM 也是 Ubuntu 14.04。我需要尽快安装 Apache Spark,但我找不到任何可以帮助我或给我最好解释的参考的东西。我曾经尝试在我的本地机器 Ubuntu 14.04 上安装它,但它失败了,但问题是我不想在集群上安装它。请帮忙吗???
这篇文章解释了在 Ubuntu/Linux 机器中设置 Apache Spark-2.0 的详细步骤。为了在 Ubuntu 中运行 Spark,机器应该安装 Java 和 Scala。Spark可以在有或没有Hadoop的情况下安装,在这篇文章中,我们将只处理安装Spark 2.0 Standalone的问题。在Hadoop上安装Spark-2.0在另一篇文章中进行了解释。我们还将介绍如何安装Jupyter笔记本,以便使用带有pyspark模块的Python运行Spark应用程序。因此,让我们从检查和安装 java 和 scala 开始。
$ scala -version
$ java –version
如果已经安装了 scala 和 java,这些命令应该会打印出这些版本,否则您可以使用以下命令去安装这些版本。
$ sudo apt-get update
$ sudo apt-get install oracle-java8-installer
$ wget http://www.scala-lang.org/files/archive/scala-2.10.4.tgz
$ sudo mkdir /usr/local/src/scala
$ sudo tar xvf scala-2.10.4.tgz -C /usr/local/scala/
您可以使用 –version 命令再次检查 java 和 scala 是否正确安装,这将显示 – Scala 代码运行器版本 2.10.4 -- 版权所有 2002-2013,LAMP/EPFL,对于 java,它应该显示 java 版本“1.8.0_101” Java(TM) SE 运行时环境(内部版本 1.8.0_101-b13) Java HotSpot(TM) 64 位服务器虚拟机(内部版本 25.101-b14, 混合模式)并通过在末尾添加这些行来更新 .bashrc 文件。
export SCALA_HOME=/usr/local/scala/scala-2.10.4
export PATH=$SCALA_HOME/bin:$PATH
并使用此命令重新启动 bashrc。
$ . .bashrc
安装Spark First 使用以下选项从 https://spark.apache.org/downloads.html 下载Spark Spark Realease:2.0.0软件包类型:预构建Hadoop 2.7和直接下载。
现在,转到$HOME/下载并使用以下命令提取 spark tar 文件并移动到给定位置。
$ `tar xvf spark-1.3.1-bin-hadoop2.6.tgz`
$ `cd $HOME/Downloads/`
$ mv spark-2.0.0-bin-hadoop2.7 /usr/local/spark
将以下行添加到 ~/.bashrc 文件。这意味着将 Spark 软件文件所在的位置添加到 PATH 变量中。
export SPARK_HOME=/usr/local/spark
export PATH =$SPARK_HOME/bin:$PATH
再次使用这些命令重新启动环境 .bashrc 源 ~/.bashrc
或
. .bashrc
现在您可以使用以下命令启动 spark-shell
$spark-shell for starting scala API
$ pyspark for starting Python API
要遵循的过程主要是这样的:
确保已安装版本 7 或 8 的 Java 开发工具包
在下一步中安装 Scala。
然后在 ~/.bashrc
文件的末尾添加以下内容
export SCALA_HOME=<path to Scala home>
export PATH=$SCALA_HOME/bin:$PATH
重新启动 bashrc。
$ . .bashrc
在下一步中安装 git。Spark 构建取决于 git。
sudo apt-get install git
最后从这里下载火花分发
$ wget http://d3kbcqa49mib13.cloudfront.net/spark-1.4.0.tgz
$ tar xvf spark-1.4.0.tgz
SBT(简单构建工具)用于构建Spark,它与它捆绑在一起。编译代码
$ cd spark-1.4.0
$ build/sbt assembly
构建需要一些时间。
请参阅这篇博客文章,在这里您可以找到在 Ubuntu-14.04 上安装 Apache Spark 的更详细步骤
您可以通过三个简单的步骤安装并开始使用 spark:
>
从终端导航到下载的文件夹并运行以下命令:
tar -xvf spark-x.x.x.tgz //replace x's with your version
导航到提取的文件夹并运行以下命令之一:
./bin/spark-shell // for interactive scala shell
./bin/pyspark // for interactive python shell
您现在可以玩火花了。
本文向大家介绍Ubuntu14.04安装pycharm的步骤,包括了Ubuntu14.04安装pycharm的步骤的使用技巧和注意事项,需要的朋友参考一下 ubuntu安装pycharm的方法如下所示: 1. 下载 http://www.jetbrains.com/pycharm/download/ 选择Linux Tab,选择下载免费的Community Edition. 2. 安装PyChar
本文向大家介绍Ubuntu14.04 安装配置Tomcat7教程,包括了Ubuntu14.04 安装配置Tomcat7教程的使用技巧和注意事项,需要的朋友参考一下 1、下载安装包: http://mirrors.tuna.tsinghua.edu.cn/apache/tomcat/tomcat-7/v7.0.75/bin/apache-tomcat-7.0.75.tar.gz 2、解压 得到apa
本文向大家介绍ubuntu14.04+docker的安装及使用,包括了ubuntu14.04+docker的安装及使用的使用技巧和注意事项,需要的朋友参考一下 安装 官方推荐在ubuntu安装,本文选择在ubuntu14.04作为宿主系统。 系统更新 安装docker 基础命令 -H 也可以用简短的方式授权TCP绑定: host[:port] or :port 你可以是用多个 -H 例如你
本文向大家介绍ubuntu14.04安装opencv3.0.0的操作方法,包括了ubuntu14.04安装opencv3.0.0的操作方法的使用技巧和注意事项,需要的朋友参考一下 1.安装依赖项 直接编译安装opencv一般会报错,依赖工具需要先安装。 2.下载opencv3(两个版本任选其一) 3.编译和安装 4.配置环境变量 以上这篇ubuntu14.04安装opencv3.0.0的操作方法就
问题内容: 我在Android手机上安装Pocketsphinx时遇到一些问题,但在CMUSphinx的支持论坛,IRC,现有的StackOverflow帖子或强化的Googling上找不到答案。如果在座的人有时间愿意提供帮助,我将不胜感激。 首先,我对于是否可以在Android上安装Pocketsphinx感到困惑。我相信我需要Java容器才能在Android上运行,因此我尝试安装Sphinx4
问题内容: 我正在尝试在Ubuntu10.04上安装RMagick。但没有喜悦。我什至从源代码编译并安装了ImageMagick,但是当我尝试使用RubyGems安装RMagick时,这里的说明仍然没有帮助。我收到此错误: 这是什么意思呢?:)我是Ruby和RubyGems的新手,所以请保持谦虚。我的设置如下: 我几乎没有想法(也很累!)。我厌倦了使用上面的链接从源代码编译RMagick,但是由于
问题内容: 我通过阅读本教程安装了预构建版本。如果我启动elasticsearch,则会收到以下错误消息,我应该尝试旧版本的ES还是解决该问题? 问题答案: 您尝试将ES分配给已使用的端口8080。从那里的配置的罪魁祸首是。只需将两个配置都保留在配置之外,或为envvar分配其他端口。ES的默认端口是http和9300的9200。
这是不言自明的... 无法完成安装,因为找不到一个或多个必需的项目。 正在安装的软件:Android 原生开发工具 20.0.0.v201206242043-391819 (com.android.ide.eclipse.ndk.feature.group 20.0.0.v201206242043-391819) 缺少要求:Android本机开发工具20 . 0 . 0 . v 201206242