当前位置: 首页 > 知识库问答 >
问题:

MacOS ImportError上的Spark安装和配置:没有名为pyspark的模块

督宏旷
2023-03-14

我正在尝试在MacOS上配置apache spark。所有在线指南都要求下载spark tar并设置一些环境变量,或者使用brew安装apache spark,然后设置一些环境变量。

现在,我使用brew安装apache spark来安装apache spark。我在terminal中运行pyspark,得到一个python提示,提示安装成功。

现在,当我尝试将pyspark导入到python文件中时,我遇到了一个错误:没有名为pyspark的模块

我无法理解的最奇怪的事情是,它如何能够启动pyspark的REPL,而无法将模块导入到python代码中。

我也尝试做pip install pyspark,但它也不能识别模块。

除了用自制软件安装apache spark外,我还设置了以下env变量。

if which java > /dev/null; then export JAVA_HOME=$(/usr/libexec/java_home); fi

if which pyspark > /dev/null; then
  export SPARK_HOME="/usr/local/Cellar/apache-spark/2.1.0/libexec/"
  export PYSPARK_SUBMIT_ARGS="--master local[2]"
fi

请建议在我的本地机器上运行pyspark代码的设置中到底缺少什么。

共有2个答案

鲁洋
2023-03-14

对不起,我不使用MAC,但在linux中,除了上述答案之外,还有另一种方法:

sudo ln -s $SPARK_HOME/python/pyspark /usr/local/lib/python2.7/site-packages

Python最终将从/path/to/your/Python/site包读取模块

赵英资
2023-03-14

pyspark模块未包含在python中

试试这个

import os
import sys

os.environ['SPARK_HOME'] = "/usr/local/Cellar/apache-spark/2.1.0/libexec/"

sys.path.append("/usr/local/Cellar/apache-spark/2.1.0/libexec/python")
sys.path.append("/usr/local/Cellar/apache-spark/2.1.0/libexec/python/lib/py4j-0.10.4-src.zip")

try:
    from pyspark import SparkContext
    from pyspark import SparkConf

except ImportError as e:
    print ("error importing spark modules", e)
    sys.exit(1)

sc = SparkContext('local[*]','PySpark')

如果您不想这样做,请将它们包含到您的系统路径中。不要忘记包含python路径。

export SPARK_HOME=/usr/local/Cellar/apache-spark/2.1.0/libexec/
export PYTHONPATH=$SPARK_HOME/python:$SPARK_HOME/python/lib/py4j-0.10.4-src.zip:$PYTHONPATH
export PATH=$SPARK_HOME/python:$PATH
 类似资料:
  • 正在尝试在Fedora21、Python 2.7上安装Biopython。我做了以下几件事 然后 我做错了什么? 编辑 我尝试安装biopython使用 并将其安装到/usr/lib/python2.7/site packages/biopython-1.65-py2.7-linux-x86_64.egg/中。没用。 然后我尝试使用相同的命令安装它,但没有使用sudo: 安装到 /home/mik

  • 问题内容: 运行基本程序时,我不断收到此错误。 这是基本的编: 当我在文件夹上运行哪个Flask时,它不返回位置。但是,如果我从那里运行pip install,它说它已经安装了。 问题答案: 如果要使用Flask和VirtualENV创建项目,则应遵循以下步骤,我确定你不会遇到上述错误。 步骤1:创建项目目录和初始virtualenv目录 步骤2:激活你的虚拟环境 第3步:创建requiremen

  • 我在Ubuntu 14上工作。我安装python3和pip3。当我尝试使用pip3时,我有这个错误 有人知道是什么问题吗? 非常感谢

  • 我已经浏览了这方面所有类似的问题,并尝试了那里提出的解决方案。但是,我无法得到这个错误排序,虽然我的包安装在我正在使用我的项目的适当虚拟环境中。 虽然在我的项目中,我不使用tkinter,当我试图运行该文件时,我得到了以下与模块相关的错误。 回溯(最近一次调用): 文件“/usr/lib/python3.5/tkinter/init.py”,第36行,在import\u tkinter Impor

  • 我在CMD中使用命令并成功安装了请求模块,但当我尝试将其导入PyCharm中的文件时,它会抛出 “ModuleNotFoundError:没有名为'requests'的模块 我看到了其他几个关于这个问题的帖子,但没有找到一个可行的解决方案。 作为旁注,我已经在我的Python IDLE中成功运行了这段代码,所以我认为这不是代码问题,只是我的PyCharm设置的问题。

  • 问题内容: 我是Debian用户,我想安装python-dev,但是当我以root身份在shell中运行代码时: 我收到以下错误: 似乎是什么问题,我该如何解决? 问题答案: 确保您有一个有效的python-apt软件包。您可以尝试再次删除并安装该软件包以解决apt_pkg.so的问题。