当前位置: 首页 > 知识库问答 >
问题:

findspark。init()失败-无法正确设置SPARK\u HOME环境变量

田成化
2023-03-14

我刚开始使用Spark,我正在尝试使用Jupyter笔记本在本地(windows)机器上玩Spark

我一直在遵循几个关于设置环境变量的教程,以及通过Python和cmd使用多个函数来实现这一点,但我无法获得任何介绍性的PySpark代码。

运行时(在Jupyter笔记本中,使用Python)

from pyspark import SparkContext
from pyspark.sql import SQLContext
sc = SparkContext('lcoal', 'Spark SQL') 

from pyspark import SparkContext
from pyspark.html" target="_blank">sql import SQLContext
sc = SparkContext('C:\spark\spark-2.4.3-bin-hadoop2.7', 'Spark SQL') 

我得到错误:

FileNotFoundError: [WinError 2] The system cannot find the file specified

此外,

我尝试使用findpark并遇到问题:

findspark.init()
OR
findspark.init("C:\spark\spark-2.4.3-bin-hadoop2.7")

我得到了错误:

IndexError: list index out of range

从围绕这个主题的其他帖子中,我认为SPARK\u HOME变量可能设置不正确。

我的环境变量如下:我的spark是在这里提取的:C:\spark\spark-2.4.3-bin-hadoop2.7

HADOOP_HOME: C:\Spark\Spark-2.4.3-bin-hadoop2.7SPARK_HOME: C:\Spark\Spark-2.4.3-bin-hadoop2.7JAVA_HOME: C:\Program Files\Java\jdk1.8.0_201

所有这些(包括%SPARK\u HOME%\bin)都已添加到我的PATH变量中。

最后,当我命令

据我所知,我的环境变量没有问题,所以我不确定为什么通过Juputer notebook的pyspark找不到我的spark\u主页(或者这不是问题所在)。

非常感谢您的帮助!

谢谢

共有1个答案

商和颂
2023-03-14

您似乎已经完成了流程的其余部分,只需要完成一步。在Jupyter NB中,运行以下命令:

import os    
os.environ['SPARK_HOME'] = 'C:\\Users\\user_name\\Desktop\\spark'

它应该将此路径添加到您的环境变量中。您还可以通过在Jupyter NB中运行以下命令来检查它是否按预期设置了正确的路径:

<代码>%环境或

for var in os.environ():  
    print(var,':',os.environ[var])

请注意代码的缩进

 类似资料:
  • 我使用spark-defaults分类[http://docs.aws.amazon.com/emr/latest/releaseGuide/emr-spark-configure.html]并提供以下属性:-来设置yarn主目录中的环境变量。

  • 我有一个预请求脚本,它在每次生成请求时递增一个环境变量以生成不同的ID。此外,我有一个运行程序多次调用此请求: 但是,我注意到在运行期间,环境变量不会更新,至少在环境选项卡中是这样: 但我监控控制台日志中的变量,它正确递增: 我的问题是,如果我在所有请求结束之前过早停止运行程序,环境变量不会注册所有已执行的集合,因此它会保留执行开始时的值。这可能是一个已知的问题,也可能只是我以错误的方式使用工具,

  • 我有来自POST方法的响应正文,如下所示 然后我想提取该会话密钥以添加到我使用此代码的环境变量中 但是在环境变量上仍然返回“undefined”值。请帮助,谢谢

  • 问题内容: 当我跑步时,我得到警告: 全局初始化失败:BadValue无效或未设置用户区域设置。请确保正确设置LANG和/或LC_ *环境变量。 问题答案: 生成语言环境 缺少的语言环境是使用locale-gen生成的: 或者,可以使用localedef:[1]手动创建区域设置文件。 设置区域设置 可以如下设置区域设置(在示例中为): 该命令将在Debian下打开一个对话框,用于选择所需的语言环境

  • 本文向大家介绍Python环境变量设置方法,包括了Python环境变量设置方法的使用技巧和注意事项,需要的朋友参考一下 Alias Maya中的脚本语言是Mel 和 Python,据说Houdini未来也会把Python作为主要的脚本语言,作为影视特效师,掌握Python语言是必备技能;虽然Maya内置了Python运行时,但是,如果要系统学习Python语言,环境变量还是需要配置一下~ 默认情况

  • 当我跑步时 $ionic cordova构建android 构建失败,出现此错误: Cordova build android找不到ANDROID_HOME环境变量。尝试设置它 尽管当我跑步时: 科尔多瓦要求 我得到以下结果: android的需求检查结果: Java JDK:已安装1.8.0 Android SDK:安装正确 Android目标:安装android-29、android-28、a