当前位置: 首页 > 知识库问答 >
问题:

无法运行pyspark

夹谷飞龙
2023-03-14

我在Windows上安装了Spark,我无法启动pyspark。当我输入c:\Spark\bin\pyspark时,我得到以下错误:

Python 3.6.0 | Anaconda custom(64位)|(默认值,2016年12月23日,11:57:41)[MSC v.1900 64位(AMD64)]在win32上键入“帮助”、“版权”、“信用”或“许可证”以了解更多信息。回溯(最近一次调用):文件“c:\Spark\bin..\python\pyspark\shell.py”,第30行,在pyspark导入文件“c:\Spark\python\pyspark\uuu init\uuuu.py”,第44行,从pyspark开始。上下文导入SparkContext文件“c:\Spark\python\pyspark\context.py”,第36行,来自pyspark。java_网关导入启动_网关文件“c:\Spark\python\pyspark\java_gateway.py”,第31行,来自py4j。java_网关导入java_导入,JavaGateway,gateway客户端文件“”,第961行,在查找和加载文件“”中,第950行,在查找和加载解锁文件“”中,第646行,在加载解锁文件“”中,第616行,在向后加载兼容文件“c:\Spark\python\lib\py4j-0.10.4-src.zip\py4j\java_gateway.py”中,第18行,在文件“C:\Users\Eigenaar\Anaconda3\lib\pydoc.py”的第62行中,在导入pkgutil文件“C:\Users\Eigenaar\Anaconda3\lib\pkgutil.py”的第22行中,在ModuleInfo=namedtuple('ModuleInfo',module finder name ispkg')文件“C:\Spark\python\pyspark\serializers.py”的第393行中,在namedtuple cls=\u old\u namedtuple(*args,**kwargs)类型错误:namedtuple()缺少3个只需关键字的参数:“verbose”、“rename”和“module”

我到底做错了什么?

共有3个答案

汪甫
2023-03-14

我使用蟒蛇脚本中的一个更改解决了这个问题。

在python脚本中,我在下面放置了一段名为序列化器的代码。py,位置是c:\your installation dir\spark-2.0.2-bin-hadoop-2.7\python\pyspark\,并在第381行替换。

cls = _old_namedtuple(*args, **kwargs, verbose=False, rename=False, module=None)

然后在命令行中运行pyspark,这样就行了。。

华星驰
2023-03-14

火花

郏景澄
2023-03-14

Spark 2.1.0不支持python 3.6.0。要解决此更改,请在anaconda环境中使用python版本。在您的anaconda env中运行以下命令

conda create -n py35 python=3.5 anaconda
activate py35
 类似资料:
  • 问题内容: 我已经在mongodb服务器中安装了mongo-connector。 我通过发出命令来执行 我还尝试了此操作,因为mongo在具有默认端口的同一服务器上运行。 我遇到错误 注意:我正在使用python2.7和mongo-connector 2.3 elasticsearch服务器是2.2 有什么建议 ? [edit] 应用的建议后: 2016-02-29 19:56:59,519 [C

  • 我知道这个问题已经张贴,但我没有找到任何可以帮助我解决我的问题。我想用AnimeJS在我的网站上创建一些动画,但我无法运行最简单的动画,即使是anime.js文档和示例中的动画。 我找到了有相同问题的人,并通过在文档加载后运行代码解决了这个问题,但在我的例子中,这似乎不是解决方案n。我使用npm安装了anime.js,在我的页面上使用的无非是这个和Jquery。下面是文档示例的代码: null n

  • 系统环境: JVM 11.0.6-打开 Ubuntu 18.04 SDKMAN 5.8.1+484 等级6.1 Chrome版本81.0.4044.138 Chrome驱动程序3.141.59 要运行的代码: 下午4:52:09:正在执行任务“Runner.Main()”... 任务:CompileJava任务:ProcessResources无源任务:类 任务:runner.main()错误:未

  • 运行start.jar时,出现以下错误: 谢谢,山姆

  • 我的笔记本电脑上有一个java项目,我正在用Gradle构建它。所有依赖项都在文件系统中,因为我在处理它时大部分时间都是脱机的。反正也不算太多。 查看checkstyle-6.10.1.jar内部,我可以看到没有这样的类,而是有一个叫做的类,我怀疑这是gradle应该调用的类。然而,我不知道如何让gradle调用它。 我唯一的一个怀疑是我的没有正确定义,并且gradle使用某些默认值调用。然而,所

  • 我正在尝试自学一些hadoop基础知识,因此已经构建了一个简单的hadoop集群。这样可以工作,并且我可以从hdfs文件系统中put,ls,cat而没有任何问题。所以我采取了下一步,尝试对我放入hadoop的文件进行单词计数,但我得到了以下错误 我可以ls Hadoop: hadoop版本: hadoop类路径: 很明显我错过了什么,所以谁能给我指出正确的方向。