当前位置: 首页 > 知识库问答 >
问题:

PySpark:Spyder中的SparkContext定义引发Java网关错误

荀靖
2023-03-14

我想将Spyder与pyspark(Spark-2.1.1)一起使用,但我无法修复一个相当令人沮丧的Java错误。在激活conda环境(Python版本为3.5.3)后,我在Windows10中从命令行启动spyder。这是我的代码:

import pyspark
sc = pyspark.SparkContext("local")
file = sc.textFile("C:/test.log")
words = file.flatMap(lambda line : line.split(" "))
words.count()
  File "D:\spark-2.1.1-bin-hadoop2.7\python\pyspark\java_gateway.py", line 95, in launch_gateway
    raise Exception("Java gateway process exited before sending the driver its port number")

Exception: Java gateway process exited before sending the driver its port number

相关的环境变量似乎还可以:

回声%spark_home%

D:\spark-2.1.1-bin-hadoop2.7

共有1个答案

程俊誉
2023-03-14

由于1)正在工作,因此最好使用Spyder中的conda环境。

在Preferences中,转到“Python解释器”部分,从“Default(即,与Spyder的相同)”切换到“使用以下Python解释器”。

如果您的环境名为spark_env,并且Anaconda安装在C:\program files\continnum\Anaconda下,则与此环境对应的python配置文件为C:\program files\continnum\Anaconda\envs\spark_env\python.exe

要检查环境变量,可以使用python代码确保这些变量与脚本看到的相同:

   from os import environ
   print(environ['SPARK_HOME'])
   print(environ['JAVA_HOME'])
   try:
          print(environ['PYSPARK_SUBMIT_ARGS'])
   except:
      print("no problem with PYSPARK_SUBMIT_ARGS")  # https://github.com/ContinuumIO/anaconda-issues/issues/1276#issuecomment-277355043

希望能有所帮助。

 类似资料:
  • 问题内容: 在我的node.js应用程序中,我做了一个操作,以便可以使用客户端javascript中固有的btoa()和atob()函数,但由于某种原因未包含在node中。新目录显示在我的node_modules文件夹中,该文件夹本身与app.js一起位于根目录中。然后,确保将btoa- atob作为依赖项添加到根目录下的package.json文件中。 但是,由于某种原因,它仍然无法正常工作。

  • 问题内容: 我正在使用Access数据库,并尝试加载DataTable对象,但收到错误消息。我的查询在标准访问模块内调用一个名为“ CountWeekDays”的公共函数,当通过Access本身运行时,会返回正确的结果。通过.NET应用程序调用时,为什么这不起作用? 问题答案: 只有在Access本身中运行查询时,才可以在Access查询中使用用户定义的VBA函数。如果要从.NET应用程序中运行查

  • 这个问题有什么解决办法吗?

  • 我试图创建一个新的数据源,用于在WebSphere8.5传统中连接到neo4j。因为neo4j jdbc驱动程序只实现javax.sql.DataSource,而不实现connectionPoolDataSource接口。为了解决这个问题,我创建了一个新的JDBC提供程序,它指向一个自定义的Neo4jConnectionPoolDataSource类,并为此定义了完整的类路径。 在尝试从Websp

  • 我有一个Spark作业,仅在确实必要时才初始化Spark上下文: 如果部署模式是“客户端”,它在纱线上工作得很好 然后我将部署模式切换到“集群”,它在 下面是错误文本: 信息纱线。客户:申请的申请报告_1509613523426_0017(州:已接受)17/11/02 11:37:17 信息纱线。客户:申请的申请报告_1509613523426_0017(状态:失败)17/11/02 11:37:

  • 我试图创建Kafka直接流与提供偏移外部在我的火花流模块,但它导致以下编译错误。 下面是创建Kafka直接流的代码 下面是我遇到的编译错误。有什么想法/指针吗?