问题：

Pyspark：无法创建SparkSession。（Java网关错误）

潘嘉佑

2023-03-14

我已经在windows上安装了PySpark，直到昨天都没有问题。我使用的是Windows 10、Pyspark版本2.3.3（预构建版本）、Java版本“1.8.0_201”。昨天，当我尝试创建一个spark会话时，我遇到了以下错误。

Exception                                 Traceback (most recent call last)
<ipython-input-2-a9ef4ac1a07d> in <module>
----> 1 spark = SparkSession.builder.appName("Hello").master("local").getOrCreate()

C:\spark-2.3.3-bin-hadoop2.7\python\pyspark\sql\session.py in getOrCreate(self)
    171                     for key, value in self._options.items():
    172                         sparkConf.set(key, value)
--> 173                     sc = SparkContext.getOrCreate(sparkConf)
    174                     # This SparkContext may be an existing one.
    175                     for key, value in self._options.items():

C:\spark-2.3.3-bin-hadoop2.7\python\pyspark\context.py in getOrCreate(cls, conf)
    361         with SparkContext._lock:
    362             if SparkContext._active_spark_context is None:
--> 363                 SparkContext(conf=conf or SparkConf())
    364             return SparkContext._active_spark_context
    365 

C:\spark-2.3.3-bin-hadoop2.7\python\pyspark\context.py in __init__(self, master, appName, sparkHome, pyFiles, environment, batchSize, serializer, conf, gateway, jsc, profiler_cls)
    127                     " note this option will be removed in Spark 3.0")
    128 
--> 129         SparkContext._ensure_initialized(self, gateway=gateway, conf=conf)
    130         try:
    131             self._do_init(master, appName, sparkHome, pyFiles, environment, batchSize, serializer,

C:\spark-2.3.3-bin-hadoop2.7\python\pyspark\context.py in _ensure_initialized(cls, instance, gateway, conf)
    310         with SparkContext._lock:
    311             if not SparkContext._gateway:
--> 312                 SparkContext._gateway = gateway or launch_gateway(conf)
    313                 SparkContext._jvm = SparkContext._gateway.jvm
    314 

C:\spark-2.3.3-bin-hadoop2.7\python\pyspark\java_gateway.py in launch_gateway(conf)
     44     :return: a JVM gateway
     45     """
---> 46     return _launch_gateway(conf)
     47 
     48 

C:\spark-2.3.3-bin-hadoop2.7\python\pyspark\java_gateway.py in _launch_gateway(conf, insecure)
    106 
    107             if not os.path.isfile(conn_info_file):
--> 108                 raise Exception("Java gateway process exited before sending its port number")
    109 
    110             with open(conn_info_file, "rb") as info:

Exception: Java gateway process exited before sending its port number

我确实查看了github上的pyspark问题以及stackoverflow问题，但这个问题没有解决。

2.）尝试设置pyspark_submit_args，但没有帮助。

请建议我可能的解决办法。

共有1个答案

周睿范

2023-03-14

我认为您需要再次卸载java和pyspark，然后重新安装java和pyspark。

pip install pyspark

类似资料：

无法创建grpc网关。gw.pb，没有错误

我写了一个简单的go服务器和客户端，客户端发送两个数字，服务器用总和回复，它工作了。现在，我正在尝试使用grpc API配置设置grpc网关，并将客户端的请求从grpc更改为rest。我正在使用本教程，在以下部分中，我无法创建gw，但没有错误：我用了这个：在这个问题之后，我搜索并找到了这种既不工作（没有错误也没有输出！）：我在grpc测试目录中运行它，目录树如下：那么，我做错了什么？编
Spark SQL（PySpark）-SparkSession导入错误

我试图使用Spark-Submit执行一个简单的Spark SQL代码(PySpark)，但收到以下错误。注意-我是在Spark2.x中运行的。从pyspark.sql导入SparkSession imporderror:无法导入名称SparkSession 代码：
错误:无法创建java虚拟机[已关闭]

这个问题是由打字错误或无法再复制的问题引起的。虽然类似的问题可能在这里是主题，但这个问题的解决方式不太可能对未来的读者有所帮助。 Eclipse 版本：eclipse-jee-oxygen-3a-win32-x86_64 java ： jdk1.7.0_79 系统信息： Eclipse错误: eclipse配置设置文件: -启动插件/org.eclipse.equinox.launcher_1
pyspark无法创建spark数据帧

我想使用PySpark创建spark数据帧，为此我在PyCharm中运行了以下代码: 但是，它会返回此错误：使用 Spark 的默认 log4j 配置文件：组织/缓存/火花/log4j-defaults.属性将默认日志级别设置为“WARN”。要调整日志记录级别，请使用 sc.setLogLevel（新级别）。对于 SparkR，请使用 setLogLevel（新级别）。18/01/08 10：
无法创建关系

我有一个Orders表，其中的< code>resellerID列是一个可空整数。在大多数记录中，< code>resellerID为NULL，但有时它包含一个与Resellers表相关联的整数，该表包含< code>resellerID和< code>resellerName列。当我尝试添加两个之间的关系时，我收到以下错误：问题是＜code＞Orders的可为Null性质吗。经销商ID列？这
错误：无法创建Java虚拟机

我已经访问了所有与我的问题相关的现有问题，但我仍然有一个问题。所有安装都正确安装。我使用的是最新的Netbeans版本。在执行程序后，我出现了以下错误：

Pyspark：无法创建SparkSession。（Java网关错误）

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档