问题：

在Google Colab上创建sparkContext时给出：` RuntimeError：Java网关进程在发送端口号之前退出`

方永贞

2023-03-14

以下是成功安装的依赖项。

!apt-get install openjdk-8-jre
!apt-get install scala
!pip install py4j
!wget -q https://downloads.apache.org/spark/spark-2.4.8/spark-2.4.8-bin-hadoop2.7.tgz
!tar xf spark-2.4.8-bin-hadoop2.7.tgz
!pip install -q findspark

现在创建火花上下文：

# Setting up environment variables
import os
os.environ["JAVA_HOME"] = "/usr/lib/jvm/java-8-openjdk-amd64"
os.environ["SPARK_HOME"] = "/content/spark-2.4.8-bin-hadoop2.7"
# export PYSPARK_SUBMIT_ARGS ="--master local[2]"

# Importing and initating spark
import findspark
findspark.init()
from pyspark.sql import SparkSession
spark = SparkSession.builder.master("local[*]").appName("Test Setup").getOrCreate()
sc = spark.sparkContext

我收到以下错误：

运行时错误：Java网关进程在发送端口号之前退出

请注意，这是一个colab笔记本。任何形式的帮助都会很好。

共有1个答案

山鸿彩

2023-03-14

您可以使用PyPI安装Pyspark作为替代：

对于Python用户，PySpark还提供了PyPI的pip安装。这通常用于本地使用或作为客户端连接到集群，而不是设置集群本身。

%pip install pyspark==2.4.8
!apt-get install openjdk-8-jdk-headless -qq > /dev/null

from pyspark.sql import SparkSession

spark = SparkSession.builder\
        .master("local[*]")\
        .appName("Test Setup")\
        .getOrCreate()

在Google Colab笔记本中测试：

类似资料：

Java网关进程在发送端口号Spark之前退出

我正试图用Anaconda在我的Windows10中安装Spark，但当我试图在JupyterNotebook中运行pyspark时，我遇到了一个错误。我正在遵循本教程中的步骤。然后，我已经下载了Java8并安装了Spark 3.0.0和Hadoop 2.7。我已经为SPARK_HOME、JAVA_HOME设置了路径，并在“path”环境中包含了“/bin”路径。在Anaconda pyspa
pycharm：Java网关进程在发送端口号前退出

我使用以下方法安装了pyspark：根据该示例的web，它应该刚好可以用以下代码执行：但我有一个错误：接着，要解决第二个问题，只需在控制面板中定义HADOOP_HOME和PATH环境变量，以便任何Windows程序都可以使用它们。
异常：Java网关进程在发送其端口号之前退出

尝试使用时我遇到了一个问题。我在我的用户路径中安装并添加了。但根据文档，它不需要任何其他依赖项。我的问题是，我必须安装其他东西吗？像Spark本身或类似的东西？我在中使用。
Java错误Java网关进程在发送其端口号之前退出

我在python环境中使用了pip安装pyspark，安装了java，但是当我尝试初始化spark会话时，我得到了一个java错误，java网关进程在发送端口号之前退出运行时错误发布在上面，我在其他帖子中没有看到这种类型的错误
init异常：Java网关进程在发送其端口号之前退出

代码在下面获取错误异常：Java网关进程在发送其端口号之前退出
Pyspark错误：Java网关进程在发送其端口号之前退出

我正在使用Pyspark运行一些命令在Jupyter笔记本，但它是抛出错误。我尝试了这个链接中提供的解决方案（pyspark：exception：Java gateway process在发送驱动程序端口号之前退出），并且尝试了这里提供的解决方案（比如将路径更改为c:Java、卸载Java SDK 10和重新安装Java8，但它仍然给我带来了同样的错误。我试着卸载和重新安装pyspark，我试着

在Google Colab上创建sparkContext时给出：` RuntimeError：Java网关进程在发送端口号之前退出`

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档