问题：

在Python笔记本中配置Spark时的运行时错误

戴嘉珍

2023-03-14

spark = SparkSession \
    .builder \
    .appName("question recommendation") \
    .config("spark.driver.maxResultSize", "96g") \
    .config("spark.driver.memory", "96g") \
    .config("spark.executor.memory", "8g") \
    .config("spark.master", "local[12]") \
    .getOrCreate()
sc = spark.sparkContext

第一行出现运行时错误:

RuntimeError                              Traceback (most recent call last)
<ipython-input-17-1b87e1472109> in <module>
      1 # spark config
----> 2 spark = SparkSession \
      3     .builder \
      4     .appName("question recommendation") \
      5     .config("spark.driver.maxResultSize", "96g") \

~\anaconda3\lib\site-packages\pyspark\sql\session.py in getOrCreate(self)
    226                             sparkConf.set(key, value)
    227                         # This SparkContext may be an existing one.
--> 228                         sc = SparkContext.getOrCreate(sparkConf)
    229                     # Do not update `SparkConf` for existing `SparkContext`, as it's shared
    230                     # by all sessions.

~\anaconda3\lib\site-packages\pyspark\context.py in getOrCreate(cls, conf)
    390         with SparkContext._lock:
    391             if SparkContext._active_spark_context is None:
--> 392                 SparkContext(conf=conf or SparkConf())
    393             return SparkContext._active_spark_context
    394 

~\anaconda3\lib\site-packages\pyspark\context.py in __init__(self, master, appName, sparkHome, pyFiles, environment, batchSize, serializer, conf, gateway, jsc, profiler_cls)
    142                 " is not allowed as it is a security risk.")
    143 
--> 144         SparkContext._ensure_initialized(self, gateway=gateway, conf=conf)
    145         try:
    146             self._do_init(master, appName, sparkHome, pyFiles, environment, batchSize, serializer,

~\anaconda3\lib\site-packages\pyspark\context.py in _ensure_initialized(cls, instance, gateway, conf)
    337         with SparkContext._lock:
    338             if not SparkContext._gateway:
--> 339                 SparkContext._gateway = gateway or launch_gateway(conf)
    340                 SparkContext._jvm = SparkContext._gateway.jvm
    341 

~\anaconda3\lib\site-packages\pyspark\java_gateway.py in launch_gateway(conf, popen_kwargs)
    106 
    107             if not os.path.isfile(conn_info_file):
--> 108                 raise RuntimeError("Java gateway process exited before sending its port number")
    109 
    110             with open(conn_info_file, "rb") as info:

RuntimeError: Java gateway process exited before sending its port number

我对Apache Spark非常陌生，有没有什么我安装错了？我应该通过Conda安装它吗？我的系统上有什么需要检查的吗？

共有1个答案

方璞

2023-03-14

错误的主要线索在最后一行

“RuntimeError：Java网关进程在发送端口号前退出”

您可以检查下面的旧堆栈溢出链接以获得解决方案

类似资料：

在Jupyter笔记本中运行Tensorflow

我正在尝试做一些深度学习的工作。为此，我首先在我的Python环境中安装了所有用于深度学习的包。这就是我所做的。在Anaconda中，我创建了一个名为的环境，如下所示然后在其中安装了data science Python包，如Pandas、NumPy等。我还在那里安装了TensorFlow和Keras。下面是该环境中的包列表您可以看到还安装了。现在，当我在这个环境中打开Python解释器
运行时配置

为什么有运行时配置？我们通过 .umirc.js 做编译时的配置，这能覆盖大量场景，但有一些却是编译时很难触及的。比如：在出错时显示个 message 提示用户在加载和路由切换时显示个 loading 页面载入完成时请求后端，根据响应动态修改路由这些在编译时就很难处理，或者不能处理了。配置方式 umi 约定 src 目录下的 app.js 为运行时的配置文件。 + src - ap
运行时配置

运行时配置和配置的区别是他跑在浏览器端，基于此，我们可以在这里写函数、import 浏览器端依赖等等，注意不要引入 node 依赖。配置方式约定 src/app.js 为运行时配置。运行时配置的类型有三种，具体查看applypluginstype。配置项 beforeRender beforeRender(lastOpts) 在渲染之前执行，执行action过程中显示 loading 配置的
在ipython笔记本中显示matplotlib时出错

我正在看一个ipython笔记本教程，上面说在一个单元中运行这个。导入numpy作为np导入数学导入matplotlib.pyplot作为plt 我应该得到一个实际的图表。我明白了我该怎么做呢？
在Spark中运行任务时出错ExecutorLostFailure

我正在尝试在一个大约14 GB数据的文件夹上运行Spark MLlib朴素贝叶斯算法。（当我在一个6 GB的文件夹上运行任务时没有任何问题）我正在从google storage读取这个文件夹作为RDD并给出32作为分区参数（我也尝试增加分区）。然后利用TF生成特征向量并在此基础上进行预测。但当我试图在这个文件夹上运行它时，它每次都抛给我ExecutorLostFailure。我尝试了不同的配置，但
pyspark-py4j.protocol.py4jJavaerror,在我的win10笔记本电脑上运行spark线性回归模型时

我尝试在我的win10笔记本电脑上运行PySpark脚本，该脚本正在用PySpark和Spark MLlib建立线性回归模型，我的代码如下：我有如下错误消息：

在Python笔记本中配置Spark时的运行时错误

共有1个答案

相关问答

相关文章

相关阅读

相关工具

相关文档