当前位置: 首页 > 知识库问答 >
问题:

为什么python控制台中对sparksession.builder..getorcreate()的调用被视为命令行spark-submit?

宋畅
2023-03-14
NOTE: SPARK_PREPEND_CLASSES is set, placing locally compiled Spark classes ahead of assembly.
Error: Missing application resource.

NOTE: SPARK_PREPEND_CLASSES is set, placing locally compiled Spark classes ahead of assembly.
Usage: spark-submit [options] <app jar | python file | R file> [app arguments]
Usage: spark-submit --kill [submission ID] --master [spark://...]
..

Options:
  --master MASTER_URL         spark://host:port, mesos://host:port, yarn,
                              k8s://https://host:port, or local (Default: local[*]).
  --deploy-mode DEPLOY_MODE   Whether to launch the driver program locally ("client") or
                              on one of the worker machines inside the cluster ("cluster")
                              (Default: client).
  --class CLASS_NAME          Your application's main class (for Java / Scala apps).
  --name NAME                 A name of your application.
  --jars JARS                 Comma-separated list of jars to include on the driver
   ..
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
  File "<stdin>", line 7, in getSpark
  File "/shared/spark/python/pyspark/sql/session.py", line 173, in getOrCreate
    sc = SparkContext.getOrCreate(sparkConf)
  File "/shared/spark/python/pyspark/context.py", line 367, in getOrCreate
    SparkContext(conf=conf or SparkConf())
  File "/shared/spark/python/pyspark/context.py", line 133, in __init__
    SparkContext._ensure_initialized(self, gateway=gateway, conf=conf)
  File "/shared/spark/python/pyspark/context.py", line 316, in _ensure_initialized
    SparkContext._gateway = gateway or launch_gateway(conf)
  File "/shared/spark/python/pyspark/java_gateway.py", line 46, in launch_gateway
    return _launch_gateway(conf)
  File "/shared/spark/python/pyspark/java_gateway.py", line 108, in _launch_gateway
    raise Exception("Java gateway process exited before sending its port number")
Exception: Java gateway process exited before sending its port number

共有1个答案

姜钧
2023-03-14

在尝试了15个以上的资源--并仔细阅读了大约两倍于此的资源--唯一有效的是这个以前没有被否决的答案https://stackoverflow.com/a/55326797/1056563:

export PYSPARK_SUBMIT_ARGS="--master local[2] pyspark-shell"

是否使用local[2]locallocal[*]并不重要:需要的是格式,包括关键的pyspark-shell片段。

处理此问题的另一种方法是在Python代码中方便地使用以下代码行:

os.environ["PYSPARK_SUBMIT_ARGS"] = "pyspark-shell"
 类似资料:
  • 除了用于构建 Web 应用程序的丰富功能,Yii 中也有一个拥有丰富功能的控制台, 它们主要用于创建网站后台处理的任务。 控制台应用程序的结构非常类似于 Yii 的一个 Web 应用程序。 它由一个或多个 yii\console\Controller 类组成,它们在控制台环境下通常被称为“命令”。 每个控制器还可以有一个或多个动作,就像 web 控制器。 两个项目模板(基础模版和高级模版)都有自己

  • 问题内容: 我今天注意到,当您输入控制台时,Chrome 49不再输出。而是输出字符串。 为什么是这样?语言改变了吗? 问题答案: 现在,Chromedevtools会自动在隐含的一对括号中包装所有以开头和结尾的内容,以强制将其评估为表达式。这样,现在创建一个空对象。如果您回顾历史记录(),则会看到此内容,前一行将包含在中。 为什么? 我不知道,但是 我可以猜到它减少了对于不了解block-vs-

  • 我尝试了几种方法通过selenium(使用python)在Firefox中打开控制台,但这些方法都不起作用,尽管我没有得到任何故障排除,除了最后一个。 Selenium 3.141.0、Firefox 68.0、geckodriver-v0.24.0-win64

  • 问题内容: 在kohana框架中,我可以使用以下命令通过命令行调用控制器 是否可以通过CLI在Laravel 5中调用我想要的控制器?如果是,该怎么做? 问题答案: 到目前为止,还没有办法(不确定是否会发生)。但是,您可以创建自己的Artisan Command 来执行此操作。使用以下命令创建命令: 对于Laravel 5.3或更高版本,您需要使用: 这将在中生成命令类。该类的内容应如下所示: 然

  • 我开始阅读《Spark权威指南大数据处理变得简单》一书,学习Spark。当我阅读时,我看到一句话:“DataFrame是最常见的结构化API,它只是用行和列表示一个数据表。”我无法理解为什么RDD和数据帧被称为API?

  • 在许多调用中,我的print语句不会显示在控制台上。 我的程序的目的是在中显示后的数学“计算”。然而,数学知识在这里并不重要。 让我们粗略地假设引用的任何数学都是正确的。 我的问题发生在中的。 请原谅程序的大小。 激活unctions.py 输出应显示在以下内容之后: