问题：

Spark在Yarn集群exitCode=13上运行：

卜凯旋

2023-03-14

我是一名spark/纱线新手，在提交纱线集群上的spark作业时遇到exitCode=13。当spark作业在本地模式下运行时，一切正常。

我使用的命令是：

/usr/hdp/current/spark-client/bin/spark-submit --class com.test.sparkTest --master yarn --deploy-mode cluster --num-executors 40 --executor-cores 4 --driver-memory 17g --executor-memory 22g --files /usr/hdp/current/spark-client/conf/hive-site.xml /home/user/sparkTest.jar*

Spark错误日志：

16/04/12 17:59:30 INFO Client:
         client token: N/A
         diagnostics: Application application_1459460037715_23007 failed 2 times due to AM Container for appattempt_1459460037715_23007_000002 exited with  exitCode: 13
For more detailed output, check application tracking page:http://b-r06f2-prod.phx2.cpe.net:8088/cluster/app/application_1459460037715_23007Then, click on links to logs of each attempt.
Diagnostics: Exception from container-launch.
Container id: container_e40_1459460037715_23007_02_000001
Exit code: 13
Stack trace: ExitCodeException exitCode=13:
        at org.apache.hadoop.util.Shell.runCommand(Shell.java:576)
        at org.apache.hadoop.util.Shell.run(Shell.java:487)
        at org.apache.hadoop.util.Shell$ShellCommandExecutor.execute(Shell.java:753)
        at org.apache.hadoop.yarn.server.nodemanager.DefaultContainerExecutor.launchContainer(DefaultContainerExecutor.java:211)
        at org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:302)
        at org.apache.hadoop.yarn.server.nodemanager.containermanager.launcher.ContainerLaunch.call(ContainerLaunch.java:82)


**Yarn logs**

    16/04/12 23:55:35 INFO mapreduce.TableInputFormatBase: Input split length: 977 M bytes.
16/04/12 23:55:41 INFO yarn.ApplicationMaster: Waiting for spark context initialization ...
16/04/12 23:55:51 INFO yarn.ApplicationMaster: Waiting for spark context initialization ...
16/04/12 23:56:01 INFO yarn.ApplicationMaster: Waiting for spark context initialization ...
16/04/12 23:56:11 INFO yarn.ApplicationMaster: Waiting for spark context initialization ...
16/04/12 23:56:11 INFO client.ConnectionManager$HConnectionImplementation: Closing zookeeper sessionid=0x152f0b4fc0e7488
16/04/12 23:56:11 INFO zookeeper.ZooKeeper: Session: 0x152f0b4fc0e7488 closed
16/04/12 23:56:11 INFO zookeeper.ClientCnxn: EventThread shut down
16/04/12 23:56:11 INFO executor.Executor: Finished task 0.0 in stage 1.0 (TID 2). 2003 bytes result sent to driver
16/04/12 23:56:11 INFO scheduler.TaskSetManager: Finished task 0.0 in stage 1.0 (TID 2) in 82134 ms on localhost (2/3)
16/04/12 23:56:17 INFO client.ConnectionManager$HConnectionImplementation: Closing zookeeper sessionid=0x4508c270df0980316/04/12 23:56:17 INFO zookeeper.ZooKeeper: Session: 0x4508c270df09803 closed *
...
    16/04/12 23:56:21 ERROR yarn.ApplicationMaster: SparkContext did not initialize after waiting for 100000 ms. Please check earlier log output for errors. Failing the application.
16/04/12 23:56:21 INFO yarn.ApplicationMaster: Final app status: FAILED, exitCode: 13, (reason: Timed out waiting for SparkContext.)
16/04/12 23:56:21 INFO spark.SparkContext: Invoking stop() from shutdown hook *

共有3个答案

柳轶

2023-03-14

我有完全相同的问题，但上面的答案不起作用。或者，当我使用spark submit--deploy模式客户端运行此程序时，一切正常。

杜鸿彩

2023-03-14

如果对某人有帮助

此错误的另一种可能性是当您错误地输入--class参数时

夏宪

2023-03-14

似乎您已将代码中的master设置为本地

SparkConf。setMaster（“本地[*]”）

您必须在代码中取消设置主控形状，然后在发布spark submit时进行设置

spark提交--主纱线客户端

类似资料：

nosuchmethoderror：在yarn集群上进行spark-submit时

我有一个spark应用程序在本地模式下正确运行。在yarn集群上运行spark-submit时，会出现以下错误：似乎找不到httpclient依赖项。这是我的构造你知道吗？
在yarn上运行Spark

配置大部分为Spark on YARN模式提供的配置与其它部署模式提供的配置相同。下面这些是为Spark on YARN模式提供的配置。 Spark属性 Property Name Default Meaning spark.yarn.applicationMaster.waitTries 10 ApplicationMaster等待Spark master的次数以及SparkContext初始
从远程客户端在Yarn集群上提交Spark作业

我被困在：在我得到这个之前：当我签出应用程序跟踪页面时，我在stderr上得到以下信息：我对这一切都很陌生，也许我的推理有缺陷，任何投入或建议都会有所帮助。
如何在10节点集群上运行Spark Sql

并编写下面的查询，它是只在我的master上运行，还是将所有10个节点都用作worker？如果不是，我必须做什么才能让我的Spark Sql使用完整的集群？
Zeppelin+Spark+Kubernetes:让Zeppelin作业在现有Spark集群上运行

在k8s集群中。如何配置zeppelin在现有spark集群中运行spark作业，而不是旋转一个新的Pod？我有一个k8s集群正在运行，我想在其中运行与齐柏林飞艇的火花。 Spark使用官方的Bitnami/Spark helm chart(v3.0.0)进行部署。我有一个主舱和两个工人舱运转良好，一切都很好。短伪DockerFile：我稍微修改了。（Image,imagePullSecre
Kubernetes集群上运行的Spark独立集群的Hadoop集群Kerberos身份验证

我已经在Kubernetes上建立了Spark独立集群，并试图连接到Kubernetes上没有的Kerberized Hadoop集群。我已经将core-site.xml和hdfs-site.xml放在Spark集群的容器中，并相应地设置了HADOOP_CONF_DIR。我能够成功地在Spark容器中为访问Hadoop集群的principal生成kerberos凭据缓存。但是当我运行spark-s

Spark在Yarn集群exitCode=13上运行：

共有3个答案

相关问答

相关文章

相关阅读

相关工具

相关文档