当前位置: 首页 > 知识库问答 >
问题:

未开始执行的任务

束雅达
2023-03-14
--num-executors 15 
--driver-memory 15G 
--executor-memory 7G 
--executor-cores 8 
--conf spark.yarn.executor.memoryOverhead=2G 
--conf spark.sql.shuffle.partitions=500 
--conf spark.sql.autoBroadcastJoinThreshold=-1 
--conf spark.executor.memoryOverhead=800

任务被卡住了,不启动代码是在一个270M的大数据集上执行带有筛选条件的交叉联接。对于大表270M和小表(100000),我已经将分区增加到16000个,我已经将其转换为广播变量

我已经为该作业添加了spark ui,

所以我必须减少分区,增加执行器,有什么想法吗

RM Home
NodeManager
Tools
Failed while trying to construct the redirect url to the log server. Log Server url may not be configured
java.lang.Exception: Unknown container. Container either has not started or has already completed or doesn't belong to this node at all.

[50per completed ui 1][4][50per completed ui 2][5][1]:https://i.stack.imgur.com/nqcys.png[2]:https://i.stack.imgur.com/s2vwl.png[3]:https://i.stack.imgur.com/81fun.png[4]:https://i.stack.imgur.com/h5mta.png[5]:https://i.stack.imgur.com/ydfkf.png

共有1个答案

江阳冰
2023-03-14

如果您能提到您的集群配置,那么这将是有帮助的。

但是由于您添加了1000的小表广播是可以工作的,但是100,000可能不是您需要调整您的内存配置。

根据您的配置,我假设您的内存总量为:15*7=105GB

 类似资料:
  • 示例: 对于文档: video1title=大海是蓝色的 video2title=狂野的大海 video3title=狂野的大海 video4title=海边随便什么 null null 现在,AFAIKS,没有真正的方法告诉Lucene“找到word1和word2等位于位置1和2和3等的文档。” 有一些“变通办法”可以模拟这种行为: > 对字段进行两次索引。在中,您将单词标记化(可能使用),在中

  • 我无法用PHPUnit解决测试问题。这是我的密码,有点问题。这是年度百分比计算(https://en.wikipedia.org/wiki/Annual_percentage_rate ). 在cmd中: 不要考虑Oracle模块,这是另一回事。我在“composer安装”之后运行了“phpunit”。 项目/测试/测试概述。php: 项目/phpunit.xml 我解决不了,试了很多次:(

  • 这是我的文件: 我已经尝试根据Github中的这个线程添加 自从我看到关于的消息后,我将此添加到我的中(通过各种google搜索): 如果有人对我如何调试这种情况有一些想法的话。

  • 我不断得到: debug.log 我的包文件如下: 我是npm的新手,当我第一次下载它时,我能够在我的本地服务器上毫无问题地启动它。 我想切换我的浏览器,这样做,突然npm start有一个问题。 我知道还有其他类似的问题,但没有一个能缓解我的问题。

  • 我用SpringBoot创建了一个简单的演示应用程序,其中包括执行器。带有@Scheduled注释的任务显示在执行器中,但以编程方式启动的任务不会显示。有没有办法让他们也出现? 我已经注释了@Enable调度。 我的组件如下所示: 执行器的结果仅显示带注释的任务:

  • 我正在尝试创建一个应用程序,用于查询cat图像的站点,如果JSON ID是唯一的,则将其保存到android设备,然后从设备以幻灯片格式显示它们。尽管如此,我的AsyncTask似乎并没有实际执行。调试器确认已建立网络连接,并且不会向我反馈任何错误,所以我不知道代码出了什么问题。希望有人能帮忙!代码如下: