当前位置: 首页 > 面试题库 >

使用Slurm工作ID

公西凯捷
2023-03-14
问题内容

当我在集群上启动计算时,通常我有一个单独的程序在最后进行后处理:

sbatch simulation
sbatch --dependency=afterok:JOBIDHERE postprocessing

我想避免输入错误,并自动插入良好的工作ID。任何的想法?谢谢


问题答案:

您可以执行以下操作:

RES=$(sbatch simulation) && sbatch --dependency=afterok:${RES##* } postprocessing

RES变量将保存sbatch命令的结果,例如Submitted batch job 102045。该构造${RES##* }隔离了最后一个单词(请参阅此处的更多信息),在当前情况下为作业ID。该&&部分可确保您不会在第一次提交失败的情况下不尝试提交第二份工作。



 类似资料:
  • SLURM (A Highly Scalable Resource Manager)是 “具备高可伸缩性的资源管理程序”。它是一种为所有规模的 Linux 集群设计的开放源码资源管理程序,提供三种关键功能 —— 分配对资源的排他和/或非排他访问;提供一个用于在分配的节点集上启动、执行和监视工作的框架;通过管理一个未完成工作队列来解决对资源的争用。 slurm 最初是给FreeBSD的做端口状态监视

  • Docker 是现今十分热门的容器引擎,可以让你轻松地打包、部署和使用应用程序以及服务。无论你是一个经验丰富的Docker开发者还是刚刚开始学习它,Visual Studio Code都可以让你轻松地创造Dockerfile和docker-compose.yml两个文件到你的开发目录中。 安装Docker扩展插件 VS Code通过插件的方式支持Docker的使用。安装这一扩展插件,只需要按下kb

  • 所以我现在花了几个小时试图解决这个问题,并希望得到任何帮助。

  • 问题内容: 我想在Ubuntu 16.04上模拟SLURM。我不需要认真的资源管理,我只想测试一些简单的例子。我无法以通常的方式安装SLURM,我想知道是否还有其他选项。我尝试过的其他方法: 一个docker形象。不幸的是,给我错误: /usr/lib/python2.6/site- packages/supervisor/options.py:295:UserWarning:Supervisor

  • 我一直坚持使用MPI将多个文件划分到多个节点的方法。 方法1 假设我有5个文件和5个节点,所有文件都存在于一个节点上。现在,是否有任何方法可以引导节点在不发送或接收任何数据的情况下读取所需的文件 例如, 文件1- 方法2 我的另一种方法是读取节点1上的所有文件,然后开始向节点2、3、4和5发送数据。 请让我知道,如果有任何其他好的方法,我应该遵循<提前谢谢。

  • 我的应用程序后端使用Spring Boot,前端使用Angular JS。 我使用Thymeleaf来支持多语言。Thymeleaf要求将所有html文件放在名为templates的文件夹下。 在前端,我使用angular的routeProvider重定向页面。代码如下: 在java端,我的WebConfig中有一些ViewController代码。JAVA 登录页面可以工作,但对于仪表板,Ang