当前位置: 首页 > 面试题库 >

在Ubuntu 16.04上模拟SLURM

桑成荫
2023-03-14
问题内容

我想在Ubuntu
16.04上模拟SLURM。我不需要认真的资源管理,我只想测试一些简单的例子。我无法以通常的方式安装SLURM,我想知道是否还有其他选项。我尝试过的其他方法:

  • 一个docker形象。不幸的是,docker pull agaveapi/slurm; docker run agaveapi/slurm给我错误:

/usr/lib/python2.6/site-
packages/supervisor/options.py:295:UserWarning:Supervisord以root身份运行,并且正在默认位置(包括其当前工作目录)中搜索其配置文件;您可能需要指定一个“
-c”参数,该html" target="_blank">参数指定配置文件的绝对路径以提高安全性。’Supervisord以root身份运行并且正在搜索‘2017-10-29 15:27:45,436
CRIT Supervisor以root身份运行(配置文件中没有用户)2017-10-29 15:27:45,437 INFO以pid 1
2017开始受监管-10-29 15:27:46,439生成的INFO:带有pid 9的’slurmd‘2017-10-29 15:27:46,441
INFO生成的:’sshd’与pid 10 2017-10-29 15:27:46,443 INFO生成的:带有pid
11的’munge‘2017-10-29 15:27:46,443信息生成::带有pid 12的’slurmctld‘2017-10-29
15:27:46,452 INFO退出:

  • 本指南通过Vagrant启动SLURM VM。我尝试过,但是复制munge密钥超时。

sudo scp /etc/munge/munge.key vagrant @ server:/ home / vagrant /
ssh:连接到主机服务器端口22:连接超时失去连接


问题答案:

所以…我们这里有一个现有群集,但是它运行的是较旧的Ubuntu版本,无法与运行17.04的我的工作站配合良好。

因此,在我的工作站上,我只是确保安装了slurmctld(后端)并slurmd安装了一个小工具slurm.conf

ControlMachine=mybox
# ...
NodeName=DEFAULT CPUs=4 RealMemory=4000 TmpDisk=50000 State=UNKNOWN
NodeName=mybox CPUs=4 RealMemory=16000

之后我重新启动slurmcltd然后slurmd。现在一切都很好:

root@mybox:/etc/slurm-llnl$ sinfo
PARTITION AVAIL  TIMELIMIT  NODES  STATE NODELIST
demo         up   infinite      1   idle mybox
root@mybox:/etc/slurm-llnl$

这是一个简并的设置,我们真正的设置包含开发和生产机器以及适当的分区的混合。但这应该回答您的“可以后端真正成为客户”的问题。另外,我的机器并不是真正被调用,mybox但在任何情况下都与该问题无关。

使用Ubuntu 17.04,所有库存都可以munge进行通信(无论如何都是默认的)。

编辑 :智慧:

me@mybox:~$ COLUMNS=90 dpkg -l '*slurm*' | grep ^ii
ii  slurm-client     16.05.9-1ubun amd64         SLURM client side commands
ii  slurm-wlm-basic- 16.05.9-1ubun amd64         SLURM basic plugins
ii  slurmctld        16.05.9-1ubun amd64         SLURM central management daemon
ii  slurmd           16.05.9-1ubun amd64         SLURM compute node daemon
me@mybox:~$


 类似资料:
  • 问题内容: 我正在开发一个Web应用程序,该应用程序显然在iOS设备中存在问题。问题是我不拥有iOS设备,而是在Linux Ubuntu中进行开发。我正在寻找一种在Linux(尤其是浏览器)中仿真/模拟此OS的方法,但是还没有找到任何东西。 到目前为止,我发现的是iOS SDK的Simulator,但这是针对Mac的。还有一些Windows模拟器。有人做过吗? 问题答案: 我能想到的唯一解决方案是

  • 问题内容: 背景 我想在Jenkins上的不同模拟器上运行我的Android Instrumented测试。假设我有100个测试和4个仿真器,我想在每个仿真器上运行25个测试。 我在Jenkins Pipeline的并行处理中为4个模拟器执行 会产生其他命令,以便为运行已测试的测试设置环境。 当环境准备就绪时,它将执行,这将开始在模拟器上运行测试。 我不想对所有并行调用都运行这些过程(在这种情况下

  • 我想在地图上画一条折线 进口com.google.android.gms.maps.model.Polyline;进口com.google.android.gms.maps.model.PolylineOptions; 导入java.util。ArrayList;导入java.util.List; 公共类 MainActivity extends AppCompatActivity 实现了 OnM

  • 所以我想做一些事情 但我得到了空异常

  • 问题内容: 我正在尝试在开发GAE服务器上模拟HTTPServletRequest数据。我正在运行Eclipse插件1.3.7 我试图做到这一点: 运行以下命令会产生异常: java.lang.NoClassDefFoundError:sun.reflect.ReflectionFactory是一个受限类。有关更多详细信息,请参阅Google App Engine开发人员指南。 关于如何在GAE开