Omnia

管理 HPC 和 AI 工作负载的工具
授权协议 Apache-2.0
开发语言 SHELL
所属分类 服务器软件、 集群/负载均衡
软件类型 开源软件
地区 不详
投 递 者 钮实
操作系统 Linux
开源组织
适用人群 未知
 软件概览

Omnia 由戴尔 HPC、英特尔和亚利桑那州立大学联合开发,能够让客户更容易管理高性能计算、人工智能和数据分析工作负载。

Omnia 可以自动下载和安装开源软件,如集群管理、应用程序执行、加速器驱动程序、框架、应用程序和平台,在运行基于 RPM 的 Linux 操作系统的服务器上基于 Ansible playbook 部署 Slurm 和 Kubernetes

Omnia 将从以下来源安装软件,其中包括:

软件与硬件要求:

  • 管理节点上安装的操作系统:CentOS 7.9 2009;
  • Omnia 在裸机服务器上部署的操作系统:CentOS 7.9 2009 Minimal Edition;
  • Cobbler:2.8.5;
  • Ansible AWX:15.0.0;
  • Slurm 工作负载管理器:20.11.2;
  • Kubernetes 控制器:1.16.7;
  • Kubeflow:1;
  • Prometheus:2.23.0;
  • 支持的 PowerEdge servers:R640, R740, R7525, C4140, DSS8440, and C6420;
 相关资料
  • 我试图在Composer 2环境中运行GKEStartPodOperator/KubernetesPodOperator任务,该环境在自动驾驶模式下使用GKE集群。我们有一个现有的Composer 1环境,GKE集群不处于自动驾驶模式。我们使用谷歌云平台服务(BigQuery、GCS等)进行身份验证的任务在Composer 2环境中失败,但在Composer 1环境中成功。 在日志文件中,我可以看

  • Google docu表示,工作负载标识可以用来授权GKE POD使用Google API提供的服务(而且效果很好)。它还表示,将有一个自动创建的标识池,名为PROJECT\u ID.svc。id.goog。 关于工作负载标识联合的Docu说:“您可以使用工作负载标识池来组织和管理外部标识。” 在我按照这里所述配置了工作负载标识(并且工作正常)之后,我正在尝试检索项目中现有的工作负载标识池,我希望

  • 工作管理指的是在单个登录终端(也就是登录的 Shell 界面)同时管理多个工作的行为。也就是说,我们登陆了一个终端,已经在执行一个操作,那么是否可以在不关闭当前操作的情况下执行其他操作呢? 当然可以,我们可以再启动一个终端,然后执行其他的操作。不过,是否可以在一个终端执行不同的操作呢?这就需要通过工作管理来实现了。 例如,我在当前终端正在 vi 一个文件,在不停止 vi 的情况下,如果我想在同一个

  • 我正在制作一个食谱盒应用程序,我决定从我的和方法开始。我能够把它拉出来,但是现在我想做一个对象数组(对象包含标题和描述),然后我将通过这个数组映射并显示数据。 但是我的函数没有按我想要的方式工作。我希望用户能够编写多个标题和描述,这些标题和描述将不断添加到该州的recipes数组中。看看代码:

  • To have people successfully develop or use your package, you need to ensure that all the necessary files are checked into your source control system. Required Files The following files must be checked

  • 我正在使用HazelCast的这个示例,其中管理中心在 但是当我访问< code > http://localhost:9090/mancenter 时,我得到< code >加载资源失败:net::ERR _ CONNECTION _ rejected

  • 概览 我们用docker run指令来运行一个容器: 交互容器跑在前端. 守护进程跑在后台. 一些常用管理容器的命令: docker ps - 列出容器. docker logs - 输出容器日志. docker stop - 停止运行容器. Docker客户端非常简单,你只需要需要输入一些带有一系列参数的指令就可以: # Usage: [sudo] docker [command] [flag

  • 16.2 工作管理 (job control) 这个工作管理 (job control) 是用在 bash 环境下的,也就是说:“当我们登陆系统取得 bash shell 之后,在单一终端机接口下同时进行多个工作的行为管理 ”。举例来说,我们在登陆 bash 后, 想要一边复制文件、一边进行数据搜寻、一边进行编译,还可以一边进行 vim 程序撰写! 当然我们可以重复登陆那六个命令行的终端机环境中,