当前位置: 首页 > 知识库问答 >
问题:

云原生 - 如何构建新型绿色算力?

麹鸿煊
2023-07-13

当前局势下,构建绿色算力面对那些挑战?如何对绿色算力进行统一纳管?如何对多元任务负载进行编排和调度?

共有1个答案

莘睿
2023-07-13

构建绿色新型算力云的主要挑战在于三点,它们相互关联。
图片
由于各个算力中心的烟囱式建设,算力资源管理处于割裂状态,往往不同的算力中心建设了各自的算力管理平台,如典型的超算平台、智算平台、通用的算力管理平台,因此建设算力的统一视图和算力的感知度量就很关键。
如何实现对以上几类异构算力进行统一纳管?
原先不同的算力中心资源管理建设方案不统一,存在物理机、虚拟化、容器化几种形式。有时候超算中心不一定做虚拟化,直接使用裸金属物理机以达到高性能运行业务诉求。如果是基于Kubernetes的业务,为提升部署密度,往往直接基于裸金属运行容器化业务,所以不同的算力应用场景对算力资源的管理建设方案也不一样,对于存量的、新建的算力中心,需要针对性地制定方案。
如何对多元任务负载进行编排和调度?
实际落地场景中,根据业务属性,有Long Running(一直运行)的业务,也有一次性的任务,而GPU训练的模型在第一次训练好之后,有时可能还需执行增量训练,这其中其实涉及大量的网络通信和数据交换。随着AI for Science的出现,超算与智算的融合已成为刚性需求,业务对于时延、敏感度、稳定性的诉求,对云网协同、资源调度、复杂业务编排等算力云的底层实力进一步提出了挑战。

 类似资料:
  • 构建新型算力云的技术难点与挑战有哪些,请从现状和未来趋势展开分析

  • 什么是绿色算力?核心特征是什么?当下在绿色算力中我们面临哪些挑战

  • 首先我们来阐述下将应用迁移到云原生架构的动机。 速度 天下武功,唯快不破,市场竞争亦是如此。想象一下,能够快速创新、实验并交付软件的企业,与使用传统软件交付模式的企业,谁将在市场竞争中胜出呢? 在传统企业中,为应用提供环境和部署新版本花费的时间通常以天、周或月来计算。这种速度严重限制了每个发行版可以承担的风险,因为修复这些错误往往跟发行一个新版本有差不多的耗时。 互联网公司经常提到它们每天几百次发

  • 现在我们将探索云原生应用架构的几个主要特征,和这些特征是如何解决我们前面提到的使用云原生应用架构的动机。 12因素应用 12因素应用是一系列云原生应用架构的模式集合,最初由Heroku提出。这些模式可以用来说明什么样的应用才是云原生应用。它们关注速度、安全、通过声明式配置扩展、可横向扩展的无状态/无共享进程以及部署环境的整体松耦合。如Cloud Foundry、Heroku和Amazon Elas

  • 我是一个很新的反应原生应用程序开发人员。请帮助我解决以下问题,我在执行react-native Run-Android时遇到以下问题。 运行jetifier将库迁移到AndroidX的信息。您可以使用“--no-jetifier”标志禁用它。Jetifier找到1112个文件要转发JEtify。使用8名工作人员...信息正在启动JS服务器...“adb”不能识别为内部或外部命令、可操作程序或批处理