当前位置：首页 > 软件库 > 神经网络/人工智能 > 机器学习/深度学习 >

DeepSpeed

基于 PyTorch 的深度学习优化库

授权协议 MIT

开发语言 Python

所属分类神经网络/人工智能、机器学习/深度学习

软件类型开源软件

地区不详

投递者怀经赋

操作系统跨平台

开源组织微软

适用人群未知

软件概览

DeepSpeed 是一个深度学习优化库，它可以使分布式训练变得容易、高效和有效。

10x 更大的模型
5x 更快地训练
最小的代码更改

DeepSpeed 可以在当前一代的 GPU 集群上训练具有超过千亿个参数的 DL 模型，而与最新技术相比，其系统性能可以提高 5 倍以上。DeepSpeed 的早期采用者已经生产出一种语言模型（LM， Language Model），它具有超过 170 亿个参数，称为 Turing-NLG（Turing Natural Language Generation，图灵自然语言生成），成为 LM 类别中的新 SOTA。

DeepSpeed API 是在 PyTorch 上进行的轻量级封装，这意味着开发者可以使用 PyTorch 中的一切，而无需学习新平台。此外，DeepSpeed 管理着所有样板化的 SOTA 训练技术，例如分布式训练、混合精度、梯度累积和检查点，开发者可以专注于模型开发。同时，开发者仅需对 PyTorch 模型进行几行代码的更改，就可以利用 DeepSpeed 独特的效率和效益优势来提高速度和规模。

使用案例

DeepSpeed系列 -- 1 - 初识DeepSpeed

本文为DeepSpeed的入门介绍，通过以下维度帮助各位看官了解什么是DeepSpeed: What: DeepSpeed是什么？ Why: DeepSpeed解决了什么痛点？ How: DeepSpeed是怎么解决这个痛点问题的？（这个下周更）近年来机器学习一直是一个很热门的话题，它在视觉，自然语言，语音等领域突不断突破，达到新的高度。之所以有不断有新的成果涌现，我理解大厂们开源的机器学习框
[论文笔记] chatgpt系列 2.1 DeepSpeed-chat 简介

DeepSpeedExamples/applications/DeepSpeed-Chat at master · microsoft/DeepSpeedExamples · GitHub �� DeepSpeed-Chat:简单，快速和负担得起的RLHF训练的类chatgpt模型 �� 一个快速、经济、可扩展和开放的系统框架，用于实现端到端的强化学习人类反馈(RLHF)训练体验，以在所有尺度上生
Megatron-Deepspeed 预训练 GPT-小白踩坑与解决

Megatron-Deepspeed 预训练 GPT-小白踩坑与解决记录在使用 megatron deepspeed 训练大模型 gpt 时，遇到的坑 1. 成功运行的最终步骤 1.1 配置分布式环境： 1.1.1 硬件配置： 3090 单机四卡 root@xxxx:/workspace# nvidia-smi -L GPU 0: NVIDIA GeForce RTX 3090 (UUID: G
DeepSpeed 搭建碰到的问题

Windows 系统来做一些前沿开发，估计连微软自家的孩子们也都鄙视，在Win 11下搭建Deepspeed 环境，遇到 PS C:\WINDOWS\system32> pip install deepspeed Collecting deepspeed Downloading deepspeed-0.9.0.tar.gz (764 kB) --------------------
【自然语言处理】【分布式训练及推理】推理工具DeepSpeed-Inference

相关博客【深度学习】【分布式训练】Collective通信操作及Pytorch示例【自然语言处理】【分布式训练及推理】推理工具DeepSpeed-Inference 【自然语言处理】【chatGPT系列】大语言模型可以自我改进【自然语言处理】【ChatGPT系列】WebGPT：基于人类反馈的浏览器辅助问答【自然语言处理】【ChatGPT系列】FLAN：微调语言模型是Zero-Shot学习器
使用 DeepSpeed 和 Accelerate 进行超快 BLOOM 模型推理

本文展示了如何使用 1760 亿 (176B) 参数的 BLOOM 模型[1] 生成文本时如何获得超快的词吞吐 (per token throughput)。因为在使用 bf16 (bfloat16) 权重时该模型内存占用为 352 GB (176*2)，所以最高效的硬件配置是使用 8x80GB 的 A100 GPU。也可使用 2x8x40GB 的 A100 或者 2x8x48GB 的 A600
DeepSpeed 安装

虚拟环境Python版本建议安装3.8版本首先克隆github中的DeepSpeed文件 git clone https://github.com/microsoft/DeepSpeed.git 文件下载完毕后进入DeepSpeed文件夹 cd DeepSpeed 进入DeepSpeed文件夹后 ./install.sh 耐心等待安装结束。安装完成之后输入 ds_report 如果全部的都显
DeepSpeed在docker容器内实现多机多卡

多台docker宿主机网络配置 https://docs.docker.com/network/overlay/ 这里需要创建overlay网络是多台宿主机的容器可以通过网络连接创建集群 docker swarm init 另一台机器加入集群 docker swarm join --token SWMTKN-1-1nnq6klpq7z93lqmshd4rqvk44x1qyyen4wacuei1

DeepSpeed

同类工具

相关阅读

相关文章

相关问答

相关文档