当前位置：首页 > 软件库 > 神经网络/人工智能 > 机器学习/深度学习 >

Horovod

TensorFlow 分布式深度学习框架

授权协议 Apache

开发语言 C/C++ Python

所属分类神经网络/人工智能、机器学习/深度学习

软件类型开源软件

地区不详

投递者汪博艺

操作系统跨平台

开源组织 Uber

适用人群未知

软件官网

软件文档

官方下载

软件概览

Horovod 是 Uber 开源的针对 TensorFlow 的分布式深度学习框架，旨在使分布式深度学习更快速，更易于使用。

Horovod 吸取了 Facebook 的 Training ImageNet in 1 Hour（一小时训练 ImageNet）论文与百度 Ring Allreduce 的优点，为用户实现分布式训练提供帮助。该项目主要是想能够轻松采用单个 GPU TensorFlow 程序，同时也能更快地在多个 GPU 上成功地对其进行训练。使用 Horovod 我们可以不需要再去担心或学习很多东西，如 tf.Server（）、tf.ClusterSpec（）、tf.train.SyncReplicasOptimizer（）、tf.train.replicas_device_setter（）等等。

除了易于使用，Horovod 的速度也很快。下图为 Inception V3 和 ResNet-101 TensorFlow 模型在 25GbE TCP 上使用不同数量的 NVIDIA Pascal GPU 时，使用标准分布式 TensorFlow 和 Horovod 运行分布式训练工作每秒处理的图像数量对比。

使用案例

Horovod介绍

Horovod介绍并行训练介绍按照并行方式，分布式训练一般分为数据并行和模型并行两种，当然也有数据并行和模型并行的混合模式。模型并行：分布式系统中的不同 GPU 负责网络模型的不同部分。例如，神经网络模型的不同网络层被分配到不同的 GPU，或者同一层内部的不同参数被分配到不同 GPU；数据并行：不同的 GPU 有同一个模型的多个副本，每个 GPU 分配到不同的数据，然后将所有 GPU 的计
horovod安装

linux: pip install horovod pip install horovod --no-cache-dir HOROVOD_WITH_MXNET=1 pip install horovod[mxnet] HOROVOD_WITH_MXNET=1 pip install horovod[mxnet]==0.19 --no-cache-dir 下载自己安装： https://p
在Linux服务器上安装horovod安装

一、默认已经安装有CUDA环境在安装之前一定要在官网上面看一看，因为每个人的环境有差异，没有百分一百的成功，根据官网安装教程先进行操作看看官网连接如下： https：//github.com/horovod/horovod%23install 二、非root账户编译安装NCCL 1.从github上将nccl克隆到本地 git clone https://github.com/NVIDIA/n
ubuntu 18.04安装horovod

今天在跑spellGCN的时候发现需要安装horovod，但是安装过程并不是很顺利，我这里分享一下我安装成功的方法：我的报错日志为： File "/home/../anaconda3/envs/ctc/lib/python3.6/site-packages/horovod/tensorflow/__init__.py", line 25, in <module> check_exten
Horovod

Horovod是一个支持TensorFlow、Keras、PyTorch和Apache MXNet的分布式训练框架。参考链接： https://github.com/horovod/horovod 转载于:https://www.cnblogs.com/yangwenhuan/p/11165168.html

Horovod

同类工具

相关阅读

相关文章

相关问答

相关文档