当前位置: 首页 > 软件库 > 神经网络/人工智能 > >

TensorFlowOnSpark

TensorFlow 结合 Apache Spark
授权协议 Apache
开发语言 Python
所属分类 神经网络/人工智能
软件类型 开源软件
地区 不详
投 递 者 宰父嘉胜
操作系统 跨平台
开源组织 Yahoo
适用人群 未知
 软件概览

TensorFlowOnSpark 将 TensorFlow 带到 Apache Spark 集群上,由 Yahoo 开源。

TensorFlowOnSpark 为 Apache Hadoop 和 Apache Spark 集群带来可扩展的深度学习。 通过结合深入学习框架 TensorFlow 和大数据框架 Apache Spark 、Apache Hadoop 的显着特征,TensorFlowOnSpark 能够在 GPU 和 CPU 服务器集群上实现分布式深度学习。

TensorFlowOnSpark 支持对 Apache Spark 集群进行分布式 TensorFlow 训练和推断。它试图最小化在共享网格上运行现有 TensorFlow 程序所需的代码更改量。 它的 Spark 兼容 API 通过以下步骤来管理 TensorFlow 集群:

  1. 预留 - 为每个执行程序保留 TensorFlow 进程的端口,并启动数据/控制消息的侦听器。

  2. 启动 - 在执行器上启动 Tensorflow 主函数。

  3. 数据摄取

    1. Readers & QueueRunners - 利用 TensorFlow 的 Reader 机制直接从 HDFS 读取数据文件。

    2. Feeding - 使用 feed_dict 机制将 Spark RDD 数据发送到 TensorFlow 节点。 请注意,需利用 Hadoop 输入/输出格式访问 HDFS 上的 TFRecords。

  4. 关闭 - 关闭执行器上的 Tensorflow 工作线程和 PS 节点。

  • 1.介绍 TensorFlowOnSpark 为 Apache Hadoop 和 Apache Spark 集群带来可扩展的深度学习。 通过结合深入学习框架 TensorFlow 和大数据框架 Apache Spark 、Apache Hadoop 的显着特征,TensorFlowOnSpark 能够在 GPU 和 CPU 服务器集群上实现分布式深度学习。 2.为了满足什么应用场景 为了利用Ten

  • TensorFlowOnSpark运行demo 导读:记录正常运行tensorflowOnSpark的数据转换、模型训练、模型inference的流程,只看官方的文档很难成功运行。主页:https://github.com/yahoo/TensorFlowOnSpark 环境: Spark 2.4.5 Hadoop 3.2.1 Tensorflow 2.1.0 TensorflowOnSpark

  • 点击下面链接阅读原文: TensorFlowOnSpark 初体验

  • Hadoop生态大数据系统分为Yam、 HDFS、MapReduce计算框架。TensorFlow分布式相当于MapReduce计算框架,Kubernetes相当于Yam调度系统。TensorFlowOnSpark,利用远程直接内存访问(Remote Direct Memory Access,RDMA)解决存储功能和调度,实现深度学习和大数据融合。TensorFlowOnSpark(TFoS),雅

  • 搭建请参考上一篇文章。 1.广播环境变量,指定Python的路径 export PYTHON_ROOT=/data/Python export PYSPARK_PYTHON=${PYTHON_ROOT}/bin/python export SPARK_YARN_USER_ENV=”PYSPARK_PYTHON=Python/bin/python” 2.提交具体任务 遇到权限问题是普遍现象,层层排查

 相关资料
  • 单机安装部署(CentOS 6.7 环境) 先安装 FastDFS 软件准备: 我这边统一提供了一个压缩包,方便使用。 下载地址:http://pan.baidu.com/s/1hsg2brA 安装依赖包:yum install -y gcc gcc-c++ pcre pcre-devel zlib zlib-devel openssl openssl-devel libevent 安装 libf

  • 在 Solidity 中,合约类似于面向对象编程语言中的类。 每个合约中可以包含 状态变量、 函数、 函数修饰器、事件、 结构类型、 和 枚举类型 的声明,且合约可以从其他合约继承。 状态变量 状态变量是永久地存储在合约存储中的值。 pragma solidity ^0.4.0; contract SimpleStorage { uint storedData; // 状态变量

  • 问题内容: 我想在CSS(或任何其他伪选择器)中结合使用。我基本上有一个列表,并且该类的项目具有使用施加的箭头形状。我希望对悬停的对象也是如此,但不能完全使其正常工作。继承人代码 问题答案: 只需以与选择器相同的方式将其追加到选择器即可:

  • 问题内容: 假设我有三个 C 静态库,它们说 libColor.a 取决于 libRGB。 a,而后者又取决于 libPixel.a 。据说库 libColor.a 依赖于库 libRGB.a, 因为 libColor.a中 有对 libRGB.a 中定义的某些符号的 引用 。如何将上述所有库合并到独立的新 libNewColor.a ? 独立意味着新库应已定义所有符号。因此,在链接时,我只需要给

  • 问题内容: 我目前的构建数量至少为10,因此我必须使用该库来实现。我已经设置了,但是我现在要添加一个,但是这需要扩展我的类,Java没有多个。我该怎么办? 问题答案: ListActivity尚未移植到AppCompat。可能是因为您应该认为它“已弃用”,而改用ListFragment。 片段将与ActionBarActivity一起使用,只需确保它们是支持库中的片段即可。 要通过读这大约片段的链

  • 问题内容: 我正在使用CodeIgniter编写的现有站点上工作,我们正在考虑将AngularJS用于需要大量前端功能的某些页面,但我们不想替换所有CodeIgniter视图(一次(尚未))。 因此,我单击了由angular的路由器控制的链接,该链接由javascript处理,但下一个链接可能是应由CodeIgniter框架处理的“正常”请求。 有两种结合这两种方法的优雅方法吗?我真的不介意一些额

  • 我可以将以下插件组合在一起还是存在任何不兼容之处?如何测试插件是否协同工作良好?

  • 你知道是否可以用PDFBox填写PDF格式的表格吗?如果是的话,是否有代码示例或教程来实现这一点?若否,有何最佳选择可达致这个目标?