当前位置: 首页 > 知识库问答 >
问题:

使用TensorFlow训练图像时使用GPU错误

商宏爽
2023-03-14

当我在容器tensorflow/tensorflow:LastGPU中运行tensorflow映像训练作业时,它不工作。

错误消息:

Cannot assign a device for operation InceptionV3/InceptionV3/Conv2d_1a_3x3/Conv2D: Operation was explicitly assigned to /device:GPU:0 but available devices are [ /job:localhost/replica:0/task:0/device:CPU:0, /job:localhost/replica:0/task:0/device:XLA_CPU:0, /job:localhost/replica:0/task:0/device:XLA_GPU:0 ]. Make sure the device specification refers to a valid device.
[[node InceptionV3/InceptionV3/Conv2d_1a_3x3/Conv2D (defined at /usr/local/lib/python2.7/dist-packages/tensorflow/contrib/layers/python/layers/layers.py:1057)  = Conv2D[T=DT_FLOAT, data_format="NHWC", dilations=[1, 1, 1, 1], padding="VALID", strides=[1, 2, 2, 1], use_cudnn_on_gpu=true, _device="/device:GPU:0"](fifo_queue_Dequeue, InceptionV3/Conv2d_1a_3x3/weights/read)]]

GPU info: nvidia-smi周一11月26 07:48:59 2018
----------------------------------------------------------------------------- | NVIDIA-SMI 410.72驱动版本: 410.72 CUDA版本: 10.0 | |------------------------------- ---------------------- ---------------------- | GPU名称持久性-M|Bus-Id Disp.A|Volatile Uncorr.ECC||风扇温度性能Pwr:用法/上限|内存-用法|GPU-Util Compute M. | |=============================== ====================== ======================| | 0 GeForce GT 630 off|00000000:01:00.0N/A|N/A|25%47C P0 N/A/N/A|0MiB/1998MiB|N/A默认 | ------------------------------- ---------------------- ----------------------

-----------------------------------------------------------------------------|进程:GPU内存| GPU PID类型进程名称用法| |===============================================================================================================================================================================================================不支持0-----------------------------------------------------------------------------

共有1个答案

谭奕
2023-03-14

看起来Tensorflow没有检测到任何可用的gpu,而是将操作映射到gpu:0。首先,尝试以下方法:

from tensorflow.python.client import device_lib
print(device_lib.list_local_devices())

您将获得可用的设备。是否存在/设备:GPU:0

 类似资料:
  • 问题内容: 我是TensorFlow的新手。我正在寻找有关图像识别的帮助,可以在其中 训练自己的图像 数据集。 有没有训练新数据集的示例? 问题答案: 如果您对如何在TensorFlow中输入自己的数据感兴趣,可以查看本教程。 我也写与CS230的最佳做法指南在斯坦福这里。 新答案(带有)和带有标签 随着in的引入,我们可以创建一批没有占位符且没有队列的图像。步骤如下: 创建一个包含图像文件名的列

  • 我正在尝试创建和训练一个CNN模型。但每次我运行代码时,tensorflow并没有使用GPU,而是使用CPU。我已经安装了tensorflow的最新版本。附上以下详细信息。 在运行时,我得到以下带有警告消息的输出。(平台:VS代码) 2021-07-28 15:35:13.163991: W tenstorflow/core/common_runtime/bfc_allocator.cc:337]

  • 本文向大家介绍如何使用Tensorflow训练'Word2Vec'算法?,包括了如何使用Tensorflow训练'Word2Vec'算法?的使用技巧和注意事项,需要的朋友参考一下 Tensorflow是Google提供的一种机器学习框架。它是一个开放源代码框架,与Python结合使用以实现算法,深度学习应用程序等等。它用于研究和生产目的。它具有优化技术,可帮助快速执行复杂的数学运算。 这是因为它使

  • 问题内容: 我一直在尝试使用Google发布的经过预先训练的inception_resnet_v2模型。我正在使用他们的模型定义(https://github.com/tensorflow/models/blob/master/slim/nets/inception_resnet_v2.py)和给定的检查点(http://download.tensorflow.org/models/incepti

  • 我目前正在尝试训练一个聊天机器人,更具体地说是这个。但是,当我开始训练聊天机器人时,它使用了我100%的CPU和大约10%的GPU。有人知道为什么吗。 我已经安装了,并确保我有正确的CUDA和cuDNN版本。我还确保我没有安装基本的pip包。我的GPU也有最新的英伟达驱动程序。我也尝试过卸载和重新安装我所有的驱动程序,CUDA,cuDNN,tensorflow gpu和它所有的依赖和python本

  • 我在我的Ubuntu 19.04笔记本电脑上使用设置了TensorFlow。所有依赖项,如CUDA,CUDNN都安装并工作。但是,当导入TensorFlow并检查给我False。我尝试过完全卸载和重新安装TensorFlow,这不起作用。输出: 2019-06-27 14:06:18.359739: I tenstorflow/core/平台/cpu_feature_guard.cc:142]您的