当前位置: 首页 > 面试题库 >

Google合作实验室:误导有关其GPU的信息(某些用户只能使用5%的RAM)

郭乐湛
2023-03-14
问题内容

更新:此问题与Google Colab的“笔记本设置:硬件加速器:GPU”有关。在添加“ TPU”选项之前就写了这个问题。

阅读有关Google Colaboratory提供免费Tesla K80
GPU的多个激动人心的公告,我试图在它上运行fast.ai课程,以使其永远无法完成-
很快耗尽内存。我开始调查原因。

最重要的是,“免费的Tesla K80”并不是所有人都“免费”的,因为其中只有一小部分是“免费的”。

我从加拿大西海岸连接到Google Colab,我只能得到0.5GB的24GB GPU RAM。其他用户可以访问11GB的GPU RAM。

显然,对于大多数ML / DL工作而言,0.5GB GPU RAM是不够的。

如果您不确定自己能得到什么,这里是我凑在一起的一些调试功能(仅适用于笔记本的GPU设置):

# memory footprint support libraries/code
!ln -sf /opt/bin/nvidia-smi /usr/bin/nvidia-smi
!pip install gputil
!pip install psutil
!pip install humanize
import psutil
import humanize
import os
import GPUtil as GPU
GPUs = GPU.getGPUs()
# XXX: only one GPU on Colab and isn’t guaranteed
gpu = GPUs[0]
def printm():
 process = psutil.Process(os.getpid())
 print("Gen RAM Free: " + humanize.naturalsize( psutil.virtual_memory().available ), " | Proc size: " + humanize.naturalsize( process.memory_info().rss))
 print("GPU RAM Free: {0:.0f}MB | Used: {1:.0f}MB | Util {2:3.0f}% | Total {3:.0f}MB".format(gpu.memoryFree, gpu.memoryUsed, gpu.memoryUtil*100, gpu.memoryTotal))
printm()

在运行任何其他代码之前,先在jupyter笔记本中执行该命令即可:

Gen RAM Free: 11.6 GB  | Proc size: 666.0 MB
GPU RAM Free: 566MB | Used: 10873MB | Util  95% | Total 11439MB

有权使用全卡的幸运用户将看到:

Gen RAM Free: 11.6 GB  | Proc size: 666.0 MB
GPU RAM Free: 11439MB | Used: 0MB | Util  0% | Total 11439MB

您从GPUtil借用的GPU RAM可用性计算中是否发现任何缺陷?

如果您在Google Colab笔记本上运行此代码,是否可以确认得到类似的结果?

如果我的计算是正确的,有什么办法可以在免费版中获取更多的GPU RAM?

更新:我不确定为什么我们中的某些人会得到其他用户的1/20。例如,帮助我调试此问题的人来自印度,他得到了全部!

注意
:关于如何杀死可能消耗GPU一部分的潜在卡住/失控/平行笔记本,请不要发送任何其他建议。无论如何切片,如果您和我在同一条船上并且要运行调试代码,您都会看到您仍然获得了5%的GPU
RAM(截至本次更新)。


问题答案:

因此,为防止在此线程对!kill -9 -1的建议的上下文中再有十几个答案提示无效,让我们关闭此线程:

答案很简单:

在撰写本文时,Google仅向我们中的某些人提供了5%的GPU,而其他人仅提供了100%的GPU。 期。

2019年12月更新:问题仍然存在-该问题的投票仍然继续。

2019年3月更新:一年后,一位Google员工@AmiF对事情的状态进行了评论,指出该问题不存在,任何似乎有此问题的人都需要简单地重置其运行时来恢复内存。但是,支持仍在继续,这对我来说,尽管@AmiF提出了相反的建议,但问题仍然存在。

2018年12月更新:我有一种理论认为,当Google的机器人检测到非标准行为时,它可能会将某些帐户或浏览器指纹列入黑名单。这可能完全是巧合,但是一段时间以来,我碰巧在任何需要它的网站上都遇到了Google
Re-
captcha的问题,在该情况下,我通常必须经过数十个难题才能被允许通过花了我10多分钟才能完成。这持续了好几个月。截至本月突然,我一点都没有困惑,而且任何Google
re-captcha都只需单击一下鼠标就可以解决,就像过去大约一年前一样。

为什么我要讲这个故事?好吧,因为 同时我在Colab上获得了100%的GPU RAM
。这就是为什么我怀疑的是,如果您处于理论上的Google黑名单中,那么您将不会获得免费提供大量资源的信任。我想知道你们中是否有人在有限的GPU访问与Re-
captcha噩梦之间找到相同的关联。正如我所说,这也可能完全是巧合。



 类似资料:
  • 是否可以只合并一些列?我有一个数据帧df1和列x、y、z,df2和列x、a、b、c、d、e、f等等。 我想合并x上的两个数据帧,但我只想合并df2. a、df2.b列——而不是整个数据帧。 结果将是一个包含x、y、z、a、b的数据帧。 我可以合并然后删除不需要的列,但似乎有更好的方法。

  • 3.3.1. 文档 3.3.1.1. 安装手册 这些文档以纯文本、HTML 或者 PDF 格式发布。 install.en.txt install.en.html install.en.pdf 3.3.1.2. 硬件文档 通常包含设置和使用您硬件的有用信息。 Linux 硬件兼容性指南 3.3.2. 提供硬件信息的资源 许多情况下,安装程序能自动检测您的硬件。 但作为预备,我们建议您还是在安装之前

  • 3.3.1.1. 安装手册 这些文档以纯文本、HTML 或者 PDF 格式发布。 install.zh_CN.txt install.zh_CN.html install.zh_CN.pdf 3.3.1.2. 硬件文档 通常包含设置和使用您硬件的有用信息。 3.3.2. 提供硬件信息的资源 许多情况下,安装程序能自动检测您的硬件。 但作为预备,我们建议您还是在安装之前熟悉一下您的硬件比较好。 获取

  • 3.3.1. 文档 3.3.1.1. 安装手册 这些文档以纯文本、HTML 或者 PDF 格式发布。 install.zh_CN.txt install.zh_CN.html install.zh_CN.pdf 3.3.1.2. 硬件文档 通常包含设置和使用您硬件的有用信息。 3.3.2. 提供硬件信息的资源 许多情况下,安装程序能自动检测您的硬件。 但作为预备,我们建议您还是在安装之前熟悉一下您

  • 本文向大家介绍使用纯css能否监控到用户的一些信息?怎么实现?相关面试题,主要包含被问及使用纯css能否监控到用户的一些信息?怎么实现?时的应答技巧和注意事项,需要的朋友参考一下 可以,著名的css keylogger: 当用户输入密码时,这段css会请求用户输入的字符对应的资源,远端服务器通过监视请求资源的顺序从而推断用户的密码。所以css也不是绝对安全的