cuda_error_out_of_memory(out of memory怎么办)

2023-04-28 13:10:53

大家好，又见面了，我是你们的朋友全栈君。

【说在前面】

复杂的机器学习程序，特别是已经训练好跑的时候出的问题，不是说改CUDA就能改的。因为很多参数已经在另一个gpu里面了，单纯改一个test的代码是不够的。

如果是上述情况，只有查运行情况了，看看到底是什么程序占用了那么那么多的内存，可以的话kill掉就行。

报错如下

简洁明了，他已经告诉你了，默认使用的那gpu内存不足。

在操作系统输入如下，查一下memory现在的状态：

nvidia-smi

复制

害，发现GPU-0有一个进程正在执行导致1GB剩余都不够。

我们用GPU-1执行就行啦！

python文件中：

import os

复制

os.environ["CUDA_VISIBLE_DEVICES"] = '1'

复制

解决了。

发布者：全栈程序员栈长，转载请注明出处：https://javaforall.cn/127682.html原文链接：https://javaforall.cn