天天看點

Tensorflow-gpu運作代碼慢的問題Tensorflow-gpu運作代碼慢的問題排查

Tensorflow-gpu運作代碼慢的問題排查

總結一次踩坑經曆。

1. 檢視代碼是否運作在Tensorflow-gpu版本

檢查是否同時安裝了Tensorflow和Tensorflow-gpu兩個版本,如果都安裝了,解除安裝cpu版本的。

2. 檢視GPU占用情況

一邊運作代碼,一邊檢視此時GPU的占用情況,可以反映出這個代碼是否用了GPU加速。Ctrl+R進入指令視窗,在C:\Program Files\NVIDIA Corporation\NVSMI 路徑下輸入指令 nvidia-smi 檢視GPU的占用情況。

Tensorflow-gpu運作代碼慢的問題Tensorflow-gpu運作代碼慢的問題排查

這個圖說明GPU占用了80%,說明代碼正在使用GPU,也可以終止代碼運作再檢視一次。

Tensorflow-gpu運作代碼慢的問題Tensorflow-gpu運作代碼慢的問題排查

此時占用為0,沒有使用GPU。

3. 終極排查:檢查代碼

有時候代碼運作速度慢的原因不是硬體的問題,而是軟體的問題,本人在經過上述兩個排查方法之後,依舊沒有找到真正的原因。原來真正的原因在于代碼,我用兩個重複的代碼塊來增加一個簡單的功能,而這個重複的代碼塊正是計算量最大的,這就導緻了代碼運作起來非常慢。把重複的代碼塊注釋之後,速度就恢複正常了。

以上是我個人的一次踩坑經曆,希望對你有一點點幫助