天天看點

cuda nvcc版本不一緻_計算機視覺入門(四)——安裝cuda配置深度學習環境

目前比較好用的深度學習架構如tensorflow、pytorch乃至Opencv中的神經網絡部分都需要cuda的支援,cuda是顯示卡廠商NVIDIA推出的運算平台,也就是利用GPU進行并行運算的底層接口,不利用GPU也可以跑深度學習(用CPU跑),但訓練速度慢,是以目前深度學習架構大部分都會利用GPU甚至分布式多GPU來訓練深度學習模型。綜上,配置cuda是搞深度學習的基礎,但cuda的安裝配置并不簡單,其坑甚多。

1.首先下載下傳cuda。這個需要你去https://developer.nvidia.com/cuda-downloads這個網址下載下傳cuda,以N卡ubuntu16.04的64位機為例,過程如下圖,當然你也可以用wget指令,一定要下載下傳runfile檔案,其他的安裝時候各種問題,不推薦。下載下傳後一定要儲存到一個你能找到的最短的路徑下,如/home否則後面隻能用指令行時,你找檔案輸入路徑會崩潰的。

cuda nvcc版本不一緻_計算機視覺入門(四)——安裝cuda配置深度學習環境

cuda下載下傳界面

2.禁用 nouveau驅動。這個驅動時linux核心自帶驅動,優先級較高,我們要安裝N卡驅動屬于第三方軟體包,不禁nouveau安裝後會出現進不去系統界面等問題,是以,必須保證禁掉它。終端中運作:$ lsmod | grep nouveau如果有輸出資訊說明沒禁掉,在/etc/modprobe.d中建立檔案blacklist-nouveau.conf 輸入指令:$ sudo gedit /etc/modprobe.d/blacklist-nouveau.conf用gedit打開這個建立的黑名單檔案,在裡面寫入

blacklist nouveau

options nouveau modeset=0

這兩條指令用來禁用nouveau。

執行$ sudo update-initramfs –u指令

在用$ lsmod | grep nouveau看看是否有輸出,如果有的話,重新開機電腦,再禁一遍直到沒有輸出為止。

3.禁用成功後重新開機電腦,不要進入圖形界面,直接按Ctrl+Alt+F1進入文本模式(指令行界面),登入賬戶。這裡登入時注意,登入密碼在linux中是不顯示位數的,是以不要以為密碼沒輸進去。登陸後$ sudo service lightdm stop關掉圖形界面。找到runfile檔案儲存路徑(cd Home/後用ls指令看一眼确定下),執行$ sudo sh cuda_7.5.18_linux.run,各種選項除安裝OpenGL選no外,都輸入accept或yes就行,若需安裝OpenGL可以另行安裝,不要在這安,會導緻循環登入問題。

4.等待安裝結束,$sudo service lightdm start 重新啟動圖形化界面。Alt + ctrl +F7回到圖形界面登入,如果不循環登入基本就成功了。

5.使用ls /dev/nvidia*指令檢測一下。若有三個輸出則成功,

/dev/nvidia0 /dev/nvidiactl /dev/nvidia-uvm

否則需添加一個啟動腳本$ sudo gedit /etc/rc.local打開rc檔案,找到其中的#!/bin/sh -e,把-e去掉後複制下段代碼到exit0之上:

/sbin/modprobe nvidia

if [ "$?" -eq 0 ]; then

# Count the number of NVIDIA controllers found.

NVDEVS=`lspci | grep -i NVIDIA`

N3D=`echo "$NVDEVS" | grep "3D controller" | wc -l`

NVGA=`echo "$NVDEVS" | grep "VGA compatible controller" | wc -l`

N=`expr $N3D + $NVGA - 1`

for i in `seq 0 $N`; do

mknod -m 666 /dev/nvidia$i c 195 $i

done

mknod -m 666 /dev/nvidiactl c 195 255

else

exit 1

fi

/sbin/modprobe nvidia-uvm

if [ "$?" -eq 0 ]; then

# Find out the major device number used by the nvidia-uvm driver

D=`grep nvidia-uvm /proc/devices | awk '{print $1}'`

mknod -m 666 /dev/nvidia-uvm c $D 0

else

exit 1

fi

重新開機之後再用ls /dev/nvidia*指令檢測時應該有三個輸出了。

6.安裝好之後需要設定環境變量,其具體方法如下:

sudo gedit ~/.bashrc

export PATH=/usr/local/cuda-8.0/bin:$PATH

export LD_LIBRARY_PATH=/usr/local/cuda-8.0/lib64$LD_LIBRARY_PATH

根據自己的cuda版本修改上述路徑。配置好環境變量後一定要重新開機電腦試試。

7.使用cat /proc/driver/nvidia/version檢視cuda版本,有輸出說明成功。

8.在安裝cuda成功後,需要安裝CUDA Toolkit,使用指令sudo apt-get install nvidia-cuda-toolkit即可。使用nvcc -V 指令會輸出CUDA的版本資訊說明安裝成功。

9.進入cuda例程目錄$ cd /home/xxx/NVIDIA_CUDA-9.0_Samples,使用make指令編譯。等待很久很久之後,提示Finished building CUDA samples,這時進入NVIDIA_CUDA-9.0_Samples/bin中,運作其中的裝置檢測程式$ ./deviceQuery,若Result = PASS則說明檢測成功,安裝完畢。

繼續閱讀