基于Centos 7.3系統下的CUDA、cuDNN配置
從網上找了幾個教程,安裝過程都出現了error,之後結合了幾個教程才把Nvidia的驅動安裝成功,以此來記錄一下安裝的教程。一下操作需在root權限下進行。
1.Nvidia顯示卡驅動安裝
更新系統
# 1\. 先來全系統更新與安裝所需要的編譯程式與環境;
[[email protected] ~]# yum update
[[email protected] ~]# yum groupinstall "Development Tools"
[[email protected] ~]# yum install kernel-devel kernel-headers
沒有wget的話安裝wget:
Yum –y install wget
查詢硬體
首先确認機器的硬體裝置,檢視是否有相應的顯示卡。簡單查詢的方法可以使用lspci,具體操作如下:
[[email protected] ~]# lspci | grep -Ei '(vga|display)'
檢視Nvidia顯示卡 lspci | grep ‘NVIDIA’
添加ELRepo源
首先是添加密鑰:
rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org
然後是對應Centos7.3安裝ELRepo:
rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm
安裝顯示卡檢查程式:
yum install nvidia-detect
運作nvidia-detect檢測nvidia所需要的驅動,輸出如下:
Knod-nvidia
搜尋nvidia驅動:
yum search nvidia
取消nouveau子產品的載入
因為這部系統是新安裝的,是以沒有我們虛拟機裡面已經安裝好所有需要的環境了。是以,我們建議你最好是做好系統更新的動作, 然後安裝所需要的編譯環境,最後還得要将 nouveau 子產品排除使用!因為強迫系統不要使用 nouveau 這個驅動,這樣才能夠完整的讓 nvidia 的驅動程式運作! 那就來瞧瞧怎麼作啰!
# 1\. 開始處理不許載入 nouveau 子產品的動作!
[[email protected] ~]# vim /etc/modprobe.d/blacklist.conf # 這檔案預設應該不存在
blacklist nouveau
options nouveau modeset=0
[[email protected] ~]# vim /etc/default/grub
GRUB_CMDLINE_LINUX="vconsole.keymap=us crashkernel=auto vconsole.font=latarcyrheb-sun16
rhgb quiet rd.driver.blacklist=nouveau nouveau.modeset=0"
# 在 GRUB_CMDLINE_LINUX 設定裡面加上 rd.driver.blacklist=nouveau nouveau.modeset=0 的意思!
[[email protected] ~]# grub2-mkconfig -o /boot/grub2/grub.cfg
[[email protected] ~]# reboot
[[email protected] ~]# lsmod | grep nouveau
# 最後要沒有出現任何子產品才是對的!
下載下傳和安裝驅動程式
下載下傳驅動程式:
wget -r -np -nd http://us.download.nvidia.com/XFree86/Linux-x86_64/390.87/NVIDIA-Linux-x86_64-390.87.run
安裝驅動程式:
[[email protected] ~]# systemctl isolate multi-user.target
後期出現要不要安裝相容32bit的libraries,點選yes。安裝成功後在/usr/lib64/xorg/modules/drivers 目錄内,會多出一個 nvidia_drv.so 的驅動程式檔案啰! 同時這個軟體還提供了一支很有用的程式來幫助我們進行驅動程式更新。
如果安裝成功,運作:nvidia-smi,可以顯示一下資訊:
參考資料:
[1] https://wizardforcel.gitbooks.io/vbird-linux-basic-4e/content/204.html
[2] https://www.dedoimedo.com/computers/centos-7-nvidia-second.html
[3] https://www.cnblogs.com/mar-q/p/7482720.html
[4] https://blog.csdn.net/Lockvictor/article/details/49301183
2.CUDA的安裝
第一步:檢視伺服器的顯示卡型号,是否支援CUDA:
lspci | grep -i nvidia
第二步:檢視 gcc、g++、python的版本
第三步:到官網檢視合适安裝的版本:
https://developer.nvidia.com/cuda-downloads
第四步:可能缺少相關的libvdpau檔案包,到網站https://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/
下載下傳安裝,具體安裝教程如下:
sudo vim /etc/yum.repos.d/linuxtech.testing.repo
輸入:
[linuxtech-testing]
name=LinuxTECH Testing
baseurl=http://pkgrepo.linuxtech.net/el6/testing/
enabled=0
gpgcheck=1
gpgkey=http://pkgrepo.linuxtech.net/el6/release/RPM-GPG-KEY-LinuxTECH.NET
sudo yum --enablerepo=linuxtech-testing install libvdpau
第五步:安裝CUDA,官網有三種安裝方式,線上安裝比較費勁,個人沒有安裝成功,用第一種安裝方式安裝的,先下載下傳,後導入伺服器,離線安裝。
第六步:環境配置:
vim /etc/profile
#在檔案中加入如下内容
export PATH=/usr/local/cuda-7.5/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-7.5/lib64:$LD_LIBRARY_PATH
#關閉檔案後執行
source /etc/profile
Vi .bashrc
之後添加:
export PATH=$PATH:$HOME/bin:/usr/local/cuda/bin
export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64/
source .bashrc
3.cuDNN的安裝
- Navigate to your <cudnnpath> directory containing the cuDNN Tar file.
- Unzip the cuDNN package.
$ tar -xzvf cudnn-9.0-linux-x64-v7.tgz
- Copy the following files into the CUDA Toolkit directory, and change the file permissions.
- $ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
- $ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64
$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
參考:https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html#installlinux
4.安裝總結
首先是以官網的教程為準,這樣可以少走彎路;其次就是認真檢視日志提示的錯誤,避免下折騰。