天天看點

基于Centos 7.3系統下的CUDA、cuDNN配置

基于Centos 7.3系統下的CUDA、cuDNN配置

從網上找了幾個教程,安裝過程都出現了error,之後結合了幾個教程才把Nvidia的驅動安裝成功,以此來記錄一下安裝的教程。一下操作需在root權限下進行。

1.Nvidia顯示卡驅動安裝

更新系統

# 1\. 先來全系統更新與安裝所需要的編譯程式與環境;

[[email protected] ~]# yum update

[[email protected] ~]# yum groupinstall "Development Tools"

[[email protected] ~]# yum install kernel-devel kernel-headers

沒有wget的話安裝wget:

  Yum –y install wget

查詢硬體

首先确認機器的硬體裝置,檢視是否有相應的顯示卡。簡單查詢的方法可以使用lspci,具體操作如下:

[[email protected] ~]# lspci | grep -Ei '(vga|display)'

檢視Nvidia顯示卡 lspci | grep ‘NVIDIA’

添加ELRepo源

首先是添加密鑰:

   rpm --import https://www.elrepo.org/RPM-GPG-KEY-elrepo.org

然後是對應Centos7.3安裝ELRepo:

   rpm -Uvh http://www.elrepo.org/elrepo-release-7.0-2.el7.elrepo.noarch.rpm

安裝顯示卡檢查程式:

   yum install nvidia-detect

運作nvidia-detect檢測nvidia所需要的驅動,輸出如下:

Knod-nvidia

搜尋nvidia驅動:

yum search nvidia

取消nouveau子產品的載入

因為這部系統是新安裝的,是以沒有我們虛拟機裡面已經安裝好所有需要的環境了。是以,我們建議你最好是做好系統更新的動作, 然後安裝所需要的編譯環境,最後還得要将 nouveau 子產品排除使用!因為強迫系統不要使用 nouveau 這個驅動,這樣才能夠完整的讓 nvidia 的驅動程式運作! 那就來瞧瞧怎麼作啰!

# 1\. 開始處理不許載入 nouveau 子產品的動作!

[[email protected] ~]# vim /etc/modprobe.d/blacklist.conf  # 這檔案預設應該不存在

blacklist nouveau

options nouveau modeset=0

[[email protected] ~]# vim /etc/default/grub

GRUB_CMDLINE_LINUX="vconsole.keymap=us crashkernel=auto  vconsole.font=latarcyrheb-sun16

  rhgb quiet rd.driver.blacklist=nouveau nouveau.modeset=0"

# 在 GRUB_CMDLINE_LINUX 設定裡面加上 rd.driver.blacklist=nouveau nouveau.modeset=0 的意思!

[[email protected] ~]# grub2-mkconfig -o /boot/grub2/grub.cfg

[[email protected] ~]# reboot

[[email protected] ~]# lsmod | grep nouveau

# 最後要沒有出現任何子產品才是對的!

下載下傳和安裝驅動程式

下載下傳驅動程式:

   wget -r -np -nd http://us.download.nvidia.com/XFree86/Linux-x86_64/390.87/NVIDIA-Linux-x86_64-390.87.run
           

安裝驅動程式:

[[email protected] ~]# systemctl isolate multi-user.target
           

後期出現要不要安裝相容32bit的libraries,點選yes。安裝成功後在/usr/lib64/xorg/modules/drivers 目錄内,會多出一個 nvidia_drv.so 的驅動程式檔案啰! 同時這個軟體還提供了一支很有用的程式來幫助我們進行驅動程式更新。

如果安裝成功,運作:nvidia-smi,可以顯示一下資訊:

參考資料:

[1]    https://wizardforcel.gitbooks.io/vbird-linux-basic-4e/content/204.html

[2]    https://www.dedoimedo.com/computers/centos-7-nvidia-second.html

[3]    https://www.cnblogs.com/mar-q/p/7482720.html

[4]    https://blog.csdn.net/Lockvictor/article/details/49301183

2.CUDA的安裝

第一步:檢視伺服器的顯示卡型号,是否支援CUDA:

lspci | grep -i nvidia

第二步:檢視 gcc、g++、python的版本

第三步:到官網檢視合适安裝的版本:

 https://developer.nvidia.com/cuda-downloads

第四步:可能缺少相關的libvdpau檔案包,到網站https://developer.download.nvidia.com/compute/cuda/repos/rhel7/x86_64/
           
下載下傳安裝,具體安裝教程如下:
           

sudo vim /etc/yum.repos.d/linuxtech.testing.repo

輸入:

[linuxtech-testing]

name=LinuxTECH Testing

baseurl=http://pkgrepo.linuxtech.net/el6/testing/

enabled=0

gpgcheck=1

gpgkey=http://pkgrepo.linuxtech.net/el6/release/RPM-GPG-KEY-LinuxTECH.NET

sudo yum --enablerepo=linuxtech-testing install libvdpau

第五步:安裝CUDA,官網有三種安裝方式,線上安裝比較費勁,個人沒有安裝成功,用第一種安裝方式安裝的,先下載下傳,後導入伺服器,離線安裝。
           
第六步:環境配置:
           
vim /etc/profile
           
#在檔案中加入如下内容
           
export PATH=/usr/local/cuda-7.5/bin:$PATH
           
export LD_LIBRARY_PATH=/usr/local/cuda-7.5/lib64:$LD_LIBRARY_PATH
           
#關閉檔案後執行
           
source /etc/profile
           

Vi .bashrc

之後添加:

export PATH=$PATH:$HOME/bin:/usr/local/cuda/bin

export LD_LIBRARY_PATH=$LD_LIBRARY_PATH:/usr/local/cuda/lib64/

source .bashrc

3.cuDNN的安裝

  1.    Navigate to your <cudnnpath> directory containing the cuDNN Tar file.
  2. Unzip the cuDNN package.

$ tar -xzvf cudnn-9.0-linux-x64-v7.tgz

  1. Copy the following files into the CUDA Toolkit directory, and change the file permissions.
  2. $ sudo cp cuda/include/cudnn.h /usr/local/cuda/include
  3. $ sudo cp cuda/lib64/libcudnn* /usr/local/cuda/lib64

$ sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*

參考:https://docs.nvidia.com/deeplearning/sdk/cudnn-install/index.html#installlinux

4.安裝總結

    首先是以官網的教程為準,這樣可以少走彎路;其次就是認真檢視日志提示的錯誤,避免下折騰。

繼續閱讀