Tesla T4安装
NVIDIA的驱动
1
|
wget https://cn.download.nvidia.com/tesla/460.106.00/NVIDIA-Linux-x86_64-460.106.00.run
|
下载deb文件后,先别着急安装,需先禁用nuoveau
1
|
sudo vi /etc/modprobe.d/blacklist.conf
|
下面两行加到末尾
1
2
|
blacklist nouveau
options nouveau modeset=0
|
更新initramfs,需要稍微等一会
1
|
sudo update-initramfs -u
|
重启系统。
验证屏蔽是否成功,执行下面语句,结果为空,即为成功。
执行安装
先安装依赖软件,gcc make。若已安装则建立cc make软链接
gcc version 9.4.0 (Ubuntu 9.4.0-1ubuntu1~20.04.1)
GNU Make 4.2.1
1
2
|
chmod +x NVIDIA-Linux-x86_64-460.106.00.run
sudo bash ./NVIDIA-Linux-x86_64-460.106.00.run
|
安装过程中,
Install 32 bit compatibility libraries ? 选择No
安装完毕后,输入

安装CUDA和cuDNN
下载run文件
1
2
|
wget https://developer.download.nvidia.com/compute/cuda/11.1.0/local_installers/cuda_11.1.0_455.23.05_linux.run
sudo sh cuda_11.1.0_455.23.05_linux.run
|
accept 同意 取消Driver,因为我们前面已经安装过显示驱动了,不能重复安装,否则会报错。

等待执行完毕

添加环境变量
最后增加如下:(这里的路径根据上面的输出自动修改)
1
2
|
export PATH=/usr/local/cuda-11.1/bin:$PATH
export LD_LIBRARY_PATH=/usr/local/cuda-11.1/lib64:$LD_LIBRARY_PATH
|
使生效。
1
2
|
source ~/.bashrc
或者使用 /etc/profile 全局生效,方便实验室用
|
测试查看cuda版本
1
2
3
4
5
6
|
labot@gui-gpu:~$ nvcc -V
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2020 NVIDIA Corporation
Built on Tue_Sep_15_19:10:02_PDT_2020
Cuda compilation tools, release 11.1, V11.1.74
Build cuda_11.1.TC455_06.29069683_0
|
然后是cuDNN
1
|
wget https://developer.nvidia.com/downloads/c118-cudnn-linux-8664-880121cuda11-archivetarz
|
安装cuDNN v8.2.1(请根据自己的需要进行下载。)这个要翻到下面以前发行的就会有这种cudnn的库文件下载。
https://developer.nvidia.com/rdp/cudnn-archivedeveloper.nvidia.com/rdp/cudnn-archive

解压。
1
|
tar zxvf cudnn-11.3-linux-x64-v8.2.1.32.tgz
|
本目录会多出一个cuda目录,将cudnn.h复制到cuda安装目录下的include下。
1
|
sudo cp cuda/include/cudnn.h /usr/local/cuda-11.1/include/
|
再将lib64下所有的so文件,复制到lib64下。
1
|
sudo cp cuda/lib64/lib* /usr/local/cuda-11.1/lib64/
|
将/usr/local/cuda-11.1/lib64下的所有so文件,复制到/usr/lib下,防止调用时找不到(非必要)
1
|
sudo cp /usr/local/cuda-11.1/lib64/* /usr/lib/
|
添加可执行权限
1
|
sudo chmod a+r /usr/local/cuda/include/cudnn.h /usr/local/cuda/lib64/libcudnn*
|