侧边栏壁纸
博主头像
Into The Abyss 博主等级

My Life is a Death Race

  • 累计撰写 34 篇文章
  • 累计创建 7 个标签
  • 累计收到 4 条评论

目 录CONTENT

文章目录

debian配置深度学习环境

Administrator
2023-02-12 / 0 评论 / 0 点赞 / 414 阅读 / 0 字

安装显卡驱动(pt.1)

下载官方显卡驱动(官方下载地址):进入官网后,选择自己的显卡型号和操作系统,下载对应的显卡驱动文件

禁用nouveau驱动

echo blacklist nouveau >> /etc/modprobe.d/blacklist.conf
echo options nouveau modeset=0 >> /etc/modprobe.d/blacklist.conf
sudo update-initramfs -u

执行完毕后,重启

# 检查nouveau驱动是否禁用,如果没有内容输出,则说明禁用生效
lsmod | grep nouveau

安装Nvidia驱动:打开下载驱动的文件夹

sh ./NVIDIA-Linux-x86_64-525.78.01.run -no-x-check -no-nouveau-check -no-opengl-files

安装过程中,出现下述情景

Install NVIDIA's 32-bit compatibility libraries?

          Yes                       No  
(我选的No)
Would you like to register the kernel module sources with DKMS? This will    
allow DKMS to automatically build a new module, if you install a different   
kernel later.

          Yes                       No  
(我选的No)
Would you like to run the nvidia-xconfig utility to automatically update your X configuration file so that the NVIDIA X driver will be used when you restart X?     
Any pre-existing X configuration file will be backed up.

          Yes                       No  
(我选的yes)

安装完成后

# 查看是否安装成功
nvidia-smi

# 如果出现下述内容
+-----------------------------------------------------------------------------+
| NVIDIA-SMI 525.78.01    Driver Version: 525.78.01    CUDA Version: 12.0     |
|-------------------------------+----------------------+----------------------+
| GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
| Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
|                               |                      |               MIG M. |
|===============================+======================+======================|
|   0  NVIDIA GeForce ...  Off  | 00000000:01:00.0 Off |                  N/A |
| N/A   41C    P0    15W /  50W |      0MiB /  4096MiB |      0%      Default |
|                               |                      |                  N/A |
+-------------------------------+----------------------+----------------------+

+-----------------------------------------------------------------------------+
| Processes:                                                                  |
|  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
|        ID   ID                                                   Usage      |
|=============================================================================|
|  No running processes found                                                 |
+-----------------------------------------------------------------------------+

可能是因为我的电脑的问题,装完之后,重启开机黑屏,不能正常开机,大概率是驱动的问题。如果出现这种情况,别慌(反正我是急了)。你需要将电脑关机,如果不能正常关机,就长按开机键,重新开机,在grub界面先选择Advanced options for Debian GNU/Linux这个选项,按回车。j将光标移动到recovery mode这个选项,按e键,移动光标到linux开头的那一行,一般是倒数第三行,在这一行的末尾添加init=/bin/bash,然后按ctrl+xF10键,就可以进入rescue mode

进入之后,输入

# 以读写模式挂载根文件系统
mount -o remount,rw /

# 删除nvidia driver
nvidia-uninstall

重新启动即可,试了好几次,都会出现这种情况,最终我选择妥协,使用别的方法来进行安装。

安装显卡驱动(pt.2)

其实特别简单,在禁用nouveau驱动后,打开终端

su

apt update

apt install nvidia-driver firmware-misc-nonfree

等待执行完毕即可,重启后,输入nvidia-smi进行验证即可

安装Cuda

进入Cuda的官网(点击进入),选择你要下载的版本(如果你拿不准,可以查看你的驱动版本,选择兼容驱动的版本),我选择的是11.4.4,然后选择好你的操作系统,架构平台,发行版本,以及版本号和安装方式(我使用的runfile,直接输命令就行)

# 命令由官网生成
wget https://developer.download.nvidia.com/compute/cuda/11.4.4/local_installers/cuda_11.4.4_470.82.01_linux.run
sudo sh cuda_11.4.4_470.82.01_linux.run

安装时,不需要在安装显卡驱动,记得取消勾选。安装完成后

vim ~/.bashrc

# 在文件中加入下面两行
export PATH=/usr/local/cuda-11.4/bin:${PATH}
export LD_LIBRARY_PATH=/usr/local/cuda-11.4/lib64:${LD_LIBRARY_PATH}

# 保存退出后
source ~/.bashrc

# 验证
nvcc --version
# 如果有版本信息,则安装成功

安装cuDNN

进入cuDNN官网(点击进入),下载相应的deb包即可,注意和Cuda版本匹配,以及选择正确的Linux发行版和版本号,打开下载文件的目录,在此处打开终端

# 将./cudnn-local-repo-debian11-8.6.0.163_1.0-1_amd64.deb换成你下载的包名
sudo apt install ./cudnn-local-repo-debian11-8.6.0.163_1.0-1_amd64.deb

安装Anaconda

进入Anaconda官网(点击进入),找到自己的系统版本,下载安装即可。

linux命令行安装

curl -O https://repo.anaconda.com/miniconda/Miniconda3-latest-Linux-x86_64.sh

sh Miniconda3-latest-Linux-x86_64.sh
# 查看协议的时候输入yes,并输入自定义安装的位置即可

安装Pytorch

进入pytorch官网(点击进入),按照自己的环境,选择操作系统,包管理器,编程语言以及cuda版本,将生成的命令复制进终端执行即可。

#如果使用conda管理
#创建虚拟环境
conda create -n torch_env python=3.9 # 官方说python环境必须大于等于3.7.0
#激活虚拟环境
conda activate torch_env
#官网给出的命令安装pytorch
conda install pytorch torchvision torchaudio pytorch-cuda=11.6 -c pytorch -c nvidia


验证

# 在pycharm中用创建的conda环境创建一个项目
import torch

# 返回当前设备索引
print(torch.cuda.current_device())

# 返回gpu数量
print(torch.cuda.device_count())

# 返回gpu名称,索引从0开始
print(torch.cuda.get_device_name(0))

# cuda是否可用
print(torch.cuda.is_available())

如果最后一个返回true,则说明环境配置成功。

参考

How to Boot Debian 11 into Rescue / Emergency Mode

Debian11.1.0安装人工智能深度学习环境(显卡驱动、cuda、cudnn、pytorch)-炼丹人士必看_Madclear的博客-CSDN博客_debian跑深度学习

https://zhuanlan.zhihu.com/p/261314033

0

评论区