Начало работы с GPU
Виртуальные машины с графическими процессорами (GPU) позволяют быстро решать задачи, связанные с машинным обучением и обработкой видео.
Важно
Для ВМ с GPU по ресурсам GPU производятся списания согласно тарифу в течение всего времени существования ВМ. Выключение виртуальной машины останавливает списания только по ресурсам vCPU и RAM.
Установка драйверов для использования GPU
Изначально виртуальные машины с GPU создаются без предустановленного ПО. Для использования GPU:
Отключите возможность использования драйверов
nouveau
.shsudo tee -a /etc/modprobe.d/blacklist-nouveau.conf > /dev/null <<-EOF blacklist nouveau options nouveau modeset=0 EOF
Выполните обновление образа
initramfs
для корректной работы GPU-устройств, подключенных к ВМ.Debian, Ubuntu и подобные
shsudo update-initramfs -u
CentOS, RedHat, Rocky и подобные
shsudo dracut -f
Для вступления изменений в силу выполните перезагрузку ВМ — через UI либо при помощи команды
reboot
.shsudo reboot
Установите пакет
dkms
, который позволит избежать переустановки драйверов при смене версии ядра Linux.Debian, Ubuntu и подобные
shsudo apt-get install -y dkms
CentOS, RedHat, Rocky и подобные
shsudo yum install -y epel-release sudo yum install -y dkms
Скачайте и установите проприетарный NVIDIA® Driver последней версии. Версию последнего релиза можно проверить здесь.
shcurl http://international.download.nvidia.com/XFree86/Linux-x86_64/535.43.02/NVIDIA-Linux-x86_64-535.43.02.run -o /tmp/NVIDIA-driver.run chmod +x /tmp/NVIDIA-driver.run sudo /tmp/NVIDIA-driver.run --dkms --no-cc-version-check --ui=none --no-questions
Для проверки установки выполните команду:
shnvidia-smi
Результат выполнения команды (пример):
shThu May 4 07:35:45 2023 +-----------------------------------------------------------------------------+ | NVIDIA-SMI 515.105.01 Driver Version: 515.105.01 CUDA Version: 11.7 | |-------------------------------+----------------------+----------------------+ | GPU Name Persistence-M| Bus-Id Disp.A | Volatile Uncorr. ECC | | Fan Temp Perf Pwr:Usage/Cap| Memory-Usage | GPU-Util Compute M. | | | | MIG M. | |===============================+======================+======================| | 0 NVIDIA A100 80G... Off | 00000000:0B:00.0 Off | 0 | | N/A 47C P0 71W / 300W | 0MiB / 81920MiB | 22% Default | | | | Disabled | +-------------------------------+----------------------+----------------------+ +-----------------------------------------------------------------------------+ | Processes: | | GPU GI CI PID Type Process name GPU Memory | | ID ID Usage | |=============================================================================| | No running processes found | +-----------------------------------------------------------------------------+