Skip to content
На этой странице:

Начало работы с GPU

Виртуальные машины с графическими процессорами (GPU) позволяют быстро решать задачи, связанные с машинным обучением и обработкой видео.

Важно

Для ВМ с GPU по ресурсам GPU производятся списания согласно тарифу в течение всего времени существования ВМ. Выключение виртуальной машины останавливает списания только по ресурсам vCPU и RAM.

Установка драйверов для использования GPU

Изначально виртуальные машины с GPU создаются без предустановленного ПО. Для использования GPU:

  1. Отключите возможность использования драйверов nouveau.

    sh
    sudo tee -a /etc/modprobe.d/blacklist-nouveau.conf > /dev/null <<-EOF
    blacklist nouveau
    options nouveau modeset=0
    EOF
  2. Выполните обновление образа initramfs для корректной работы GPU-устройств, подключенных к ВМ.

    Debian, Ubuntu и подобные
    sh
    sudo update-initramfs -u
    CentOS, RedHat, Rocky и подобные
    sh
    sudo dracut -f
  3. Для вступления изменений в силу выполните перезагрузку ВМ — через UI либо при помощи команды reboot.

    sh
    sudo reboot
  4. Установите пакет dkms, который позволит избежать переустановки драйверов при смене версии ядра Linux.

    Debian, Ubuntu и подобные
    sh
    sudo apt-get install -y dkms
    CentOS, RedHat, Rocky и подобные
    sh
    sudo yum install -y epel-release
    sudo yum install -y dkms
  5. Скачайте и установите проприетарный NVIDIA® Driver последней версии. Версию последнего релиза можно проверить здесь.

    sh
    curl http://international.download.nvidia.com/XFree86/Linux-x86_64/535.43.02/NVIDIA-Linux-x86_64-535.43.02.run -o /tmp/NVIDIA-driver.run
    chmod +x /tmp/NVIDIA-driver.run
    sudo /tmp/NVIDIA-driver.run --dkms --no-cc-version-check --ui=none --no-questions
  6. Для проверки установки выполните команду:

    sh
    nvidia-smi

    Результат выполнения команды (пример):

    sh
    Thu May  4 07:35:45 2023       
    +-----------------------------------------------------------------------------+
    | NVIDIA-SMI 515.105.01   Driver Version: 515.105.01   CUDA Version: 11.7     |
    |-------------------------------+----------------------+----------------------+
    | GPU  Name        Persistence-M| Bus-Id        Disp.A | Volatile Uncorr. ECC |
    | Fan  Temp  Perf  Pwr:Usage/Cap|         Memory-Usage | GPU-Util  Compute M. |
    |                               |                      |               MIG M. |
    |===============================+======================+======================|
    |   0  NVIDIA A100 80G...  Off  | 00000000:0B:00.0 Off |                    0 |
    | N/A   47C    P0    71W / 300W |      0MiB / 81920MiB |     22%      Default |
    |                               |                      |             Disabled |
    +-------------------------------+----------------------+----------------------+
                                                                               	
    +-----------------------------------------------------------------------------+
    | Processes:                                                                  |
    |  GPU   GI   CI        PID   Type   Process name                  GPU Memory |
    |        ID   ID                                                   Usage      |
    |=============================================================================|
    |  No running processes found                                                 |
    +-----------------------------------------------------------------------------+