Расширение NVIDIA

Материал из Документация Ключ-АСТРОМ
Версия Изменения
1.0.3 Исправлена ​​ошибка, из-за которой расширение давало сбой, если графический процессор не сообщал определенные показатели.
1.0.2 Сообщать 0, когда для определенного графического процессора нет процессов
1.0.1 Добавлена ​​метрика энергопотребления
1.0.0 Поддержка мониторинга графических процессоров Nvidia на основе новейшей платформы Framework Расширения 2.0. Мониторинг температуры, памяти, количества процессов и загрузки. Создание экранов хоста для этих показателей.

Обзор

Это расширение отслеживает базовые параметры графических процессоров NVIDIA, отслеживая нагрузку, использование памяти и ресурсов. Расширение использует доступ к инструментарию NVIDIA через Python для предоставления подробной информации об использовании графических процессоров.

Это предназначено для пользователей, которые:

Хотят расширить мониторинг своих хостов на GPU и иметь обзор их использования.

Варианты использования

Это расширение позволяет вам:

  • Мониторить использование графического процессора в вашей среде
  • Находить узкие места в использовании памяти графического процессора

Начать

Это расширение выполняется ЕдинымАгентом (локальный мониторинг). Для начала просто активируйте расширение в своей среде с помощью встроенного в продукт Расширения.

Подробности

Собранные показатели:

  • Количество процессов, запущенных на GPU
  • Использование в процентах
  • Использование памяти
  • Общая память
  • Температура графического процессора

Это расширение создано на основе Framework Расширения 2.0 и обеспечивает:

  • Код для получения метрик из графического процессора NVIDIA
  • Экраны унифицированного анализа расширяют обзор хоста

Информация о совместимости

Это расширение использует следующие внешние библиотеки, которые должны поддерживаться вашим графическим процессором (картой и драйвером):

  • gpustat
  • nvidia-ml-py