Поиск и устранение неисправностей SNMP
При работе с расширениями Ключ-АСТРОМ, использующими источник данных SNMP, могут возникнуть проблемы, требующие устранения.
Состояние конфигурации не в порядке
Всякий раз, когда создается или обновляется конфигурация мониторинга, может потребоваться несколько минут для полной активации и начала мониторинга. До этого времени статус конфигурации может измениться на Предупреждение или Ошибка, поскольку конфигурация запланирована для конечной точки, поставлена в очередь на загрузку, активирована, проверена и запущена. Подождите не менее 5 минут. Если статус все еще не ОК, выберите цветную точку рядом с ней; это откроет интерфейс Логов для получения более подробной информации.
Ошибки Fastcheck
Fastcheck — это простой запрос Get SNMP, цель которого — извлечь один OID из устройства, представляющий его системное имя. У устройства есть 18 секунд на ответ, иначе проверка не будет пройдена. Это самый первый шаг перед сбором любых других данных с устройства.
Ошибки Fastcheck указывают на проблему со связью с устройством
- Неверные учетные данные для подключения к устройству
- Сетевые брандмауэры не позволяют осуществлять связь
- Неправильно настроенные устройства не позволяют выполнять запросы SNMP
GetBulk вернул ошибку
GetBulk — это операция запроса SNMP, используемая для извлечения данных с устройства. Когда это появляется в сообщении об ошибке, это означает, что устройство доступно (FastCheck пройден), но данные не могут быть извлечены.
Этот тип ошибки может иметь несколько причин:
- Предоставленные учетные данные (например, строка сообщества) недействительны.
- Сеть ненадежна, что приводит к проблемам со связью
- Слишком много данных для извлечения; попробуйте уменьшить наборы функций или оптимизировать расширенные настройки.
Неверные ошибки конфигурации
Недействительная конфигурация будет указывать на данные, введенные в поля конфигурации мониторинга. Хотя данные устройства говорят сами за себя, фильтры переменных должны следовать синтаксису, упомянутому в предыдущем разделе.
Высокая загрузка ЦП
HIGH_CPU статус означает, что на АктивныйШлюз достигнуто максимально допустимое потребление ресурсов ЦП для модуля источника данных контроллера выполнения расширений (EEC).
- Объем данных не может быть собран и обработан без превышения встроенного ограничения ресурсов ЦП в 5%.
- Попробуйте изначально включить меньшее количество наборов функций (что подразумевает меньшее количество показателей, а значит, и меньшее количество запросов для обработки) или распределить наборы функций по нескольким конфигурациям.
Расширение логов
Логи расширения можно найти в директориях АктивногоШлюза. Найдите Extensions 2.0 configuration, logs в столбце Назначение .
Оптимизация для больших устройств
Конфигурации мониторинга снабжены набором расширенных настроек, которые влияют на то, как данные запрашиваются с устройства через SNMP. Значения по умолчанию работают в большинстве случаев, но вы можете изменить их, если у вас возникнут такие проблемы, как отсутствие данных.
- Тайм-аут и повторные попытки означают максимальное время ожидания возврата запроса SNMP и количество повторных попыток запроса в случае сбоя.
- Макс. повторения относятся к тому, сколько раз OID (идентификатор метрики в SNMP) может быть повторен как часть одного ответа на запрос SNMP GetBulk, когда одна и та же метрика собирается для нескольких объектов/экземпляров. Более низкое значение означает больше запросов между расширением и устройством для сбора большого набора данных. Из-за скорости и ненадежности протокола SNMP эффективнее использовать меньшее значение (например, 20). По умолчанию = 50.
- Макс. OID на запрос означает максимальное количество OID, которые могут быть запрошены для каждого запроса SNMP GetBulk. В очень больших средах мы рекомендуем установить значение 5. Это повышает производительность за счет дальнейшего разделения рабочей нагрузки на большее количество запросов.