Перейти к основному содержимому

ALD Pro

Мониторинг ALD Pro должен охватывать ключевые сетевые службы и компоненты приложения, чтобы обеспечивать стабильность, производительность и отказоустойчивость работы сервера. Важно собирать информацию о структуре ALD Pro и состоянии каждого сервиса — это помогает своевременно обнаруживать сбои и планировать масштабирование.

Памир понимает структуру ALD Pro и строит его сервисно-ресурсную модель (СРМ).
СРМ ALD Pro — это иерархическая структура, которая описывает компоненты приложения и их взаимосвязи, что упрощает мониторинг, управление и планирование ресурсов.

CMDB

Место в структуре TKE

Ниже представлена иерархическая схема расположения ALD Pro в структуре TKE:

Конфигурационная единица
└─ Программное обеспечение
└─ LDAP
└─ ALD Pro

Модель СРМ и место ALD Pro в CMDB

СРМ строится из типов конфигурационных единиц (TKE) и их связей. Для ALD Pro модель выглядит так:

- ✅ **ОС**  
Операционная система хоста
- ✅ **ALD PRO**
Набор приложений ALD PRO

✅ — отмечены уровни, включённые в шаблон мониторинга. Ниже приведены описания уровней модели.

TKE

  • ALD Pro – Это набор сетевых служб сервера Astra Linux для организации централизованного управления ИТ-инфраструктурой.
  • Linux – Linux-сервер.

Атрибуты

  • ALD Pro

    • IP адрес
    • Название (Hostname)
  • Linux

    • IP адрес
    • Название (Hostname)
    • Операционная система
    • Версия

Дашборды

Состояние ALD Pro

dashboard

Содержит основные параметры приложения ALD Pro:
Название и IP-адрес хоста
Срок годности LDAP-сертификата и WEB-сертификата
HTTP-статус портала, DNS-резолв, NTP-синхронизация
Успешность подключения пользователя и количество отключённых учётных записей


Состояние сервера и дисков

dashboard

Показывает потребление ресурсов ОС на хосте ALD Pro:
Загрузка ЦПУ (CPU Usage) и Загрузка ОЗУ (Memory Usage)
Использование диска для томов /usr, /opt, /var/log ...


Статус служб и потоки systemd-юнитов

dashboard

Отображает состояние ключевых сервисов ALD Pro:
Статус служб (apache2, certmonger, gssproxy, ipa-custodia, krb5-kdc, sssd)
UP Time каждой службы
Количество потоков (threads) systemd-юнитов по сервисам

Метрики

  • Загрузка ЦПУ (CPU Usage) – процент использования процессора на хосте ALD Pro.
  • Загрузка ОЗУ (Memory Usage) – доля занятой оперативной памяти, важна для оценки потребления ресурсов.
  • Использование диска (Disk Usage) – процент заполнения основных томов (/usr, /opt, /var/log).
  • HTTP-статус портала (Portal HTTP Status) – код ответа при обращении к веб-интерфейсу (200 — OK).
  • Статус DNS-резолва (DNS Resolve Status) – успешность разрешения имени хоста ALD Pro.
  • Статус NTP-синхронизации (NTP Sync Status) – проверка отклонения системного времени от NTP.
  • Успешность подключения пользователя (User Connection Success) – доля удачных IPA-аутентификаций.
  • Срок годности LDAP-сертификата (LDAP Cert Expiry) – дни до истечения срока действия.
  • Срок годности WEB-сертификата (Web Cert Expiry) – дни до окончания действия HTTPS-сертификата.
  • Количество отключённых пользователей (Disabled Users Count) – число заблокированных учётных записей.
  • Состояние служб (Service State) – активность ключевых systemd-юнитов ALD Pro.
  • UP Time – время непрерывной работы сервисов.
  • Потоки systemd-юнитов (systemd Threads) – количество рабочих потоков у каждого сервиса.

Индикаторы здоровья

  • Подключения пользователя
    CRITICAL при отсутствии успешных подключений тестового пользователя за 5 мин.
    Проверяет возможность базовой аутентификации через ALD Pro.

  • Состояние служб ALD-Pro
    CRITICAL, если хотя бы одна из ключевых служб неактивна более 2 мин.
    Контролирует работу systemd-юнитов ALD Pro.

  • NTP-синхронизация
    WARNING при нарушении NTP-синхронизации более 5 мин.
    Следит за точностью системного времени для корректной работы Kerberos.

  • Статус портала ALD-Pro
    CRITICAL, если HTTP-код при опросе портала ≠ 200 в течение 2 мин.
    Гарантирует доступность веб-интерфейса ALD Pro.

  • LDAP-сертификат ALD-Pro
    – WARNING, если < 30 дн до истечения
    – ERROR, если < 7 дн до истечения
    – CRITICAL, если сертификат не найден
    Предупреждает об обновлении LDAP-сертификата.

  • WEB-сертификат ALD-Pro
    – WARNING, если < 30 дн до истечения
    – ERROR, если < 7 дн до истечения
    – CRITICAL, если сертификат не найден
    Контролирует срок действия HTTPS-сертификата портала.

  • Время авторизации пользователя
    ERROR при задержке аутентификации > 2000 мс за 5 мин.
    Оценивает производительность процедуры входа.

  • DNS-резолв ALD-Pro
    WARNING при неуспешном DNS-резолве имени ALD Pro более 5 мин.
    Контролирует доступность DNS для приложения.

Файлы