Зачем нужен AIOps

Anton I. Kasimov
1 min readSep 5, 2019

--

Специально для телеграм-канала @monitorim_it.

На днях я у себя спросил: «А зачем нужен мониторинг?» Первый ответ очевиден: «Чтобы обнаруживать проблемы». Но есть и другой вариант ответа: «Чтобы проблемы не происходили». Задайте себе этот вопрос относительно своей системы мониторинга. Лучше бы ответом был второй вариант. Для примера два события:

17:06 CRITICAL! Время ответа шлюза к платежным системам >2 секунд!

15:05 CRITICAL! Прогнозное время ответа шлюза к платёжным системам составит >2 секунд к 17:09 (вероятность 95%)

Но не только в этом сила систем AIOps. Если получилось предсказать будущую проблему, то и показать что к ней может привести тоже можно. Пример:

Отчёт по событию 3948574 06-Sep-2019 15:05:34 CRITICAL! Прогнозное время ответа шлюза к платёжным системам составит >2 секунд к 17:09 (вероятность 95%).

Возможные причины:

Кратковременная циклическая недоступность шлюза платёжных систем (Подтвердить Да/Нет)

Снижение производительности серверов prod-payments001, prod-payments002…ещё 5 серверов (Подтвердить Да/Нет)

Ожидаемое влияние на сервисы:

Процессинг (Подтвердить Да/Нет)

ещё 5 сервисов

Возможные причины:

Обновление версии с 1.16 до 1.17 сегодня в 10:05 (Подтвердить Да/Нет)

Цепочка событий:

10:05 Применение обновления версии с 1.16 до 1.17

15:05 CRITICAL! Прогнозное время ответа шлюза к платёжным системам составит >2 секунд к 17:09 (вероятность 95%)

15:09 Сформирован этот отчёт

17:09 CRITICAL! Время ответа шлюза к платёжным системам >2 секунд

Хотите получать такие уведомления? Некоторые из систем AIOps так могут. А какие именно — читайте в следующих постах.

Прочитайте другие посты серии:

--

--