Мониторинг

Инцидентов нет
Журнал инцидентов
Сервис:
Система BackUp (Hyper-V)
ЦОД:
Москва SLAVA, Москва OST
Начало события:
18.06.2026 11:00
Конец события:
20.06.2026 20:00
Длительность:
2 дня
Описание:
Работа системы BackUp восстановлена в полном объёме.
Сервис:
СХД, диски типа SSD (Hyper-V), СХД, диски типа HDD (Hyper-V)
ЦОД:
Москва SLAVA
Начало события:
18.06.2026 01:07
Конец события:
18.06.2026 13:38
Длительность:
12 часов
Описание:
Сбой в системе управления системой хранения данных. Описание неисправности и восстановления сервиса: физически все данные были сохранены, в момент инцидента ВМ потеряли доступ к своим дискам, потребовался последовательный перезапуск ВМ на хостах для их старта и полной доступности. Часть ВМ восстановили работу в автоматическом режиме, часть потребовала ручного вмешательства для восстановления штатной работы ВМ. Предпринятые меры для не повторения ситуации: дополнен мониторинг системы хранения данных в части загрузки по ядрам, IOPS и задержкам записи на диски с алертингом на ранние признаки деградации, переработаны процедура анализа логов и процедура обеспечения доступности сервисов клиентов в аварийной ситуации.
Сервис:
Система BackUp (Elastic Cloud)
ЦОД:
Москва SLAVA
Начало события:
17.06.2026 22:07
Конец события:
18.06.2026 20:00
Длительность:
21 час
Описание:
Доступность системы BackUp восстановлена.
Сервис:
Виртуальные машины (Hyper-V 2016)
ЦОД:
Москва SLAVA
Начало события:
17.06.2026 10:59
Конец события:
17.06.2026 11:03
Длительность:
4 минуты
Описание:
В ЦОД SLAVA произошел сбой на одном из узлов виртуализации. Несмотря на сбой на узле виртуализации, отказоустойчивая платформа отработала штатно, и недоступность составила менее 5 минут. Хронология событий: 17.06.2026 11:03 по МСК Восстановление ВМ подтверждено. 17.06.2026 10:59 по МСК Произошел сбой на узле виртуализации. ВМ восстановили работу на соседнем узле с перезагрузкой.