РЕШЕНИЕ
Проектирование и построение систем мониторинга и управления инцидентами

Мы предлагаем услуги по внедрению и настройке Microsoft System Center Operations Manager – платформы для управления и мониторинга ИТ-сервисов, приложений и серверов в смешанной среде, где используются решения от разных производителей, базирующиеся на различных операционных системах.

Многолетний опыт построения и эксплуатации подобных систем нашими специалистами помогает нашим заказчикам избежать типичных ошибок как при их проектировании, так и при их дальнейшем использовании.

Данное решение позволяет:

  • Отслеживать доступность и производительность систем со стороны пользователей, что дает возможности для своевременного (в том числе и автоматизированного) реагирования на сбои до того, как они приводят к глобальным последствиям.
  • Своевременно получать точную и детальную информацию о недоступности сервиса или его узла в случае сбоя.
  • Устанавливать и отслеживать исполнение требуемого уровня доступности и обслуживания приложений (SLA).
  • Использовать заготовленные шаблоны для быстрого подключения новых сервисов к системе мониторинга.
  • Интегрировать данную платформу с другими продуктами для решения сложных специализированных задач в зависимости от потребностей бизнеса.

При подключении различных сервисов к системе мониторинга используются так называемые пакеты управления. Они позволяют системе должным образом взаимодействовать с сервисом, реализуют логику различных проверок доступности. С их помощью система мониторинга сможет полностью понимать, что происходит с тем или иным сервисом в данный момент времени. Для многих популярных и наиболее востребованных систем существуют готовые пакеты управления. Они могут как входить в состав продукта, так и быть выложены в открытый доступ командами независимых разработчиков. Существует также возможность самостоятельной разработки пакетов управления для специфичных бизнес-сервисов. Многолетний опыт наших специалистов позволяет избежать различных проблем при разработке таких решений и использовать уже существующие разработки для ускорения процесса.

Пакеты управления содержат в себе модель здоровья конкретного сервиса, так как довольно часто они создаются непосредственно разработчиками ПО и в них заложены все рекомендации по настройке. При этом они всегда могут быть сильно видоизменены: с учетом особенности окружения заказчика, в зависимости от актуальности проведения тех или иных проверок в конкретной инфраструктуре заказчика.

Сложность такого проекта напрямую будет зависеть от сложности инфраструктуры заказчика:

  • Количество серверов, которые будут находиться под наблюдением системы
  • Количество инфраструктурных систем
  • Количество бизнес-систем
  • Существуют ли готовые пакеты управления для используемых систем или необходимо вкладывать свои силы в их разработку.

Типовой проект по развертыванию подобной системы включает:

1) Аудит инфраструктуры заказчика.

2) Определение списка устройств и сервисов, наблюдаемых системой, на основе пожеланий заказчика и наших рекомендаций по результатам исследования.

3) Планирование архитектуры решения с учетом особенностей инфраструктуры. Составление и согласование проектной документации.

4) Внедрение системы в инфраструктуру заказчика, конфигурация основных узлов в соответствии с планом.

5) Конфигурация платформы под список решаемых задач.

  • Подключение наблюдаемых серверов и сервисов к системе.
  • Поиск и подготовка пакетов управления.
  • Разработка необходимых пакетов управления для специфических систем и сервисов заказчика.
  • Конфигурация автоматизированных заданий для самостоятельной реакции на сбои.
  • Настройка системы составления отчетов.
  • Настройка предпочитаемых способов и параметров информирования о происшествиях.
  • Интеграция с другими системами.

6) Тестирование корректной работы всех компонентов в различных сценариях, подготовка сопроводительной документации.

7) Обучение персонала заказчика.

По нашим оценкам, использование систем мониторинга работоспособности инфраструктуры значительно снижает количество сбоев и время, необходимое на их устранение. Кроме того, использование такой системы с единой консолью предоставления информации сильно облегчает взаимодействие различных групп внутри ИТ-отдела.