Жизнь после миграции: а как же сопровождение, управление и мониторинг?

Опыт проектов в части внедрения коммуникационных решений на базе CommuniGate Pro, а также создания ИТ-инфраструктур на базе Linux, позволяет нам предложить ряд идей, которые окажутся полезными для архитекторов и администраторов, вступающих на этот путь. Вячеслав Пронин, системный архитектор Digital Design, рассказал о некоторых особенностях управления и сопровождения крупных решений на базе CommuniGate Pro.

Вячеслав Пронин
Вячеслав Пронин
Системный архитектор, Digital Design

Когда стоит присмотреться к менее знакомым технологиям и подходам? Конечно, все зависит от планируемых масштабов внедрения: если речь идет об одном сервере, одном кластере и одной площадке - все достаточно просто, и привычные подходы все еще работают. Простой мониторинг ИТ-инфраструктуры, ручное администрирование, резервное копирование все еще эффективны. Ну и системный администратор пригодится.

Но если наши планы более дерзкие? Десятки площадок, сотни серверов, тысячи - десятки тысяч пользователей? У действительно ответственных специалистов голова может начать болеть, а сон стать более прерывистым. Хотя причины такого беспокойства давно уже известны, классифицированы, и включают в себя:

  • Трудности управления конфигурацией: тот самый процесс управления конфигурацией оказывается не просто желанием развести больше бюрократии и согласования комитетом, а здоровым стремлением знать: какие конфигурационные параметры действительно используются, какие изменения внесены, и каким образом можно все откатить или развернуть с нуля? И будет ли оно при этом работать?
  • Желание понимать, что же на самом деле происходит в системе. Процесс управления журналами событий (нет-нет, мы совсем не про SIEM!) также может быть не просто причиной расходования большого объема дисковых ресурсов, а приятной возможностью предсказать проблемы, обнаружить неожиданные угрозы и узнать результаты предоставления сервиса конкретному клиенту.
  • Желание быстро увидеть, как наш сервис выглядит со стороны и какова степень утилизации ресурсов в каждый момент времени. Ну, про мониторинг все и так знают: нет мониторинга -> нет сервиса -> нет проблем.

Конкретные советы

Отложив в сторону красивые истории про процессы, ITIL, и документооборот/согласование изменений комиссией, в сухом остатке можно предложить такие варианты:

  1. Без контроля за конфигурацией большой распределенный сервис в ряде случаев рискует стать большой распределенной болью. Как минимум, обратите внимание на инструмент Ansible – он открыт, достаточно легко изучается, не требует внедрения в виде отдельной системы, при этом:
    • С ходу позволяет документировать конфигурацию всей системы - серверного ПО, приложений (в том числе и CommuniGate Pro), сетевого оборудования.
    • Позволяет автоматически распространить эти конфигурационные параметры на целевые узлы.
    • Обеспечивает хранение такой конфигурации в простом YAML-файле, позволяет реализовать ее версионный контроль, разделение на тестовые - продуктивные зоны.
    • Расширяет, и позволяет как самостоятельно добавлять в него новые возможности управления, так и в дальнейшем построить на его основе полноценную систему управления конфигурацией серверного Linux-парка.
  2. Без сбора и возможности анализа журналов событий большая распределенная система станет черным ящиком. Не стоит ожидать, что в этом случае вы справитесь старым-добрым grep’ом, AWKом и черной консолью, но и не требуется сразу же подключать к этой истории прожорливые системы, новые статьи бюджетов и специалистов по информационной безопасности. В качестве стартовой точки мы рекомендуем обратить внимание на инструмент Graylog - также открытый, доступный, необлачный, и позволяющий:
    • Принимать и агрегировать события из разных источников - от классического syslog до модного и прикладного gelf.
    • Выполнять пост-обработку событий: разбирать их по атрибутам, преобразовывать, перекодировать, дополнять.
    • Хранить терабайты собранных событий (благодаря Elasticsearch под капотом).
    • При росте аппетитов масштабировать его, получая требуемую пропускную способность и длительность истории хранения.
    • Анализировать хранимые данные через специализированный веб-интерфейс, быстро искать необходимую информацию.
    • Отправлять через заданные каналы оповещения информацию о выявленных событиях.
    • Собирать и отображать панели индикаторов, формируемые на основе хранимых данных.
  3. Само собой, не рассчитывать, что в 21 веке можно обойтись без старого доброго мониторинга - как в виде черного ящика, так и со сбором и хранением метрик производительности.

Упомянутые выше инструменты достаточно просты в освоении, и не требуют безусловного привлечения стороннего интегратора, а при необходимости у Digital Design есть ряд полезных дополнений и соответствующая экспертиза:

  • Специализированные модули Ansible управления конфигурацией ПО CommuniGate Pro и экспертиза в части их создания.
  • Набор компонентов «Логрус» для CGP и Graylog, значительно расширяющий возможности управления журналами событий CommuniGate Pro: распределенный сбор и фильтрация, специализированные задачи разбора событий, упрощенные средства поиска полезной информации и формирования отчетов.

Ну и, конечно же, у нас имеется большой опыт в части создания комплексных ИТ-инфраструктур и действительно крупных систем объединенных коммуникаций на базе CommuniGate Pro, в том числе:

  • создания полноценных систем управления конфигурацией и систем мониторинга ИТ-инфраструктуры;
  • создания масштабных и производительных решений по управлению журналами событий.

Продолжая использовать данный веб-сайт, вы соглашаетесь с Политикой использования файлов cookie и тем,
что группа компаний Digital Design может использовать файлы cookie для оптимизации работы веб-сайта.