Четыре шага к эффективному мониторингу производительности облачной ИТ-инфраструктуры

Последние 18 месяцев ярко продемонстрировали преимущества облачных архитектур, которые обеспечили быструю и гибкую интеграцию в существующие системы и отказоустойчивость при эксплуатации. Благодаря этому многие компании смогли быстро перенести свои бизнес-процессы на облачные сервисы, которые позволили им оперативно запустить и масштабировать новые услуги в условиях повсеместной цифровизации.

Однако ускоренный переход привел к появлению серьёзных проблем в ИТ-подразделениях. Исследование AppDynamics Agents of Transformation 2021: The Rise of Full-Stack Observability показало, что в результате быстрого внедрения облачных сервисов большинство ИТ-инфраструктур стало похоже на лоскутное одеяло, включающее в себя On-Premises и SaaS решения. ИТ-специалисты резко обнаружили, что традиционные подходы к мониторингу больше не актуальны и не подходят для анализа динамических и распределенных программно-определяемых сред с постоянным масштабированием мощностей.

Ожидается, что цифровизация и внедрение облачных сред будут только ускоряться в течение следующих 3 лет. Чрезвычайно быстрый рост несет в себе серьезные угрозы, которые могут сказываться не только на показателях бизнеса, а также на моральном состоянии сотрудников. Исследование Agents of Transformation 2021: The Rise of Full-Stack Observability показало, что 79% опрошенных ИТ-специалистов считают, что для достижения инновационных целей своих организаций им необходимы более совершенные инструменты мониторинга и новые компетенции.

Эксперты AppDynamics разработали 4 шага, которые позволят наладить эффективный мониторинг производительности облачной ИТ-инфраструктуры, получить более глубокое понимание состояния приложений без лишних трудозатрат и увеличить уровень возврата инвестиций.

Полная прозрачность облачных ИТ-инфраструктур

Многие технологи сообщают о серьёзных проблемах с мониторингом приложений и облачных ИТ-инфраструктур. Они обнаруживают, что традиционные инструменты мониторинга плохо работают с масштабируемыми моделями систем, где важно постоянно адаптироваться к изменяющимся потребностям бизнеса. Исходя из этого, важно внедрить APM и Network Intelligence решения для мониторинга гибридного ИТ-стека: от клиентских приложений, до базовой инфраструктуры, включая вычислительные мощности, хранилища, сеть, доступ в Интернет и систему безопасности.

Для быстрого устранения неполадок на ранних этапах, технологам нужен инструмент, который обеспечит поиск первопричины сбоев и свяжет показатели инфраструктуры (вычислительные ресурсы, хранилища и сети) с уровнем производительности сервисов и приложений. Это позволит легко понять, где находится источник проблемы и избавит от необходимости работать в режиме «тушения пожаров».

Производительность системы и результаты бизнеса

После формирования общей картины состояния ИТ-инфраструктуры и приложений необходимо связать эти данные с показателями бизнеса в реальном времени. Это позволит не только приоритизировать проблемы по степени их влияния на клиентский опыт и бизнес-процессы, а также принять более обоснованные решения на основе конкретных показателей качества обслуживания клиентов, продажи и выручки.

Также анализ данных о производительности с точки зрения бизнеса существенно влияет на управление повседневной рабочей нагрузкой и позволяет сфокусировать усилия на тех направлениях, которые имеют наибольшее значение для основной деятельности компании. К тому же такой подход позволит повысить эффективность каждого сотрудника за счет четкого распределения рабочих задач среди сотрудников.

Развитие новых навыков

Использование новых инструментов мониторинга гибридных ИТ-сред требует совершенно новых компетенций, таких как переход на OpenTelemetry — новый стандарт данных, ориентированный на облачное ПО. Исследование Agents of Transformation 2021: The Rise of Full-Stack Observability выявило, что 35% ИТ-специалистов выражают озабоченность по поводу недостатка навыков, необходимых для эффективного владения новыми решениями сквозного мониторинга.

Для преодоления угрозы нехватки нужных компетенций руководству необходимо инвестировать в обучение существующей команды, проводя тренинги, science slam (соревнования в виде коротких выступлений с рассказами о своих инициативах), конкурсы, хакатоны или корпоративные соревнования.

Стоит отметить, что такой подход позволит не только плавно подготовить сотрудников к использованию новых инструментов и решению нестандартных задач, а также поможет развить культуру инноваций в коллективе. К примеру, эксперты ИТ-консалтинговой компании Wote считают, что если у сотрудников всех уровней есть возможность предлагать идеи и реализовывать их, то это показатель зрелой компании. Также в процессе обучения появляются новые лидеры, которые, возможно, в будущем займутся решением сложных стратегических задач.

Внедрение искусственного интеллекта

Существует высокая вероятность, что даже при наличии лучших инструментов мониторинга и квалифицированного персонала, ИТ-отделы будут перегружены огромным объемом данных, генерируемым бизнес-процессами после ускоренного перехода на “цифровые рельсы”. В результате ИТ-отделы начнут бороться за ресурсы и навыки, необходимые для эффективного управления гибридными ИТ-инфраструктурами, так как большинство существующих решений не сможет справиться с потоком данных и уровнем сложности, которые характерны для крупномасштабных сред.

Для предотвращения проблем в будущем стоит подумать, как уменьшить зависимость ИТ-отдела от ручных операций при мониторинге производительности и устранении проблем. Всё более важную роль в отслеживании работоспособности и производительности ИТ-инфраструктуры, особенно в крупномасштабных ИТ-средах, будут играть автоматизация и искусственный интеллект. Так ИТ-специалисты смогут сэкономить время, переложив на ИИ большую часть рутинных операций по выявлению и устранению проблем с производительностью.