Вторая пара глаз: советы по мониторингу инфраструктуры вашей организации

Пословица, которой живут многие из нас, звучит так: «Если это не сломано, не чини это». К сожалению, это часто приводит к другому жизненному принципу, а именно: «Не покупайте инструмент, если он вам не нужен, чтобы починить что-то сломанное». Системы мониторинга, сети и базы данных примерно такие. Большинство из нас, работающих в сфере ИТ, согласятся, что мониторинг инфраструктуры — это хорошая идея. Удивительно, однако, как много компаний — и не только малых — не готовы тратить деньги на комплексное и интеллектуальное решение для мониторинга, чтобы обеспечить вторую пару глаз для наблюдения за своей инфраструктурой.
Так что, если вы отвечаете за ИТ в одной из тех компаний, которые считают каждую копейку и не будут покупать инструмент, если двигатель уже не сломан, пришло время вернуться к основам и понять, почему мониторинг важен для организаций любого размера.. Чтобы помочь нам понять это, я некоторое время назад разговаривал с Беном Деем, старшим системным инженером, работающим в группе технической поддержки Paessler AG, компании, базирующейся в Германии, которая является ведущим мировым поставщиком программного обеспечения для мониторинга сети. А пока вы этим занимаетесь, возможно, вы захотите ознакомиться со статьей автора TechGenix Ричарда Хикса, в которой он сделал обзор продукта Paessler PRTG Network Monitor, комплексного решения для мониторинга сети, обладающего мощными возможностями. Теперь давайте послушаем Бена, который объясняет важность мониторинга ИТ-инфраструктуры вашей организации.
Что такое мониторинг инфраструктуры?
Современная инфраструктура, будь то на крупных предприятиях или в малом бизнесе, становится все более сложной. Эта сложность обусловлена виртуализацией, облаком и мобильностью, при этом во многих случаях не за горами рост межмашинного трафика. Проблемы современной инфраструктуры усугубляются для ИТ-отделов меняющимся характером бизнеса — компании стали более глобальными, чем когда-либо, более распределенными, чем когда-либо, и имеют приложения и процессы, которые должны быть доступны 24 часа в сутки, 7 дней в неделю, а простои часто означают потерю производительности или доход.
Сочетание этих технических и бизнес-задач создает идеальный шторм для ИТ-отделов. Примите во внимание текущие проблемы, в том числе распространение теневых ИТ и постоянно растущие темпы приобретения технологий отделами маркетинга, и ваш среднестатистический системный администратор или ИТ-менеджер действительно отстает от восьмерки. Группе поддержки нужна поддержка, а для ИТ это означает прозрачность того, что происходит в их инфраструктуре, и основанный на правилах подход к управлению и мониторингу. Глубокий обзор сетевого трафика, тщательно настроенные оповещения, информационные панели и карты, которые можно просматривать в любом месте, — все это дает ИТ-специалистам дополнительную помощь в обеспечении бесперебойной работы и, что более важно, в наблюдении за своей инфраструктурой, когда они не могут этого сделать.
Мониторинг лучше всего рассматривать как профилактическую медицину. Отслеживание и сравнительный анализ времени безотказной работы, пропускной способности, использования ЦП, емкости и других показателей за длительный период времени обеспечивает базовый уровень, на основе которого можно настроить оповещения для информирования ИТ-отдела о сбоях в работе систем. Перебои в работе и сбои в конечном счете обходятся очень дорого, но когда ИТ-специалисты могут выявить их до того, как они произойдут, серьезные проблемы станут мелкими проблемами, которые легко решить.
Переходя к специфике, независимый от поставщика инструмент мониторинга, используемый надлежащим образом, может помочь предотвратить ряд распространенных ИТ-головных болей, проблем, которые легко предотвратить, но трудно исправить. Вот выборка проблем, которые ИТ-специалисты могут предотвратить, сэкономив время и продуктивность, с помощью второй пары глаз.
Автоматическая перезагрузка неисправных серверов Windows
При сбое службы или сервера Windows большинство системных администраторов получают текстовое уведомление или уведомление по электронной почте. Самый распространенный способ решить эту проблему — отправить поддержку для ручной перезагрузки всего сервера. Когда это такая служба, как Outlook, и это происходит в середине рабочего дня, это серьезная проблема.
С помощью мониторинга активный администратор может автоматически перезагружать серверы, создавая простой сценарий, который выполняет перезагрузку после того, как сервер или служба не работает в течение заданного периода времени. Вместо того, чтобы ждать оповещения или билета, инструмент мониторинга действует сам по себе, автоматически перезагружая отказавший или зависший сервер, и даже может писать дополнительные сценарии для программирования конкретных параметров перезапуска.
Виртуальные машины по-прежнему требуют внимания
Виртуализация — замечательная технология, но если у нее и есть недостаток, так это то, что о ней легко забыть. Крайне важно отслеживать базовые показатели и отслеживать загрузку ЦП и памяти, использование диска и использование сети, а также отслеживать эти показатели. Существует ряд проблем, которые могут возникнуть, если ИТ-отдел потеряет связь с виртуальными машинами: трата ресурсов впустую, снижение производительности сети, посторонние виртуальные машины, перегружающие один хост или, наоборот, их слишком мало. Установление базовых показателей и моделей долгосрочного использования имеет первостепенное значение при анализе работоспособности и успешности виртуализированной инфраструктуры.
Виртуализированные среды также полностью зависят от эффективности и времени безотказной работы сети. Таким образом, хотя мониторинг виртуальных машин крайне важен, не менее важно отслеживать производительность хост-сервера, соединения, сетевых коммутаторов и маршрутизаторов. Понимание множества метрик, влияющих на правильную работу виртуальных машин, и настройка предупреждений, когда какая-либо метрика выходит за пределы предопределенных границ, не только предотвращает сбои, но и оптимизирует сетевые ресурсы и помогает контролировать расходы.
Устранение неполадок с производительностью базы данных
Выявление основной причины низкой производительности базы данных часто является сложной и трудоемкой задачей. SQL-серверы, например, требуют обслуживания и мониторинга для обеспечения их оптимизации. Определяя базовую производительность, администраторы баз данных могут попытаться понять, когда сервер испытывает наибольшую нагрузку, и отслеживать количество одновременных подключений пользователей, чтобы увидеть, не перегружена ли база данных. Кроме того, правильно настроенный мониторинг может определить процент страниц в буферном кеше без чтения диска, и в этом случае можно написать сценарии для автоматического увеличения объема памяти.
В сложной ИТ-среде может произойти множество вещей, которые могут пойти не так, но большинство из них можно предотвратить, если ИТ-администраторы окажут некоторую помощь. Обзорность и круглосуточный мониторинг необходимы, потому что они дают ИТ-отделу то, чего у них нет в противном случае, — вторую группу глаз, наблюдающих за их инфраструктурой, даже если они не могут этого сделать.