Важность резервирования сети
Введение
Сегодня более чем когда-либо современному бизнесу требуется надежное подключение к сети и доступ к корпоративным ресурсам. Связи с бизнес-подразделениями, поставщиками и SOHO одинаково важны для обеспечения непрерывности, когда это необходимо. Бизнес работает весь день, каждый день и даже в нерабочее время. Большинство компаний работают круглосуточно, семь дней в неделю, поэтому важно понимать, что для сохранения надежной стратегии обеспечения непрерывности бизнеса следует рассмотреть и/или внедрить технологии резервирования.
Таким образом, мы должны держать все в порядке и доступны все время. Иногда это называют пятью девятками (99,999) безотказной работы. Небольшой процент времени простоя приходится на непредвиденные инциденты или «плановое техническое обслуживание» и обычно проводится в периоды наименьшего воздействия, например, посреди ночи или в праздничные выходные, если это запланировано. Если это не является частью ваших систем и сетевой архитектуры, это следует учитывать, если вы хотите поддерживать высокий уровень доступности. Поскольку что-то ломается и происходят непредвиденные события, нам необходимо оценить необходимость создания архитектуры, которая будет «высокодоступной» или максимально возможной, с заранее предвидимыми сбоями и единственным временем простоя, которое будет выполнять плановое обслуживание..
Чтобы сотрудники компании и их клиенты были на связи и работали, нам необходимо планировать это. С серверами, которые вы можете кластеризовать, а с веб-ресурсами и приложениями вы можете балансировать нагрузку. Сегодня почти каждый поставщик выпускает линейку продуктов для удовлетворения этой потребности с помощью аппаратного и программного обеспечения, а теперь и с помощью виртуализации.
В этой статье мы подробно рассмотрим современные технологии и стратегии, используемые для создания избыточности в вашей глобальной сети, а также то, как правильно спроектировать, внедрить, отслеживать и тестировать в случае любой аварии, которая может произойти. Мы также кратко рассмотрим другие варианты резервирования для серверов и другой сетевой архитектуры, питания и приложений.
Важность резервирования
Сегодняшние сети являются высокотехнологичными и в большинстве случаев высокоскоростными. Общим для большинства проектов глобальных сетей (WAN) является необходимость резервного копирования на случай любого сбоя основного канала. Простым сценарием было бы, если бы у вас было одно подключение T1 от вашего основного сайта к каждому удаленному офису или филиалу, к которому вы подключаетесь. Что, если эта ссылка не работает? Как бы вы продолжили свою деятельность, если бы это произошло? В этом разделе мы рассмотрим этот и другие сценарии, чтобы помочь вам спроектировать и спланировать решение для резервного копирования, на которое вы можете положиться, которое является экономически эффективным и не обходится в кругленькую сумму.
Избыточность сети — это простая для понимания концепция. Если у вас есть единственная точка отказа, и она вас подводит, то вам не на что полагаться. Если вы добавите вторичный (или третичный) метод доступа, то, когда основное соединение выйдет из строя, у вас будет способ подключиться к ресурсам и сохранить бизнес в рабочем состоянии.
Первым шагом в создании избыточности сети (особенно в глобальной сети) является создание плана проекта, который позволит вам тщательно изучить текущую архитектуру/инфраструктуру, спланировать способ сделать ее избыточной, спланировать способ ее развертывания и затем настройте способ проверить это. Ничто не должно считаться «завершенным», пока вы не проверили все на работоспособность. Ваш последний шаг будет включать политику и процессы, которые позволят вам отслеживать их и получать оповещения, когда что-то выходит из строя, чтобы вы могли принять меры. Обычно политика безопасности компании, план аварийного восстановления, план обеспечения непрерывности бизнеса и/или план реагирования на инциденты оставляют место для такого типа решения.
Однако тестирование является ключом к вашему успеху. Это не схема «установил и забыл». Сбой основной ссылки означает, что резервная копия должна вступить во владение автоматически, если вы так ее спроектировали. Может быть одна из множества проблем, которые нельзя устранить самостоятельно или разрешить без взаимодействия, поэтому, если они не установлены автоматически, вам потребуется план реагирования на инциденты для ее учета. У вас также должна быть последующая процедура, независимо от того, автоматическая она или ручная. Это означает, что при внедрении резервирования в ваши системы или сеть вам необходимо немедленно принять меры независимо от того, даже если ваши операции продолжаются, чтобы убедиться, что все идет по плану. Если нет, то вам нужен отчет о действиях, в котором вы можете указать, как что-то будет исправлено или переработано, а затем повторно протестировано.
Анализ имеет решающее значение для создания хорошего плана резервирования. Почти каждая созданная сеть в чем-то уникальна. Вот почему вы должны проанализировать и принять к сведению не только общие элементы, требующие избыточности, но и другие существующие решения, которые вы, возможно, не рассматривали, например, доступ к мэйнфреймам.
Во-первых, должна быть проведена оценка анализа рисков. Затем необходимо принять во внимание основной сайт (или основные сайты), если именно там находится основная часть ваших ресурсов или где заканчивается большинство ваших деловых соединений. Необходимо учитывать маршрутизацию и протоколы маршрутизации. Существуют решения (например, при использовании устройств и программного обеспечения Cisco Systems), в которых можно использовать определенные протоколы для обработки процесса аварийного переключения за вас, если они реализованы правильно. Балансировщики нагрузки, решения для аварийного переключения и протоколы доступны практически для любого варианта резервирования, который вы только можете себе представить.
Примечание:
Вы всегда должны учитывать аппаратное обеспечение. Для серверов и сетевых устройств используются резервные блоки питания и диски с возможностью «горячей» замены (а также другие компоненты), чтобы все было в рабочем состоянии в случае аварии. Кроме того, дисковые накопители можно развернуть таким образом, чтобы данные распределялись по нескольким дискам, например, при использовании RAID, чтобы в случае отказа диска данные не были потеряны. Данные также должны быть сохранены (резервированы) в нескольких местах, чтобы обеспечить возможности восстановления избыточности. Одним из таких примеров является наличие внешнего ленточного хранилища, а также репликация данных на несколько хостов с использованием таких технологий, как Windows DFS.
Кончик:
Локальная вычислительная сеть (LAN) также должна быть проверена на наличие единых точек отказа. Если ваша локальная сеть использует только один коммутатор и к нему подключены оба маршрутизатора, в случае отказа коммутатора локальная сеть также выходит из строя, а также доступ к глобальной сети.
После завершения этапа проектирования необходимо также провести сеанс анализа затрат. Конкуренты в бизнесе, ищущие ваш бизнес, будут надеяться, что вы неправильно составите бюджет, спланируете и спроектируете это решение. Создание избыточности на 90 % оставляет вам 10 % возможного сценария отказа. Это означает, что вы потратили много времени, денег и ресурсов на внедрение решения, которое по-прежнему имеет единственную точку отказа, и если эта единственная точка создает значительное время простоя, то вы потратили все это время и энергию, сделав себя уязвимыми для неудача несмотря ни на что. Хорошая управленческая команда позаботится о том, чтобы ничего не осталось незавершенным, чтобы инвестиции были надежными и выполняли то, что они обещают — поддерживать ваши операции в рабочем состоянии.
Критически важно учитывать текущий дизайн и архитектуру сети (как упоминалось ранее). Упрощенным представлением сети компании может быть основное местоположение (например, штаб-квартира компании), где находятся все серверы, системы, приложения и основная инфраструктура. В этой статье мы будем называть это «базовой инфраструктурой».
На рис. 1 показана схема чрезвычайно распространенной схемы, в которой филиалу необходимо подключиться к основному сайту, где расположены централизованные ресурсы, такие как финансовые приложения, программное обеспечение для планирования ресурсов предприятия (ERP), базы данных, данные файлового сервера и т. д.
Рис. 1. Типичный сценарий подключения к глобальной сети с резервированием
Здесь вы можете увидеть, как удаленный филиал подключается к основному сайту. Здесь имеется выделенный канал/канал MPLS, который обеспечивает пропускную способность примерно 1,5 Мбит/с, что соответствует скорости соединения T1. Маршрутизаторы MPLS подключаются к сети через сетевой коммутатор. Обычно маршрутизатор является шлюзом сети по умолчанию, куда отправляются все пакеты, не найденные локально. Маршрутизатору необходимо принять решение о маршрутизации, и, поскольку основной канал работает, он решает отправить через соединение MPLS. Когда основная ссылка обрывается, обычно используется альтернативная ссылка, если она настроена правильно. Это предоставляет вашему удаленному сайту новый путь доступа к ресурсам, необходимым для продолжения работы.
Около 10-15 лет назад технологиями, которые соединяли большинство корпоративных сайтов, были Frame Relay и цифровая сеть с интеграцией служб (ISDN). Хотя ISDN все еще используется в той или иной форме, Frame Relay ушла на второй план, будучи заменена высокоскоростными сетями на основе TCP/IP с поддержкой уровня 3, такими как MPLS, которые мы сейчас рассмотрим. Ядро компании и удаленные сайты обычно соединяются с помощью той или иной технологии на основе глобальной сети, такой как OC3, T3, T1, DSL, MPLS и многие другие. Наиболее распространенными формами сегодня являются многопротокольная коммутация по меткам или MPLS (частная) и некоторая форма подключения к Интернету (общедоступная или общая), подключенная через зашифрованный туннель, называемый виртуальной частной сетью (VPN).
VPN аналогичны тем, к которым вы можете подключаться через свой ноутбук при подключении к работе из дома. Используется та же технология. Поскольку вы подключаетесь через незащищенный общедоступный Интернет, необходимо использовать шифрование для защиты передачи данных и связи. Маршрутизаторы и брандмауэры, если они заказаны с установленными и включенными определенными функциями VPN, могут таким же образом подключать ваши удаленные сайты к основному сайту, шифруя данные, которые вы отправляете через общедоступный Интернет через так называемый «туннель». Это часто используется, потому что это дешевле, чем управляемое, выделенное и частное соединение MPLS, и обычно бездействует до тех пор, пока не будет использовано. Это также безопасно. Поскольку соглашение об уровне обслуживания приобретается по основному каналу, поставщику необходимо быстро его восстановить и запустить, чтобы вам не пришлось долго зависеть от альтернативного канала.
MPLS по своей природе является избыточной сетью. Обычно им управляет интернет-провайдер, который предоставляет вам подключение к нему, или маршрутизатор, которым они также будут управлять. Когда данные отправляются с одного сайта на другой, они передаются в «облако», которое представляет собой частную сеть, которой управляет интернет-провайдер. Пакеты поступают в облако и в ячеистую сеть интернет-провайдера, где существует избыточность. Несмотря на высокую внутреннюю доступность, если маршрутизатор, который соединяет ваш удаленный сайт, выходит из строя, или соединение не работает... ваш сайт будет недоступен независимо от того, если у вас нет резервного маршрутизатора и ссылки на него, чтобы подобрать место неисправного маршрутизатора.
Интернет-провайдеры также иногда предлагают доступ в Интернет через свою сеть MPLS. Не рекомендуется использовать этот конкретный доступ в Интернет для подключения ваших VPN-туннелей для резервного копирования, потому что потенциально он может подключаться к той же сети, которая изначально вас подвела.
Итак, все, что осталось ответить, это последний вопрос — что, если обе ссылки упадут? Вы должны убедиться, что у вас есть доступ к удаленным сайтам через внешнее управление (OOB), например через модемное соединение с последовательным портом подключающегося маршрутизатора. Это дает возможность провести внутреннее тестирование на месте (из локальной сети [LAN] во время полного отключения. Модем можно подключить к последовательному порту на маршрутизаторе или на сервере в локальной сети. настроена коммутируемая линия, и вы можете набрать ее и подключиться, вы можете получить доступ к своему Убедитесь, что все правильно защищено, не позволяйте кому-либо входить в вашу сеть через модем, что довольно легко сделать, если нет заблокированы.
Совет:
Вы всегда должны создавать альтернативную ссылку на удаленные сайты, когда обе ссылки не работают. Это можно сделать с помощью чрезвычайно экономичного (дешевого) решения для коммутируемого доступа через линию POTS. Вы можете подключить модем к маршрутизатору, серверу или ноутбуку и получить доступ к локальной сети для устранения неполадок или обеспечения доступа, если это необходимо.
Есть компании, которые являются более сложными, например, если стратегия компании заключается в слиянии и поглощении других компаний, может быть основная инфраструктура, расположенная в нескольких основных сетях с критически важными ресурсами. Этим компаниям следует рассмотреть стратегию упрощения схемы, консолидации и перемещения в централизованное (и защищенное) место, но это не всегда так. В таких ситуациях создание резервного плана резервного копирования сети может быть затруднено. Иногда это настраивается так по замыслу, например, если у вас есть основная/центральная штаб-квартира, где расположены некоторые из ваших ресурсов, а другие размещены в совместно расположенном центре обработки данных. Использование ресурсов за пределами вашей сети, управляемых другими (или переданными на аутсорсинг), считается «облачными вычислениями» и SaaS или «программным обеспечением как услугой». Кроме того, вам необходимо учитывать различия между хранением услуг внутри компании и использованием аутсорсинговых решений. Если ваша архитектура частично или полностью передана на аутсорсинг — вы должны тщательно изучить политику провайдера, соглашение об уровне обслуживания (SLA) и политики ведения работ.
Вы также всегда должны учитывать LAN-соединения ваших маршрутизаторов и назначение шлюза LAN по умолчанию. Для лучшего проектирования создайте пуленепробиваемую (избыточную) локальную сеть, установив два коммутатора и назначив их шлюзом по умолчанию. Таким образом, если маршрутизатор полностью выйдет из строя (например, потеря питания), адрес шлюза по умолчанию останется нетронутым, и решение может принять коммутатор, а не маршрутизатор. См. рис. 2 для резервного подключения к локальной сети, где маршрутизаторы подключены, а коммутаторы принимают решения о маршрутизации в случае, когда маршрутизатор с назначением шлюза по умолчанию находится под угрозой.