Важность резервирования сети

Опубликовано: 21 Марта, 2023

Введение

Сегодня более чем когда-либо современному бизнесу требуется надежное подключение к сети и доступ к корпоративным ресурсам. Связи с бизнес-подразделениями, поставщиками и SOHO одинаково важны для обеспечения непрерывности, когда это необходимо. Бизнес работает весь день, каждый день и даже в нерабочее время. Большинство компаний работают круглосуточно, семь дней в неделю, поэтому важно понимать, что для сохранения надежной стратегии обеспечения непрерывности бизнеса следует рассмотреть и/или внедрить технологии резервирования.

Таким образом, мы должны держать все в порядке и доступны все время. Иногда это называют пятью девятками (99,999) безотказной работы. Небольшой процент времени простоя приходится на непредвиденные инциденты или «плановое техническое обслуживание» и обычно проводится в периоды наименьшего воздействия, например, посреди ночи или в праздничные выходные, если это запланировано. Если это не является частью ваших систем и сетевой архитектуры, это следует учитывать, если вы хотите поддерживать высокий уровень доступности. Поскольку что-то ломается и происходят непредвиденные события, нам необходимо оценить необходимость создания архитектуры, которая будет «высокодоступной» или максимально возможной, с заранее предвидимыми сбоями и единственным временем простоя, которое будет выполнять плановое обслуживание..

Чтобы сотрудники компании и их клиенты были на связи и работали, нам необходимо планировать это. С серверами, которые вы можете кластеризовать, а с веб-ресурсами и приложениями вы можете балансировать нагрузку. Сегодня почти каждый поставщик выпускает линейку продуктов для удовлетворения этой потребности с помощью аппаратного и программного обеспечения, а теперь и с помощью виртуализации.

В этой статье мы подробно рассмотрим современные технологии и стратегии, используемые для создания избыточности в вашей глобальной сети, а также то, как правильно спроектировать, внедрить, отслеживать и тестировать в случае любой аварии, которая может произойти. Мы также кратко рассмотрим другие варианты резервирования для серверов и другой сетевой архитектуры, питания и приложений.

Важность резервирования

Сегодняшние сети являются высокотехнологичными и в большинстве случаев высокоскоростными. Общим для большинства проектов глобальных сетей (WAN) является необходимость резервного копирования на случай любого сбоя основного канала. Простым сценарием было бы, если бы у вас было одно подключение T1 от вашего основного сайта к каждому удаленному офису или филиалу, к которому вы подключаетесь. Что, если эта ссылка не работает? Как бы вы продолжили свою деятельность, если бы это произошло? В этом разделе мы рассмотрим этот и другие сценарии, чтобы помочь вам спроектировать и спланировать решение для резервного копирования, на которое вы можете положиться, которое является экономически эффективным и не обходится в кругленькую сумму.

Избыточность сети — это простая для понимания концепция. Если у вас есть единственная точка отказа, и она вас подводит, то вам не на что полагаться. Если вы добавите вторичный (или третичный) метод доступа, то, когда основное соединение выйдет из строя, у вас будет способ подключиться к ресурсам и сохранить бизнес в рабочем состоянии.

Первым шагом в создании избыточности сети (особенно в глобальной сети) является создание плана проекта, который позволит вам тщательно изучить текущую архитектуру/инфраструктуру, спланировать способ сделать ее избыточной, спланировать способ ее развертывания и затем настройте способ проверить это. Ничто не должно считаться «завершенным», пока вы не проверили все на работоспособность. Ваш последний шаг будет включать политику и процессы, которые позволят вам отслеживать их и получать оповещения, когда что-то выходит из строя, чтобы вы могли принять меры. Обычно политика безопасности компании, план аварийного восстановления, план обеспечения непрерывности бизнеса и/или план реагирования на инциденты оставляют место для такого типа решения.

Однако тестирование является ключом к вашему успеху. Это не схема «установил и забыл». Сбой основной ссылки означает, что резервная копия должна вступить во владение автоматически, если вы так ее спроектировали. Может быть одна из множества проблем, которые нельзя устранить самостоятельно или разрешить без взаимодействия, поэтому, если они не установлены автоматически, вам потребуется план реагирования на инциденты для ее учета. У вас также должна быть последующая процедура, независимо от того, автоматическая она или ручная. Это означает, что при внедрении резервирования в ваши системы или сеть вам необходимо немедленно принять меры независимо от того, даже если ваши операции продолжаются, чтобы убедиться, что все идет по плану. Если нет, то вам нужен отчет о действиях, в котором вы можете указать, как что-то будет исправлено или переработано, а затем повторно протестировано.

Анализ имеет решающее значение для создания хорошего плана резервирования. Почти каждая созданная сеть в чем-то уникальна. Вот почему вы должны проанализировать и принять к сведению не только общие элементы, требующие избыточности, но и другие существующие решения, которые вы, возможно, не рассматривали, например, доступ к мэйнфреймам.

Во-первых, должна быть проведена оценка анализа рисков. Затем необходимо принять во внимание основной сайт (или основные сайты), если именно там находится основная часть ваших ресурсов или где заканчивается большинство ваших деловых соединений. Необходимо учитывать маршрутизацию и протоколы маршрутизации. Существуют решения (например, при использовании устройств и программного обеспечения Cisco Systems), в которых можно использовать определенные протоколы для обработки процесса аварийного переключения за вас, если они реализованы правильно. Балансировщики нагрузки, решения для аварийного переключения и протоколы доступны практически для любого варианта резервирования, который вы только можете себе представить.

Примечание:
Вы всегда должны учитывать аппаратное обеспечение. Для серверов и сетевых устройств используются резервные блоки питания и диски с возможностью «горячей» замены (а также другие компоненты), чтобы все было в рабочем состоянии в случае аварии. Кроме того, дисковые накопители можно развернуть таким образом, чтобы данные распределялись по нескольким дискам, например, при использовании RAID, чтобы в случае отказа диска данные не были потеряны. Данные также должны быть сохранены (резервированы) в нескольких местах, чтобы обеспечить возможности восстановления избыточности. Одним из таких примеров является наличие внешнего ленточного хранилища, а также репликация данных на несколько хостов с использованием таких технологий, как Windows DFS.

Кончик:
Локальная вычислительная сеть (LAN) также должна быть проверена на наличие единых точек отказа. Если ваша локальная сеть использует только один коммутатор и к нему подключены оба маршрутизатора, в случае отказа коммутатора локальная сеть также выходит из строя, а также доступ к глобальной сети.

После завершения этапа проектирования необходимо также провести сеанс анализа затрат. Конкуренты в бизнесе, ищущие ваш бизнес, будут надеяться, что вы неправильно составите бюджет, спланируете и спроектируете это решение. Создание избыточности на 90 % оставляет вам 10 % возможного сценария отказа. Это означает, что вы потратили много времени, денег и ресурсов на внедрение решения, которое по-прежнему имеет единственную точку отказа, и если эта единственная точка создает значительное время простоя, то вы потратили все это время и энергию, сделав себя уязвимыми для неудача несмотря ни на что. Хорошая управленческая команда позаботится о том, чтобы ничего не осталось незавершенным, чтобы инвестиции были надежными и выполняли то, что они обещают — поддерживать ваши операции в рабочем состоянии.

Критически важно учитывать текущий дизайн и архитектуру сети (как упоминалось ранее). Упрощенным представлением сети компании может быть основное местоположение (например, штаб-квартира компании), где находятся все серверы, системы, приложения и основная инфраструктура. В этой статье мы будем называть это «базовой инфраструктурой».

На рис. 1 показана схема чрезвычайно распространенной схемы, в которой филиалу необходимо подключиться к основному сайту, где расположены централизованные ресурсы, такие как финансовые приложения, программное обеспечение для планирования ресурсов предприятия (ERP), базы данных, данные файлового сервера и т. д.

Изображение 19536
Рис. 1. Типичный сценарий подключения к глобальной сети с резервированием

Здесь вы можете увидеть, как удаленный филиал подключается к основному сайту. Здесь имеется выделенный канал/канал MPLS, который обеспечивает пропускную способность примерно 1,5 Мбит/с, что соответствует скорости соединения T1. Маршрутизаторы MPLS подключаются к сети через сетевой коммутатор. Обычно маршрутизатор является шлюзом сети по умолчанию, куда отправляются все пакеты, не найденные локально. Маршрутизатору необходимо принять решение о маршрутизации, и, поскольку основной канал работает, он решает отправить через соединение MPLS. Когда основная ссылка обрывается, обычно используется альтернативная ссылка, если она настроена правильно. Это предоставляет вашему удаленному сайту новый путь доступа к ресурсам, необходимым для продолжения работы.

Около 10-15 лет назад технологиями, которые соединяли большинство корпоративных сайтов, были Frame Relay и цифровая сеть с интеграцией служб (ISDN). Хотя ISDN все еще используется в той или иной форме, Frame Relay ушла на второй план, будучи заменена высокоскоростными сетями на основе TCP/IP с поддержкой уровня 3, такими как MPLS, которые мы сейчас рассмотрим. Ядро компании и удаленные сайты обычно соединяются с помощью той или иной технологии на основе глобальной сети, такой как OC3, T3, T1, DSL, MPLS и многие другие. Наиболее распространенными формами сегодня являются многопротокольная коммутация по меткам или MPLS (частная) и некоторая форма подключения к Интернету (общедоступная или общая), подключенная через зашифрованный туннель, называемый виртуальной частной сетью (VPN).

VPN аналогичны тем, к которым вы можете подключаться через свой ноутбук при подключении к работе из дома. Используется та же технология. Поскольку вы подключаетесь через незащищенный общедоступный Интернет, необходимо использовать шифрование для защиты передачи данных и связи. Маршрутизаторы и брандмауэры, если они заказаны с установленными и включенными определенными функциями VPN, могут таким же образом подключать ваши удаленные сайты к основному сайту, шифруя данные, которые вы отправляете через общедоступный Интернет через так называемый «туннель». Это часто используется, потому что это дешевле, чем управляемое, выделенное и частное соединение MPLS, и обычно бездействует до тех пор, пока не будет использовано. Это также безопасно. Поскольку соглашение об уровне обслуживания приобретается по основному каналу, поставщику необходимо быстро его восстановить и запустить, чтобы вам не пришлось долго зависеть от альтернативного канала.

MPLS по своей природе является избыточной сетью. Обычно им управляет интернет-провайдер, который предоставляет вам подключение к нему, или маршрутизатор, которым они также будут управлять. Когда данные отправляются с одного сайта на другой, они передаются в «облако», которое представляет собой частную сеть, которой управляет интернет-провайдер. Пакеты поступают в облако и в ячеистую сеть интернет-провайдера, где существует избыточность. Несмотря на высокую внутреннюю доступность, если маршрутизатор, который соединяет ваш удаленный сайт, выходит из строя, или соединение не работает... ваш сайт будет недоступен независимо от того, если у вас нет резервного маршрутизатора и ссылки на него, чтобы подобрать место неисправного маршрутизатора.

Интернет-провайдеры также иногда предлагают доступ в Интернет через свою сеть MPLS. Не рекомендуется использовать этот конкретный доступ в Интернет для подключения ваших VPN-туннелей для резервного копирования, потому что потенциально он может подключаться к той же сети, которая изначально вас подвела.

Итак, все, что осталось ответить, это последний вопрос — что, если обе ссылки упадут? Вы должны убедиться, что у вас есть доступ к удаленным сайтам через внешнее управление (OOB), например через модемное соединение с последовательным портом подключающегося маршрутизатора. Это дает возможность провести внутреннее тестирование на месте (из локальной сети [LAN] во время полного отключения. Модем можно подключить к последовательному порту на маршрутизаторе или на сервере в локальной сети. настроена коммутируемая линия, и вы можете набрать ее и подключиться, вы можете получить доступ к своему Убедитесь, что все правильно защищено, не позволяйте кому-либо входить в вашу сеть через модем, что довольно легко сделать, если нет заблокированы.

Совет:
Вы всегда должны создавать альтернативную ссылку на удаленные сайты, когда обе ссылки не работают. Это можно сделать с помощью чрезвычайно экономичного (дешевого) решения для коммутируемого доступа через линию POTS. Вы можете подключить модем к маршрутизатору, серверу или ноутбуку и получить доступ к локальной сети для устранения неполадок или обеспечения доступа, если это необходимо.

Есть компании, которые являются более сложными, например, если стратегия компании заключается в слиянии и поглощении других компаний, может быть основная инфраструктура, расположенная в нескольких основных сетях с критически важными ресурсами. Этим компаниям следует рассмотреть стратегию упрощения схемы, консолидации и перемещения в централизованное (и защищенное) место, но это не всегда так. В таких ситуациях создание резервного плана резервного копирования сети может быть затруднено. Иногда это настраивается так по замыслу, например, если у вас есть основная/центральная штаб-квартира, где расположены некоторые из ваших ресурсов, а другие размещены в совместно расположенном центре обработки данных. Использование ресурсов за пределами вашей сети, управляемых другими (или переданными на аутсорсинг), считается «облачными вычислениями» и SaaS или «программным обеспечением как услугой». Кроме того, вам необходимо учитывать различия между хранением услуг внутри компании и использованием аутсорсинговых решений. Если ваша архитектура частично или полностью передана на аутсорсинг — вы должны тщательно изучить политику провайдера, соглашение об уровне обслуживания (SLA) и политики ведения работ.

Вы также всегда должны учитывать LAN-соединения ваших маршрутизаторов и назначение шлюза LAN по умолчанию. Для лучшего проектирования создайте пуленепробиваемую (избыточную) локальную сеть, установив два коммутатора и назначив их шлюзом по умолчанию. Таким образом, если маршрутизатор полностью выйдет из строя (например, потеря питания), адрес шлюза по умолчанию останется нетронутым, и решение может принять коммутатор, а не маршрутизатор. См. рис. 2 для резервного подключения к локальной сети, где маршрутизаторы подключены, а коммутаторы принимают решения о маршрутизации в случае, когда маршрутизатор с назначением шлюза по умолчанию находится под угрозой.

Изображение 19537
Рисунок 2: Создание резервирования в вашей локальной сети с помощью нескольких коммутаторов

Кончик:
Рекомендуется приобрести оборудование с несколькими резервными источниками питания с возможностью горячей замены и убедиться, что источник питания находится на генераторе, имеет резервную копию и/или имеет правильную фазу, чтобы вы могли полностью пережить потерю питания. Корпоративные системы ИБП, резервные генераторы и т. д. могут использоваться для обеспечения альтернативных и резервных решений по питанию, когда это необходимо.

Примечание:
Заказ строк у интернет-провайдера или поставщика может занять некоторое время, поэтому убедитесь, что вы правильно их размер, а затем закажите их заранее, что может сэкономить ваше время при развертывании решения резервирования.

Следует также учитывать географические соображения. Рассмотрим точку присутствия (POP). Если вы используете одного провайдера, и у него есть внутренние проблемы в сети, или произойдет бедствие (например, ураган), которое затронет этот район, то вы окажетесь во власти провайдера, независимо от того, сколько у вас линий. Решения для аварийного восстановления учитывают это, особенно если вы используете совмещенный центр обработки данных, например холодный/теплый или горячий сайт.

В общем, простое эмпирическое правило при проектировании и планировании резервирования: выполняйте работу правильно… не срезайте углы, чтобы сэкономить деньги, потому что, если вы начнете тратить капитал на резервирование и все еще оставите единую точку отказа (например, один переключатель), небольшая стоимость может поставить под угрозу все решение, которое на самом деле стоило вам больших затрат на реализацию. Линии, маршрутизаторы, человеческие ресурсы для его реализации и ежедневный мониторинг стоят денег. Было бы глупо оставлять простую единственную точку отказа, когда вы тратите время и деньги на остальную часть проекта. Подумайте о том, чтобы выполнить проект правильно, спроектировав его, заложив для него бюджет и наняв нужных людей (или обученных) для его правильного развертывания, управления и мониторинга… и, наконец, проверьте его на точность. Учитывайте все и не оставляйте камня на камне.

После того, как вы спроектировали и спланировали свое решение, во время развертывания необходимо учесть несколько моментов. Если используются внутренние решения, ваши сотрудники должны знать, как справиться с инцидентом. В случае аутсорсинга ваш поставщик/поставщик должен иметь план по добавлению, управлению, мониторингу и последующему восстановлению после сбоя. Планы тестирования также следует учитывать в обоих сценариях.

Вы также должны учитывать более сложную структуру при рассмотрении того, как добавить и развернуть свое решение. На рис. 3 показано более распространенное решение для крупной компании.

Изображение 19538
Рис. 3. Подключение нескольких удаленных сайтов к ядру с резервным решением

Здесь у вас есть несколько удаленных сайтов, подключенных к основному (или нескольким основным) местоположениям. Резервные каналы обеспечивают альтернативное решение проблемы сбоя основного канала в вашей глобальной сети и обеспечивают удаленный доступ к основным ресурсам.

Также следует рассмотреть технологии аварийного переключения. Подобно кластеризации серверов, сетевое оборудование также может переключаться на другие устройства (такие как маршрутизаторы, коммутаторы, брандмауэры и т. д.), если оно настроено для этого. Например, маршрутизатор Cisco можно настроить с использованием протокола маршрутизатора с горячим резервированием (HSRP). Серверы могут быть объединены в кластеры и сбалансированы по нагрузке для любого сценария отработки отказа, о котором вы только можете подумать. С помощью решений виртуализации Windows Hyper-V, VMware и Citrix вы можете создать структуру, в которой любой сбой можно устранить, автоматически поддерживая работу в случае любой аварии.

Кончик:
Для VPN-клиентов также важно иметь доступ к корпоративным ресурсам, будь то в дороге или в домашнем офисе. При этом вам также следует рассмотреть возможность проверки избыточности концентратора VPN. Если для этой стратегии вам нужны два основных устройства, убедитесь, что они знают, как переключаться с одного на другое в случае необходимости.

После того, как вы рассмотрели свой проект после полного анализа и реализовали его, вам необходимо тщательно его протестировать, а затем задокументировать процедуры. После этого вам необходимо продолжать тестировать и обновлять документацию, особенно по мере добавления новых технологий в вашу архитектуру или по мере роста вашей архитектуры, например добавления новых сайтов.

Теперь, когда мы поговорили о важности резервирования, особенно в сети… вам нужно его протестировать.

План тестирования — составьте план, который охватывает детали сценария отработки отказа, чтобы вы могли его протестировать. Для этого подробно опишите всю архитектуру, которую необходимо протестировать, и вручную выполните отработку отказа, чтобы увидеть, как работает решение. Убедитесь, что вы тестируете приложения, пути маршрутизации, время/скорость/пропускную способность и точность. Также протестируйте отказоустойчивость и то, как основная ссылка, когда она становится доступной, может возобновить роль основной ссылки.

Мониторинг сети — ваше решение для мониторинга сети должно помочь вам узнать об отказе основного канала. Используя такие технологии, как ICMP и SNMP, вы можете постоянно отслеживать время безотказной работы и получать оповещения об изменении любого устройства, канала связи или решения.

План аварийного восстановления — план должен быть готов, а если нет, то должен быть немедленно добавлен. В этом плане должны быть изложены

Планирование непрерывности бизнеса и планирование реагирования на инциденты являются частью этого плана аварийного восстановления. Как бизнес будет продолжать работать, а также кто будет реагировать на проблему и решать ее до тех пор, пока нормальная работа не будет восстановлена.

Резюме

В этой статье мы рассмотрели добавление избыточности в вашу сеть. Чтобы сотрудники компании и их клиенты были на связи и работали, нам необходимо планировать это. С серверами, которые вы можете кластеризовать, а с веб-ресурсами и приложениями вы можете балансировать нагрузку. Сетевое оборудование можно сделать высокодоступным. Сегодня почти каждый поставщик выпускает линейку продуктов для удовлетворения этой потребности с помощью аппаратного и программного обеспечения, а теперь и с помощью виртуализации. В этой статье мы подробно рассмотрели современные технологии и стратегии, используемые для создания избыточности в вашей глобальной сети, а также то, как правильно спроектировать, внедрить, отслеживать и тестировать в случае любой аварии, которая может произойти.