Серия статей по безопасности: разработка плана обеспечения непрерывности бизнеса (часть 3 из 6)

Опубликовано: 13 Апреля, 2023

Содержание

  • Глава 1: Тактика аварийного восстановления, обеспечивающая непрерывность бизнеса
  • Глава 2: Цель аварийного восстановления
  • Глава 3: Формулировка плана обеспечения непрерывности бизнеса
  • Глава 4: Цели и этапы аварийного восстановления
  • Глава 5: Подготовка здания


  • Глава 6. Последние советы по обратному отсчету для аварийного восстановления и обеспечения непрерывности бизнеса
  • Требования плана обеспечения непрерывности бизнеса

    При разработке плана обеспечения непрерывности бизнеса (BCP) важно добавить элементы, соответствующие бизнес-требованиям. Некоторые из бизнес-требований, которые необходимо решить, перечислены ниже:

    1. Временные окна

    Прежде чем формулировать планы обеспечения непрерывности, необходимо установить и согласовать приемлемые сроки. Это связано с тем, что следующие шаги требуют временных окон, чтобы сформулировать правильные шаги действий и прийти к технологическому решению.

    2. Формулировка действий

    Необходима формулировка того, какие действия необходимо предпринять в случае аварии, и необходимо вести документацию по любой установке и настройке. Этот план действий является поэтапным и должен быть документом, который растет внутри организации. Непрерывное уточнение этого документа должно повторяться, когда выполняются тесты на восстановление операций.

    Хороший способ сформулировать план действий — сначала попытаться восстановиться на месте в изолированной зоне или комнате и задокументировать шаги по мере их выполнения.

    3. Доступность

    Необходимо принять меры для обеспечения доступности услуг, связанных и не связанных с ИТ. Из-за тесной интеграции не связанных с ИТ услуг, таких как телефонные сети и другие офисные технологии и удобства, жизненно важно, чтобы при принятии решения о том, какие услуги должны быть доступны, принимали участие правильные деловые люди.

    4. Выбор оборудования

    Аппаратное обеспечение, которое вы выбираете сегодня, напрямую влияет на возможность восстановления в будущем. Это особенно очевидно в архивных стратегиях и должно быть отмечено. Устройство DLT (Digital Linear Tape) было рекомендовано и использовалось несколько лет назад, но теперь нормой является LTO (Linear Tape Open). Если вам нужно восстановить носитель, которому несколько лет, вам может показаться сложным, если ваше оборудование выведен из эксплуатации и особенно если он больше не поддерживается производителями. Уместно обеспечить постоянное резервное копирование ваших данных на последний тип носителя. Таким образом, помимо живого сервера вам может понадобиться также сервер архивации, который ваша организация может создавать резервными копиями на более современные носители. Не все носители, на которых есть данные, нужно отправлять за пределы офиса.

    5. Внедрение механизмов защиты на критических бизнес-системах и процессах

    Персональные брандмауэры и антивирусы на критически важных рабочих станциях должны быть установлены и поддерживаться во избежание потери данных. Безопасность на этих машинах должна быть высокой, поскольку они имеют решающее значение и существует риск потери данных. Уровни защиты нужно сформулировать для каждого критического сервиса.

    6. Подготовка должна быть тщательной, и вся документация после обновления должна быть отправлена за пределы офиса.

    7. Документация должна быть актуальной и удаленной

    8. Управление изменениями включает в себя постоянное обновление документации по управлению изменениями и является необходимым компонентом аварийного восстановления, которое должно происходить в обязательном порядке. Хорошие процессы управления изменениями помогают снизить риски и отследить системные изменения, которые могли привести к аварии. Планы и процедуры аварийного восстановления также необходимо поддерживать на регулярной основе, а изменения необходимо отмечать, как только они происходят. Процедура должна быть определена на изменение. Протестируйте изменение, убедитесь в его качестве. Задокументируйте изменение, а затем внедрите его. Затем документ должен быть отправлен за пределы офиса. Эта процедура обеспечит обновление документации.

    9. Целостность резервного носителя. Резервные копии — это здорово, и если программное обеспечение для резервного копирования показывает, что резервное копирование было успешным, вы можете чувствовать себя более комфортно. Абсолютный способ проверить это — восстановить данные. Таким образом вы можете проверить целостность ваших резервных лент. В наши дни вы можете использовать полезные технологии, такие как виртуальный ПК и виртуальный сервер, для тестирования полуживых сред. Хорошим примером этого может быть резервное копирование в вашей действующей локальной сети, работающее в запланированное время, а затем запланированное восстановление на следующий день, которое восстанавливает резервные копии данных действующей локальной сети в другую полуживую сеть с VPC. Этот механизм проверки является относительно недорогим и может быть реализован довольно быстро путем добавления двух сетевых карт к серверу резервного копирования и планирования восстановления и резервного копирования с использованием альтернативных сетевых карт. Обратите внимание, что магнитные носители могут быть утеряны, и невозможно отследить целостность такого решения после его отправки за пределы офиса. Ленты и другие магнитные носители могут быть повреждены при падении, воздействии температурных диапазонов, выходящих за пределы эксплуатационных спецификаций, включая ленты, которые влетают из другого места, поскольку ленты удерживаются в фюзеляже и потенциально могут подвергаться воздействию низких температур, что, в свою очередь, может требуют акклиматизации во избежание образования конденсата. Такое случается редко, но следует отметить, что малые риски — это те, которые потенциально могут привести к бедствиям. Большинство бедствий вызвано самыми незначительными событиями.

    Изображение 26040

    Рис. 1. На приведенной выше диаграмме показано возможное решение для восстановления.

    10. Тестирование

    11. Техническое обслуживание

    12. Уровни бедствия

    13. Регулярные встречи через запланированные промежутки времени

    Уровни бедствия

    Полная катастрофа: Это происходит после полного разрушения всех операционных и производственных систем. Вам потребуются все удаленные ресурсы для восстановления, и это будет обязательное удаленное восстановление, так как в этом случае рабочее место было уничтожено.

    Частичная авария: некоторые части операционных и производственных систем были разрушены или повреждены. Это приведет к частичному восстановлению. Это восстановление может не требовать восстановления вне площадки. Частичная авария может заключаться в выходе из строя одной некритической машины и восстановлении из резервной копии или сетевого источника в сети.

    Минимальная катастрофа: пострадали только небольшие некритические части операционной среды. Вирусные эпидемии и удаление файлов могут вызвать эти небольшие бедствия. Эти аварии можно легко восстановить с помощью программного обеспечения для восстановления или резервного копирования на ленту.

    1. Создайте группу аварийного восстановления.

    Группа аварийного восстановления должна состоять из руководителя группы, который будет руководить проектом и иметь власть над процессом и влияние в управленческом отделе компании. Это ратифицирует план, а также обеспечит принятие политики.

    2. Задокументируйте команду DR и контактные данные участника.

    Этот процесс важен с той точки зрения, что при возникновении бедствия необходимо связаться со всеми, кто участвует в восстановлении. В этот список контактов должны входить поставщики, ИТ-специалисты, сотрудники службы поддержки, руководители групп, старшие сотрудники и весь соответствующий персонал аварийного восстановления.

    3. Установите пакет аварийного восстановления.

    Необходимо создать пакет аварийного восстановления со всей необходимой документацией и соответствующими контактными данными каждого участника аварийного восстановления.

    4. Составьте план.

    5. Установите, что должно быть доступно.

    Начиная с физического сетевого кабеля и подключения, и от того, как компьютеры, которые вы восстанавливаете, будут обмениваться данными, а также от используемой инфраструктуры и коммутационной матрицы.

    • Компьютеры
    • Сеть
    • Аппаратное обеспечение
    • Связь
    • Почта
    • Интернет
    • Удаленный доступ
    • VPN
    • Ввести номер

    Не забывайте об инфраструктуре, не связанной с ИТ, которая пересекается с зоной ответственности ИТ. Такие вещи, как телефонные линии и контроль доступа, могут сами по себе стать катастрофой, если их не спланировать и не обеспечить должным образом. Вот почему жизненно важно включить весь бизнес и привлечь к участию все соответствующие стороны, чтобы обеспечить полноту такого плана.

    6. Обеспечьте наличие резервного персонала.

    В случае причинения вреда персоналу организации необходимо привлечь запасной персонал для решения вопросов, связанных со стихийным бедствием. Именно по этой причине важно иметь подробную и обновленную документацию, чтобы штатный персонал мог восстановить сложные специализированные системы. Некоторые системы очень динамичны, и их невероятно сложно документировать и восстанавливать. Помните, что посадки на Луну и космическая наука были задокументированы. Нет причин для сбоя документации, если система работает так, как задумано. Опыт ничто не заменит, и по этой причине резервный персонал должен подбираться тщательно.

    7. Убедитесь, что документация по процедуре обновлена.

    Документ, который не обновляется, может считаться бесполезным, так как может отсутствовать соответствующая информация, необходимая для восстановления среды. Руководитель группы аварийного восстановления должен нести ответственность за обновление документа DRP, любого приложения и любой другой соответствующей информации. Никаких компромиссов в этом вопросе, это высокий риск, и если этот процесс не удастся, ваш DRP будет скомпрометирован.

    8. Убедитесь, что документы по управлению конфигурацией обновлены.

    Документация по конфигурации — это запасной вариант на случай, если изменение приведет к аварии. Вот почему контроль изменений заполняется до внесения изменений, а затем подписывается после внесения изменений. По той же причине изменения вносятся в тестовую систему. Может помочь обновление всей документации с помощью отслеживания изменений, сохранения новой версии каждый раз или использования решений для контроля версий.

    9. Убедитесь, что копия всей документации находится вне офиса и обновлена.

    Вся документация должна быть отправлена за пределы офиса после ее обновления. Когда случается бедствие, весьма вероятно, что документы также будут уничтожены. Поэтому важно обеспечить внешнее хранение всей вашей документации DRP. Убедитесь, что документы хранятся в безопасном месте, обеспечивающем целостность и конфиденциальность этих документов, поскольку они могут содержать конфиденциальную информацию.

    10. Убедитесь, что вся информация защищена и хранится в надежном месте.

    Ежедневное резервное копирование всех данных записывается на ленту и хранится вне офиса в безопасной среде. Еженедельно документацию следует обновлять и загружать во внешнее хранилище или физически отправлять в удаленное место. Обратите внимание, что удаленные места относятся к зданиям, которые не находятся через дорогу. История научила нас, что башни через дорогу тоже можно разрушить.

    Резюме

    В третьей части серии DR были рассмотрены выбор оборудования, возможные решения и стратегии восстановления, а также централизация хранения информации. Были также охвачены различные типы стихийных бедствий. Подготовка к ним на разных уровнях поможет организациям стать эффективными, когда произойдет настоящая катастрофа.