Столкнитесь со своими рисками с помощью этого шаблона плана аварийного восстановления

Опубликовано: 30 Марта, 2023
Столкнитесь со своими рисками с помощью этого шаблона плана аварийного восстановления

Для некоторых ИТ-команд, которые только приступают к планированию аварийного восстановления, создание плана восстановления с обнаружением (DRP) может оказаться довольно сложной задачей. Как начать? Какие элементы следует добавить в план аварийного восстановления?

В этой статье я собираюсь поделиться с вами базовым шаблоном плана аварийного восстановления, который вы можете настроить, использовать и адаптировать для своего бизнеса. Затем я объясню, что обычно содержит каждый раздел. Прежде чем мы перейдем к этому, я хотел бы кое-что прояснить. Что такое план аварийного восстановления? Давайте начнем с этого.

Что такое план аварийного восстановления?

План аварийного восстановления представляет собой документированный набор политик и процедур. Они направлены на поддержание вашего бизнеса в рабочем состоянии во время или после стихийного бедствия. Это то, чем ваша ИТ-команда и другие заинтересованные стороны (высшее руководство, руководители отделов, штатные сотрудники и т. д.) могут воспользоваться, когда ваша ИТ-инфраструктура перестанет работать.

Например, допустим землетрясение. После первоначальной паники вы обнаружите след из поврежденных серверов, сетевого оборудования и рабочих станций. Если вы не готовы к этому сценарию, вам придется потратить время на планирование того, как вы можете вернуться к действию. Что делать, если вам все еще необходимо приобрести оборудование, установить операционные системы и получить приложения? Хуже того, что, если у вас нет резервных копий ваших данных?

План аварийного восстановления поможет вам точно знать, что делать. После катастрофы вы быстро претворите этот план в жизнь. В идеале у вас также должна быть резервная ИТ-инфраструктура для поддержки ваших усилий по восстановлению.

Обязательно ли наличие DRP? Да, и вот почему.

Зачем нужен план аварийного восстановления

Время имеет важное значение для аварийного восстановления (DR). Крупные природные и техногенные катастрофы могут вывести из строя вашу ИТ-инфраструктуру. Подумайте, что случилось бы с вами во время землетрясения, цунами, наводнения, лесного пожара или урагана? Что делать, если ваш бизнес пострадал от DDoS-атак или программ-вымогателей?

Если ваша ИТ-инфраструктура не работает в течение длительного времени, будет сложно возобновить работу. Некоторые из ваших сотрудников и клиентов могут уже уйти к тому времени. Для быстрого восстановления необходимы систематические инициативы по аварийному восстановлению. В противном случае вы можете упустить из виду важные детали и совершить дорогостоящие ошибки. Вот где может пригодиться план аварийного восстановления.

План аварийного восстановления может гарантировать, что все заинтересованные стороны находятся на одной странице. Они все точно знают, что делать в момент бедствия. Вооружившись этим руководством, все ваши действия будут методичными. Они также будут ориентированы на бизнес, а не беспокойны и неуправляемы. В этом случае вы сможете выполнять аварийное восстановление быстрее, эффективнее и с меньшим количеством ошибок.

Даже обычные сотрудники должны знать о плане аварийного восстановления. Самое главное, они также должны быть в курсе разделов, которые требуют их участия. Например, им может понадобиться знать , к кому обращаться, если они увидят, что назревает кризис. Им также может понадобиться знать , куда обращаться, если им придется продолжать работу на сайте аварийного восстановления.

Учитывая важность этого плана, я помогу вам создать его для вашего бизнеса. Во-первых, вот обзор этого шаблона плана аварийного восстановления. По сути, это просто схема, но мы обсудим каждый пункт в следующем разделе.

Элементы плана аварийного восстановления

Изображение 9672

Ниже приведен обзор предлагаемого шаблона плана аварийного восстановления. Опять же, это ни в коем случае не исчерпывающий план DRP. Скорее, это шаблон, который вы можете использовать для своей конкретной программы аварийного восстановления. Сначала я представляю его вам в виде плана, чтобы было легче увидеть отдельные разделы. После этого мы можем погрузиться в детали.

  • Введение
  • Цели
  • Управление DRP
    • Команда
    • Распределение
    • Тестирование
    • Обслуживание
  • Подготовка
    • Управление рисками
    • Команды восстановления
    • Резервные копии
    • Сайт аварийного восстановления
    • Командный центр
    • Контакты
    • Роли и обязанности
  • Реагирование на стихийные бедствия
    • Обнаружение и оценка
    • Уведомление властей
    • Мобилизация спасательных бригад
    • Активация командного центра
    • активация сайта аварийного восстановления
    • Уведомить сотрудников
  • Оценка ущерба
  • Кризисная коммуникация
  • Страховые полисы
  • Оценка финансового воздействия
  • Юридические проблемы

Некоторые из этих разделов могут не подойти вашей фирме. Например, вам, вероятно, не понадобятся разделы для сайтов аварийного восстановления, если ваш бизнес недостаточно велик, чтобы позволить себе его. Не стесняйтесь добавлять или удалять разделы в соответствии с вашими конкретными требованиями.

Далее я расскажу вам, что следует включить в каждый элемент вашего плана аварийного восстановления.

Анализ нашего шаблона плана аварийного восстановления

Введение

Некоторые новые читатели могут понятия не иметь, что такое DRP. Здесь вы знакомите читателя (предположительно, ваших сотрудников и других заинтересованных лиц) с документом. Объясните, что содержит документ. Уточните, когда читателям нужно будет применять DRP, и предоставьте другую соответствующую информацию. Это поможет всем узнать, чего ожидать.

Цели

Даже если ваши читатели уже знают, о чем ваш документ, некоторые из них могут не знать о его важности. Здесь вы представляете цель своего плана аварийного восстановления. Объясните существование различных угроз и то, как они могут повлиять на ваш бизнес. После этого объясните, как план аварийного восстановления помогает снизить сопутствующие риски. Этот раздел призван помочь читателю оценить ценность этого документа. Это также помогает им увидеть важность вашего DRP в целом.

Управление аварийным восстановлением

Несомненно, ваш план аварийного восстановления должен быть надлежащим образом задокументирован. В этом разделе определяются все административные аспекты самого документа DRP. Это включает в себя разработку, распространение, тестирование и обслуживание.

Последующие подразделы в основном являются руководством для группы аварийного восстановления и высшего руководства. Они разъяснят все об администрировании документа DRP.

Группа аварийного восстановления

Группа аварийного восстановления состоит из лиц, которым поручено разрабатывать, распространять, тестировать и поддерживать ваш документ DRP. В идеале его должен возглавить кто-то из высшего руководства, например, ваш финансовый директор. Он также должен быть хорошо представлен различными ведомствами. Это необходимо для того, чтобы ваш DRP учитывал все риски и возможности снижения рисков в вашей компании. Введите здесь всю необходимую информацию о вашей команде аварийного восстановления. В основном упоминайте, кто они, и объясняйте их роль в аварийном восстановлении.

Изображение 9780

Дистрибутив аварийного восстановления

Люди в вашем бизнесе должны точно знать , где они могут найти политики и процедуры вашего DRP. В этом разделе укажите, кто отвечает за создание цифровых и печатных копий вашего DRP. Укажите, где будут храниться эти копии. Убедитесь, что у каждого члена вашей группы аварийного восстановления есть как минимум две копии — одна на месте, а другая дома. Это обеспечит им доступ к DRP, когда в этом возникнет необходимость.

Тестирование аварийного восстановления

Вы никогда не узнаете, насколько эффективен ваш план, пока не протестируете его. Эффективность вашего плана также может снижаться по мере развития ландшафта угроз. Вот почему вам нужно регулярно тестировать. В этом разделе объясните, почему вам нужно тестировать DRP и как часто ваша компания должна проводить тесты. Наконец, укажите, как вы планируете проводить эти тесты. Этот раздел напомнит читателям о важности тестирования. Он также может служить справочным материалом для людей, которым необходимо провести аудит вашего DRP.

Обслуживание аварийного восстановления

Угрозы и бизнес-ландшафт меняются со временем. Меняются и технологии. В свою очередь, ваш план аварийного восстановления должен быть живым документом. Он должен развиваться вместе с этими изменениями. В этом разделе укажите, почему и как вы собираетесь выполнять обновления DRP. Например, вы можете включить условие о том, что ваша команда аварийного восстановления будет ежегодно собираться для переоценки вашего DRP. Упомяните, что вы также обновите DRP на основе их выводов.

Подготовка к аварийному восстановлению

Одним из ключевых компонентов эффективного плана аварийного восстановления является подготовка. Убедитесь, что все, что вам нужно, когда ваш DRP должен быть активирован, находится на месте. В этом разделе рассматриваются все аспекты подготовки. Это включает в себя управление угрозами, планы резервного копирования, контактную информацию и т. д. Это может служить руководством и справочным материалом для заинтересованных сторон, особенно для членов вашей группы аварийного восстановления и высшего руководства.

Управление рисками

На каждый бизнес может повлиять уникальный набор угроз. Управление рисками позволяет определить , какие угрозы наиболее вероятны для вас. Это также поможет вам принять меры предосторожности для снижения этих рисков. В этом разделе укажите, почему и как должно осуществляться управление рисками (включая оценку рисков и снижение рисков).

Команды восстановления

Это отличается от вашей группы аварийного восстановления. Группы восстановления — это технические группы, которые восстанавливают определенные области вашей ИТ-инфраструктуры. Например, у вас будет группа восстановления для сетей, еще одна группа для настольных компьютеров, еще одна для серверов и так далее. Убедитесь, что каждая команда имеет опыт работы с технологиями, которые им назначены, и укажите эти назначения здесь. Таким образом, другие сотрудники вашей компании также будут знать , к кому обратиться, если у них возникнут проблемы в той или иной области.

Резервные копии

Резервные копии играют решающую роль в аварийном восстановлении. Если у вас нет резервных копий данных, вам не с чем будет работать, если ваш основной сайт выйдет из строя. В этом разделе включите условия для вашей стратегии резервного копирования. Обычно вы указываете расписание резервного копирования, решения и методы (например, резервное копирование вне офиса или в облаке). Также важно отметить любые проблемы с конфиденциальностью и адекватность средств контроля конфиденциальности данных в средстве резервного копирования.

Сайт аварийного восстановления

Сайт аварийного восстановления — это объект, расположенный в отдельном географическом месте. Ваши сотрудники должны иметь возможность использовать его, если ваш основной сайт станет полностью неработоспособным. Не каждый может позволить себе сайт аварийного восстановления, но если он у вас есть, в этом разделе должно быть указано , где он находится, и его тип (холодный сайт или горячий сайт). Наконец, укажите , кто имеет право на его использование (в основном это сотрудники, занимающиеся критически важными процессами), и другие важные детали.

Процедуры восстановления

В идеале это должен быть комплексный набор процедур для восстановления каждого набора компонентов вашей ИТ-инфраструктуры. Например, у вас будет подраздел, подробно описывающий набор процедур для восстановления рабочих столов. У вас также будет другой для восстановления сервера, еще один для восстановления данных и так далее.

Командный центр

Если ваш основной сайт выходит из строя, вам нужен единый источник информации и инструкций. Это будет ваш командный центр. Командный центр позволит вам по-прежнему координировать действия всех членов вашей компании. Это также никого не оставит в неведении. В этом разделе укажите, где, как и кто о вашем командном центре.

Изображение 9781

Контакты

Чтобы быстро мобилизовать команду аварийного восстановления, вам необходимо вести список контактов со всеми членами команды. Этот список должен войти в этот раздел. Все другие соответствующие внутренние (например, капитаны спасательных групп, высшее руководство и т. д.) и внешние контакты (экстренные службы, такие как пожарная часть, больница, полиция и т. д.) также должны быть включены сюда.

Роли и обязанности

В этом разделе определяются роли всех участников вашего плана аварийного восстановления. Укажите обязанности отдельных лиц и групп, особенно во время реагирования на стихийные бедствия. Например, вы можете указать людей, отвечающих за обнаружение стихийных бедствий, эвакуацию, восстановление, оценку ущерба, связь, юридические вопросы и так далее.

Реагирование на стихийные бедствия

Раздел «Реагирование на стихийные бедствия» содержит все ваши политики и процедуры, которые вступают в действие после возникновения стихийного бедствия. Обычно он содержит протоколы, касающиеся обнаружения чрезвычайных ситуаций, уведомления экстренных служб, мобилизации спасательной группы и так далее. Ваша команда аварийного восстановления может обратиться к этим разделам за рекомендациями. К этому разделу должны обращаться даже другие сотрудники, которые могут быть непреднамеренно вовлечены в стихийное бедствие. Вы также можете использовать его в качестве справочного материала при проведении тестирования аварийного восстановления.

Обнаружение и оценка

Обычно вы активируете DRP только после определенных инициирующих событий. Например, ваш DRP активируется после полной потери питания, затопления ваших объектов или полного отключения сети. В этом разделе определите критерии, по которым событие классифицируется как триггер. Кроме того, вы также должны указать, кто уполномочен оценивать событие и определять, инициирует ли оно.

Уведомление уполномоченного органа

Здесь вы указываете, кто отвечает за связь с пожарной службой, отделением полиции, больницей и другими службами экстренной помощи. Вам также следует снова указать контактные телефоны этих служб. Даже если вы разместили эту информацию в разделе «Контактная информация», снова включите ее сюда для быстрого доступа.

Мобилизация спасательных групп

Здесь вы описываете политики и процедуры для мобилизации ваших групп восстановления. Укажите здесь контактную информацию капитанов вашей команды. Вы также должны предоставить информацию об альтернативных капитанах команд.

Активация командного центра

В этом разделе вы определите протоколы для активации вашего командного центра. Вы также можете указать контактную информацию вашего командного центра (номера телефонов, адрес электронной почты, URL-адрес и т. д.). Если сотрудники могут связаться с командным центром через платформу обмена сообщениями (например, Facebook Messenger, Signal, Discord и т. д.), вы также должны добавить эту информацию сюда.

Активация сайта аварийного восстановления

Если у вас есть сайт аварийного восстановления, здесь вы подробно описываете политики и процедуры для активации этого сайта. Вы также должны указать , кто будет отвечать за сайт аварийного восстановления. Укажите их контактную информацию и адрес сайта. Если местоположение сайта фиксировано, полезно включить карту и соответствующие направления относительно вашего текущего местоположения.

Уведомление сотрудников

Вообще говоря, руководители отделов должны связываться с членами своего отдела и передавать всю соответствующую информацию. Например, они должны уточнить следующие шаги, контактную информацию командного центра, контактную информацию сайта аварийного восстановления и т. д. Если руководитель отдела недоступен или если определенные сотрудники не принадлежат к определенному отделу, эту задачу может выполнять назначенный персонал. В этом разделе должны быть представлены все подробности, относящиеся к этому аспекту.

Оценка ущерба

Оценка ущерба должна проводиться группой, состоящей из людей из отдела управления недвижимостью, ИТ и других отделов. Эти команды могут, по сути, определить степень ущерба, нанесенного критически важным приложениям, оборудованию, офисам и помещениям. В этом разделе вы обычно определяете, кто отвечает за проведение оценки ущерба. Вы также подробно изучите политики и процедуры, относящиеся к этому упражнению.

Кризисная коммуникация

Назначенный персонал (предпочтительно из отдела коммуникаций) должен будет подготовить соответствующие сообщения в связи с кризисом. Затем они должны передать это широкой публике. Они могут делать это через традиционные средства массовой информации (например, телевидение, радио, газеты) или современные каналы (например, официальный веб-сайт, социальные сети). Вы также можете использовать систему массового оповещения о чрезвычайных ситуациях. В этом разделе должны быть указаны политика и процедуры, регулирующие кризисные коммуникации.

Страховые полисы

Ваша компания может иметь страховые полисы, которые могут вступить в силу после стихийного бедствия. Этот раздел должен содержать список всех соответствующих страховых полисов. Например, упомяните такие политики, как «Ошибки и пропуски» (E&O), «Директора и должностные лица» (D&O) и другие. Кроме того, в этом разделе должны быть указаны тип покрытия каждого полиса, период покрытия, сумма покрытия, лицо, ответственное за покрытие, и т. д. Наконец, в нем должно быть указано, кому необходимо связаться с соответствующей страховой компанией. Укажите, кто также будет координировать действия с оценщиками ущерба, и подайте соответствующие формы претензий.

Оценка финансового воздействия

Каждая катастрофа приводит к финансовым потерям. Это означает, что вам нужно заниматься этим систематически. В этом разделе определяются политика и процедуры проведения финансовой оценки. Он также обсуждает удовлетворение финансовых требований. Укажите, кто должен проводить финансовые оценки, какие элементы они должны оценивать и какие финансовые потребности они должны решать.

Юридические проблемы

Ущерб от стихийного бедствия может также серьезно сказаться на ваших клиентах. Например, если вы являетесь частью цепочки поставок, любое продолжительное время простоя на вашем конце может привести к финансовым потерям для других компаний. В результате некоторые из них вполне могут подать на вас в суд. Этот раздел должен охватывать все политики и процедуры, связанные с возможными юридическими проблемами, которые могут возникнуть.

Советы профессионалов

Прежде чем мы закончим, позвольте мне поделиться некоторыми советами, которые могут еще больше улучшить ваш план аварийного восстановления.

  • Попробуйте отправить клиентам уведомление, когда вы видите, что продолжающаяся катастрофа обязательно приведет к задержкам. Это позволит им принять соответствующий план действий
  • Примите меры предосторожности, чтобы предотвратить или свести к минимуму последствия стихийного бедствия. Например, вы можете внедрить надежную кибербезопасность, чтобы предотвратить вспышки программ-вымогателей.
  • Уделите приоритетное внимание подготовке к DR. Это может означать разницу между успешным ответом аварийного восстановления и неудачей.
  • Проведение семинаров/обучения сотрудников по аварийному восстановлению. Это повысит осведомленность сотрудников и их способность реагировать. В свою очередь, это повысит эффективность вашего DRP.
  • Стремитесь внедрить виртуализацию. Это может значительно упростить определенные инициативы аварийного восстановления, такие как создание избыточности или создание сайта аварийного восстановления.

Последние мысли

Разработать план аварийного восстановления непросто, особенно если вы не знаете, с чего начать. В этой статье я рассмотрел некоторые ключевые элементы документа DRP. Во-первых, вы должны начать с введения и целей. Затем включите разработку и реагирование на стихийные бедствия и продолжите свой план вплоть до финансовых и юридических вопросов. Надеемся, что этот шаблон плана аварийного восстановления дал вам достаточно информации для создания собственного DRP.

Как упоминалось ранее, этот шаблон ни в коем случае не является полным. Вам нужно будет настроить его и сделать его своим. Добавьте (или удалите) дополнительные разделы и подразделы по своему усмотрению. В конце концов, у вас должно быть все готово для реализации эффективной программы аварийного восстановления. Таким образом, вы сможете очень быстро восстановиться, если авария выведет из строя вашу ИТ-инфраструктуру.

Есть еще вопросы, связанные с аварийным восстановлением? Ознакомьтесь с часто задаваемыми вопросами и ресурсами ниже!

Часто задаваемые вопросы

Что такое техногенные катастрофы?

Техногенные катастрофы — это чрезвычайно разрушительные события, влияющие на бизнес, вызванные преднамеренными или непреднамеренными действиями человека. Примеры таких событий включают случайные пожары, поджоги, террористические акты или военные действия, атаки программ-вымогателей и DDoS-атаки. Многие из этих событий (например, атаки программ-вымогателей и DDoS-атаки) нацелены конкретно на ИТ-инфраструктуру. Некоторые даже стремятся вызвать сбои или полностью разрушить целевые системы.

Что такое стихийные бедствия?

Стихийные бедствия — это чрезвычайно разрушительные события, влияющие на бизнес, вызванные факторами окружающей среды. Это могут быть землетрясения, наводнения, цунами, ураганы, лесные пожары, полярные вихри и пандемии. Несмотря на то, что эти бедствия не нацелены конкретно на ИТ-инфраструктуру, они все же могут повредить ИТ-инфраструктуру некоторых компаний. Включение стихийных бедствий в ваши оценки рисков может повысить эффективность вашего DRP.

В чем разница между угрозами и рисками?

Угрозы — это объекты, которые могут причинить вред. Например, они могут ориентироваться на ваш бизнес. С другой стороны, риски учитывают, насколько вероятно, что угроза может повлиять на ваш бизнес. Даже если угроза существует, уровень риска, который она представляет, может варьироваться в зависимости от различных условий.

В чем разница между управлением рисками, их оценкой и смягчением?

Управление рисками — это дисциплина, которая включает в себя оценку рисков и снижение рисков. Оценка риска – это процесс выявления угроз. Он рассчитывает уровень риска, который он представляет для данного предмета. Наконец, снижение риска — это процесс сведения к минимуму воздействия указанной угрозы. Полная программа управления рисками будет включать как оценку рисков, так и снижение рисков.

В чем разница между холодным сайтом и горячим сайтом?

Холодный сайт — это самый простой тип сайта аварийного восстановления. Он включает только положения об электропитании и физическом пространстве для поддержки вашей резервной ИТ-инфраструктуры. Он не включает саму ИТ-инфраструктуру. С другой стороны, горячая площадка — это полноценный объект, в котором есть все необходимое для возобновления работы. Естественно, горячий сайт дороже, чем холодный.