Не слишком ли мы зависим от облака AWS?

Опубликовано: 5 Марта, 2023
Не слишком ли мы зависим от облака AWS?

Большинство онлайн-провайдеров облачных сервисов могут похвастаться временем безотказной работы до 99,99% (Amazon S3 предположительно имеет надежность 99,99999999999%), чего и следовало ожидать от таких громких имен, как Amazon, Google и Microsoft. Но когда эти 0,01 процента времени действительно случаются, и S3 действительно выходит из строя, как это было 28 февраля, это затрагивает треть Интернета.

Клиенты вдруг понимают, что у них все яйца в одной корзине, и лихорадочно начинают искать другие варианты. Со стороны Amazon было бы справедливо разрешить им этот 0,01-процентный экземпляр. Однако случайное упоминание о том, что это вызвано опечаткой, не только заставляет людей сидеть и удивляться, но и сыплет соль на недавно открытую рану. Когда вы являетесь крупнейшим в мире поставщиком облачных услуг, когда вы падаете, вы уничтожаете всех вместе с вами. К сожалению, многие из этих «всех» — это стартапы, которые не могут позволить себе обанкротиться или запятнать свою репутацию на столь раннем этапе игры.

Удар на дороге

28 февраля был насыщенным днем для AWS, потому что примерно с полудня до примерно 17:00 по восточному времени, когда службы были полностью возобновлены, тысячи веб-сайтов и приложений столкнулись с необычной производительностью и ошибками. Хотя изначально Amazon понятия не имел, что пошло не так, позже они опубликовали заявление о том, что это была неправильно введенная команда. Многие люди спрашивают, почему не было резервных копий или мер безопасности, чтобы подготовиться к такой возможности, но они забывают, что даже облачный гигант не прочь совершить честную ошибку.

Когда вы поддерживаете скаковую лошадь, потому что она лучшая и самая доминирующая, вы должны принимать хорошее вместе с плохим. Даже у чистокровных бывают выходные, и у AWS должен быть такой выходной. Проблема, вероятно, возникает из-за ожиданий людей, что законы физики внезапно перестанут применяться к облачному провайдеру №1. Если бы у людей было в голове, что 99,99% означает, что однажды он выйдет из строя, у них, вероятно, был бы резервный сервер в другом месте, который можно было бы загрузить в случае такой чрезвычайной ситуации.

Вся заслуга в облаке

Это также неплохая реклама облака. На самом деле, это больше свидетельствует о том, как быстро технология распространилась по предприятию и насколько доминирующее положение AWS занимает в этом секторе. Хорошей стороной здесь является то, что все приложения и веб-сайты, которые вышли из строя с AWS, столкнулись со своей долей простоя, которая длилась всего около пяти часов, и теперь они могут рассчитывать на остальные 99,99% — надеюсь.

Могла ли AWS избежать такой ошибки? Любой может избежать ошибки, если оглянуться на нее задним числом. Ожидать, что кто-то не совершит честную ошибку, значит ожидать, что кто-то не будет человеком. Честность AWS в отношении того, как простая опечатка вызвала отключение, на самом деле является их заслугой, хотя правда часто может быть тяжелой пилюлей. Спекуляции о том, можно ли избежать катастрофы, — это рецепт безумия и путь, который никуда не заканчивается. AWS обязательно примет ряд мер, чтобы этого больше не повторилось, но этот 0,01-процентный экземпляр может появиться и откуда угодно.

Облачная экономика

Изображение 641
smartdatacollective.com

Важно помнить одну вещь: стоимость облачных серверов по сравнению с фактическим владением и обслуживанием собственных физических серверов. Проще говоря, многие стартапы вообще бы не существовали, если бы не облачные вычисления. С такими платформами, как AWS, Azure и Google Cloud, которые изо всех сил стараются привлечь стартапы, облако сейчас почти похоже на сказочную страну для стартапов. В дополнение к тому факту, что большинство облачных провайдеров предоставляют бесплатный уровень, достаточный для почти 250 000 ежедневных посещений, пятичасовой простой (к которому можно подготовиться) — это небольшая цена.

Причина, по которой облако является идеальным вариантом для стартапов, заключается в том, что любой новый бизнес связан с множеством «неизвестных» факторов. Настройка в облаке дает вам эластичность для роста по мере необходимости, а также возможность справляться со скачками спроса. Сочетание этих преимуществ действительно делает облако бесценным для начинающих разработчиков, которые, вероятно, уже заняты своими приложениями.

Аварийное восстановление в облаке

Многие компании, включая AWS, предлагают довольно хорошие варианты аварийного восстановления. Учитывая, что 25 % компаний не открываются после катастрофы, а около 43 % не переживают катастрофическую потерю данных, заблаговременное планирование, вероятно, является хорошей идеей. Предложение AWS называется Pilot Light, что представляет собой сравнение обогревателя, который может включиться в любое время, и спящего сервера аварийного восстановления (аварийного восстановления), который может включиться в любое время и эффективно спасти ваш бизнес. В этой многосайтовой архитектуре AWS предлагает создать и обновить сайт аварийного восстановления как зеркало вашего рабочего сайта, который затем может храниться в 10 изолированных регионах AWS с несколькими зонами доступности. В отличие от традиционного резервного копирования и восстановления для серверов и хранилищ, Pilot Light включает в себя приложения и всю производственную среду через Amazon Machine Images (AMI).

Теперь, что касается аварийного восстановления, последнее, что вы хотите сделать, это снова сложить все яйца в одну корзину. Хотя у AWS есть довольно хорошие возможности резервного копирования и восстановления, если вы уже используете AWS, имеет смысл сохранить резервную копию у другого поставщика. Для чистого управления стихийными бедствиями предложение Azure кажется довольно хорошим выбором. Azure Site Recovery (ASR) позволяет реплицировать и обновлять виртуальные машины в Azure, чтобы впоследствии их можно было запустить в любое время в качестве варианта аварийного восстановления. Microsoft действительно делает все возможное, чтобы сделать свои предложения неотразимыми, и за 54 доллара в месяц за экземпляр вы не можете просить большего. Кроме того, любые затраты на вычисления или хранение рассчитываются только тогда, когда вы фактически запускаете виртуальную машину, а поскольку вы собираетесь запускать ее только раз в четыре года (надеюсь), это действительно приятный вариант. Еще одна интересная функция от Microsoft — возможность протестировать протокол аварийного восстановления без прерывания работы.

Резервное копирование или разорение

Что касается того, что искать на сервере резервного копирования, поскольку вы надеетесь, что вам вообще не придется его использовать, оплата по мере использования или оплата только по мере использования — это первое, что вы хотите искать.. Что касается обслуживания, чем меньше вам нужно делать, тем лучше, поэтому что-то вроде ASR или Pilot Light, где ваш сервер резервного копирования автоматически обновляется с вашим рабочим сервером, отлично подходит. Что касается цен, ваш сервер резервного копирования — это не то место, где вы хотите сократить расходы, поэтому выберите лучшее решение, которое, по вашему мнению, можно купить за ваши деньги, поскольку, если вам действительно повезет, вам может вообще никогда не понадобиться его использовать..

Когда бедствие действительно происходит, такие вещи, как RTO — Целевое время восстановления (приемлемое количество времени, в течение которого ИТ-услуга должна быть восстановлена) и RPO — Целевое время восстановления (приемлемый объем потерянных данных, измеренный во времени), имеют решающее значение и должны быть подтверждены до того, как вы выберите службу резервного копирования или управления аварийным восстановлением. Отключение S3 — или то, что стало известно как S3izure, — всего лишь несколько часов простоя компании, которой принадлежит около 40% облачных сервисов. Хотя у централизации есть свои недостатки, преимущества намного перевешивают эти недостатки. Это событие, вероятно, было даже полезно для бизнеса, так как теперь все больше предприятий собираются подписаться на один или два сервера аварийного восстановления.