Создание вашей базы данных на AWS (часть 1)

Опубликовано: 7 Марта, 2023
Создание вашей базы данных на AWS (часть 1)

  • Создание вашей базы данных на AWS (часть 3)
  • Создание вашей базы данных на AWS (часть 4)

Почтенная база данных претерпела множество изменений за эти годы. Компьютерная база данных — это, в самом простом смысле, набор цифровых данных.

Управление базами данных было одним из первых применений компьютеров, а иерархическая IMS IBM в 1960-х годах была одной из первых. Десять лет спустя следующий шаг в эволюции баз данных принес нам реляционные базы данных, большинство из которых используют язык структурированных запросов (SQL) и моделируются на основе таблиц.

Реляционные базы данных отлично подходят для структурированных данных, которые легко организовать в поля, но не так хороши для потока неструктурированных данных, которые сегодня собирают организации и отдельные лица. Начиная с 2000-х годов начали появляться неструктурированные базы данных с базами данных NoSQL, которые работают быстро и не требуют фиксированных схем таблиц. Многие базы данных NoSQL хранят данные в формате XML.

Существуют и другие модели баз данных, такие как модель объект-связь, объектная модель, модель массива, семантическая модель, модель документа, модель схемы звезды и другие. Сегодня компании часто используют комбинацию разных типов баз данных для разных типов данных, а появление больших данных — комбинации структурированных и неструктурированных данных, генерируемых в больших объемах, — поставило перед управлением базами данных новые задачи.

С ростом популярности облачных вычислений неудивительно, что организации рассматривают возможность переноса своих баз данных в облако, а поставщики облачных услуг готовятся предложить варианты, которые нужны клиентам. Amazon Web Services может предоставить ресурсы как для реляционных баз данных, так и для баз данных NoSQL через свои службы RDS и DynamoDB, а если у вас есть большие данные, у AWS есть Redshift, служба хранения данных с петабайтным масштабированием. В этой статье мы более подробно рассмотрим каждый из них и то, как ваша организация может использовать их для наибольшей выгоды для своего бизнеса.

Преимущества облачных решений для баз данных

Базы данных, возможно, больше, чем большинство приложений, имеют тенденцию к быстрому росту. Если вы запускаете свои базы данных локально, это означает, что вам может потребоваться инвестировать в новое оборудование, чтобы не отставать от роста. Размещение вашей базы данных в облаке позволяет вам воспользоваться высокой масштабируемостью обширной инфраструктуры поставщика облачных услуг. В то же время вы получаете выгоду от эффекта масштаба, так как вы получаете лучшую производительность при меньших затратах.

Поставщик облачных услуг может предложить автоматический переход на другой ресурс в случае сбоя оборудования, поэтому в случае возникновения проблем вы можете быть уверены, что восстановление будет быстрым и автоматизированным, и с вашей стороны не потребуется никаких действий.

Облачные базы данных иногда называют DBaaS (база данных как услуга). Передав управление инфраструктурой поставщику облачных услуг, вы можете сосредоточиться на своих приложениях, не беспокоясь о физическом уровне. Базы данных в среде IaaS позволяют вам сохранять полный контроль над вашими базами данных и данными, которые они содержат, а облачные сервисы обеспечивают интегрированный мониторинг, резервное копирование, избыточное хранилище и механизмы безопасности для защиты целостности ваших данных.

Конечно, DBaaS не идеален, и при принятии решения о переносе баз данных за пределы предприятия важно учитывать и недостатки. Недостатки являются общими для любого облачного развертывания. Несмотря на то, что основные поставщики облачных услуг имеют надежные механизмы безопасности — более сильные, чем у большинства организаций, — все же возникают неотъемлемые проблемы безопасности и конфиденциальности, возникающие всякий раз, когда вы размещаете конфиденциальные или регулируемые данные в общедоступном облаке. Доступ к вашей базе данных также, очевидно, зависит от вашего интернет-соединения, поэтому для вашей организации важно иметь надежные избыточные соединения, чтобы избежать простоев и потери производительности.

Сервис реляционных баз данных Amazon (RDS)

Сервис Amazon RDS — это решение для тех, кто хочет развернуть традиционную реляционную базу данных в облачных сервисах AWS. Вы можете настроить базу данных на основе Microsoft SQL Server, MySQL, Oracle, PostgreSQL или Amazon Aurora в облаке AWS. Вы можете выбрать ядро базы данных на своем экземпляре базы данных, и сервис Amazon RDS будет автоматически поддерживать базу данных в актуальном состоянии с помощью исправлений безопасности. RDS также автоматически создает резервную копию базы данных.

Варианты хранения базы данных

Как и все веб-сервисы Amazon, RDS интегрируется с другими компонентами AWS для предоставления ресурсов, необходимых вашей базе данных. Важным элементом любой базы данных является система хранения, и при использовании RDS у вас есть несколько вариантов:

  • Хранилище общего назначения (SSD)
  • Выделенный IOPS (SSD)
  • Магнитное хранилище

Когда вы создаете или вносите изменения в экземпляр базы данных в Amazon RDS, вам нужно будет выбрать тип хранилища, который вы хотите использовать, а также требуемый объем хранилища. Хорошей новостью является то, что вы можете изменить тип хранилища позже. Для этого вам нужно изменить экземпляр базы данных. Вы можете столкнуться с коротким (до 120 секунд) отключением при внесении изменений. Хранилище находится в томах Amazon Elastic Block Storage (EBS).

Тип хранилища, который вы выберете, зависит от требуемой производительности и суммы, которую вы готовы заплатить. Магнитное хранилище является наименее дорогим, но это совместно используемое хранилище; то есть несколько клиентов используют это хранилище, и это может повлиять на производительность. Однако, если ваши потребности в хранении невелики, вы можете сэкономить деньги, используя магнитное хранилище.

SSD-накопитель общего назначения, конечно же, быстрее, чем хранилище на традиционных магнитных дисках. Amazon оценивает его в 3 IOPS/GB с пакетной скоростью 3000 IOPS (операций ввода/вывода в секунду). Емкость может варьироваться от 5 ГБ до 3 ТБ. Это прекрасно работает для баз данных малого/среднего размера и является хорошим экономичным решением, которое сочетает в себе цену и производительность.

Выделенное хранилище IOPS — это то, что вам нужно, если вы серьезно относитесь к производительности базы данных. Максимальный размер этих томов составляет 1 ТБ или 3 ТБ в зависимости от типа экземпляра базы данных. MySQL, Oracle и PostgreSQL предлагают большую емкость, тогда как Microsoft SQL Server (версия Standard или Enterprise) поддерживает только до 1 ТБ. Вы можете указать необходимое количество выделенных IOPS, до 4000 IOPS.

Если вы обнаружите, что вам нужно больше места для хранения, вы можете добавить место для хранения. Это может занять некоторое время, от нескольких часов до нескольких дней, в зависимости от типа хранилища, его размера и нагрузки на базу данных. Вы по-прежнему сможете использовать базу данных во время добавления хранилища, но в это время производительность может снизиться.

Варианты платформы базы данных

Amazon RDS можно развернуть на любой из платформ AWS Elastic Cloud Compute (EC-2): EC2-Classic и EC2-VPC. Большинство новых клиентов будут использовать EC2-VPC. В любом случае вы можете создать виртуальное частное облако (VPC) и разместить в нем свой экземпляр базы данных. VPC — это просто виртуальная сеть, изолированная от других виртуальных сетей, существующих в облаке Amazon.

Однако между ними есть некоторые различия. EC2-VPC поставляется с VPC по умолчанию. Когда вы создаете новый экземпляр базы данных, он будет расположен в облаке VPC по умолчанию, если только вы не решите разместить его в другом созданном вами облаке VPC. EC2-Classic не поставляется с VPC по умолчанию, поэтому вам нужно создать его, чтобы поместить в него свой экземпляр базы данных.

Тип безопасности, который вы будете использовать для доступа к вашему VPC, также зависит от того, какую из двух платформ вы используете. На платформе EC2-VPC вам необходимо создать группу безопасности EC2 или VPC, чтобы предоставить доступ к вашему экземпляру базы данных.

Если вы не знаете, какую платформу использует ваша учетная запись AWS, эта информация доступна на домашней странице консоли EC2 или консоли RDS. На поддерживаемых платформах будет указано только «VPC», если вы используете EC2-VPC. Если вы используете EC2 Classic, в этом поле будет указано «EC2, VPC».

Резюме

На этом этапе у вас должно быть некоторое базовое представление о преимуществах (а также недостатках) облачных баз данных и общий обзор предложения реляционных баз данных Amazon в облаке AWS, RDS. Мы обсудили варианты хранения, доступные для баз данных RDS, и познакомили вас с двумя платформами баз данных и концепцией запуска вашей базы данных в виртуальном частном облаке (VPC) в облаке Amazon.

Тема развертывания и управления базой данных в облаке AWS является сложной, и мы едва коснулись основ. Эта серия, состоящая из нескольких частей, позволит глубже погрузиться в эти сложности. В нашей следующей части, части 2, мы продолжим с того места, на котором остановились, и подробно расскажем о том, как работать с экземпляром базы данных в VPC, включая некоторые передовые методы. Мы также поговорим о том, как вы можете переместить экземпляр базы данных в VPC, если он еще не находится в нем.

  • Создание вашей базы данных на AWS (часть 3)
  • Создание вашей базы данных на AWS (часть 4)