Назад к основам (часть 2): виртуализация 101: учебник по хранению данных

Опубликовано: 21 Апреля, 2023

Введение

Виртуализация — это наука, в которую время от времени добавляют искусство. Таким образом, значительное время и усилия тратятся (или должны быть) на правильное планирование архитектуры виртуальной инфраструктуры. В этой статье мы сосредоточимся на хранилище, но давайте начнем с обсуждения трех важнейших ресурсов, которые входят в виртуальный плавильный котел:

  • Вычислить. Это часть уравнения, связанная с обработкой, и она обрабатывается любыми процессорами, размещенными на серверах, на которых размещена виртуальная среда. Современные процессоры с двумя, четырьмя, 6-ю, 8-ю процессорами и процессорами с большим количеством ядер упрощают работу, когда дело доходит до выбора того, что поставить на серверы хостинга. Когда требуется больше вычислительных ресурсов, несложно просто добавить еще один сервер в кластер или заменить менее мощный сервер на более мощный.
  • БАРАН. Я видел много виртуальных сред, поставленных на колени из-за того, что на хостах было установлено слишком мало оперативной памяти. Тем не менее, добавление оперативной памяти к существующим хостам или, опять же, замена хостов более мощными блоками в большинстве случаев не является серьезной задачей.
  • Хранилище. Несмотря на то, что можно добавить слишком мало вычислительной мощности или слишком мало оперативной памяти, я видел слишком много сред, в которых отсутствует один из двух ключевых показателей хранения:
    о Емкость. Этот вообще несложный. Какую емкость вы хотите иметь в своей виртуальной среде? Мы рассмотрим это более подробно в этой статье.
    о Производительность. Это немного сложнее, и это то, что часто упускается из виду. Многие неопытные администраторы сосредотачиваются на емкости и не всегда учитывают производительность. В конце концов, добавьте в сервер несколько SATA-дисков емкостью 2 ТБ, и емкости будет предостаточно, но эти очень немногие SATA-диски не выдержат большого количества наказаний за чтение/запись, особенно после внедрения RAID в сервер. уравнение.

Что касается хранилища, вам необходимо принять еще одно решение: как вы хотите, чтобы хост-серверы подключались к хранилищу? Планируете ли вы использовать диски, которые подключены к каталогу сервера (хранилище с прямым подключением), или вы собираетесь использовать сетевое устройство хранения/инфраструктуру — сеть хранения данных (SAN) или сетевое хранилище (NAS). ).

Основы RAID

Независимо от типа хранилища, которое вы покупаете для своей виртуальной среды, вам необходимо принять меры для защиты данных, находящихся в этом хранилище. Хотя существует несколько способов защиты данных, наиболее часто используемым методом является использование своего рода RAID (избыточного массива независимых дисков). При использовании большинства уровней RAID вы добавляете избыточность к своей инфраструктуре хранения за счет емкости и производительности. Например, когда вы внедрили зеркальный уровень RAID (RAID 1/RAID 10), вы «отказываетесь» от 50 % своей необработанной емкости, и вы получаете удар, когда дело доходит до того, как быстро система может записывать данные на диск. Почему? Каждая команда записи данных в массив приводит к необходимости выполнения двух операций записи — по одной на каждой стороне зеркального набора. Скоро мы поговорим о производительности.

Каждый уровень RAID имеет свой набор плюсов и минусов. Вот краткий обзор каждого распространенного уровня RAID и его влияния:

Рейдовый уровень

Защита

Толерантность

Мин.

диски

Накладные расходы

Напишите

влияние

RAID 0

Никто

0 дисков

2

Никто

Никто

RAID 1

Отлично

1 диск

2

50%

2x

RAID 5

Хороший

1 диск

3

1/n дисков

4x

RAID 6

Превосходно

2 диска

4

2/n дисков

6x

RAID 10

Превосходно

1/2 дисков*

4

50%

2x

RAID 50

Хороший

1 в комплекте

6

1/n дисков * Наборы RAID 5

4x

RAID 60

Превосходно

2 в наборе

8

1/n дисков * наборы RAID 6

6x

Мне нужно сделать пару пояснений относительно приведенной выше таблицы. Прежде всего, хотя в названии RAID 0 есть слово «RAID», в нем нет ничего лишнего. В RAID 0 вы в основном распределяете данные по всем дискам в массиве, чтобы повысить общую производительность. Если вы потеряете хотя бы один диск в этом массиве, вы потеряете все данные в этом массиве. Хотя RAID 0 используется в некоторых других типах RAID (например, RAID 50), в качестве автономного решения он очень плох.

Столбец допуска в таблице отображает количество дисков, которые могут выйти из строя, прежде чем произойдет потеря данных. При наборе RAID 5, поскольку в RAID 5 используется диск четности, один диск в массиве может выйти из строя. Когда этот диск выходит из строя, говорят, что массив находится в «деградированном» режиме. Если у вас настроен диск горячего резерва, массив

Вы заметите, что вы можете потерять «1/2 дисков» в наборе RAID 10. Теоретически вы можете потерять все диски на одной стороне зеркального набора и все еще работать на другом зеркале. Тем не менее, вероятность того, что вы случайно потеряете именно те диски, которые вам нужны, довольно мала, поэтому не думайте, что RAID 10 действительно позволяет вам потерять массу дисков.

Вопрос о емкости

Когда дело доходит до расчета потребностей в хранении, емкость — это простая сторона уравнения, даже если вы добавляете RAID в смесь. Все дело в относительно простом умножении. Для целей приведенных здесь примеров мы предполагаем, что все диски в выборочных массивах имеют размер 1 ТБ. Это делает цифры более понятными.

Теперь предположим, что у вас есть массив с 15 дисками. Это исходная емкость 15 ТБ. Поставщики используют термин «необработанная емкость» для описания массива, который только что вышел с завода и еще не был отформатирован или объединен в RAID.

  • RAID 0. Если вы используете RAID 0, вы приблизитесь к сырой емкости массива хранения, но имейте в виду, что у вас не будет защиты данных. Итак, у вас будет 15 ТБ емкости.
  • RAID 1. В устройстве с 15 дисками у вас есть нечетное количество дисков, поэтому в этой конфигурации вы бы назначили один диск в качестве горячего резерва, который может подключиться и заменить отказавший диск. Это оставит вам 14 дисков и половину оставшейся емкости (два зеркала по семь дисков в каждом) для примерно 7 ТБ полезного пространства.
  • RAID 5. С набором RAID 5, опять же, вы, как правило, хотите иметь горячий резерв. Итак, опять же, у вас есть 14 дисков для работы. Здесь вы можете создать один большой набор дисков или отдельные наборы RAID меньшего размера. Если вы создали один большой набор RAID 5, у вас будет 13 дисков, то есть 13 ТБ полезного пространства. В качестве альтернативы вы можете создать два набора RAID 5 из 7 дисков, каждый из которых имеет собственный диск четности. Каждый набор RAID 5 будет иметь полезную емкость 6 ТБ, а весь массив будет иметь полезную емкость 12 ТБ.
  • RAID 6. Опять же, давайте просто используем здесь 14 дисков. Так как RAID 6 требует двух дисков для контроля четности. Один набор дисков оставляет 12 ТБ полезного пространства, а для двух наборов из семи дисков требуется по два диска для контроля четности. Это означает, что вы получите общее полезное пространство 10 ТБ.
  • RAID 50. Два набора RAID 5, по 7 дисков в каждом, по 1 четности в каждом = 12 ТБ.
  • RAID 60. Два набора RAID 6, по 7 дисков в каждом, по 2 четности в каждом = 10 ТБ.

На первый взгляд может показаться, что RAID 6 — ваш лучший выбор, поскольку он предлагает максимальную избыточность и защиту без особых накладных расходов. Однако, как я упоминал ранее, производительность — всего лишь одна переменная в уравнении. Производительность так же важна, как и емкость, и ее важность возрастает в зависимости от типа развертываемой среды.

Например, если вы развертываете серверную среду, производительность может быть не так заметна для пользователя, но если вы развертываете виртуальные рабочие столы, пользователи сразу же заметят проблемы с производительностью.

В следующей части этой серии мы поговорим о производительности хранилища и о различных способах подключения хранилища к хост-серверам с гипервизором.