Ускоренный курс по организации сетей хранения данных (часть 1)

Опубликовано: 20 Марта, 2023

  • Ускоренный курс по организации сетей хранения данных (часть 4)
  • Ускоренный курс по организации сетей хранения данных (часть 5)
  • Ускоренный курс по организации сетей хранения данных (часть 6)

Введение

Кажется, что куда бы вы ни повернулись в эти дни, вы слышите, как кто-то говорит о хранилище в сети хранения данных (SAN). Возможно, вы слышали, как кто-то говорил, что сети SAN сложны или дороги, но вам, возможно, было интересно, чем SAN отличается от традиционной сети. В этой серии статей я расскажу об основах организации сетей хранения данных. Мой план состоит в том, чтобы начать с обсуждения того, что такое SAN (и чем она не является). Далее я хочу рассказать о некоторых аппаратных средствах, используемых в SAN, а также о некоторых распространенных архитектурах SAN. Чтение этой серии статей не сделает вас экспертом в области SAN, но должно дать вам гораздо лучшее представление о сетях хранения данных.

Что такое сеть хранения данных?

Я никогда не забуду, как впервые услышал, как кто-то упомянул SAN. Много лет назад мне позвонил друг, взволнованный тем, что только что внедрил SAN. Когда я спросил его, что такое SAN, он сказал мне, что его хранилище напрямую связано с сетью. Я помню, как задавался вопросом, в чем же дело, ведь сетевое хранилище существует уже много лет.

В тот момент моей жизни (а это было много лет назад) я никогда не слышал о SAN, поэтому, возможно, я неправильно понял объяснение моего друга. Однако также возможно, что мой друг тоже не совсем понял, что такое SAN. В любом случае, определение SAN, данное моим другом, было несколько точным, но совершенно неадекватным.

SAN — это набор сетевых устройств хранения, как сказал мой друг, но SAN полностью отличается от сетевого хранилища (NAS), которое также является формой сетевого хранилища.

Существует три основных отличия SAN от NAS. Во-первых, SAN использует другое оборудование, чем NAS. Во-вторых, в SAN используются другие протоколы, чем в устройствах NAS. В-третьих, SAN считывают и записывают данные иначе, чем NAS.

Чтобы показать вам, что я имею в виду, рассмотрим природу устройства NAS. На рынке представлено множество различных типов устройств NAS, и некоторые из них более сложные, чем другие, но, вообще говоря, устройство NAS — это устройство, которое подключается к сети через один или несколько кабелей Ethernet. Устройство NAS содержит один или несколько дисков и обычно настраивается через веб-интерфейс. Этот интерфейс обычно позволяет разделить хранилище устройства на разделы или использовать его в качестве массива RAID.

После того, как устройство NAS запущено в эксплуатацию, с ним обращаются так же, как с обычным файловым сервером. Пользователи подключаются к устройству NAS через соединение Ethernet с использованием протокола TCP/IP. В зависимости от типа NAS он также может поддерживать SMB или NetBIOS через TCP/IP. В любом случае вы можете рассматривать устройство NAS как автономный файловый сервер.

Хранилище SAN работает совершенно иначе, чем хранилище NAS. Когда NAS используется, пользователь с соответствующими разрешениями может напрямую подключаться к тому NAS (через общий файловый ресурс) и читать и записывать файлы.

Сети SAN можно настроить для обеспечения аналогичной функциональности, но многое происходит за кулисами. Во-первых, пользователи, как правило, не могут напрямую подключаться к хранилищу SAN, поскольку пользовательские рабочие станции взаимодействуют с другими компьютерами в сети с помощью TCP/IP. Хотя есть исключения, доступ к хранилищу SAN обычно осуществляется через Fibre Channel.

Хотя эта разница в протоколах может показаться тривиальной, на самом деле она намекает на саму суть SAN. Сети, зависящие от TCP/IP и SMB, в первую очередь предназначены для доступа к данным файловой системы. Другими словами, эти типы сетей идеально подходят для чтения и записи файлов, которые хранятся на файловых серверах, веб-серверах и т. д.

Fibre Channel, напротив, работает не на уровне файлов, а на уровне блоков хранилища. Таким образом, вы не будете использовать Fibre Channel для чтения файла, который хранится в общей папке. Вместо этого Fibre Channel считывает и записывает отдельные блоки хранилища.

Есть несколько причин, по которым это, казалось бы, тривиальное различие важно. Во-первых, Fibre Channel предлагает гораздо более высокую производительность, чем традиционная сеть TCP/IP. Хотя пропускная способность сети действительно влияет на общую скорость соединения, основная причина, по которой Fibre Channel намного быстрее, чем TCP/IP, заключается в том, что Fibre Channel является более эффективным протоколом с меньшими накладными расходами. Меньшие накладные расходы позволяют Fibre Channel быстрее перемещать данные.

Другая причина, по которой взаимодействие хранилища на уровне блоков Fibre Channel имеет большое значение, заключается в том, что Fibre Channel взаимодействует напрямую (и изначально) с устройством хранения. Это означает, что в среде SAN удаленное устройство хранения можно рассматривать как локальный ресурс хранения.

Чтобы лучше понять, о чем я говорю, рассмотрим, что происходит, когда вы подключаете компьютер Windows к устройству NAS. Хранилище NAS сопоставляется с сетевым диском. Однако в случае SAN можно заставить Windows рассматривать том SAN как локальное хранилище (в отличие от сетевого диска), даже если физическое устройство хранения расположено удаленно.

Это важное различие, поскольку операционная система Windows по-разному обрабатывает локальное и сетевое хранилище. Например, есть приложения для Windows, которые можно установить на локальное хранилище, но не на сетевой диск. Однако эти типы приложений могут быть установлены в хранилище SAN, поскольку операционная система Windows не различает истинное локальное хранилище и хранилище SAN (по крайней мере, в отношении приложения).

Имейте в виду, что я не говорю, что хранилище SAN всегда рассматривается как локальное хранилище или что его нельзя использовать ни для чего другого. Часто конечные пользователи фактически видят хранилище SAN как подключенный сетевой диск.

Так как же это может быть? Все дело в том, что рабочие станции пользователей обычно не подключаются напрямую к хранилищу SAN. Обычно хранилище SAN используют серверы (или виртуальные рабочие станции). Представьте, например, что файловый сервер настроен на использование хранилища SAN вместо настоящего локального хранилища. Файловый сервер подключен к SAN таким образом, что хранилище можно рассматривать как локальное. Однако когда конечные пользователи подключаются к файловому серверу, они могут получать доступ к файлам, хранящимся в SAN, но не подключаются к SAN напрямую. Вместо этого пользователи подключаются к файловому серверу через TCP/IP. Файловый сервер — это единственная машина, которая напрямую обращается к хранилищу SAN.

Эта архитектура на самом деле не сильно отличается от той, которая была бы, если бы файловый сервер использовал хранилище с прямым подключением. Даже если бы хранилище файлового сервера было действительно локальным, пользователи не имели бы прямого доступа к хранилищу. Пользователи взаимодействуют с операционной системой файлового сервера, и именно операционная система передает запросы к диску подсистеме хранения. Точно то же самое происходит, если файловый сервер подключен к SAN. Единственное отличие состоит в том, что хранилище не является локальным по отношению к файловому серверу.

Вывод

В этой статье я объяснил, что существуют некоторые существенные различия между сетями хранения данных (SAN) и сетевыми хранилищами (NAS). Во второй части этой серии статей я начну обсуждение аппаратного обеспечения, используемого в SAN.

  • Ускоренный курс по организации сетей хранения данных (часть 4)
  • Ускоренный курс по организации сетей хранения данных (часть 5)
  • Ускоренный курс по организации сетей хранения данных (часть 6)