Это должно быть где-то здесь! Устранение проблем с доступностью данных

Данные — это кровь бизнеса в современном мире. Это означает, что если вы по какой-либо причине не можете получить доступ к данным вашей компании, у вашего бизнеса проблемы. Существует два основных способа реагирования при возникновении проблемы с доступностью данных. Во-первых, вы можете запаниковать. Однако обычно это не помогает, поэтому лучше следовать второму подходу: сделать несколько глубоких вдохов и приступить к устранению неполадок, чтобы найти и исправить то, что пошло не так.
Сложность вопросов доступности данных
В прежние времена, что с точки зрения ИТ означает около десяти лет назад, устранение проблем с доступностью данных было довольно простым по нескольким причинам. Во-первых, ваша организация обычно владела собственным оборудованием инфраструктуры данных. Небольшие предприятия и отделы имели собственные файловые серверы и ленточные накопители. А крупные предприятия обычно имели сети хранения данных (SAN) и автоматизированные ленточные библиотеки. Поэтому, когда что-то пошло не так, кто-то из вашей ИТ-команды мог физически пройти в серверную и начать дергать провода и щелкать переключателями. Это подводит меня ко второй причине, по которой устранение этих проблем в то время было проще: организации не передавали на аутсорсинг так много, как сейчас, поэтому им требовался и содержался квалифицированный ИТ-персонал.
Однако сегодня инфраструктура данных типичного бизнеса отличается. Облачные вычисления стали ключевым элементом инфраструктуры данных вашей организации. Для небольших предприятий это изменение часто упрощает хранение, доступ, извлечение и защиту своих бизнес-данных. Но для крупных предприятий это обычно означало повышенную сложность из-за сочетания устаревших систем хранения и облачных сервисов, которые они используют для хранения своих данных и управления ими. Давление на затраты, которое частично вызвано высокими ожиданиями экономии, ожидаемой от перехода на облачные решения, также стало препятствием в уравнении. Неустанное стремление снизить расходы и увеличить прибыль привело к тому, что многие компании сократили ИТ-персонал, отдав часть или все обслуживание своей инфраструктуры на аутсорсинг. Реальность, однако, такова, что большинство организаций по-прежнему будут полагаться на гибридный подход для удовлетворения большинства своих ИТ-потребностей, а это означает, что все еще есть практические шаги, которые вы можете предпринять локально для устранения проблем с доступностью данных, когда они возникают. Чтобы проиллюстрировать это, давайте рассмотрим несколько общих проблем и способы их решения.
Действия по устранению неполадок, связанных с компонентами инфраструктуры данных
Допустим, пользователь в вашей организации сообщил, что не может получить доступ к ресурсу данных X, доступ к которому ему необходим для выполнения своей работы. Что могло пойти не так? Ресурс мог быть перемещен, возможно, из-за миграции сервера или изменения его имени или адреса во время реконфигурации сети. Или, может быть, пользователь говорит, что может читать из X, но не может писать в X, поэтому он беспокоится, что не сможет сохранить отчет, над которым работает в данный момент. Это может быть результатом проблемы с квотой, когда достигнут предел пользователя. Или, может быть, на устройстве больше нет свободного места, или разрешения были изменены из-за изменений в политике компании. В таких случаях мы видим, что проблемы, связанные с доступностью данных, могут быть гораздо шире, чем просто проблемы с оборудованием, на котором хранятся ваши данные.
Невозможность доступа к устройству NAS может быть вызвана аппаратным сбоем устройства, неудачным обновлением микропрограммы, проблемой в вашей сети или проблемой, связанной с рабочей станцией пользователя. Проблемы также могут возникнуть, когда в вашу инфраструктуру данных вводится новое устройство. Например, IP-адрес, буква диска, номер LUN или точка подключения нового тома хранилища или папки могут конфликтовать с существующим компонентом вашей инфраструктуры данных. Трудности с доступом к данным, хранящимся в облачных томах, также могут быть результатом проблем, связанных с DNS. Изменения в конфигурации брандмауэра периметра также могут вызвать проблемы с доступом к данным, хранящимся в облаке. Сертификаты с истекшим сроком действия также могут быть проблемой и могут потребовать расследования.
Повторная инициализация устройства хранения часто может оказаться самым быстрым способом решения проблем, связанных с недоступностью данных. К сожалению, иногда устройство может зависнуть в состоянии, когда его невозможно повторно инициализировать. В такой ситуации, если команды Linux не будут выполняться, вы можете попробовать запустить в режиме sudo или попробовать выполнить аппаратный сброс на устройстве. Проверка журналов на любых устройствах и системах на сетевом пути между вашими данными и пользователями может дать дополнительные подсказки о том, что пошло не так и как это исправить.
Устранение неполадок доступа к данным, хранящимся в базах данных, на самом деле проще, чем устранение трудностей с доступом к неструктурированным устаревшим или облачным решениям для хранения данных. Что касается баз данных, первое, что вы должны сделать, это убедиться, что ваш сервер базы данных все еще работает и что экземпляр базы данных все еще существует и не был переименован или перемещен куда-либо. Убедитесь также, что экземпляр tembdb не переполнился или что какой-то другой экземпляр достиг своего предела. Если известно, что в последнее время база данных ведет себя вяло, это может свидетельствовать о том, что файлы журналов или основные таблицы базы данных слишком велики или возникла какая-то другая проблема. Если у вас есть контроль над сервером базы данных, вы также должны проверить, достаточно ли памяти выделено для его буферов. Если ваша база данных работает на виртуальной машине в Azure или AWS, вам может потребоваться выделить для машины дополнительный логический процессор.
Если ни один из этих подходов не помогает, попробуйте сосредоточить усилия по устранению неполадок на проблемах с сетью. Например, убедитесь, что конечные точки настроены правильно и что порты доступа к сети отвечают. И если кажется, что сеть запущена и работает нормально, попробуйте выяснить, не может ли ваша проблема быть связана с какой-либо основной проблемой аутентификации пользователя. Если ваш каталог выходит из строя, будь то локальный контроллер домена или облачная служба управления идентификацией, такая как Azure Active Directory, вы можете быть уверены, что пользователи не только не смогут получить доступ к своим данным, но и столкнутся с другими проблемами. виды вопросов.
Наконец, есть несколько общих советов по устранению неполадок, которые могут помочь вам сузить круг проблем, устранив то, что не является проблемой. Во-первых, спросите себя: что еще работает должным образом? Работает ли аутентификация и управление идентификацией? Доступен ли Интернет для пользователей? Сообщал ли ваш поставщик облачных услуг о каких-либо проблемах на своем конце? Ваша платформа управления системами отметила что-нибудь необычное? Сделав эти шаги, задайте второй вопрос: что изменилось за последнее время в вашем окружении? Вы представили новый сервер? Создать новый экземпляр базы данных? Перенастроить маршрутизатор или подсеть? Подключить новый ИБП? Нанять кого-то нового в свой ИТ-персонал? Всякий раз, когда вносятся изменения, существует возможность возникновения последствий. Сделайте несколько вдохов и просмотрите ближайшее прошлое в поисках подсказок.
Где можно узнать больше о проблемах с доступностью данных
Хорошим ресурсом для получения дополнительной информации по этой теме является новая книга Грега Шульца «Управление инфраструктурой данных: идеи и стратегии». Грег — известный эксперт по технологиям хранения, основатель и старший аналитик StorageIO. Я настоятельно рекомендую книгу Грега лицам, принимающим решения в области ИТ, и профессионалам, которые хотят больше узнать об управлении широким спектром различных решений для инфраструктуры данных, доступных для современного бизнеса.