Администраторы сервера Data Skills должны освоить

Опубликовано: 19 Марта, 2023

Введение

Администраторы часто защищены от базовой сложности бизнес-данных, а более специализированные аналитики бизнес-аналитики часто занимаются большинством проектов по интеграции данных. Однако с течением времени и по мере того, как «большие данные» в конечном итоге превращаются в «рутинные данные», для системных администраторов становится все более важным понять, как лучше всего поддерживать то, что должно стать рутинной операцией, даже в небольших организациях. Более того, я считаю, что все ИТ-специалисты должны время от времени покидать свою зону комфорта и исследовать темы, выходящие за рамки их традиционных областей знаний. Наконец, я также считаю, что нам нужно снести стены, разделяющие ИТ, и, даже если организация не идет наперекосяк с DevOps, я считаю, что принятие некоторых принципов DevOps важно для обеспечения своевременного выполнения проектов и по бюджету, но, что более важно, чтобы они соответствовали потребностям пользователей.

Примечание:
Сейчас я работаю над важным проектом по интеграции данных для клиента, поэтому я думаю об этом.

Базы данных

Подумайте о своей компании. Что на самом деле заставляет его работать? Скорее всего, какая-то комбинация корпоративных приложений и данных, верно? Ваша работа как администратора сервера или виртуализации заключается в том, чтобы убедиться, что системы, на которых работают эти критически важные для бизнеса системы, работают в идеальном состоянии.

Но стоит ли останавливаться на достигнутом? Многие администраторы серверов проводят черту между системой и данными, считая, что это конец их ответственности. Но, возможно, вам пора начать изучать основы работы с базой данных, если вы еще этого не сделали. Если вы администратор, который вообще не разбирается в данных, вы упускаете множество возможностей, а базы данных — это лишь верхушка айсберга.

Скриптовые языки

PowerShell и такие инструменты, как PowerCLI (на основе PowerShell), — это невероятно мощные языки сценариев, которые позволяют администраторам создавать собственные инструменты автоматизации, идеально подходящие для их среды. Но эти инструменты также могут копаться в базах данных и извлекать информацию или системы запросов и записывать информацию в базу данных.

Однако для использования функций интеграции базы данных требуется знание таблиц и структур базы данных, в том числе того, как таблицы и базы данных связаны друг с другом. Хотя я не знал этого в то время, мне очень повезло, что на моей самой первой работе в сфере ИТ я глубоко познакомился со структурами данных. Независимо от области ИТ, в которой я работал на протяжении многих лет, структуры баз данных были жизненно важны.

Даже если вас не интересуют функции, связанные с базами данных, которые может использовать PowerShell, начните думать о том, как вы можете использовать PowerShell для облегчения своей жизни. Я использовал его в прошлом для автоматизации подготовки учетных записей, для автоматизации сбора данных почтовых ящиков Exchange и для многого другого. Практически каждый современный продукт Microsoft, включая Windows Azure и Office 365, можно полностью контролировать с помощью PowerShell.

Твердотельное хранилище/гибридное хранилище

Вам может быть интересно, какое отношение твердотельное хранилище имеет к инструментам обработки данных. Ну, данные должны где-то храниться, верно? Раньше эта цель хранения состояла из серии обычных жестких дисков, и, если уровни производительности начали падать, вам может быть просто предложено добавить больше шпинделей в систему хранения, чтобы обеспечить достаточное количество операций ввода-вывода в секунду для работы. сделано.

Однако сегодня в арсенале есть еще одно оружие: твердотельные накопители. В то время как жесткие диски идеальны, когда речь идет о хранении больших объемов данных, твердотельные диски действительно хороши, когда необходим необработанный ввод-вывод. Когда дело доходит до данных, необработанный ввод-вывод может понадобиться, чтобы позволить системе выполнять сложный вычислительный анализ большого набора данных. Такие операции могут потребовать большого количества операций чтения и записи данных со скоростью, которая невозможна для традиционных жестких дисков.

Сегодня на рынке нет конца вариантам хранения в вашем распоряжении. Кажется, что каждый день появляются новые продавцы. Если вы не считаете, что хранилище all-flash необходимо для аналитического проекта, рассмотрите возможность использования гибридного массива. Гибридные массивы состоят в основном из традиционных жестких дисков, но перед ними стоит ряд твердотельных устройств хранения, которые помогают организациям значительно ускорить свои системы хранения без необходимости тратить целое состояние на решение для хранения на основе флэш-памяти.

Инструменты интеграции данных, отчетности и аналитики

Существует множество способов интеграции данных между системами. Как системный администратор, вы часто находитесь в центре всего этого и можете даже не подозревать об этом. Подумайте об этом: все данные, потребляемые вашей организацией, хранятся на тех самых серверах, которыми вы управляете. Итак, почему бы не начать знакомиться с некоторыми инструментами, которые используют ваши пользователи, чтобы вы могли еще больше повысить свою ценность для организации?

Вот некоторые из инструментов, которые вы можете рассмотреть:

  • Составление отчетов. Если вы продаете SQL Server, добавление отчетов не составит труда, поскольку SQL уже поставляется с SQL Server Reporting Services (SSRS) для нескольких версий. Хотя он может быть не таким полнофункциональным, как некоторые из доступных автономных инструментов, SSRS более чем способен справляться с довольно сложными потребностями в отчетности. Я использовал SSRS для ряда задач и считаю его довольно хорошим, особенно учитывая, что он «бесплатен» с SQL Server.
  • Извлечение, преобразование, загрузка (ETL). Лично я считаю, что ETL — одна из самых сложных частей уравнения данных. Именно здесь организации усердно работают над интеграцией своих различных систем данных в нечто, напоминающее единое целое. Интеграция данных — это работа, требующая тщательного планирования, глубокого анализа данных и понимания различных бизнес-процессов, которые заставляют организацию работать так, как она работает. Опять же, SQL Server поставляется со службами SQL Server Integration Services (SSIS), что является хорошим вариантом начального уровня. Однако недавно я обнаружил инструмент от Astera под названием Centerprise, который доводит возможности ETL до безумного уровня. Centerprise использует полностью основанный на графическом интерфейсе подход перетаскивания к тому, что часто является невероятно сложной задачей. Как вы можете видеть на рисунке ниже, этот подход на основе графического интерфейса позволяет очень и очень легко увидеть, откуда именно берутся данные и куда они направляются. Centerprise также позволяет легко увидеть возможности преобразования данных на всем пути потока данных.

Изображение 4846
фигура 1

  • Аналитика. Вершиной работы с данными является аналитика. Инструменты и процессы ETL необходимы для обеспечения реальной аналитики, поэтому не сбрасывайте со счетов ETL; кроме того, инструменты ETL можно использовать для активного улучшения процессов. Аналитика — это место, где люди действительно могут получить реальное представление о том, что происходит в окружающей среде, и начать принимать стратегические решения для компании. Инструменты ETL позволяют принимать оперативные решения и вносить улучшения, в то время как аналитика позволяет реально обсудить стратегическую сторону обсуждения. Инструменты в этой области включают такие вещи, как IBM SPSS.

Резюме

Не прекращайте расширять свой набор навыков после того, как освоите мир серверов! Данные — это источник жизненной силы организации, и постоянно меняющийся ИТ-ландшафт делает эту сферу более доступной, чем когда-либо. Вы даже можете начать работу бесплатно, загрузив пробную копию SQL Server от Microsoft и начав изучать эти важные функции. Рассмотрите также способы, с помощью которых вы можете начать свое обучение с помощью курсовых работ от PluralSight.