Что такое Azure Purview? Взгляните на его основные функции и преимущества

Данные меняют жизнь. Но даже если это дает вам силы, это подвергает вас риску. Как бы парадоксально это ни звучало, данные могут дать вам самое глубокое понимание, если они хорошо структурированы и проанализированы с использованием соответствующих инструментов. Но это катастрофа, когда он попадает не в те руки, и является пустой тратой времени, когда он разбросан по нескольким системам. Последнее имеет большое значение в современном мире, где данные разбросаны по вашему облаку, в локальной среде, в приложениях SaaS и т. д., что затрудняет их объединение для получения более значимой информации. Такие хранилища данных ограничивают то, что вы можете с ними делать, угрожают целостности данных, растрачивают ресурсы и делают совместную работу практически невозможной. Чтобы решить эту проблему разрозненных данных, Microsoft разработала новую унифицированную службу управления данными под названием Azure Purview, которая сопоставляет данные из разных источников, создает ландшафт данных, классифицирует конфиденциальные данные, создает родословную данных и многое другое.
Излишне говорить, что вы лучше контролируете свои данные и можете получать подробные сведения для упрощенного принятия решений. Давайте подробно рассмотрим эту новую услугу, чтобы увидеть, какую пользу она может принести вам.
Azure Purview: ключевые функции и их преимущества
Azure Purview, доступный в общедоступной предварительной версии, предназначен для объединения всех ваших данных для улучшения управления данными, контроля и прозрачности.
Одним из основных моментов Azure Purview является то, что он включает в себя коллективный опыт Microsoft с его возможностями Bing, индексирования и поиска Azure, поэтому вы можете ожидать, что он будет первоклассным.

Майк Фласко (Mike Flasko), директор по управлению программами Azure Purview, говорит, что эта услуга является результатом самостоятельной потребности Microsoft в оптимизации управления данными и сопоставлении данных. В этом смысле сама Microsoft является одним из клиентов Purview, поэтому этот продукт решает многие реальные проблемы, с которыми сегодня сталкиваются крупные компании.
Но так ли это важно, как утверждает Microsoft?
Чтобы ответить на этот вопрос, давайте рассмотрим некоторые существующие проблемы в использовании данных и управлении ими, а также то, как с ними справляется Azure Purview.
Связывание типов и форматов данных
Распространенная проблема, с которой сталкиваются компании, заключается в том, что разные платформы и приложения генерируют данные в разных форматах и типах, от столбцовых данных до файлов, что затрудняет взаимодействие. В настоящее время нет простых способов соединить эти типы данных и связать данные без значительных затрат времени и усилий.
Тот факт, что с каждыми данными связано множество процессов, усложняет связывание данных и их объединение.
Но Azure Purview упрощает эту задачу. Все, что нужно сделать администратору, — это зайти в настройки классификации и выбрать типы и форматы данных, которые необходимо сканировать и индексировать. Purview сканирует метаданные и в результатах поиска отображает все связанные данные независимо от типа и формата.
Например, если вы ищете термин «маркетинг», он выведет все соответствующие данные. Это могут быть электронные таблицы, обзоры, объекты больших двоичных объектов, информационные бюллетени и практически любая связанная информация, даже если они представлены в разных форматах.
Улучшение управления данными
Управление данными — это процесс установления политик, обеспечивающих полный контроль над данными на протяжении всего их жизненного цикла. Кроме того, он определяет обязанности внутри организации, чтобы определить, кто может получить доступ к данным и как их можно использовать.
Azure Purview хорошо справляется с управлением данными и связанными с ними проблемами, поскольку дает администраторам и специалистам по обработке и анализу данных общий обзор всего ландшафта, чтобы они могли быстро понять состояние данных в целом и получить ключевую информацию о них, например о местонахождении конфиденциальной информации, уровень генерации данных и многое другое.
Соответственно, они могут настраивать оповещения и уведомления для мониторинга работоспособности и состояния данных по всему предприятию.
Обнаружение данных
Данные распространяются по вашему облаку, локальным системам, приложениям SaaS, базам данных и т. д., и это затрудняет их использование.
Azure Purview автоматически обнаруживает данные и классифицирует их, не перемещая их между системами или форматами. Все метаданные индексируются и объединяются в единую карту данных, поэтому вы знаете, где какие данные находятся.
Каждый результат поиска даже предоставляет подробную информацию, например, местонахождение данных. Когда вы щелкаете по нему, вы можете увидеть много полезной информации, такой как имя таблицы, ее поля, типы данных, хранящиеся в каждом поле, и многое другое.
Вы даже можете щелкнуть его местоположение, чтобы открыть данные в Power BI Desktop для лучшей визуализации. На вкладке связанных данных отображаются все таблицы и информация, относящиеся к той, которую вы просматриваете.
Удобство использования данных
Когда у вас есть все данные в одном месте, их легко анализировать, чтобы получить нужные сведения. Но если они распределены по системам, этот процесс становится громоздким.
Azure Purview стремится решить эту проблему с помощью оптимизированного пользовательского интерфейса, который позволяет производителям и потребителям данных сотрудничать. Например, бизнес-пользователи и ИТ-специалисты могут взаимодействовать с одними и теми же данными, чтобы понять бизнес-контекст, связанный с данными.
Изюминкой является то, что неструктурированные и частично структурированные данные также индексируются и отображаются, что делает их очень актуальными и полезными.
Отслеживание происхождения
Отслеживание данных на протяжении их жизненного цикла дает лучший контекст, поэтому вы можете получить соответствующую информацию. Опять же, это сложно, потому что мы генерируем тонны данных каждую секунду, поэтому отслеживание происхождения требует значительных ресурсов.
Azure Purview отслеживает и визуализирует происхождение данных непосредственно от того места, где они были созданы, и их движение по всему жизненному циклу, поэтому вы можете лучше понять, как данные преобразовывались, и это может существенно определить способ их использования.
Эта линия передачи данных и ее производные формы сообщают вам, получены ли данные из авторитетного источника. Это гораздо больше, чем просто сопоставление пар ключ-значение, которое можно найти в инструментах управления данными, и оно может сыграть большую роль в отображении и понимании данных.
Использование технологий
Azure Purview использует некоторые инновации, появившиеся в сообществе открытого исходного кода, такие как Apache Atlas, платформа, обеспечивающая управление метаданными и руководство для создания активов данных.
Он также использует искусственный интеллект и машинное обучение для получения интеллектуальных результатов поиска, поэтому они могут быть очень актуальными и полезными для организаций. Он обеспечивает все, от сканирования и классификации данных до бизнес-контекста.
Приведенные выше функции ясно показывают, что Azure Purview может объединить все данные в форме, которую вы можете визуализировать и понять связи. Это, несомненно, важный шаг в мире управления данными, и ожидается, что они унифицируют данные и сделают их очень актуальными и полезными для бизнес-пользователей.
Рабочий процесс Azure Purview
Двигаясь дальше, давайте разберемся с рабочим процессом, чтобы оценить его простоту использования и важность для всех пользователей в организации.
Как правило, организации имеют множество активов данных, таких как таблицы, файлы, модели, базы данных и многое другое, которые распределены по облачным, локальным и SaaS-средам. В качестве первого шага подключите эти различные ресурсы к Azure Purview с помощью соединителей, чтобы он мог сканировать все эти источники для сбора их метаданных без перемещения или преобразования данных.
Затем все метаданные публикуются на карте данных Azure Purview — интеллектуальном графе, описывающем все содержащиеся в нем данные. Вы даже можете использовать API-интерфейсы Apache Atlas для отправки данных из других источников, не подключенных к Purview.

Вот и все! Теперь все пользователи в организации могут быстро найти нужные им данные. Кроме того, специалисты по данным могут получить сквозную информацию об этом.
Наконец, давайте немного коснемся безопасности и настройки.
Безопасность и настройка
Azure Purview автоматически обнаруживает конфиденциальную информацию и классифицирует ее. Так, она отображается в результатах поиска, и открывать и просматривать эту информацию могут только авторизованные пользователи.
Что касается настройки, то это несложно. Если вы администратор:
- Щелкните источники, чтобы увидеть возможные источники данных, которые Purview может сканировать.
- Нажмите «Зарегистрироваться» в верхнем левом углу и выберите источники данных. Если у вас есть учетная запись Azure, она может собирать данные из всех различных источников Azure одним щелчком мыши.
- Вы можете организовать их в виде коллекций и древовидных представлений, а также задать параметры конфигурации классификации и сканирования на корневом уровне каждой коллекции. Вы также можете выбрать, как часто вы хотите сканировать данные, чтобы быть в курсе изменений данных и их влияния.

Как видите, Purview также имеет высокие оценки безопасности и настройки.
Заключительные слова о Azure Purview
В целом ожидается, что Azure Purview упростит управление данными и поможет организациям максимально эффективно использовать свои ценные активы (данные), независимо от того, где они расположены. Для получения дополнительной информации о ценах нажмите здесь.
Итак, что вы думаете о Azure Purview? Пожалуйста, дайте нам знать ваши мысли в разделе комментариев.