Лучшие библиотеки R для визуализации данных в 2021 году

Опубликовано: 1 Июня, 2021

Когда вы говорите об анализе данных, не забывайте о визуализации данных! Это очень важная часть анализа данных, которая может выявить скрытые тенденции и обеспечить более глубокое понимание данных. Визуализация данных может предоставить информацию, просто взглянув на них, тогда как получение той же информации из электронных таблиц или текстовых отчетов займет гораздо больше времени. Именно поэтому визуализация данных так популярна. И в этой статье мы обсудим лучшие библиотеки R для визуализации данных.

Поскольку R - один из самых популярных языков программирования в анализе данных, неудивительно, что существует множество библиотек R для визуализации данных. Эти библиотеки настолько популярны, потому что они позволяют аналитикам данных легко создавать желаемые визуализации из своих данных, предоставляя удобный интерфейс и инструменты в одном месте! Тогда единственное, что важно - это знать, что визуализация хочет донести до пользователей, и создавать это, используя все доступные инструменты. Что еще нужно аналитику данных ?!

Итак, давайте проверим некоторые из этих популярных библиотек R для визуализации данных , которые широко используются в наши дни.

1. ggplot2

ggplot2 - это библиотека визуализации данных R, основанная на Грамматике графики. ggplot2 может создавать визуализации данных, такие как гистограммы, круговые диаграммы, гистограммы, диаграммы рассеяния, диаграммы ошибок и т. д., используя высокоуровневый API. Он также позволяет добавлять различные типы компонентов или слоев визуализации данных в одну визуализацию. После того, как ggplot2 было сказано, какие переменные сопоставить с какой эстетикой на графике, он выполняет остальную работу, чтобы пользователь мог сосредоточиться на интерпретации визуализаций и тратить меньше времени на их создание. Но это также означает, что в ggplot2 невозможно создавать сильно настраиваемую графику. Но в сообществе RStudio и Stack Overflow есть много ресурсов, которые могут помочь в ggplot2, когда это необходимо. Как и dplyr, если вы хотите установить ggplot2, вы можете установить tidyverse или просто установить ggplot2 с помощью install.packages («ggplot2»)

2. Сюжетно

Plotly - это бесплатная графическая библиотека с открытым исходным кодом, которую можно использовать для визуализации данных. Plotly - это пакет R, который построен на основе библиотеки Plotly JavaScript (plotly.js) и может использоваться для создания веб-визуализаций данных, которые могут отображаться в записных книжках Jupyter или веб-приложениях с помощью Dash или сохраняться в виде отдельных файлов HTML. Plotly предоставляет более 40 уникальных типов диаграмм, таких как точечные диаграммы, гистограммы, линейные диаграммы, гистограммы, круговые диаграммы, полосы ошибок, прямоугольные диаграммы, множественные оси, спарклайны, дендрограммы, трехмерные диаграммы и т. Д. Plotly также предоставляет контурные диаграммы, которые не так распространены в других библиотеках визуализации данных. В дополнение ко всему этому, Plotly можно использовать в автономном режиме без подключения к Интернету. Вы можете установить Plotly из CRAN с помощью install.packages ('plotly') или установить последнюю версию для разработки с GitHub с помощью devtools :: install_github («ropensci / plotly»).

3. Esquisse

Esquisse - это инструмент визуализации данных в R, который позволяет создавать подробные визуализации данных с помощью пакета ggplot2. Используя Esquisse, вы можете создавать всевозможные точечные диаграммы, гистограммы, линейные диаграммы, гистограммы, круговые диаграммы, полосы ошибок, прямоугольные диаграммы, множественные оси, спарклайны, дендрограммы, трехмерные диаграммы и т. Д., А также экспортировать эти графики или получать доступ к код для создания этих графиков. Esquisse - такой известный и простой в использовании инструмент визуализации данных, благодаря его способности перетаскивать и отпускать, что делает его популярным даже среди новичков. Вы можете установить Esquisse из CRAN с помощью install.packages («esquisse») или установить версию для разработки с GitHub с помощью remotes :: install_github («dreamRs / esquisse»).

4. Решетка

Решетка - это инструмент визуализации данных, который в основном используется для реализации решетчатых графиков в R. Эти решетчатые графики используются для одновременного просмотра множества сложных и многопараметрических наборов данных, чтобы их можно было сравнивать. Поскольку все эти разные графики в конечном итоге выглядят как решетчатая диаграмма, это называется решетчатым графом. Поскольку Lattice представляет собой библиотеку визуализации данных высокого уровня, она может обрабатывать многие типичные графические элементы без необходимости выполнять множество настроек. Если вы хотите расширить возможности Lattice, они могут загрузить пакет LatticeExtra, который является расширенной версией. Вы можете установить Lattice из CRAN с помощью install.packages («решетка») или установить версию для разработки с GitHub с помощью remotes :: install_github («deepayan / lattice»).

5. RGL

Пакет RGL в R создан специально для создания трехмерных визуализаций данных и графиков данных. Он имеет множество графических команд, которые работают в 3-х измерениях, но смоделированы по образцу классической двухмерной графики в R. RGL также вдохновлен пакетом сетки в R, но несовместим с ним. Однако опытные кодеры R могут легко использовать RGL, поскольку уже знакомы с сеткой. И RGL это очень круто! Он имеет множество опций для трехмерных форм, различных световых эффектов, создания новых форм, а также анимации. Вы можете установить RGL из CRAN с помощью install.packages («rgl»).

6. Диграфы

Пакет dygraphs представляет собой интерфейс R для dygraphs библиотеки диаграмм JavaScript, которые используются для предоставления различных диаграмм для визуализации наборов данных. Этот пакет можно использовать для создания различных интерактивных визуализаций с параметрами масштабирования и панорамирования, а также метками по умолчанию при наведении указателя мыши. dygraphs также обеспечивает поддержку различных наложений графиков, таких как аннотации точек, закрашенные области, линии событий и т. д. Вы также можете автоматически строить объекты временных рядов xts. Однако все эти функции не происходят за счет скорости в Dygraph. Скорее, он может обеспечить максимальную интерактивность даже с миллионами точек данных в визуализации. Вы можете установить RGL из CRAN, используя install.packages («диграфы»).

7. Брошюра

Как и dygraphs, пакет Leaflet представляет собой интерфейс R для библиотеки Leaflet JavaScript, которая чрезвычайно популярна. Leaflet очень полезен при создании интерактивных, но легких карт, которые можно увидеть на различных веб-сайтах, таких как Washington Post, New York Times и т. Д. В этом пакете есть много полезных функций, таких как интерактивное панорамирование и масштабирование диаграмм, возможность комбинируйте полигоны, линии, всплывающие окна и т. д. для создания диаграмм, встраивайте карты в knitr, создавайте карты в несферических проекциях меркатора и т. д. Пакет Leaflet можно использовать в консоли R после его установки из CRAN с помощью команды install.packages («листовка»).

Все эти библиотеки R для визуализации данных - отличные варианты, если вы хотите создавать визуализации данных. Каждая из этих библиотек имеет свои сильные стороны, и вы можете выбрать лучшую в зависимости от типа визуализации или проекта по науке о данных, который вы хотите создать. Теперь, когда вы знаете эти библиотеки, продолжайте создавать красивые, но информативные визуализации данных с их помощью!