Столбчатые и групповые гистограммы в R
В этой статье объясняется, как можно визуализировать гистограммы с накоплением и группами на языке программирования R с помощью ggplot2.
Столбчатые и групповые гистограммы в R
Подготовка данных для демонстрации:
Чтобы создать фрейм данных, мы будем использовать список элементов, а затем подготовим фрейм данных для демонстрации.
R
# create a dataset # list of elements vehicle <- c ( rep ( "car" , 3) , rep ( "bike" , 3) , rep ( "truck" , 3) , rep ( "scooter" , 3) ) condition <- rep ( c ( "okay" , "bad" , "worst" ) , 4) # list generated with random values pollution <- abs ( rnorm (12 , 0 , 15)) # preparing the data set data <- data.frame (vehicle, condition, pollution) # glimpse of the data cat ( "Vehicle: " , vehicle) cat ( "
Condition: " , condition) cat ( "
Pollution: " , pollution) head (data) |
Выход:
Сгруппированная гистограмма
Сгруппированная гистограмма (также известная как гистограмма с кластерами или гистограмма с несколькими рядами) — это тип гистограммы, на котором отображаются числовые значения для двух категориальных переменных, а не для одной. Для уровней одной категориальной переменной полосы сгруппированы по положению, при этом цвет представляет уровень вторичной категории в каждой группе.
R
# Grouped bar chart plot using the geom_bar() # distinguishing the bar with "condition" parameter ggplot (data, aes (fill = condition, # y-axis value y = pollution, # this will group the data # based on the "vehicle" type x = vehicle)) + # position adjustment of the bar, geom_bar (position = "dodge" , # since we are grouping the bar, # we have chosen "dodge" stat= "identity" ) |
Выход:
Столбчатая диаграмма с накоплением
Гистограмма с накоплением — это форма гистограммы, которую можно использовать для визуализации сравнения частей с целыми во времени. Это упрощает представление данных в формате с накоплением. Этот график подходит для данных, которые представлены в нескольких разделах и в целом. Это можно использовать для визуализации устойчивого изменения нескольких факторов.
R
# Grouped # distinguishing the bar with "condition" parameter ggplot (data, aes (fill = condition, # y-axis value y = pollution, # this will group the data # based on the "vehicle" type x = vehicle)) + # position adjustment of the bar, geom_bar (position = "stack" , # since we are grouping the bar, # we have chosen "stack" stat= "identity" ) |
Выход: