Столбчатые и групповые гистограммы в R
В этой статье объясняется, как можно визуализировать гистограммы с накоплением и группами на языке программирования R с помощью ggplot2.
Столбчатые и групповые гистограммы в R
Подготовка данных для демонстрации:
Чтобы создать фрейм данных, мы будем использовать список элементов, а затем подготовим фрейм данных для демонстрации.
R
# create a dataset # list of elementsvehicle <- c(rep("car" , 3) , rep("bike" , 3) , rep("truck" , 3) , rep("scooter" , 3) )condition <- rep(c("okay" , "bad" , "worst") , 4) # list generated with random valuespollution <- abs(rnorm(12 , 0 , 15)) # preparing the data setdata <- data.frame(vehicle, condition, pollution) # glimpse of the datacat("Vehicle: ", vehicle)cat("
Condition: ", condition)cat("
Pollution: ", pollution) head(data) |
Выход:

Сгруппированная гистограмма
Сгруппированная гистограмма (также известная как гистограмма с кластерами или гистограмма с несколькими рядами) — это тип гистограммы, на котором отображаются числовые значения для двух категориальных переменных, а не для одной. Для уровней одной категориальной переменной полосы сгруппированы по положению, при этом цвет представляет уровень вторичной категории в каждой группе.
R
# Grouped bar chart plot using the geom_bar() # distinguishing the bar with "condition" parameterggplot(data, aes(fill = condition, # y-axis value y = pollution, # this will group the data # based on the "vehicle" type x = vehicle)) + # position adjustment of the bar, geom_bar(position = "dodge", # since we are grouping the bar, # we have chosen "dodge" stat="identity") |
Выход:

Столбчатая диаграмма с накоплением
Гистограмма с накоплением — это форма гистограммы, которую можно использовать для визуализации сравнения частей с целыми во времени. Это упрощает представление данных в формате с накоплением. Этот график подходит для данных, которые представлены в нескольких разделах и в целом. Это можно использовать для визуализации устойчивого изменения нескольких факторов.
R
# Grouped# distinguishing the bar with "condition" parameterggplot(data, aes(fill = condition, # y-axis value y = pollution, # this will group the data # based on the "vehicle" type x = vehicle)) + # position adjustment of the bar, geom_bar(position = "stack", # since we are grouping the bar, # we have chosen "stack" stat="identity") |
Выход:
