Столбчатые и групповые гистограммы в R

Опубликовано: 6 Октября, 2022

В этой статье объясняется, как можно визуализировать гистограммы с накоплением и группами на языке программирования R с помощью ggplot2.

Столбчатые и групповые гистограммы в R

Подготовка данных для демонстрации:

Чтобы создать фрейм данных, мы будем использовать список элементов, а затем подготовим фрейм данных для демонстрации.

R




# create a dataset
  
# list of elements
vehicle <- c(rep("car" , 3) , rep("bike" , 3) ,
             rep("truck" , 3) , rep("scooter" , 3) )
condition <- rep(c("okay" , "bad" , "worst") , 4)
  
# list generated with random values
pollution <- abs(rnorm(12 , 0 , 15))
  
# preparing the data set
data <- data.frame(vehicle, condition, pollution)
  
# glimpse of the data
cat("Vehicle: ", vehicle)
cat(" Condition: ", condition)
cat(" Pollution: ", pollution)
  
head(data)

Выход:

Сгруппированная гистограмма

Сгруппированная гистограмма (также известная как гистограмма с кластерами или гистограмма с несколькими рядами) — это тип гистограммы, на котором отображаются числовые значения для двух категориальных переменных, а не для одной. Для уровней одной категориальной переменной полосы сгруппированы по положению, при этом цвет представляет уровень вторичной категории в каждой группе.

R




# Grouped bar chart plot using the geom_bar()
  
# distinguishing the bar with "condition" parameter
ggplot(data, aes(fill = condition, 
                  
                # y-axis value
                y = pollution, 
  
                # this will group the data
                # based on the "vehicle" type
                x = vehicle)) + 
  
# position adjustment of the bar,
 geom_bar(position = "dodge"
  
          # since we are grouping the bar,
          # we have chosen "dodge"
          stat="identity")

Выход:

Столбчатая диаграмма с накоплением

Гистограмма с накоплением — это форма гистограммы, которую можно использовать для визуализации сравнения частей с целыми во времени. Это упрощает представление данных в формате с накоплением. Этот график подходит для данных, которые представлены в нескольких разделах и в целом. Это можно использовать для визуализации устойчивого изменения нескольких факторов.

R




# Grouped
# distinguishing the bar with "condition" parameter
ggplot(data, aes(fill = condition, 
                   
                 # y-axis value 
                 y = pollution,
                   
                 # this will group the data
                 # based on the "vehicle" type 
                 x = vehicle)) + 
  
  # position adjustment of the bar,
  geom_bar(position = "stack",  
           # since we are grouping the bar,
           # we have chosen "stack"
           stat="identity")

Выход: