Неоднородные данные в R
Структуры данных являются логическим способом или представляются в соответствии с требованиями. Кроме того, они помогают физически отобразить это логическое представление в памяти компьютера. В языке R структуры данных можно разделить на две группы: гомогенные и гетерогенные.
- Однородные структуры данных: этот тип может хранить внутри себя только один тип данных (целое число, символ и т. д.),
- Гетерогенные структуры данных: этот тип может хранить более одного типа данных одновременно.
Гетерогенные структуры данных
R поддерживает два способа представления разнородных данных, а именно списки и фреймы данных. Обе структуры подробно обсуждаются ниже:
1) Списки:
- Списки — это одномерные гетерогенные типы данных.
- Список может представлять более одного типа данных одновременно.
- Мы можем просто использовать функцию list() для создания списка.
- Списки похожи на векторы, однако векторы однородны, а списки разнородны.
- Другое интересное свойство списков заключается в том, что мы можем хранить списки внутри других списков (например, простая рекурсия). По этой причине списки также называют « рекурсивными векторами ».
Пример:
R
list_ex = list (Ch= "R language" , numbers = 5:1, fl= FALSE ) print (list_ex) |
Выход:
$Ch
[1] “R language”
$numbers
[1] 5 4 3 2 1
$fl
[1] FALSE
Пример: рекурсивные векторы
R
list_ex2<- list ( list (1, "R language" , FALSE ), list ( "Python" ,2, "Language" ), list ( "Hello" , FALSE , "World" )) str (list_ex2) |
Выход:
List of 3
$ :List of 3
..$ : num 1
..$ : chr “R language”
..$ : logi FALSE
$ :List of 3
..$ : chr “Python”
..$ : num 2
..$ : chr “Language”
$ :List of 3
..$ : chr “Hello”
..$ : logi FALSE
..$ : chr “World”
2) Кадры данных:
- В языке R фрейм данных представляет собой двумерную гетерогенную табличную структуру.
- Это просто списки векторов одинаковой длины.
- Фреймы данных облегчают анализ данных, когда они используются систематически.
- В языке R мы используем функцию data.frames() для создания фреймов данных.
- Фрейм данных в R должен соответствовать следующим правилам:
- Фрейм данных должен иметь имена столбцов , и каждый столбец должен содержать одинаковое количество элементов,
- Каждая строка во фрейме данных должна иметь уникальное имя .
- Каждая запись в столбце должна иметь одинаковый тип данных ,
- Разные столбцы могут иметь одинаковые или разные типы данных .
Пример:
R
employee_id <- c (1:4) employee_name <- c ( "Abdul" , "Anshul" , "Vishal" , "Riya" ) employee_salary <- c ( "45000" , "90000" , "25000" , "75000" ) employee_designation <- c ( "Software Engineer" , "Senior Manager" , "Intern" , "Manager" ) employee.data <- data.frame (employee_id , employee_name, employee_salary, employee_designation) employee.data |
Выход: