Таблица непредвиденных обстоятельств в Python
Такие оценки, как среднее значение, медиана, стандартное отклонение и дисперсия, очень полезны в случае одномерного анализа данных. Но в случае двумерного анализа (сравнения двух переменных) в игру вступает корреляция.
Таблица непредвиденных обстоятельств - это один из методов исследования двух или даже более переменных. По сути, это подсчет двух или более категориальных переменных.
Чтобы получить данные о ссуде, нажмите здесь.
Загрузка библиотек
import numpy as npimport pandas as pdimport matplotlib as plt |
Загрузка данных
data = pd.read_csv("loan_status.csv") print (data.head(10)) |
Выход:
Описать данные
data.describe() |
Выход:
Информация о данных
data.info() |
Выход:
Типы данных
# data types of feature/attributes# in the datadata.dtypes |
Выход:
Код №1: Таблица непредвиденных обстоятельств, показывающая корреляцию между оценками и статусом кредита.
data_crosstab = pd.crosstab(data["grade"], data["loan_status"], margins = False)print(data_crosstab) |
Выход: 
Код № 2: Таблица непредвиденных обстоятельств, показывающая взаимосвязь между Целью и статусом кредита.
data_crosstab = pd.crosstab(data[ 'purpose' ], data[ 'loan_status' ], margins = False )print (data_crosstab) |
Выход: 
Код № 3: Таблица непредвиденных обстоятельств, показывающая взаимосвязь между оценками + целью и статусом ссуды.
data_crosstab = pd.crosstab([data.grade, data.purpose], data.loan_status, margins = False )print (data_crosstab) |
Выход: 
Как и в коде, таблицы непредвиденных обстоятельств дают четкие значения корреляции между двумя и более переменными. Таким образом, понимание данных для дальнейшего извлечения информации становится гораздо более полезным.
.
Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.
Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.