Как проверить тип данных в Pandas DataFrame?

Опубликовано: 27 Марта, 2022

Pandas DataFrame - это двумерная структура данных изменяемого размера и разнородных табличных данных. В Python доступны различные встроенные типы данных. Для проверки типов данных используются два метода: pandas.DataFrame.dtypes и pandas.DataFrame.select_dtypes.

Consider an dataset of a shopping store having data about Customer Serial Number, Customer Name, Product ID of the purchased item, Product Cost and Date of Purchase.

Python3

#importing pandas as pd
import pandas as pd
  
# Create the dataframe 
df = pd.DataFrame({
"Cust_No": [1,2,3],
"Cust_Name": ["Alex", "Bob", "Sophie"],
"Product_id": [12458,48484,11311],
"Product_cost": [65.25, 25.95, 100.99],
"Purchase_Date": [pd.Timestamp("20180917"),
                  pd.Timestamp("20190910"),
                  pd.Timestamp("20200610")]
})
  
# Print the dataframe 
df

Выход:

Метод 1. Использование pandas.DataFrame.dtypes

Чтобы пользователь мог проверить DataType определенного набора данных или определенного столбца из набора данных, можно использовать этот метод. Этот метод возвращает список типов данных для каждого столбца или также возвращает только тип данных определенного столбца.

Example 1 : 

Python3

# Print a list datatypes of all columns
  
df.dtypes

Выход:

Example 2: 

Python3



# print datatype of particular column
df.Cust_No.dtypes

Выход:

 dtype ('int64')

Метод 2: Использование pandas.DataFrame.select_dtypes

В отличие от проверки типа данных, пользователь может альтернативно выполнить проверку, чтобы получить данные для определенного типа данных, если он существует, в противном случае получить взамен пустой набор данных. Этот метод возвращает подмножество столбцов DataFrame на основе dtypes столбцов.

Example 1:

Python3

# Returns Two column of int64 
df.select_dtypes(include = "int64")

Выход:

Example 2: 

Python3

# Returns columns excluding int64 
df.select_dtypes(exclude = "int64")

Выход :

Example 3 : 

Python3

# Print an empty list as there is
# no column of bool type
df.select_dtypes(include = "bool")

Выход :

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.

Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.