Как импортировать файл Excel в Python с помощью Pandas?

Опубликовано: 27 Марта, 2022

Получить набор данных в формате CSV не всегда возможно. Итак, Pandas предоставляет нам функции для преобразования наборов данных в других форматах во фрейм данных. Файл Excel имеет формат .xlsx.

Прежде чем мы начнем, нам нужно установить несколько библиотек.

 pip install pandas
pip install xlrd

Для импорта файла Excel в Python с помощью Pandas мы должны использовать функцию pandas.read_excel ().

Syntax: pandas.read_excel(io, sheet_name=0, header=0, names=None,….)

Return: DataFrame or dict of DataFrames.

Предположим, файл Excel выглядит так:

Теперь мы можем погрузиться в код.

Example 1: Read an Excel file.

Python3

import pandas as pd
  
df = pd.read_excel("sample.xlsx")
print(df)

Выход:

Пример 2: Чтобы выбрать конкретный столбец, мы можем передать параметр index_col .

Python3

import pandas as pd
  
# Here 0th column will be extracted
df = pd.read_excel("sample.xlsx",
                   index_col = 0)  
  
print(df)

Выход:

Example 3: In case you don’t prefer the initial heading of the columns, you can change it to indexes using the parameter “header”.

Python3

import pandas as pd
  
df = pd.read_excel("sample.xlsx",
                   header = None)
print(df)

Выход:

Example 4: If you want to change the data type of a particular column you can do it using the parameter “dtype“.

Python3

import pandas as pd
  
df = pd.read_excel("sample.xlsx"
                   dtype = {"Products": str,
                            "Price":float})
print(df)

Выход:

Example 5: In case you have unknown values, then you can handle it using the parameter “na_values“. It will convert the mentioned unknown values into “NaN” 

Python3

import pandas as pd
df = pd.read_excel("sample.xlsx"
                   na_values =["item1"
                               "item2"])
print(df)

Выход:

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.

Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.