Как импортировать файл Excel в Python с помощью Pandas?
Получить набор данных в формате CSV не всегда возможно. Итак, Pandas предоставляет нам функции для преобразования наборов данных в других форматах во фрейм данных. Файл Excel имеет формат .xlsx.
Прежде чем мы начнем, нам нужно установить несколько библиотек.
pip install pandas pip install xlrd
Для импорта файла Excel в Python с помощью Pandas мы должны использовать функцию pandas.read_excel ().
Syntax: pandas.read_excel(io, sheet_name=0, header=0, names=None,….)
Return: DataFrame or dict of DataFrames.
Предположим, файл Excel выглядит так:

Теперь мы можем погрузиться в код.
Example 1: Read an Excel file.
Python3
import pandas as pd df = pd.read_excel("sample.xlsx")print(df) |
Выход:

Пример 2: Чтобы выбрать конкретный столбец, мы можем передать параметр index_col .
Python3
import pandas as pd # Here 0th column will be extracteddf = pd.read_excel("sample.xlsx", index_col = 0) print(df) |
Выход:

Example 3: In case you don’t prefer the initial heading of the columns, you can change it to indexes using the parameter “header”.
Python3
import pandas as pd df = pd.read_excel("sample.xlsx", header = None)print(df) |
Выход:

Example 4: If you want to change the data type of a particular column you can do it using the parameter “dtype“.
Python3
import pandas as pd df = pd.read_excel("sample.xlsx", dtype = {"Products": str, "Price":float})print(df) |
Выход:

Example 5: In case you have unknown values, then you can handle it using the parameter “na_values“. It will convert the mentioned unknown values into “NaN”
Python3
import pandas as pddf = pd.read_excel("sample.xlsx", na_values =["item1", "item2"])print(df) |
Выход:

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.
Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.