Использование параметра na_values в функции read_csv () Pandas в Python

Опубликовано: 27 Марта, 2022

read_csv () - важная функция pandas для чтения файлов CSV. Но есть много других вещей, которые можно сделать с помощью этой функции только для полного изменения возвращаемого объекта. В этом посте мы увидим использование параметра na_values.

na_values: используется для создания строки, которая рассматривает панды как NaN (не число). по умолчанию pandas рассматривает # N / A, -NaN, -n / a, N / A, NULL и т. д. как значение NaN. давайте посмотрим на пример для лучшего понимания.

Итак, это наш фрейм данных, у него есть три имени столбца, класс и общие оценки. теперь импортируйте фрейм данных в python pandas.

См. Ссылку на набор данных, который используется здесь.

Example 1: see pandas consider #N/A as NaN.

Python3

# import pandas library
import pandas as pd
  
# read a csv file
df = pd.read_csv("Example.csv")
  
# show the dataframe
print(df)

Выход:

Example 2: Now the na_values parameter is used to tell pandas they consider “not available” as NaN value and print NaN at the place of “not available”.

Python3

# import pandas library
import pandas as pd
  
# read a csv file
df = pd.read_csv("Example.csv"
                 na_values = "not available")
  
# show the dataframe
print(df)

Выход:

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.

Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.