Добавить столбец в Pandas DataFrame со значением по умолчанию

Опубликовано: 27 Марта, 2022

Три способа добавить столбец в Pandas DataFrame со значением по умолчанию.

  • Использование pandas.DataFrame.assign (** kwargs)
  • Использование оператора []
  • Использование pandas.DataFrame.insert ()

Использование Pandas.DataFrame.assign (** kwargs)

Он назначает новые столбцы DataFrame и возвращает новый объект со всеми существующими столбцами в новые. Существующие переназначенные столбцы будут перезаписаны.

Syntax: Pandas.DataFrame.assign(**kwargs)

Parameters : **kwargsdict of {str: callable or Series}

Returns : DataFrame

Разберемся на примерах:

First, create a simple DataFrame.

Python3

# importing pandas as pd
import pandas as pd
  
# creating the dataframe
df = pd.DataFrame({"Name": ["Anurag", "Manjeet", "Shubham",
                            "Saurabh", "Ujjawal"],
  
                   "Address": ["Patna", "Delhi", "Coimbatore",
                               "Greater noida", "Patna"],
  
                   "ID": [20123, 20124, 20145, 20146, 20147],
  
                   "Sell": [140000, 300000, 600000, 200000, 600000]})
  
print("Original DataFrame :")
display(df)

Выход:

Add a new column:

Python3

new_df = df.assign(profit=[40000, 20000, 30000, 60000, 200000])
new_df

Выход:

Add a new column with Default Value:

Python3

new_df = df.assign(profit="NAN")
new_df

Выход:

Использование оператора [] для добавления нового столбца

Мы можем использовать индексирование DataFrame, чтобы создать новый столбец в DataFrame и установить для него значения по умолчанию.

Синтаксис:

 df [col_name] = значение

Let’s understand with an example:

Python3

# importing pandas as pd
import pandas as pd
  
# creating the dataframe
df = pd.DataFrame({"Name": ["Anurag", "Manjeet", "Shubham",
                            "Saurabh", "Ujjawal"],
                     
                   "Address": ["Patna", "Delhi", "Coimbatore"
                               "Greater noida", "Patna"],
                     
                   "ID": [20123, 20124, 20145, 20146, 20147],
                     
                   "Sell": [140000, 300000, 600000, 200000, 600000]})
  
print("Original DataFrame :")
display(df)

Выход:

Add new column in Dataframe:

Python3

df["loss"] = [40000, 20000, 30000, 60000, 200000]
df

Выход:

Add a new column with default values:

Python3

df["loss"] = "NAN"
df

Выход:

Использование pandas.DataFrame.insert ()

Добавить новый столбец в DataFrame в указанном месте.

Syntax: DataFrame.insert(loc, column, value, allow_duplicates=False)

Parameters

loc : int Insertion index. Must verify 0 <= loc <= len(columns).

column : str, number, or hashable object Label of the inserted column.

value : int, Series, or array-like

allow_duplicates : bool, optional

Let’s understand with examples:

Python3

# importing pandas as pd
import pandas as pd
  
# creating the dataframe
df = pd.DataFrame({"Name": ["Anurag", "Manjeet", "Shubham",
                            "Saurabh", "Ujjawal"],
                     
                   "Address": ["Patna", "Delhi", "Coimbatore"
                               "Greater noida", "Patna"],
                     
                   "ID": [20123, 20124, 20145, 20146, 20147],
                     
                   "Sell": [140000, 300000, 600000, 200000, 600000]})
  
print("Original DataFrame :")
display(df)

Выход:

Add a new column with default value:

Python3

df.insert(2, "expenditure", 4500, allow_duplicates=False)
df

Выход:

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.

Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.