Добавить столбец в Pandas DataFrame со значением по умолчанию
Три способа добавить столбец в Pandas DataFrame со значением по умолчанию.
- Использование pandas.DataFrame.assign (** kwargs)
- Использование оператора []
- Использование pandas.DataFrame.insert ()
Использование Pandas.DataFrame.assign (** kwargs)
Он назначает новые столбцы DataFrame и возвращает новый объект со всеми существующими столбцами в новые. Существующие переназначенные столбцы будут перезаписаны.
Syntax: Pandas.DataFrame.assign(**kwargs)
Parameters : **kwargsdict of {str: callable or Series}
Returns : DataFrame
Разберемся на примерах:
First, create a simple DataFrame.
Python3
# importing pandas as pd import pandas as pd # creating the dataframe df = pd.DataFrame({ "Name" : [ "Anurag" , "Manjeet" , "Shubham" , "Saurabh" , "Ujjawal" ], "Address" : [ "Patna" , "Delhi" , "Coimbatore" , "Greater noida" , "Patna" ], "ID" : [ 20123 , 20124 , 20145 , 20146 , 20147 ], "Sell" : [ 140000 , 300000 , 600000 , 200000 , 600000 ]}) print ( "Original DataFrame :" ) display(df) |
Выход:
Add a new column:
Python3
new_df = df.assign(profit = [ 40000 , 20000 , 30000 , 60000 , 200000 ]) new_df |
Выход:
Add a new column with Default Value:
Python3
new_df = df.assign(profit = "NAN" ) new_df |
Выход:
Использование оператора [] для добавления нового столбца
Мы можем использовать индексирование DataFrame, чтобы создать новый столбец в DataFrame и установить для него значения по умолчанию.
Синтаксис:
df [col_name] = значение
Let’s understand with an example:
Python3
# importing pandas as pd import pandas as pd # creating the dataframe df = pd.DataFrame({ "Name" : [ "Anurag" , "Manjeet" , "Shubham" , "Saurabh" , "Ujjawal" ], "Address" : [ "Patna" , "Delhi" , "Coimbatore" , "Greater noida" , "Patna" ], "ID" : [ 20123 , 20124 , 20145 , 20146 , 20147 ], "Sell" : [ 140000 , 300000 , 600000 , 200000 , 600000 ]}) print ( "Original DataFrame :" ) display(df) |
Выход:
Add new column in Dataframe:
Python3
df[ "loss" ] = [ 40000 , 20000 , 30000 , 60000 , 200000 ] df |
Выход:
Add a new column with default values:
Python3
df[ "loss" ] = "NAN" df |
Выход:
Использование pandas.DataFrame.insert ()
Добавить новый столбец в DataFrame в указанном месте.
Syntax: DataFrame.insert(loc, column, value, allow_duplicates=False)
Parameters
loc : int Insertion index. Must verify 0 <= loc <= len(columns).
column : str, number, or hashable object Label of the inserted column.
value : int, Series, or array-like
allow_duplicates : bool, optional
Let’s understand with examples:
Python3
# importing pandas as pd import pandas as pd # creating the dataframe df = pd.DataFrame({ "Name" : [ "Anurag" , "Manjeet" , "Shubham" , "Saurabh" , "Ujjawal" ], "Address" : [ "Patna" , "Delhi" , "Coimbatore" , "Greater noida" , "Patna" ], "ID" : [ 20123 , 20124 , 20145 , 20146 , 20147 ], "Sell" : [ 140000 , 300000 , 600000 , 200000 , 600000 ]}) print ( "Original DataFrame :" ) display(df) |
Выход:
Add a new column with default value:
Python3
df.insert( 2 , "expenditure" , 4500 , allow_duplicates = False ) df |
Выход:
Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.
Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.