Работа со строками и столбцами в Pandas DataFrame

Опубликовано: 28 Марта, 2022

Фрейм данных представляет собой двумерную структуру данных, т. Е. Данные выровнены в табличной форме по строкам и столбцам. Мы можем выполнять базовые операции со строками / столбцами, такие как выбор, удаление, добавление и переименование. В этой статье мы используем файл nba.csv.

Работа со столбцами

Чтобы иметь дело со столбцами, мы выполняем основные операции с столбцами, такие как выбор, удаление, добавление и переименование.

Column Selection:
In Order to select a column in Pandas DataFrame, we can either access the columns by calling them by their columns name.

# Import pandas package
import pandas as pd
  
# Define a dictionary containing employee data
data = {"Name":["Jai", "Princi", "Gaurav", "Anuj"],
        "Age":[27, 24, 22, 32],
        "Address":["Delhi", "Kanpur", "Allahabad", "Kannauj"],
        "Qualification":["Msc", "MA", "MCA", "Phd"]}
  
# Convert the dictionary into DataFrame 
df = pd.DataFrame(data)
  
# select two columns
print(df[["Name", "Qualification"]])

Выход:

Дополнительные примеры см. В разделе Как выбрать несколько столбцов в кадре данных pandas.

Добавление столбца:
Чтобы добавить столбец в Pandas DataFrame, мы можем объявить новый список как столбец и добавить к существующему Dataframe.

Output:

For more examples refer to Adding new column to existing DataFrame in Pandas
 
Column Deletion:
In Order to delete a column in Pandas DataFrame, we can use the drop() method. Columns is deleted by dropping columns with column names.

# importing pandas module
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name" )
  
# dropping passed columns
data.drop(["Team", "Weight"], axis = 1, inplace = True)
  
# display
print(data)

Выход:
Как показано на изображениях вывода, новый вывод не имеет переданных столбцов. Эти значения были отброшены, поскольку ось была установлена равной 1, и изменения были внесены в исходный фрейм данных, поскольку inplace было True.

Фрейм данных перед удалением столбцов-


Фрейм данных после удаления столбцов-

Дополнительные примеры см. В разделе Удаление столбцов из DataFrame с помощью Pandas.drop ().

Работа со строками:

Чтобы иметь дело со строками, мы можем выполнять базовые операции со строками, такие как выбор, удаление, добавление и переименование.

Row Selection:
Pandas provide a unique method to retrieve rows from a Data frame.DataFrame.loc[] method is used to retrieve rows from Pandas DataFrame. Rows can also be selected by passing integer location to an iloc[] function.

# importing pandas package
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name")
  
# retrieving row by loc method
first = data.loc["Avery Bradley"]
second = data.loc["R.J. Hunter"]
  
  
print(first, " ", second)

Output:
As shown in the output image, two series were returned since there was only one parameter both of the times.

For more examples refer to Pandas Extracting rows using .loc[]
 
Row Addition:
In Order to add a Row in Pandas DataFrame, we can concat the old dataframe with new one.

# importing pandas module 
import pandas as pd 
    
# making data frame 
df = pd.read_csv("nba.csv", index_col ="Name"
  
df.head(10)
  
new_row = pd.DataFrame({"Name":"Geeks", "Team":"Boston", "Number":3,
                        "Position":"PG", "Age":33, "Height":"6-2",
                        "Weight":189, "College":"MIT", "Salary":99999},
                                                            index =[0])
# simply concatenate both dataframes
df = pd.concat([new_row, df]).reset_index(drop = True)
df.head(5)

Output:

Data Frame before Adding Row-


Data Frame after Adding Row-


For more examples refer to Add a row at top in pandas DataFrame
 
Row Deletion:
In Order to delete a row in Pandas DataFrame, we can use the drop() method. Rows is deleted by dropping Rows by index label.

# importing pandas module
import pandas as pd
  
# making data frame from csv file
data = pd.read_csv("nba.csv", index_col ="Name" )
  
# dropping passed values
data.drop(["Avery Bradley", "John Holland", "R.J. Hunter",
                            "R.J. Hunter"], inplace = True)
  
# display
data

Выход:
Как показано на изображениях вывода, новый вывод не имеет переданных значений. Эти значения были отброшены, и изменения были внесены в исходный фрейм данных, поскольку inplace было True.

Кадр данных перед отбрасыванием значений-


Кадр данных после отбрасывания значений-

Дополнительные примеры см. В разделе Удаление строк из DataFrame с помощью Pandas.drop ().

Проблема, связанная со столбцами:

  • Как получить имена столбцов в фреймворке Pandas
  • Как переименовать столбцы в Pandas DataFrame
  • Как удалить один или несколько столбцов в Pandas Dataframe
  • Получить уникальные значения из столбца в Pandas DataFrame
  • Как писать имена столбцов в нижнем регистре в фрейме данных Pandas
  • Применить верхний регистр к столбцу в фрейме данных Pandas
  • Сделать заглавными первую букву столбца в кадре данных Pandas
  • Получить n-большие значения из определенного столбца в Pandas DataFrame
  • Получить n-наименьшие значения из определенного столбца в Pandas DataFrame
  • Преобразование столбца в имя / индекс строки в Pandas

Проблема, связанная со строками:

  • Применить функцию к каждой строке в Pandas DataFrame
  • Как получить имена строк в фрейме данных Pandas

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.

Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.