Как получить имена строк / индексов в фреймворке Pandas

Опубликовано: 28 Марта, 2022

При анализе реальных наборов данных, которые часто очень большие по размеру, нам может потребоваться получить имена строк или индексов для выполнения некоторых определенных операций.

Давайте обсудим, как получить имена строк в фрейме данных Pandas.

First, let’s create a simple dataframe with nba.csv

# Import pandas package 
import pandas as pd 
    
# making data frame 
    
# calling head() method  
# storing in new variable 
data_top = data.head(10
    
# display 
data_top 

Теперь давайте попробуем получить имя строки из набора данных выше.

Method #1: Simply iterate over indices

# Import pandas package 
import pandas as pd 
    
# making data frame 
data = pd.read_csv("nba.csv"
  
# calling head() method  
# storing in new variable 
data_top = data.head() 
    
# iterating the columns
for row in data_top.index:
    print(row, end = " ")

Выход:

 0 1 2 3 4 5 6 7 8 9

 
Method #2: Using rows with dataframe object

# Import pandas package 
import pandas as pd 
    
# making data frame 
data = pd.read_csv("nba.csv"
  
# calling head() method  
# storing in new variable 
data_top = data.head() 
    
# list(data_top) or
list(data_top.index)

Выход:

 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

 
Method #3: index.values method returns an array of index.

# Import pandas package 
import pandas as pd 
    
# making data frame 
data = pd.read_csv("nba.csv"
  
# calling head() method  
# storing in new variable 
data_top = data.head() 
    
list(data_top.index.values)

Выход:

 [0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

 
Method #4: Using tolist() method with values with given the list of index.

# Import pandas package 
import pandas as pd 
    
# making data frame 
data = pd.read_csv("nba.csv"
  
# calling head() method  
# storing in new variable 
data_top = data.head() 
    
list(data_top.index.values.tolist())

Выход:

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]


Метод # 5: подсчитать количество строк в фрейме данных

Since we have loaded only 10 top rows of dataframe using head() method, let’s varify total number of rows first.

# iterate the indices and print each one
for row in data.index:
    print(row, end= " ")

Выход:

Now, let’s print the total count of index.

# Import pandas package 
import pandas as pd 
    
# making data frame 
data = pd.read_csv("nba.csv"
  
row_count = 0
  
# iterating over indices
for col in data.index:
    row_count += 1
  
# print the row count
print(row_count)

Выход:

 458

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.

Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.