Python | Панды Series.gt ()

Опубликовано: 29 Марта, 2022

Python - отличный язык для анализа данных, в первую очередь из-за фантастической экосистемы пакетов Python, ориентированных на данные. Pandas - один из таких пакетов, который значительно упрощает импорт и анализ данных.

Pandas Series.gt() is used to compare two series and return Boolean value for every respective element.

Syntax: Series.gt(other, level=None, fill_value=None, axis=0)

Parameters:
other: other series to be compared with
level: int or name of level in case of multi level
fill_value: Value to be replaced instead of NaN
axis: 0 or ‘index’ to apply method by rows and 1 or ‘columns’ to apply by columns.

Return type: Boolean series

Примечание . Результаты возвращаются на основе сравнения серии вызывающих> других серий.

Чтобы загрузить набор данных, используемый в следующем примере, щелкните здесь.

В следующих примерах используемый фрейм данных содержит данные некоторых игроков НБА. Изображение фрейма данных до каких-либо операций прилагается ниже.

Example #1:
In this example, the Age column and Weight columns are copared using .gt() method. Since values in weight columns are very large as compared to Age column, hence the values are divided by 10 first. Before comparing, Null rows are removed using .dropna() method to avoid errors.

# importing pandas module 
import pandas as pd 
  
# importing regex module
import re
    
# making data frame 
    
# removing null values to avoid errors 
data.dropna(inplace = True
  
# other series
other = data["Weight"]/10
  
# calling method and returning to new column
data["Age > Weight"]= data["Age"].gt(other)

Выход:
Как показано на выходном изображении, новый столбец имеет значение True, если значение в столбце Age больше, чем Weight / 10.


Пример # 2: Обработка значений NaN

In this example, two series are created using pd.Series(). The series contains null value too and hence 5 is passed to fill_value parameter to replace null values by 5.

# importing pandas module 
import pandas as pd 
  
# importing numpy module
import numpy as np
  
# creating series 1
series1 = pd.Series([24, 19, 2, 33, 49, 7, np.nan, 10, np.nan])
  
# creating series 2
series2 = pd.Series([16, np.nan, 2, 23, 5, 40, np.nan, 0, 9])
  
# setting null replacement value
na_replace = 5
  
# calling and storing result
result = series1.gt(series2, fill_value = na_replace)
  
# display
result

Выход:
Как видно из выходных данных, значения NaN были заменены на 5, и сравнение выполняется после замены, и для сравнения используются новые значения.

0 Верно
1 Верно
2 ложь
3 Верно
4 Верно
5 ложно
6 ложь
7 Верно
8 Ложь
dtype: bool

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.

Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.