Python | Панды серии. Дублированный ()

Опубликовано: 27 Марта, 2022

Серия Pandas - это одномерный массив ndarray с метками осей. Этикетки не обязательно должны быть уникальными, но должны быть хешируемого типа. Объект поддерживает как целочисленное, так и основанное на метках индексирование и предоставляет множество методов для выполнения операций с индексом.

Pandas Series.duplicated() function indicate duplicate Series values. The duplicated values are indicated as True values in the resulting Series. Either all duplicates, all except the first or all except the last occurrence of duplicates can be indicated.

Syntax: Series.duplicated(keep=’first’)

Parameter :
keep : {‘first’, ‘last’, False}, default ‘first’

Returns : pandas.core.series.Series

Example #1: Use Series.duplicated() function to find the duplicate values in the given series object.

# importing pandas as pd
import pandas as pd
  
# Creating the Series
sr = pd.Series([80, 25, 3, 25, 24, 6])
  
# Create the Index
index_ = ["Coca Cola", "Sprite", "Coke", "Fanta", "Dew", "ThumbsUp"]
  
# set the index
sr.index = index_
  
# Print the series
print(sr)

Выход :

Now we will use Series.duplicated() function to find the duplicate values in the underlying data of the given series object.

# detect duplicates
result = sr.duplicated()
  
# Print the result
print(result)

Выход :

As we can see in the output, the Series.duplicated() function has successfully detected the duplicated values in the given series object. False indicates that the corresponding value is unique whereas, True indicates that the corresponding value was a duplicated value in the given series object.
 
Example #2 : Use Series.duplicated() function to find the duplicate values in the given series object.

# importing pandas as pd
import pandas as pd
  
# Creating the Series
sr = pd.Series([11, 11, 8, 18, 65, 18, 32, 10, 5, 32, 32])
  
# Create the Index
index_ = pd.date_range("2010-10-09", periods = 11, freq ="M")
  
# set the index
sr.index = index_
  
# Print the series
print(sr)

Выход :

Now we will use Series.duplicated() function to find the duplicate values in the underlying data of the given series object.

# detect duplicates
result = sr.duplicated()
  
# Print the result
print(result)

Output :

As we can see in the output, the Series.duplicated() function has successfully detected the duplicated values in the given series object. False indicates that the corresponding value is unique whereas, True indicates that the corresponding value was a duplicated value in the given series object.

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.

Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.