Python | Панды Series.factorize ()
Серия Pandas - это одномерный массив ndarray с метками осей. Этикетки не обязательно должны быть уникальными, но должны быть хешируемого типа. Объект поддерживает индексирование как на основе целых чисел, так и на основе меток и предоставляет множество методов для выполнения операций, связанных с индексом.
Pandas Series.factorize() function encode the object as an enumerated type or categorical variable. This method is useful for obtaining a numeric representation of an array when all that matters is identifying distinct values.
Syntax: Series.factorize(sort=False, na_sentinel=-1)
Parameter :
sort : Sort uniques and shuffle labels to maintain the relationship.
na_sentinel : Value to mark “not found”.Returns :
labels : ndarray
uniques : ndarray, Index, or Categorical
Example #1: Use Series.factorize() function to encode the underlying data of the given series object.
# importing pandas as pdimport pandas as pd # Creating the Seriessr = pd.Series(["New York", "Chicago", "Toronto", None, "Rio"]) # Create the Indexsr.index = ["City 1", "City 2", "City 3", "City 4", "City 5"] # set the indexsr.index = index_ # Print the seriesprint(sr) |
Выход :

Now we will use Series.factorize() function to encode the underlying data of the given series object.
# encode the valuesresult = sr.factorize() # Print the resultprint(result) |
Output :
As we can see in the output, the Series.factorize() function has successfully encoded the underlying data of the given series object. Notice missing values has been assigned a code of -1.
Example #2 : Use Series.factorize() function to encode the underlying data of the given series object.
# importing pandas as pdimport pandas as pd # Creating the Seriessr = pd.Series([80, 25, 3, 80, 24, 25]) # Create the Indexindex_ = ["Coca Cola", "Sprite", "Coke", "Fanta", "Dew", "ThumbsUp"] # set the indexsr.index = index_ # Print the seriesprint(sr) |
Выход :
Now we will use Series.factorize() function to encode the underlying data of the given series object.
# encode the valuesresult = sr.factorize() # Print the resultprint(result) |
Output :
As we can see in the output, the Series.factorize() function has successfully encoded the underlying data of the given series object.
Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.
Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.