Способы применения LEFT, RIGHT, MID в пандах

Опубликовано: 27 Марта, 2022

Часто нам нужно извлечь определенные символы, присутствующие в строке во фрейме данных Pandas. Чтобы решить эту проблему, у нас есть концепции Left, Right и Mid в пандах.

Example 1: Extract Characters From the Left

Python3

# importing pandas library
import pandas as pd
  
# creating and initializing a list 
Cars = ["1000-BMW","2000-Audi","3000-Volkswagen",
        "4000-Datsun","5000-Toyota","6000-Maruti Suzuki"]
  
# creating a pandas dataframe
df = pd.DataFrame(Cars, columns= ["Model_name"])
  
# Extracting characters from right side
# using slicing and storing result in 
# "Left"
Left = df["Model_name"].str[:4]
  
print(Left)

Выход :

 0 1000
1 2000
2 3000
3 4000
4 5000
5 6000
Имя: Model_name, dtype: object

Пример 2: извлечение символов справа

Python3

# importing pandas library
import pandas as pd
  
# creating and initializing a list 
Cars = ["ID-11111-BMW","ID-22222-Volkswagen",
        "ID-33333-Toyota","ID-44444-Hyundai ",
        "ID-55555-Datsun","ID-66666-Mercedes"]
  
# creating a pandas dataframe
df = pd.DataFrame(Cars, columns= ["Model_name"])
  
# Extracting characters from left side using
# slicing and storing result in "Right"
Right = df["Model_name"].str[4:8]
  
print (Right)

Выход :

 0 11111
1 22222
2 33333
3 44444
4 55555
5 66666
Имя: Model_name, dtype: object

Example 3: Extract Characters From the Middle

Python3

# importing pandas library
import pandas as pd
  
# creating and initializing a list 
Cars = ["ID-11111-BMW","ID-22222-Volkswagen",
        "ID-33333-Toyota","ID-44444-Hyundai ",
        "ID-55555-Datsun","ID-66666-Mercedes"]
  
# creating a pandas dataframe
df = pd.DataFrame(Cars, columns= ["Model_name"])
  
# Extracting characters from Middle using 
# slicing and storing result in "Mid"
Mid = df["Model_name"].str[4:8]
  
print (Mid)

Выход :

 0 1111
1 2222
2 3333
3 4444
4 5555
5 6666
Имя: Model_name, dtype: object

Example 4 : Before a symbol using str.split() function

Python3

# importing pandas library
import pandas as pd
  
# creating and initializing a list 
Cars = ["1000-BMW","2000-Audi",
        "3000-Volkswagen","4000-Datsun",
        "5000-Toyota","6000-Maruti Suzuki"]
  
# creating a pandas dataframe
df = pd.DataFrame(Cars, columns= ["Model_name"])
  
# Extracting characters before symbol "-"
# using srt.strip() and str[0]
# and storing result to "Before_symbol"
Before_symbol = df["Model_name"].str.split("-").str[0]
  
print (Before_symbol)

Выход :

 0 1000
1 2000
2 3000
3 4000
4 5000
5 6000
Имя: Model_name, dtype: object

Example 5 :  Between identical symbols using str.split() function

Python3

# importing pandas library
import pandas as pd
  
# creating and initializing a list 
Cars = ["M3-1906-BMW","M5-2096-Audi",
        "M11-3096-Volkswagen","M9-4096-Datsun",
        "M8-5096-Toyota","M23-6096-Maruti Suzuki"]
  
# creating a pandas dataframe
df = pd.DataFrame(Cars, columns= ["Model_name"])
  
# Extracting characters between symbol "-"
# using srt.strip() and str[1]
# and storing result to "Before_symbol"
BetweenTwoSymbols = df["Model_name"].str.split("-").str[1]
  
print (BetweenTwoSymbols)

Выход :

 0 1906
1 2096
2 3096
3 4096
4 5096
5 6096
Имя: Model_name, dtype: object

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.

Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.