Разделите DataFrame в соотношении

Опубликовано: 27 Марта, 2022

Pandas - это библиотека с открытым исходным кодом, построенная на основе библиотеки numpy. ADataframe - это двухмерная структура данных, например, данные выровнены в табличной форме по строкам и столбцам. DataFrame.sample () Метод может использоваться для разделения Dataframe.

Syntax: DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)

Атрибут frac определяет используемую долю фрейма данных. Например, frac = 0,25 указывает, что будет использовано 25% фрейма данных.

Now, Let’s create a Dataframe:

Python3

# importing pandas as pd 
import pandas as pd
  
# dictionary
cars = {
  "Brand": ["Honda Civic", "Toyota Corolla"
            "Ford Focus", "Audi A4", "Maruti 800",
            "Toyota Innova", "Tata Safari", "Maruti Zen"
            "Maruti Omni", "Honda Jezz"],
   "Price": [22000, 25000, 27000, 35000,
             20000, 25000, 31000, 23000,
             26000, 25500]
 }
  
# create the dataframe 
df = pd.DataFrame(cars, 
                  columns = ["Brand",
                             "Price"])
# show the dataframe
df

Выход:

Example 1: Divide a given Dataframe in 60% and 40%.

Python3

# importing pandas as pd 
import pandas as pd
  
# dictionary
cars = {
  "Brand": ["Honda Civic", "Toyota Corolla"
            "Ford Focus", "Audi A4", "Maruti 800",
            "Toyota Innova", "Tata Safari", "Maruti Zen"
            "Maruti Omni", "Honda Jezz"],
   "Price": [22000, 25000, 27000, 35000,
             20000, 25000, 31000, 23000,
             26000, 25500]
 }
  
# create the dataframe 
df = pd.DataFrame(cars, 
                  columns = ["Brand",
                             "Price"])
  
# Print the 60% of the dataframe 
part_60 = df.sample(frac = 0.6)
print(" 60%  DataFrame:")
print(part_60)
  
# Print the 40% of the dataframe 
part_40 = df.drop(part_60.index)
print(" 40% DataFrame:")
print(part_40)

Выход:

Example 2: Divide a given Dataframe in 80% and 20%.

Python3

# importing pandas as pd 
import pandas as pd
  
# dictionary
cars = {
  "Brand": ["Honda Civic", "Toyota Corolla"
            "Ford Focus", "Audi A4", "Maruti 800",
            "Toyota Innova", "Tata Safari", "Maruti Zen"
            "Maruti Omni", "Honda Jezz"],
   "Price": [22000, 25000, 27000, 35000,
             20000, 25000, 31000, 23000,
             26000, 25500]
 }
  
# create the dataframe 
df = pd.DataFrame(cars, 
                  columns = ["Brand",
                             "Price"])
  
# Print the 80% of the dataframe 
part_80 = df.sample(frac = 0.8)
print(" 80%  DataFrame:")
print(part_80)
  
# Print the 20% of the dataframe 
part_20 = df.drop(part_80.index)
print(" 20% DataFrame:")
print(part_20)

Выход:

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.

Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.