Разделите DataFrame в соотношении
Pandas - это библиотека с открытым исходным кодом, построенная на основе библиотеки numpy. ADataframe - это двухмерная структура данных, например, данные выровнены в табличной форме по строкам и столбцам. DataFrame.sample () Метод может использоваться для разделения Dataframe.
Syntax: DataFrame.sample(n=None, frac=None, replace=False, weights=None, random_state=None, axis=None)
Атрибут frac определяет используемую долю фрейма данных. Например, frac = 0,25 указывает, что будет использовано 25% фрейма данных.
Now, Let’s create a Dataframe:
Python3
# importing pandas as pd import pandas as pd # dictionarycars = { "Brand": ["Honda Civic", "Toyota Corolla", "Ford Focus", "Audi A4", "Maruti 800", "Toyota Innova", "Tata Safari", "Maruti Zen", "Maruti Omni", "Honda Jezz"], "Price": [22000, 25000, 27000, 35000, 20000, 25000, 31000, 23000, 26000, 25500] } # create the dataframe df = pd.DataFrame(cars, columns = ["Brand", "Price"])# show the dataframedf |
Выход:

Example 1: Divide a given Dataframe in 60% and 40%.
Python3
# importing pandas as pd import pandas as pd # dictionarycars = { "Brand": ["Honda Civic", "Toyota Corolla", "Ford Focus", "Audi A4", "Maruti 800", "Toyota Innova", "Tata Safari", "Maruti Zen", "Maruti Omni", "Honda Jezz"], "Price": [22000, 25000, 27000, 35000, 20000, 25000, 31000, 23000, 26000, 25500] } # create the dataframe df = pd.DataFrame(cars, columns = ["Brand", "Price"]) # Print the 60% of the dataframe part_60 = df.sample(frac = 0.6)print("
60% DataFrame:")print(part_60) # Print the 40% of the dataframe part_40 = df.drop(part_60.index)print("
40% DataFrame:")print(part_40) |
Выход:

Example 2: Divide a given Dataframe in 80% and 20%.
Python3
# importing pandas as pd import pandas as pd # dictionarycars = { "Brand": ["Honda Civic", "Toyota Corolla", "Ford Focus", "Audi A4", "Maruti 800", "Toyota Innova", "Tata Safari", "Maruti Zen", "Maruti Omni", "Honda Jezz"], "Price": [22000, 25000, 27000, 35000, 20000, 25000, 31000, 23000, 26000, 25500] } # create the dataframe df = pd.DataFrame(cars, columns = ["Brand", "Price"]) # Print the 80% of the dataframe part_80 = df.sample(frac = 0.8)print("
80% DataFrame:")print(part_80) # Print the 20% of the dataframe part_20 = df.drop(part_80.index)print("
20% DataFrame:")print(part_20) |
Выход:

Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.
Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.