Создание простой модели машинного обучения
Создайте модель линейной регрессии в Python, используя случайно созданный набор данных.
Модель линейной регрессии
Вундеркинды линейной регрессии для гиков
Создание обучающего набора
# python library to generate random numbers from random import randint # the limit within which random numbers are generated TRAIN_SET_LIMIT = 1000 # to create exactly 100 data items TRAIN_SET_COUNT = 100 # list that contains input and corresponding output TRAIN_INPUT = list () TRAIN_OUTPUT = list () # loop to create 100 data items with three columns each for i in range (TRAIN_SET_COUNT): a = randint( 0 , TRAIN_SET_LIMIT) b = randint( 0 , TRAIN_SET_LIMIT) c = randint( 0 , TRAIN_SET_LIMIT) # creating the output for each data item op = a + ( 2 * b) + ( 3 * c) TRAIN_INPUT.append([a, b, c]) # adding each output to output list TRAIN_OUTPUT.append(op) |
Модель машинного обучения - линейная регрессия
Модель может быть создана в два этапа: -
1. Обучение модели с помощью обучающих данных
2. Тестирование модели с помощью тестовых данных.
Обучение модели
Данные, созданные с использованием приведенного выше кода, используются для обучения модели.
# Sk-Learn contains the linear regression model from sklearn.linear_model import LinearRegression # Initialize the linear regression model predictor = LinearRegression(n_jobs = - 1 ) # Fill the Model with the Data predictor.fit(X = TRAIN_INPUT, y = TRAIN_OUTPUT) |
Тестирование данных
Тестирование проводится вручную. Тестирование может быть выполнено с использованием некоторых случайных данных и тестирования, дает ли модель правильный результат для входных данных.
# Random Test data X_TEST = [[ 10, 20, 30 ]] # Predict the result of X_TEST which holds testing data outcome = predictor.predict(X = X_TEST) # Predict the coefficients coefficients = predictor.coef_ # Print the result obtained for the test data print( 'Outcome : {}
Coefficients : {}' .format(outcome, coefficients)) |
Результат приведенных выше тестовых данных должен быть 10 + 20 * 2 + 30 * 3 = 140.
Выход
Результат: [140.] Коэффициенты: [1. 2. 3.]
Внимание компьютерщик! Укрепите свои основы с помощью базового курса программирования Python и изучите основы.
Для начала подготовьтесь к собеседованию. Расширьте свои концепции структур данных с помощью курса Python DS. А чтобы начать свое путешествие по машинному обучению, присоединяйтесь к курсу Машинное обучение - базовый уровень.