10 лучших идей для проектов машинного обучения, которые вы можете реализовать

Опубликовано: 3 Июня, 2021

Машинное обучение - одна из самых популярных новых технологий в наше время! И лучший способ изучить эту технологию - заниматься проектами. Другие варианты, такие как онлайн-курсы, чтение книг и т. Д., Помогают только понять основы машинного обучения, но по-настоящему изучить предмет можно только путем выполнения проектов с реальными данными. В этой статье представлены 10 идей проектов машинного обучения, которые вы можете реализовать, и при этом узнать о машинном обучении больше, чем вы когда-либо делали!

Большинство этих проектов имеют соответствующие наборы данных, доступные на Kaggle. Вы можете использовать эти наборы данных для завершения проектов и приобретения новых навыков в области машинного обучения. Эти проекты хорошо подходят вам, если вы находитесь на начальном / среднем этапе и все еще изучаете машинное обучение. Если вам нужны более сложные задачи, вы всегда можете найти более сложный проект, сын Kaggle. Итак, без лишних слов, давайте начнем с этих проектов и узнаем что-то новое!

1. Проект "Выживание на Титанике"

Это проект для начинающих на Kaggle, который лучше всего подойдет вам, если вы только начинаете работать с проектами машинного обучения. Речь идет о катастрофе "Титаник", которая является одной из самых известных в морской истории. Все, что вам нужно сделать в проекте, - это предсказать, какие пассажиры выжили при кораблекрушении Титаника, основываясь на таких данных, как их возраст, пол, социально-экономический класс и т. Д. Например, весьма вероятно, что кто-то из первоклассных богатых выжил как по сравнению с кем-то из третьего класса. Вы можете использовать набор данных Titanic на Kaggle для этого проекта. И, чтобы сделать вещи более интересными, этот набор данных содержит реальные данные, основанные на людях, которые погибли и пережили настоящую катастрофу Титаника.

2. Проект прогнозирования личности

Представьте, насколько интересно было бы читать сообщения, написанные людьми в Интернете, и понимать их личность в целом? Это разрешило бы массу недоразумений в Интернете! Этот проект машинного обучения направлен на поиск личности Майерс Бриггс человека на основе типов сообщений, которые они размещают в социальных сетях. Индикатор типа Майерса Бриггса - это система идентификации личности, которая делит человека на одну из 16 различных личностей на основе интроверсии, интуиции, мышления и восприятия. Ось варьируется от интроверсии (I) до экстраверсии (E), от интуиции (N) до ощущения (S), от мышления (T) до чувства (F) и от суждения (J) до восприятия (P). Вы можете использовать набор данных прогнозирования личности, доступный на Kaggle, для создания проекта машинного обучения.

3. Проект прогнозирования ссуды

Получить ссуду в банке совсем не просто. Получение одобрения ссуды требует сложного сочетания факторов, не последним из которых является стабильный доход! Таким образом, этот проект ML направлен на создание модели, которая будет классифицировать, сколько ссуды может получить пользователь, на основе различных факторов, таких как семейное положение пользователя, доход, образование, перспективы трудоустройства, количество иждивенцев и т. Д. Набор данных прогнозирования ссуды предоставляет подробную информацию обо всех этих факторах, которые затем можно использовать для создания модели машинного обучения, демонстрирующей сумму кредита, которая может быть одобрена.

4. Проект прогнозирования цен на акции

Фондовый рынок - это постоянно меняющееся поле со множеством взлетов и падений, как у компаний, так и у успехов. Общеизвестно, что прогнозировать фондовый рынок сложно, но в этом весь смысл этого проекта машинного обучения. Вы будете прогнозировать будущую доходность акций на основе прошлых данных фондового рынка, таких как цена открытия, цена закрытия, объем торгов, рассчитанная доходность и т. Д., А также новостных данных, таких как новостные статьи, опубликованные об активах компании и т. на Kaggle есть все эти данные, которые вы можете использовать для проекта.

5. Проект прогнозирования игр Xbox

Кому не нравятся игры на Xbox? Большинство людей так и поступают, и у них есть множество вариантов на выбор! Этот проект направлен на прогнозирование того, какая игра Xbox будет интересна человеку больше всего, на основе его поисковых запросов в Интернете. И вы можете использовать набор данных прогнозов, предоставленный BestBuy, компанией по производству бытовой электроники, которая предоставляет данные по поисковым запросам миллионов клиентов, чтобы понять, какая игра Xbox им может быть интересна. Данные содержат идентификатор пользователя, элемент, который пользователь щелкнул на категории, к которой принадлежит элемент, запрос, время щелчка и время запроса.

6. Проект прогнозирования цен на жилье

На цену дома влияет множество факторов, включая его местоположение, размер, количество комнат и т. Д. Но люди игнорируют многие из этих факторов при покупке или продаже дома. Вот тут-то и пригодится этот проект! Он предоставляет множество факторов для дома, таких как его фасад, площадь, улица, контур земли, коммуникации, близость, качество гаража, материалы крыши и т. Д., С конечной целью прогнозирования окончательной цены дома на основе этих факторов. Вы можете получить набор данных проекта прогнозирования цен на жилье для Kaggle и использовать его для создания алгоритма машинного обучения, который может точно прогнозировать цены на жилье на основе этих факторов.

7. Проект прогнозирования продаж

Что, если бы магазины могли оценивать товары, которые они продают каждый месяц! На то и нацелен этот проект на сообщников. Вы должны спрогнозировать общее количество продуктов, которые продаются в каждом магазине, пока вам предоставляются данные о ежедневных продажах. А еще проект динамичный, ведь список магазинов и товаров может меняться каждый месяц. Вы можете получить набор данных о продажах для создания этого проекта машинного обучения на Kaggle. Набор данных содержит обучающий набор и набор тестов, для которых необходимо спрогнозировать продажи. Этот проект на Kaggle также является частью заключительного проекта курса «Как победить в конкурсе по науке о данных» на Coursera.

8. Проект распознавания цифр

Это проект машинного обучения, который значительно улучшит ваши навыки компьютерного зрения! Вам необходимо создать алгоритм машинного обучения для идентификации идентификационных цифр из набора данных, в котором также есть другие рукописные изображения. И данных очень много! Набор данных содержит десятки тысяч изображений, некоторые из которых также представляют собой рукописные цифры. Перед тем, как начать этот проект, вы должны освежить свои навыки работы с простыми нейронными сетями и методами классификации, такими как машина опорных векторов и K-ближайших соседей. Вы можете получить набор данных, необходимый для этого проекта, на Kaggle.

9. Прогнозирование одобрения кредитной карты

Не каждый может легко получить кредитную карту. Банк решает, выпускать ли кредитную карту или нет, на основании множества факторов, которые демонстрируют, насколько человек заслуживает доверия. А кредитные рейтинги объективно определяют этот фактор доверия и величину риска. Таким образом, этот проект направлен на создание модели машинного обучения, которая может определить, является ли кандидат «хорошим» или «плохим» клиентом для получения кредитной карты. Набор данных для этого содержит такие данные, как годовой доход, категория дохода, уровень образования, образ жизни и т. Д., Чтобы решить, подходит ли заявитель для получения кредитной карты или нет.

10. Прогнозирование кассовых сборов IMDB

Фильмы - большая часть нашего мира! Но никто не знает, как фильм будет работать в прокате. Есть несколько фильмов с бюджетным бюджетом, которые взрывают бомбу, и есть фильмы меньшего размера, которые добиваются огромного успеха. Этот проект пытается спрогнозировать общие мировые кассовые сборы фильмов, используя такие данные, как актеры фильма, съемочная группа, плакаты, ключевые слова сюжета, бюджет, производственные компании, даты выпуска, языки и страны. Набор данных на Kaggle содержит все эти точки данных, которые вы можете использовать для прогнозирования кассовых сборов фильма.

Все эти идеи проектов машинного обучения - отличные варианты, если вы только начинаете заниматься машинным обучением или знаете основы и вам нужно больше практики. Так что проверьте все эти проекты, и когда вы закончите с ними, вы сможете попробовать еще больше проектов на Kaggle, а также принять участие в активных конкурсах. Кто знает, может, вы даже выиграете первый приз!