5 лучших онлайн-сред машинного обучения с открытым исходным кодом

Опубликовано: 27 Мая, 2021

Машинное обучение - это область исследований, которая позволяет машинам учиться без прямого программирования. Развитие машинного обучения находится в тренде, поскольку многие студенты, преподаватели, разработчики и специалисты по обработке данных используют машинное обучение для разработки различных проектов и продуктов. Однако разработка моделей машинного обучения требует высоких требований к системе, поскольку иногда процесс обучения модели может занимать от 2 часов до 2 дней и более. Таким образом, системы начального уровня не могут справиться с обучением хороших моделей машинного обучения, или даже если они каким-то образом обучат модели, могут возникнуть критические системные проблемы.

Однако существует множество доступных сред машинного обучения с открытым исходным кодом, которые не требуют каких-либо требований к системе и используют облачную инфраструктуру для обучения вашей модели в наиболее оптимальное время. Ниже приведены наиболее эффективные и часто используемые среды машинного обучения в Интернете:

1. Google Colaboratory

Это облачный сервис, к которому можно легко получить доступ для разработки продуктов и проектов, предоставляемых Google. Он поддерживает бесплатные графические процессоры и основан на настройке Jupyter Notebooks. Он представляет собой форум для всех , чтобы строить машинное обучение и глубокие приложения обучения с использованием широко используемыми библиотек , как PyTorch, TensorFlow и Keras. Это дает вашей системе возможность не брать на себя всю рабочую нагрузку ваших операций машинного обучения. Это одна из самых успешных платформ в своем роде.

  • Оперативная память - от 12 ГБ до 26,75 ГБ
  • Место на диске - 25 ГБ
  • Ядра процессора - 2
  • Поддерживаемые языки - Python

2. IBM Watson

IBM запустила платформу Watson Data Platform и Data Science Experience (DSX) для поддержки решений с открытым исходным кодом. В конце концов, она запустила мультиоблачную платформу со свободой выбора для работы в области науки о данных. Это было достигнуто с помощью контейнеризации запаса Kubernetes . Как следствие, его можно распространять в контейнерах Docker или CloudFoundry везде, где хранятся данные.

  • Оперативная память - 16 ГБ
  • Место на диске - 90 ГБ
  • Ядра процессора - 4
  • Поддерживаемые языки - Apache Spark, Python, R, Scala

3. Ядро Kaggle

Это отличная платформа для приложений глубокого обучения и машинного обучения в облаке. Kaggle и Colab во многом похожи, поскольку оба являются продуктами Google. Он поддерживает блокноты Jupyter в браузере. Многие сочетания клавиш в Jupyter Notebook почти такие же, как в Kaggle. Kaggle имеет большую коллекцию наборов данных и широкое сообщество, посвященное продвижению, изучению и проверке навыков работы с данными. Использование GPU и TPU имеет некоторые ограничения в ядре Kaggle.

  • Оперативная память - 25 ГБ
  • Место на диске - 155 ГБ
  • Ядра процессора - 1
  • Поддерживаемые языки - Python, R

4. Коклак

Это виртуальное онлайн-рабочее пространство для вычислений, исследований, совместной работы и написания документов. Это включает в себя работу с полным спектром научных языков, предоставление функций авторского текста в LaTeX, R / knitr или Markdown, веб-консоль Linux , функцию путешествий во времени и сетевые ресурсы, такие как чаты, управление курсами и многое другое. Однако большинство его функций предоставляется по платному тарифу.

  • Оперативная память - 16 ГБ
  • Место на диске - 20 ГБ
  • Ядра процессора - 3
  • Поддерживаемые языки - Julia, Octave, Python, SageMath, R Statistics и т. Д.

5. Microsoft Azure

Ноутбуки Microsoft Azure несколько похожи по функциональности на Colab, но выигрывают по скорости и намного лучше Colab в этом отношении. Записные книжки Azure - это серия связанных записных книжек, называемых библиотеками. Эти библиотеки имеют размер менее 100 мегабайт для каждого файла данных. Записные книжки Azure больше подходят для базовых приложений. Azure предоставляет только 12 месяцев бесплатного обслуживания.

  • RAM - переменная
  • Дисковое пространство - переменное
  • Ядра ЦП - переменные
  • Поддерживаемые языки - Python, R, F #