Краткий обзор компьютерного зрения
Компьютерное зрение означает извлечение информации из изображений, текста, видео и т. Д. Иногда компьютерное зрение пытается имитировать зрение человека. Это подмножество компьютерного интеллекта или искусственного интеллекта, который собирает информацию из цифровых изображений или видео и анализирует их для определения атрибутов.
Весь процесс включает в себя получение изображений, просмотр, анализ, идентификацию и извлечение информации. Эта обширная обработка помогает компьютерам понимать любой визуальный контент и действовать в соответствии с ним. Проекты компьютерного зрения преобразуют цифровой визуальный контент в точные описания для сбора многомерных данных. Затем эти данные превращаются в машиночитаемый язык, чтобы помочь процессу принятия решений. Основная цель этой области искусственного интеллекта - научить машины собирать информацию с изображений.
Приложения компьютерного зрения
- Медицинская визуализация: компьютерное зрение помогает при реконструкции МРТ, автоматической патологии, диагностике, компьютерных операциях и многом другом.
- AR / VR: окклюзия объекта, отслеживание внешнего и внутреннего внешних условий для виртуальной и дополненной реальности.
- Смартфоны: все фотофильтры (включая фильтры анимации в социальных сетях), сканеры QR-кода, построение панорамы, компьютерная фотография, детекторы лиц, детекторы изображений, такие как (Google Lens, Night Sight), которые мы используем, являются приложениями компьютерного зрения.
- Интернет: поиск изображений, картография, подписи к фотографиям, создание изображений Ariel для карт, категоризация видео и многое другое.
Компьютерное зрение с OpenCV
OpenCV (компьютерное зрение с открытым исходным кодом), кроссплатформенная и бесплатная библиотека функций, основана на компьютерном зрении в реальном времени, которое поддерживает платформы глубокого обучения, которые помогают в обработке изображений и видео. В компьютерном зрении основным элементом является извлечение пикселей из изображения для изучения объектов и, таким образом, понимания того, что они содержат. Ниже приведены несколько ключевых аспектов, которые компьютерное зрение пытается распознать на фотографиях:
- Обнаружение объекта: расположение объекта.
- Распознавание объектов: объекты на изображении и их положение.
- Классификация объекта: широкая категория, к которой принадлежит объект.
- Сегментация объекта: пиксели, принадлежащие этому объекту.
Потребность в компьютерном зрении
Сегодня мы наводнены всевозможными фотографиями, от селфи до пейзажных изображений. В отчете Internet Trends говорится, что люди загружают более 1,8 миллиарда фотографий ежедневно, и это всего лишь количество загруженных изображений. Подумайте, к чему будет это число, если посчитать изображения, хранящиеся в телефонах. Мы просматриваем более 4, 146, 600 видео на YouTube и рассылает 103, 447, 520 спамерских писем ежедневно. Опять же, это только часть - общение, средства массовой информации и развлечения, Интернет вещей - все это активно способствует увеличению этого числа. Этот широко доступный визуальный контент требует анализа и понимания, и компьютерное зрение помогает в этом, обучая машины «видеть» эти изображения и видео.