Распознавание лиц с использованием искусственного интеллекта

Опубликовано: 17 Июля, 2021

Современные технологии поражают людей удивительными инновациями, которые не только делают жизнь простой, но и сносной. Распознавание лиц с течением времени оказалось наименее навязчивой и самой быстрой формой биометрической проверки.

Распознавание лиц - это категория биометрического программного обеспечения, которое отображает черты лица человека и сохраняет данные в виде отпечатка лица. Программное обеспечение использует алгоритмы глубокого обучения для сравнения захваченного изображения в реальном времени с сохраненным отпечатком лица для проверки личности. Обработка изображений и машинное обучение являются основой этой технологии. Распознавание лиц привлекло значительное внимание исследователей из-за деятельности человека в различных приложениях безопасности, таких как аэропорт, обнаружение преступников, отслеживание лиц, судебно-медицинская экспертиза и т. Д. По сравнению с другими биометрическими характеристиками, такими как отпечаток ладони, радужная оболочка глаза, отпечаток пальца и т. Д., Биометрия лица может быть ненавязчивым.

Их можно использовать даже без ведома пользователя, а в дальнейшем их можно использовать для приложений безопасности, таких как обнаружение преступников, отслеживание лиц, безопасность в аэропортах и системы судебного наблюдения. Распознавание лиц включает в себя захват изображений лиц с видео или камеры наблюдения. Они сравниваются с сохраненной базой данных. Распознавание лиц включает обучение известных изображений, их классификацию по известным классам, а затем они сохраняются в базе данных. Когда в систему передается тестовое изображение, оно классифицируется и сравнивается с сохраненной базой данных.

Обработка изображений и машинное обучение

Обработка изображений компьютерами включает процесс компьютерного зрения. Он касается высокого уровня понимания цифровых изображений или видео. Требуется автоматизировать задачи, которые могут выполнять зрительные системы человека. Итак, компьютер должен уметь распознавать такие объекты, как лицо человека, фонарный столб или даже статую.

Чтение изображений

Компьютер считывает любое изображение в диапазоне значений от 0 до 255. Для любого цветного изображения существует 3 основных цвета - красный, зеленый и синий. Матрица формируется для каждого основного цвета, а затем эти матрицы объединяются, чтобы обеспечить значение пикселя для отдельных цветов R, G, B. Каждый элемент матриц предоставляет данные об интенсивности яркости пикселя.

OpenCV - это библиотека Python, предназначенная для решения задач компьютерного зрения. OpenCV был первоначально разработан в 1999 году компанией Intel, но позже поддержан Willow Garage. OpenCV поддерживает множество языков программирования, таких как C ++, Python, Java и т. Д. Поддержка нескольких платформ, включая Windows, Linux и macOS. OpenCV Python - это класс-оболочка для исходной библиотеки C ++, которая будет использоваться с Python. Используя это, все структуры массивов OpenCV преобразуются в / из массивов NumPy. Это упрощает интеграцию с другими библиотеками, использующими NumPy. Например, такие библиотеки, как SciPy и Matplotlib.

Машинное обучение

Каждый алгоритм машинного обучения принимает набор данных в качестве входных данных и учится на них, что в основном означает изучение алгоритма из предоставленных входных и выходных данных в виде данных. Он определяет закономерности в данных и предоставляет желаемый алгоритм. Например, чтобы определить, чье лицо присутствует на данном изображении, несколько вещей можно рассматривать как образец:

  • Высота / ширина лица.
  • Высота и ширина могут быть ненадежными, поскольку изображение можно масштабировать до меньшего размера лица или сетки. Однако даже после масштабирования неизменными остаются только соотношения - отношение высоты лица к ширине лица не изменится.
  • Цвет лица.
  • Ширина других частей лица, таких как губы, нос и т. Д.

Здесь присутствует закономерность - разные грани имеют разные размеры, как и те, что указаны выше. Подобные лица имеют аналогичные размеры. Алгоритмы машинного обучения понимают только числа, поэтому это довольно сложно. Это числовое представление «лица» (или элемента в обучающем наборе) называется вектором признаков. Вектор признаков состоит из различных чисел в определенном порядке.

В качестве простого примера мы можем отобразить «лицо» в вектор признаков, который может включать в себя различные функции, такие как:

  • Высота лица (см)
  • Ширина лица (см)
  • Средний цвет лица (R, G, B)
  • Ширина губ (см)
  • Высота носа (см)

По сути, имея изображение, мы можем преобразовать его в вектор признаков, например:

Высота лица (см) Ширина лица (см) Средний цвет лица (RGB) Ширина губ (см) Высота носа (см)

23,1 15,8 (255, 224, 189) 5,2 4,4

Итак, изображение теперь является вектором, который может быть представлен как (23.1, 15.8, 255, 224, 189, 5.2, 4.4). На изображении может быть бесчисленное множество других характеристик, например, цвет волос, растительность на лице, очки и т. Д.

Машинное обучение выполняет две основные функции в технологии распознавания лиц. Они приведены ниже:

  1. Получение вектора признаков: сложно вручную перечислить все функции, потому что их очень много. Алгоритм машинного обучения может разумно обозначить многие из таких функций. Например, сложной характеристикой может быть соотношение высоты носа и ширины лба.
  2. Алгоритмы сопоставления: после получения векторов признаков алгоритм машинного обучения должен сопоставить новое изображение с набором векторов признаков, присутствующих в корпусе.
  3. Распознавание лиц

Распознавание лиц

Когда дело доходит до распознавания лиц, технологическая система может быть разной. В разных программах используются разные методы и средства для распознавания лиц. Пошаговый метод выглядит следующим образом:

  • Распознавание лиц: для начала камера обнаружит и распознает лицо. Лицо лучше всего распознается, когда человек смотрит прямо в камеру, так как это упрощает распознавание лиц. С развитием технологий это улучшается, когда лицо может быть обнаружено с небольшим изменением положения лица, обращенного к камере.
  • Анализ лица: затем снимается и анализируется фотография лица. В большинстве случаев распознавание лиц полагается на 2D-изображения, а не на 3D, потому что их удобнее сопоставлять с базой данных. Программа распознавания лиц проанализирует расстояние между вашими глазами или форму скул.
  • Преобразование изображения в данные: теперь оно преобразуется в математическую формулу, и эти черты лица становятся числами. Этот числовой код известен как отпечаток лица. Как у каждого человека уникальный отпечаток пальца, так и у каждого человека есть уникальный отпечаток лица.
  • Поиск совпадений: затем код сравнивается с базой данных других отпечатков лиц. В этой базе данных есть фотографии с идентификационными данными, которые можно сравнивать. Затем технология определяет соответствие вашим точным характеристикам в предоставленной базе данных. Он возвращается с совпадением и прикрепленной информацией, такой как имя и адрес, или это зависит от информации, сохраненной в базе данных человека.

Программное обеспечение для распознавания лиц

Многие известные компании постоянно вводят новшества и импровизируют, чтобы разработать надежное и надежное программное обеспечение для распознавания лиц. Некоторые известные программы обсуждаются ниже:

а. Deep Vision AI

Deep Vision AI - лидирующая компания в области программного обеспечения для распознавания лиц. Компания владеет передовой технологией компьютерного зрения, которая может автоматически распознавать изображения и видео. Затем он превращает визуальный контент в аналитику в реальном времени и дает очень ценную информацию.

Deep Vision AI предоставляет пользователям по всему миру платформу plug and play. Пользователи получают оповещения в режиме реального времени и более быстрый ответ на основе анализа потоков с камеры с помощью различных модулей на основе ИИ. Продукт предлагает высокоточную идентификацию лиц в списке наблюдения за счет непрерывного мониторинга целевых зон. Программное обеспечение очень гибкое: его можно подключить к любой существующей системе камер или развернуть через облако.

В настоящее время Deep Vision AI предлагает лучшее решение на рынке по производительности, поддерживающее обработку в реальном времени при +15 потоках на графический процессор.

Сбору бизнес-аналитики способствует предоставление в реальном времени данных о клиентах, частоте их посещений или повышении безопасности. Кроме того, выходные данные программного обеспечения могут содержать такие атрибуты, как количество, возраст, пол и т. Д., Которые могут улучшить понимание поведения потребителей, меняющихся предпочтений, сдвигов во времени и условий, которые могут определять будущие маркетинговые усилия и стратегии. Пользователи также комбинируют возможности распознавания лиц с другими функциями Deep Vision AI на основе искусственного интеллекта, такими как распознавание транспортных средств, чтобы получить более согласованные данные о потребителях.

Компания соблюдает международные законы о защите данных и применяет значительные меры для прозрачного и безопасного процесса обработки данных, созданных ее клиентами. Мы позаботимся о конфиденциальности и этике данных.

Потенциальные рынки включают города, общественные места, общественный транспорт, образовательные учреждения, крупные розничные торговцы и т. Д. Deep Vision AI является сертифицированным партнером NVIDIA Metropolis, Dell Digital Cities, Amazon AWS, Microsoft, Red Hat и других.

б. SenseTime

  • SenseTime - ведущий разработчик платформы, который посвятил свои усилия созданию решений с использованием инноваций в области искусственного интеллекта и анализа больших данных. Технология, предлагаемая SenseTime, многофункциональна. Аспекты этой технологии расширяются и включают возможности распознавания лиц, распознавания изображений, интеллектуальной видеоаналитики, автономного вождения и распознавания медицинских изображений. Программное обеспечение SenseTime включает в себя различные части, а именно SensePortrait-S, SensePortrait-D и SenseFace.
  • SensePortrait-S - это статический сервер распознавания лиц. Он включает в себя функции обнаружения лиц из источника изображения, извлечения функций, извлечения и анализа атрибутов, а также целевого извлечения из обширной базы данных изображений лиц.
  • SensePortrait D - это сервер динамического распознавания лиц. Включенные возможности включают обнаружение лиц, отслеживание лица, извлечение функций, а также сравнение и анализ данных из данных в нескольких потоках видеонаблюдения.
  • SenseFace - это платформа наблюдения с распознаванием лиц. Эта утилита представляет собой технологию распознавания лиц, использующую алгоритм глубокого обучения. SenseFace очень эффективен в интегрированных решениях для интеллектуального анализа видео. Его можно широко использовать для наблюдения за объектами, анализа траектории движения человека, управления популяцией и связанного анализа данных и т. Д.
  • SenseTime предоставляет свои услуги многим компаниям и государственным учреждениям, включая Honda, Qualcomm, China Mobile, UnionPay, Huawei, Xiaomi, OPPO, Vivo и Weibo.

c. Признание Amazon

Amazon предоставляет облачное программное решение. Amazon Rekognition - это сервисная платформа компьютерного зрения. Это решение позволяет легко добавлять анализ изображений и видео в различные приложения. Он использует хорошо масштабируемую и проверенную технологию глубокого обучения. Для использования этого программного обеспечения от пользователя не требуется никаких знаний в области машинного обучения. Платформу можно использовать для идентификации объектов, текста, людей, действий и сцен на изображениях и видео. Он также может обнаруживать неприемлемый контент. Пользователь получает высокоточный анализ лица и возможности поиска по лицу. Следовательно, программное обеспечение можно легко использовать для проверки, подсчета людей и общественной безопасности путем обнаружения, анализа и сравнения лиц.

Организации могут использовать настраиваемые метки Amazon Rekognition для создания данных об определенных объектах и сценах, доступных в изображениях, в соответствии с их бизнес-потребностями. Например, модель может быть легко построена для классификации конкретных деталей машин на сборочной линии или для обнаружения нездоровых растений. Пользователь просто предоставляет изображения объектов или сцен, которые он хочет идентифицировать, а сервис обрабатывает все остальное.

d. FaceFirst

Программное обеспечение FaceFirst обеспечивает безопасность сообществ, безопасные транзакции и отличный клиентский опыт. FaceFirst - это безопасное, точное, частное, быстрое и масштабируемое программное обеспечение. Решения Plug-and-play также включены для обеспечения физической безопасности, аутентификации личности, контроля доступа и анализа посетителей. Легко интегрируется в любую систему. Эта платформа компьютерного зрения используется многими организациями для распознавания лиц и автоматизированной видеоаналитики с целью предотвращения преступлений и улучшения взаимодействия с клиентами.

Как ведущий поставщик эффективных систем распознавания лиц, он приносит пользу розничной торговле, транспорту, безопасности мероприятий, казино и другим отраслям и общественным местам. FaceFirst обеспечивает интеграцию искусственного интеллекта с существующими системами наблюдения для предотвращения краж, мошенничества и насилия.

является. Trueface

TrueFace - это ведущая модель компьютерного зрения, которая помогает людям понимать данные своих камер и преобразовывать их в полезную информацию. TrueFace - это локальное решение для компьютерного зрения, которое повышает безопасность данных и повышает производительность. Платформенные решения специально обучены в соответствии с требованиями индивидуального развертывания и эффективно работают в различных экосистемах. Программное обеспечение уделяет первоочередное внимание разнообразию обучающих данных. Он обеспечивает одинаковую производительность для всех пользователей, независимо от их самых разных требований.

Trueface разработал пакет, состоящий из SDK и докеризованного контейнерного решения, основанного на возможностях машинного обучения и искусственного интеллекта. Этот пакет может преобразовывать данные камеры в действенный интеллект. Он может помочь организациям создать более безопасную и разумную среду для своих сотрудников, клиентов и гостей с помощью технологий распознавания лиц, обнаружения оружия и проверки возраста.

f. Лицо ++

  • Face ++ - это открытая платформа, созданная китайской компанией Megvii. Он предлагает технологии компьютерного зрения. Это позволяет пользователям легко интегрировать технологии распознавания изображений на основе глубокого обучения в свои приложения.
  • Face ++ удивительным образом использует искусственный интеллект и машинное зрение для обнаружения и анализа лиц и точного подтверждения личности человека. Face ++ также удобен для разработчиков, являясь открытой платформой, так что любой разработчик может создавать приложения, используя ее алгоритмы. Благодаря этой функции Face ++ стала самой обширной платформой распознавания лиц в мире, которую используют 300 000 разработчиков из 150 стран.
  • Наиболее значительным использованием Face ++ была его интеграция в платформу Alibaba City Brain. Это позволило провести анализ сети видеонаблюдения в городах, чтобы оптимизировать транспортные потоки и привлечь внимание медиков и полиции, наблюдая за инцидентами.

грамм. Кайрос

  • Kairos - это современное и этичное решение для распознавания лиц, доступное разработчикам и компаниям по всему миру. Kairos можно использовать для распознавания лиц через облачный API Kairos, или пользователь может разместить Kairos на своих серверах. Утилиту можно использовать для контроля данных, безопасности и конфиденциальности. Организации могут обеспечить своим клиентам более безопасный и удобный доступ.
  • Kairos Face Recognition On-Premises имеет дополнительное преимущество, заключающееся в контроле конфиденциальности и безопасности данных, хранении важных данных внутри компании и в безопасности от любых потенциальных третьих лиц / хакеров. Скорость продуктов с поддержкой распознавания лиц значительно повышена, поскольку они не сталкиваются с проблемой задержки и других рисков, связанных с развертыванием общедоступного облака.
  • Kairos - это ультра-масштабируемая архитектура, так что поиск 10 миллионов лиц может выполняться примерно за то же время, что и поиск 1 лица. Рынок принимает его с распростертыми руками.

час Cognitec

Cognitec FaceVACS Engine позволяет пользователям разрабатывать новые приложения для распознавания лиц. Движок очень универсален, поскольку он обеспечивает ясный и логичный API для легкой интеграции в другие программы. Cognitec позволяет использовать FaceVACS Engine с помощью индивидуальных наборов для разработки программного обеспечения. Платформу можно легко настроить с помощью набора функций и модулей, специфичных для каждого варианта использования и вычислительной платформы. Возможности этого программного обеспечения включают проверку качества изображения, безопасную выдачу документов и контроль доступа путем точной проверки.

Отличительные особенности включают:

  • Очень мощная локализация лица и отслеживание лица
  • Эффективные алгоритмы регистрации, проверки и идентификации
  • Точная проверка возраста, пола, возраста, экспозиции, отклонения позы, очков, закрытых глаз, обнаружения равномерного освещения, неестественного цвета, изображения и геометрии лица
  • Соответствует требованиям электронных паспортов, обеспечивая полную фронтальную проверку типа изображения и форматирование в соответствии с ISO 19794-5.

Использование распознавания лиц

Хотя распознавание лиц может показаться футуристическим, в настоящее время оно используется по-разному. Вот несколько удивительных применений этой технологии.

  • Идентификация генетического заболевания:

    Существуют медицинские приложения, такие как Face2Gene, и программное обеспечение, такое как Deep Gestalt, которое использует распознавание лиц для обнаружения генетического заболевания. Затем это лицо анализируется и сопоставляется с существующей базой данных расстройств.

  • Авиакомпания:

    Некоторые авиакомпании используют распознавание лиц для идентификации пассажиров. Этот сканер лица поможет сэкономить время и избавит от хлопот по отслеживанию билета.

  • Безопасность больницы:

    Распознавание лиц можно использовать в больницах, чтобы вести учет пациентов, что намного лучше, чем вести записи и находить их имена и адреса. Персоналу было бы легко использовать это приложение, распознать пациента и получить подробную информацию в считанные секунды. Во-вторых, он может использоваться в целях безопасности, где он может определить, подлинный человек или нет, или это пациент.

  • Обнаружение эмоций и настроений:

    Обнаружение эмоций в реальном времени - еще одно ценное применение распознавания лиц в здравоохранении. Его можно использовать для выявления эмоций, которые пациенты проявляют во время пребывания в больнице, и анализа данных, чтобы определить, как они себя чувствуют. Результаты анализа могут помочь определить, нужно ли пациентам больше внимания, если они испытывают боль или грустят.

Проблемы и вызовы

Технология распознавания лиц сталкивается с несколькими проблемами. Общие проблемы и проблемы, с которыми может столкнуться система распознавания лиц при обнаружении и распознавании лиц, обсуждаются в следующих параграфах.

  • Поза: система распознавания лиц допускает случаи с небольшими углами поворота, но становится трудно определить, будет ли угол большим, и если база данных не содержит всех углов лица, это может создать проблему.
  • Выражения: из-за эмоций человеческое настроение меняется и приводит к разным выражениям. С такими выражениями лица машина могла делать ошибки, чтобы определить правильную личность человека.
  • Старение: Со временем и возрастными изменениями лица оно уникально и не остается жестким, из-за чего может быть трудно идентифицировать человека, которому сейчас 60 лет.
  • Окклюзия: окклюзия означает закупорку. Это связано с наличием на лице различных закрывающих объектов, таких как очки, борода, усы и т. Д., А при захвате изображения на лице отсутствуют некоторые части. Такая проблема может серьезно повлиять на процесс классификации системы распознавания.
  • Освещение: Освещение означает вариации света. Изменения освещенности могут варьировать общую величину интенсивности света, отраженного от объекта, а также узор затенения и теней, видимых на изображении. Проблема распознавания лиц при изменении освещенности широко признана сложной для людей и алгоритмов. Трудности, связанные с условиями освещения, представляют собой проблему для систем автоматического распознавания лиц.
  • Определите похожие лица: разные люди могут иметь похожую внешность, что иногда делает невозможным их различение.

Недостатки распознавания лиц

  1. Опасность автоматического наблюдения за одеялом
  2. Отсутствие четкой нормативно-правовой базы
  3. Нарушение принципов необходимости и соразмерности
  4. Нарушение права на неприкосновенность частной жизни
  5. Влияние на демократическую политическую культуру