OpenFace – распознавание лиц для всех


Распознавание лиц, которое когда-то было прерогативой немногих, таких как разведка и службы безопасности, теперь стало доступно и широким массам благодаря OpenFace.

Оговорка, существует множество библиотек для распознавания лиц, таких как OpenCV, и приложений, таких как Facebook или Picasa, но речь идет о распознавании лиц, а приложения такого рода нелегко найти в открытом доступе.

OpenFace меняет все это. Это реализация распознавания лиц с открытым исходным кодом, написанная на Python и Torch и основанная на глубоком обучении и нейронных сетях. Как таковая, она опирается на ряд компонентов, которые работают вместе как конвейеры, каждый из которых основывает свой вход на выходе предыдущего компонента. Это dlib и OpenVC, используемые для обнаружения, выравнивания и преобразования лиц; библиотека машинного обучения Torch для реализации глубокого обучения; и nn4 – сама модель нейронной сети.

Типичный рабочий процесс начинается с подачи набора изображений в dlib, который затем делает свою магию и обнаруживает закрытые лица, размещая вокруг них ограничительные рамки и затем обрезая их до области шириной 96×96 пикселей. Затем лицо выравнивается и преобразуется, чтобы глаза и нижняя губа располагались в одном и том же месте на каждом изображении, поскольку лицо может иметь разную ориентацию. Недавно выпущенная версия OpenFace 0.2.0 улучшает эти процессы выравнивания и преобразования, удаляя избыточный цикл обнаружения лица, что вдвое сокращает время выполнения.

OpenFace

Изображение лица, обработанное dlib, затем используется в качестве входных данных для компонента глубокой нейронной сети nn4, который отображает его на 128-мерную единичную гиперсферу, таким образом, представляя каждое лицо в 128 байтах. Благодаря тому, как работает процесс выравнивания, nn4 может, даже на этой ранней стадии, определить, что два лица не принадлежат одному и тому же человеку, если существует несоответствие (евклидовых) расстояний между характеристиками их представлений, расстояний, непосредственно соответствующих мере сходства лиц.

Версия 0.2.0 также улучшает производительность nn4, используя более эффективные методы обучения нейронной сети, которые увеличивают точность с 76,1% до впечатляющих 92,9%!

Конечно, модель должна быть обучена на наборе данных, поскольку модель настолько хороша, насколько хорош набор данных, на котором она основана, что напоминает случай, рассмотренный в книге “Запоминаются ли ваши фотографии?

Эти нейросетевые модели имеют несколько версий, текущая версия – nn4.v2, и могут быть обучены различными способами и на разных наборах данных. В настоящее время модели обучаются на комбинации наборов FaceScrub и CASIA-WebFace, но авторы находятся в поиске более крупных наборов данных, один из вариантов – Megaface.

Наконец, после обработки nn4 для завершения задачи распознавания могут быть применены собственные методы классификации.

Все это теперь доступно широкой публике, и поэтому вы можете задаться вопросом, кто и для чего будет это использовать?

На самом деле, существует множество применений, помимо видеонаблюдения, например, использование распознавания лиц для проверки личности с целью исключения самозванства, VR и игр, или даже для повышения клиентоориентированности бизнеса, помогая им определять постоянных клиентов и их предпочтения, чтобы они могли предложить лучший клиентский опыт.

С другой стороны, использование такой технологии вызывает множество опасений по поводу неприкосновенности частной жизни и гражданских свобод, поскольку в руках авторитарного правительства она может стать инструментом контроля над массами. Она также ставит под угрозу неприкосновенность частной жизни, отслеживая общественную активность путем введения возможности связать физическое присутствие человека с местами, где он бывал, что до сих пор было возможно только с помощью мониторинга операций по кредитным картам или перехвата MAC-адреса мобильного устройства. Представьте себе возможности для персонализированной рекламы.

Потенциально это усугубляет и без того тревожный сценарий, когда частная жизнь и меры ее защиты, такие как криптография, подвергаются серьезным атакам, еще больше размывая грань между уклонением от частной жизни и использованием слежки в качестве контрмеры против преступности и террора.

Закон, не готовый к вызовам, которые предвещает такая технология, не может идти в ногу с технологическим прогрессом, поскольку у него нет ответа ни на одну из вышеупомянутых дилемм.

Однако одно можно сказать наверняка – эта технология дает огромную власть, а с огромной властью приходит и огромная ответственность. Как говорят сами авторы:

Пожалуйста, используйте ответственно!
Мы не поддерживаем использование этого проекта в приложениях, нарушающих конфиденциальность и безопасность. Мы используем его, чтобы помочь пользователям с нарушениями познавательной функции ощущать и понимать окружающий мир.

Будем надеяться, что их просьба будет уважена.


Добавить комментарий