Kinect SDK 1.5 — теперь с функцией отслеживания лица


Новый Kinect 1.5 SDK добавляет множество новых функций к существующему Kinect для Windows без каких-либо изменений в оборудовании. Теперь он поставляется с отслеживанием лица, отслеживанием сидящего скелета и множеством новых инструментов для разработчиков.

В 1.5 SDK так много новых функций, что трудно понять, что является наиболее важным, но SDK для отслеживания лиц должен занимать первое место в чьем-либо списке. Это позволяет использовать карту глубины для создания трехмерной каркасной модели лица. Отсюда можно выделить черты лица — положение глаз, положение рта и так далее. Это не встроено в Kinect, как отслеживание скелета, а представляет собой приложение, использующее потоки данных.

Обратите внимание, что это не распознавание лиц, как сообщают некоторые источники. Это можно использовать для анимации аватара или лица робота. Его также можно расширить для распознавания выражений и даже идентичности, но для этого потребуется дополнительная работа.

Отслеживание сидящего позволяет получить скелет сидящего пользователя. Он отслеживает в ближнем режиме и предоставляет данные о 10 суставах, поэтому идея заключается в том, что его можно использовать для обнаружения рук и рук, что идеально для управления жестами. Общее отслеживание скелета теперь обеспечивает ориентацию суставов, а также положение, и оно также работает в ближнем режиме. Это значительно упрощает сопоставление аватара или робота с вашим текущим положением.

Объединение SDK для отслеживания лиц с новой ориентацией суставов означает, что теперь вы можете использовать Kinect для управления аватаром или устройством телеприсутствия гораздо точнее, чем раньше. Вы можете не только убедиться, что тело повторяет позу и движения объекта, но и сделать лицо выразительным.

Если вы работали с Kinect, вы знаете, что тестирование затруднено, потому что вам нужно встать или попросить кого-нибудь встать перед Kinect, чтобы получить некоторые тестовые данные. Теперь вы можете записать некоторые тестовые данные и воспроизвести их с помощью Kinect Studio. Возможность воспроизведения одних и тех же данных должна дать возможность точно настроить приложение и выяснить, что пошло не так.

Помимо новых функций, были ускорены различные вещи, что позволяет тратить больше времени на обработку данных. Глубина и видеопотоки также синхронизированы, а качество видеопотока было улучшено.

Хотя распознавание речи — не самая захватывающая часть Kinect, это по-прежнему функция, которая может привести к настоящему прорыву — и теперь на различных языках, включая испанский, французский, японский и другие.

Большинство новых функций были введены без нарушения API версии 1 — чего не было при переходе от бета-версии к первому выпуску.

Количество демонстрационных программ с исходным кодом также увеличилось, и это должно упростить создание приложений, использующих эти базовые задачи, такие как, например, удаление фона и отслеживание аватаров. В образцах по-прежнему отсутствуют какие-либо признаки Kinect Fusion, усовершенствованной системы трехмерного моделирования в реальном времени, которая позволяет «рисовать» трехмерную модель, перемещая Kinect. Если вы хотите что-то подобное, вам все равно нужно перейти на OpenCV с открытым исходным кодом или аналогичный.

Вы можете увидеть демонстрацию многих новых функций в следующем видео:

Учитывая расширенный набор демонстрационных программ, вы можете почти повеселиться с Windows Kinect, не прибегая к программированию, и, взяв большие фрагменты «шаблонного» кода из примеров, вы можете начать опробовать все быстрее, но действительно инновационные приложения по-прежнему потребуется понимание не только SDK, но и трехмерной графики, искусственного интеллекта и многого другого.


Добавить комментарий