Kinect SDK от Microsoft включает отслеживание тела

На второй день MIX Microsoft предоставила некоторую информацию об обещанном официальном Kinect SDK – и да, как и ожидалось, он, похоже, включает новое программное обеспечение для отслеживания тела, способное отслеживать до двух пользователей одновременно, а также обещает новая функция – возможность слушать.

Kinect для Windows Beta SDK должен быть доступен весной и, похоже, будет включать версию программы отслеживания тела, разработанную Microsoft Research. Это основная функция, отсутствующая в альтернативных SDK, предоставляемых сообществом с открытым исходным кодом и PrimeSense, компанией, стоящей за оборудованием Kinect.

Спонсируемый PrimeSense SDK действительно включает приложение для отслеживания тела, но оно основано на более старой технике, когда начинается с начальной конфигурации и отслеживаются отдельные движения. Это хорошо работает, но если местоположение тела потеряно, может потребоваться много времени, чтобы переместиться в другое место и продолжить отслеживание. Также ему трудно отслеживать нескольких людей или настраивать, когда другой человек входит в поле зрения.

Трекер тела Microsoft, используемый в программном обеспечении Kinect, основан на подходе к обучению искусственному интеллекту, и пользователю не нужно принимать начальное известное начальное положение. Он также быстро определяет местонахождение тела, если оно по какой-либо причине потеряно. Утверждается, что в SDK есть средство отслеживания, которое будет отслеживать одного или двух человек одновременно.

Кроме того, SDK поддерживает обычные данные карты глубины, а также звуковые датчики в оборудовании. Звук – это функция Kinect, которую альтернативные SDK более или менее игнорируют. Microsoft SDK обещает использовать четырехэлементный массив микрофонов для подавления шума и эха и интеграции с существующим API распознавания речи Windows. Распознавание речи может подтолкнуть приложение Kinect к новым областям, но стоит отметить, что того же можно добиться, просто подключив микрофон к ПК, на котором запущен Kinect с неофициальным SDK. Хотя использование микрофонной решетки в сочетании с датчиком положения может значительно повысить точность распознавания. Это машинная версия эффекта коктейльной вечеринки, где вы можете настроиться на конкретный динамик, потому что вы знаете, где слушать, а не что слушать. Идея состоит в том, чтобы создать систему распознавания речи, которая работает без какой-либо специальной подготовки и на расстоянии 4 м, при этом пользователь может свободно перемещаться по комнате.

Возможно, этой улучшенной производительности достаточно, чтобы добиться практического успеха *.

Учитывая целый ряд вещей, которые были достигнуты с помощью неофициального API, перспектива создания надежной системы слежения за несколькими телами может быть только хорошей новостью. Однако все зависит от лицензионных соглашений. Поскольку это нацелено на экспериментатора, вероятно, будут ограничения на использование и, в частности, на распространение.

Разработчики могут подписаться на получение уведомлений о выпуске на http://research.microsoft.com/kinectsdk.

Бета-версия SDK для любителей выйдет 16 мая.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *