Обнаружение эмоций с помощью Project Oxford


Команда Project Oxford выпустила новую демонстрацию, в которой используется API распознавания лиц машинного обучения. Он распознает эмоциональные состояния на фотографиях людей и кажется впечатляюще чувствительным.

Project Oxford – это набор API-интерфейсов искусственного интеллекта от Microsoft, который дает разработчикам возможность использовать преимущества машинного обучения без необходимости выполнять учебный процесс для себя, как это уже было сделано.
В случае с новым инструментом эмоционального распознавания он был обучен распознавать восемь основных эмоциональных состояний – гнев, презрение, страх, отвращение, счастье, нейтральность, печаль или удивление, – которые, согласно команде Project Oxford, понимаются как перекрестные. -культурно и повсеместно общаются с определенными выражениями лица.
Чтобы опробовать демонстрацию, вы можете загрузить JPEG, GIF, PNG или BMP размером менее 4 МБ или указать URL-адрес изображения. Microsoft сообщает, что наилучший результат дает почти фронтальное или полностью фронтальное изображение лица. Можно использовать изображение нескольких людей при условии, что общее количество лиц не превышает 64. Инструмент «Эмоции» выделит лица на фотографии и для каждого из них вернет уровни достоверности для каждой из восьми эмоций.

Для демонстрации Microsoft предоставила три образца фотографии, но, как это часто бывает, когда люди знают, что их фотографии снимаются, на них изображены счастливые лица.
Чтобы опробовать инструмент, мы искали фотографии, которые раскрывали бы другие эмоции, и выбрали в качестве объекта съемки принца Чарльза, которого как члена британской королевской семьи часто фотографируют как официально, так и откровенно.

Общепризнанным выражением презрения является загибание одной стороны рта вверх. Это доминирующая эмоция, распознаваемая здесь с уверенностью 0,88, здесь также присутствует элемент счастья, и выражение «кривое веселье» лучше всего может описать его выражение.

Уровень достоверности счастья на официальном портретном фото выше составляет 0,49, при этом 0,48 отнесено к нейтральному. Сравните это с 0,9997 на фото ниже и нейтральным 0,96 на финальной фотографии.

Эта и другие демонстрации, основанные на Face SDK, о котором мы ранее сообщали (см. «Сколько лет – весело, неправильно, потенциально опасно?» И «Обнаружение близнецов с использованием ИИ»), предназначены не только для нашего развлечения. Как и другие API-интерфейсы Project Oxford, Face SDK предоставляется другим разработчикам и может быть загружен, включая документацию, образцы и оболочки REST.


Добавить комментарий