API распознавания голоса AT&T доступен в июне


AT&T предоставляет разработчикам инструменты для создания приложений и сервисов, использующих ваш голос для связи со смартфонами, телевизорами и другими цифровыми устройствами.

Более миллиона часов исследований и разработок было потрачено на разработку новаторской технологии распознавания речи Watson от AT&T, которая уже несколько десятилетий обеспечивает продвинутые речевые сервисы на рынке. Например, он обеспечивает их поиск в мобильном каталоге и голосовую почту для текстовых служб.

Теперь AT&T объявила, что планирует сделать доступными несколько своих Watson Speech API. Предположительно, это имя связано с помощником Эдисона, которому в первый раз позвонили: «Мистер Ватсон, идите сюда. Вы мне нужны». Также не следует путать с программой ответов на вопросы IBM Watson.
Помимо API, он планирует выпустить SDK речевого комплекта для записи произнесенных пользователем слов и отправки их в сеть для транскрипции, чтобы другие разработчики могли включить функции распознавания голоса и транскрипции в свои приложения.
Согласно объявлению, первые API-интерфейсы, которые появятся в июне, будут ориентированы на семь областей:

поиск в интернете
поиск местного бизнеса
вопрос и ответ
голосовая почта в текст
SMS
Электронное руководство по программированию U-verse,
диктовка

Позже мы можем ожидать API-интерфейсы для игр, социальных сетей и других областей. Технология распознавания речи использует предметную область для повышения ее точности за счет использования ограниченного набора целевых слов.
Вы можете увидеть, что AT&T думает об этой технологии, в следующем промо-видео:


Добавить комментарий