Поговорите с Chrome


Мы действительно хотим поговорить с веб-страницей? Прежде чем ответить, подумайте, сколько пользователей разговаривают со своим мобильным телефоном. Теперь для этого есть стандартизированный API.

По пятам, или, должно быть, в хвосте выпуска Firefox 4 Google Chrome добавил несколько интересных дополнений в свой бета-канал.

Google не только кажется первым, кто поддерживает расширенные функции браузера, но и, похоже, настроен на дальнейшее продвижение всего HTML к тому, что мы привыкли считать территорией настольных компьютеров. Теперь в HTML5 добавлено распознавание речи. После работы с группой Incubator был подготовлен проект стандарта для Speech Input API. Это в основном позволяет пользователю разговаривать с веб-страницей, а не печатать.

Распознавание речи было доступно на большинстве настольных компьютеров в форме Microsoft Speech SDK и SAPI, но вы не видите, что оно широко используется. Причина недостаточного использования этого средства может быть в том, что распознавание речи никогда не достигало точности, которая делает его полезным, если только вы не приложите много усилий, чтобы обучить его и работать в тихой комнате.

Однако распознавание речи может вернуться, но не на настольном компьютере — на мобильном телефоне. Многие пользователи мобильных телефонов очень довольны использованием голосового ввода для выбора телефонных номеров для набора и для управления своим телефоном в ситуациях, когда руки отключены — обычно в машине. Так что, возможно, распознавание речи в Интернете не обречено на неудачу, но для этого потребуется хорошая идея, тщательный дизайн и реализация.

Веб-SDK удивительно прост в использовании — все, что вам нужно, это новый тег:

http://www.google.com/search»>

Теперь пользователь просто нажимает на элемент ввода, и начинает говорить, и распознанный текст отправляется как содержимое элемента ввода — как если бы он был набран.

Вы можете попробовать демоверсию: http://slides.html5rocks.com/#speech-input

но это работает только в том случае, если у вас есть правильная бета-версия Chrome. Распознавание выполняется речевым сервером, но подробности этого пока неясны. Действительно, вся спецификация находится на очень ранней стадии.

Вы также можете предоставить простую грамматику, которой должен соответствовать ввод, чтобы ограничить диапазон возможных вводов и повысить точность. Например, если ваше приложение имеет только ограниченный набор команд, на которые оно может реагировать, то грамматика, ограничивающая результаты распознавания командами, является хорошей идеей.

Последняя бета-версия Chrome поддерживает не только речевой API, но и 3D CSS с ускорением на GPU, который позволяет добавлять 3D-эффекты, применяя стиль. Ясно, что война браузеров накаляется, несмотря на недавние выпуски IE9, Chrome 10 и Firefox 4, а может быть, из-за них.


Добавить комментарий