Mozilla хочет, чтобы ваш голос


Mozilla запустила проект Common Voice для краудсорсинга распознавания речи. Как только будет записан огромный объем аудиоданных, они будут доступны другим пользователям для использования в их собственных приложениях.

Обоснование Project Common Voice заключается в том, что для любого типа машинного обучения требуется большой объем данных. В случае обучения системе преобразования речи в текст требуется около 10 000 часов, и это цель. Использование краудсорсинга позволит Mozilla сделать технологию распознавания голоса доступной для использования разработчиками.
Объясняя, почему проект важен, Mozilla заявляет:
Голос естественный, голос человеческий. Это самый простой и естественный способ общения. С помощью Common Voice разработчики могут создавать удивительные вещи – от переводчиков в реальном времени до помощников по администрированию с голосовым управлением. Но данные, необходимые для создания этих приложений, не являются общедоступными. Common Voice даст им все необходимое для внедрения инноваций.
Большая часть недавней революции в искусственном интеллекте произошла из-за того, что Интернет предоставил огромные базы данных помеченных данных, которые позволяют обучать нейронные сети. Без базы данных речевых фрагментов с точной транскрипцией текста обучение нейронной сети преобразованию речи в текст было бы невозможным. Для создания такой базы данных до сих пор требовались ресурсы таких крупных компаний, как Google, Amazon, Microsoft и Apple. Подход Mozilla, напротив, заключается в том, чтобы полагаться на всех нас.
Проект полагается на пожертвования, но на этот раз он требует вашего голоса и навыков слушания. Чтобы принять участие, вам понадобится система с микрофоном и динамиками и разрешите Mozilla доступ к ним. Есть приложение для iOS, и в наших настольных тестах веб-приложение без проблем работало с Firefox, отказывалось работать с Edge, иногда работало с Chrome и работало удручающе медленно на Android.
Вы можете узнать, когда Common Voice реагирует на изменение цвета:

Приложение просит вас произнести три предложения, а затем дает вам возможность просмотреть их, прежде чем отправлять свои записи.

Другой способ внести свой вклад в проект – это проверить предложения, записанные другими, подтверждая, что то, что вы слышите, соответствует тексту. Не ждите идеального звука, напротив:
Мы хотим, чтобы качество звука отражало качество звука, которое механизм преобразования речи в текст увидит в реальных условиях. Таким образом, мы хотим разнообразия. Это учит механизм преобразования речи в текст без ошибок справляться с различными ситуациями – фоновым разговором, автомобильным шумом, шумом вентилятора.

Интересно слышать различные акценты, записанные другими, и это действует как подсказка для заполнения вашего собственного профиля, в котором запрашивается ваш акцент, пол и возрастной диапазон.
Поскольку этот проект является открытым исходным кодом, есть также возможность принять участие в его будущем развитии и поддержать миссию Mozilla, последним компонентом которой является проект Common Voice:
Mozilla стремится сделать Интернет открытым и доступным для всех. Для этого нам нужно расширить возможности веб-разработчиков с помощью таких проектов, как Common Voice. Поскольку голосовые технологии распространяются за пределы нишевых приложений, мы считаем, что они должны одинаково хорошо служить всем пользователям. Мы видим необходимость включать больше языков, акцентов и демографических данных при создании и тестировании голосовых технологий. Mozilla хочет видеть здоровый и динамичный Интернет. Это означает предоставление новым авторам доступа к голосовым данным, чтобы они могли создавать новые необычные проекты. Common Voice станет общедоступным ресурсом, который поможет командам Mozilla и разработчикам по всему миру.
С приложением Common Voice весело работать, и приятно осознавать, что вы не тратите зря время, а вкладываете в полезный ресурс.


Добавить комментарий