Код Голосом Быстрее, Чем С Клавиатуры

Возможно ли, что мы зря тратим время на ввод программ? Может ли распознавание голоса, с небольшой помощью изобретенного разговорного языка, быть решением, в котором мы не знали, что нуждаемся?

Около двух лет назад Тавис Радд разработал плохой случай RSI, вызванный вводом большого количества кода с помощью Emacs. Это было так тяжело, что его руки онемели, и он больше не мог работать. Перепробовав все стандартные “обычные” решения, такие как различные клавиатуры и вообще обратив внимание на эргономику своего рабочего места, ничего не помогло. Как он выразился: “В отчаянии я попытался распознать голос”.

Если вы пробовали распознавание голоса, особенно если это было несколько лет назад, вы, вероятно, думаете, что проект обречен на провал. Даже если вы недавно попробовали распознавание голоса и обнаружили, что оно стало намного лучше, вы, вероятно, все еще думаете, что разговор с вашим кодом не сработает. 

Именно здесь на сцену выходит творчество. Система естественного языка Дракона, используемая Раддом, довольно хорошо поддерживала стандартный язык, но она не была адаптирована для команд редактирования программ. Решение состояло в том, чтобы использовать расширение речи Python, DragonFly, для программирования пользовательских команд. Ладно, пока все хорошо, но … .. команды были не совсем такими, как вы могли бы ожидать. Вместо английских слов для команд он использовал короткие вокализации – вы должны услышать это, чтобы поверить в это. Теперь программирование звучит как разговор с R2D2. Преимущество в том, что это быстрее и распознавание проще – это также звучит очень круто и очень технично. 

После долгой практики, насчитывающей около 2000 команд, утверждается, что система работает быстрее, чем ввод текста. Настолько, что он все еще используется после того, как RSI прояснился.

Теперь пришло время посмотреть видео и посмотреть, что вы думаете. У него довольно медленный, но интересный старт, но если вы хотите перейти к действию, перейдите примерно на 9 минут.:

Процитировать:

 “Я надеюсь убедить вас, что распознавание голоса больше не является костылем для инвалидов или ограничивается простой прозой. Теперь это очень эффективный инструмент, который может принести пользу всем программистам.”

Лично я не убежден, но, возможно, это потому, что я печатаю быстрее, чем говорю. Так много программистов никогда не учатся правильно печатать, и даже если вы действительно хорошая машинистка “охоты и клюва”, вы все равно используете только два канала десятиканального устройства вывода. 

Конечно, если RSI является проблемой, то вся игра меняется, и разговорный код выглядит как большой шаг в правильном направлении. Радд говорит, что выпустит код через несколько месяцев на GitHub. 

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *