Нейронные сети, применяемые для машинного перевода


И Microsoft, и Google объявили о значительных улучшениях в своем инструменте интерактивного перевода благодаря нейронным сетям.

Команда переводчиков Microsoft объявила, что переводит всю свою речь для Skype и мобильных устройств через нейронные сети. В сообщении блога говорится:
Помимо девяти языков, поддерживаемых API речи Microsoft Translator, а именно арабского, китайского, мандаринского, английского, французского, немецкого, итальянского, бразильского португальского, русского и испанского, нейронные сети также обеспечивают перевод текста на японский язык. Эти десять языков вместе составляют более 80% переводов, выполняемых Microsoft Translator ежедневно.
Чтобы увидеть ожидаемый уровень улучшения, на веб-сайте Microsoft Translator есть функция «Попробовать и сравнить», где вы можете увидеть результаты старых и новых методов перевода — статистических и нейронных. Для предложенных фраз Neural, похоже, работает лучше:

Однако, когда я напечатал рекламные материалы из испанского супермаркета «Elegir a la carta una buena hamburguesa», мне показали точный перевод «Выберите хороший гамбургер á la carte» и тот, который полностью упустил суть: «Выберите букву a. хороший гамбургер ». Сначала я был удивлен, обнаружив, что первый был старым статистическим подходом, но затем, поскольку на статистику влияет частота запросов на перевод меню и обзоров ресторанов. Однако этот пример, вероятно, является аномалией, и я не собираюсь спорить с мнением Microsoft о том, что использование нейронных сетей обеспечивает превосходные переводы. В сообщении в блоге представлен этот график, используемый для продвижения идеи, что мы можем ожидать улучшений в будущем.

В тот же день, когда был опубликован пост в блоге Microsoft, Барак Туровский, руководитель отдела продуктов Google Translate, также объявил о запуске нейронного машинного перевода с обновлением Google Translate:
Представляя этот выкат, Туровский пишет:
Нейронный машинный перевод уже несколько лет дает захватывающие результаты исследований, и в сентябре наши исследователи анонсировали версию этого метода от Google. На высоком уровне нейронная система переводит целые предложения за раз, а не просто по частям. Он использует этот более широкий контекст, чтобы помочь ему определить наиболее подходящий перевод, который затем перестраивает и корректирует, чтобы он больше походил на человека, говорящего с правильной грамматикой. Поскольку каждое предложение легче понять, переведенные абзацы и статьи намного проще и легче читаются. И все это возможно благодаря системе сквозного обучения, построенной на нейронном машинном переводе, что в основном означает, что система со временем учится создавать более качественные и естественные переводы.
Google Translate использует нейронный машинный перевод с восемью языковыми парами: на английский и французский, немецкий, испанский, португальский, китайский, японский, корейский и турецкий и обратно. По данным Google, эти языки являются родными для примерно одной трети населения мира, однако, если принять во внимание людей, которые говорят на них как на вторых языках или хорошо их понимают, доля пользователей мобильных устройств и веб-сайтов значительно возрастет. выше, вероятно, будет подавляющее большинство.
Машинный перевод, похоже, близок к тому, чтобы стать вавилонской рыбкой в видении Дугласа Адама. Следующая задача — превратить устройства перевода в носимые наушники с наушниками.


Добавить комментарий