Baidu совершает прорыв в области синхронного перевода


Baidu Research анонсировала STACL (одновременный перевод с прогнозированием и контролируемой задержкой), автоматизированную систему, которая может выполнять высококачественный перевод одновременно между двумя языками.

Одна из областей, в которой искусственный интеллект уже вносит существенный вклад, – это перевод с одного разговорного языка на другой. Ранее в этом году мы сообщали, что Microsoft Research добивается равноправия китайско-английского перевода, что явилось прорывом в беглости и точности машинного перевода. Теперь Baidu Research продвинулась вперед в области синхронного перевода и разместила демонстрационные версии на GitHub.

В аннотации к статье, опубликованной на arXiv, в соавторстве с Минбо Ма, Лян Хуангом, Хао Сион, Кайбо Лю, Чуанцян Чжан, Чжунцзюнь Хэ, Хайронг Лю, Син Ли и Хайфэн Ван говорится:
Синхронный перевод, при котором предложения переводятся до их завершения, полезен во многих сценариях, но, как известно, сложен из-за различий в порядке слов и требований одновременности. Мы представляем очень простую, но удивительно эффективную модель ожидания k, обученную генерировать целевое предложение одновременно с исходным предложением, но всегда на k слов позади, для любого заданного k. Эта структура легко интегрирует ожидание и перевод в единую модель, которая включает лишь незначительные изменения в существующей нейронной платформе перевода. В ходе экспериментов с синхронным переводом с китайского на английский достигается задержка в 5 слов с ухудшением качества на 3,4 балла (однократная ссылка) по BLEU по сравнению с синхронным переводом полного предложения. Мы также формулируем новую метрику задержки, которая устраняет недостатки предыдущих.
Этот рисунок из статьи показывает, как работает модель ожидания k:
На этом видео показано, как переводится это предложение с ожиданием в 5 слов:

Ссылаясь на этот пример, блог Baidu Research объясняет:
Мы решили эту проблему, используя идею, вдохновленную синхронными переводчиками-людьми, которые обычно предвосхищают или предсказывают материалы, которые докладчик собирается осветить за несколько секунд в будущем. Однако, в отличие от устных переводчиков, наша модель не предсказывает слова исходного языка в речи говорящего, а вместо этого напрямую предсказывает слова целевого языка в переводе, и, что более важно, она плавно объединяет перевод и ожидание в одном «ожидании». модель. В этой модели перевод всегда выполняется на k слов за речью говорящего, чтобы можно было предсказать определенный контекст. Мы обучаем нашу модель использовать доступный префикс исходного предложения на каждом этапе (вместе с переводом), чтобы выбрать следующее слово в переводе. В вышеупомянутом примере с учетом китайского префикса Bùshí zǒngtǒng zài Mòsīkē («Президент Буша в Москве») и английского перевода до сих пор «Президент Буш», который на k = 2 слова отстает от китайского, наша система точно предсказывает, что следующее слово перевода должно быть «встречаться», потому что Буш, скорее всего, «встречается» с кем-то (например, с Путиным) в Москве задолго до появления китайского глагола. Подобно тому, как переводчикам необходимо заранее ознакомиться с темой и стилем говорящего, наша модель также должна быть обучена на огромном количестве обучающих данных, которые имеют похожие структуры предложений, чтобы прогнозировать с разумной точностью.

(щелкните изображение, чтобы увеличить)
В сообщении блога объясняется, что STACL является гибким с точки зрения компромисса между задержкой и качеством, так что пользователь может указать задержку от одного до пяти слов. Это означает, что он может работать с тесно связанными языками, такими как французский и испанский, где даже дословный перевод работает очень хорошо. Однако для отдаленных языков, таких как английский и китайский, и языков с разным порядком слов, таких как английский и немецкий, более высокая задержка справляется лучше.
Этот пример демонстрирует различия между синхронным машинным переводом с ожиданием 5 слов и 3 слов:

Вывод сообщения в блоге предполагает, что нет никаких непосредственных ожиданий того, что синхронные переводчики-люди останутся без работы благодаря STACL:
Даже с учетом последних достижений мы полностью осознаем многие ограничения системы синхронного машинного перевода. Выпуск STACL не предназначен для замены устных переводчиков-людей, от которых будут продолжать зависеть их профессиональные услуги в течение многих лет, а скорее для того, чтобы сделать синхронный перевод более доступным.


Добавить комментарий