Переводчик Google превышает 200 миллионов


У Google Translate сейчас более 200 миллионов активных пользователей в месяц, и с его помощью можно переводить на 64 разных языка.

Он прошел долгий путь с момента своего основания в 2001 году, когда он предоставил не очень хорошую возможность для перевода с восьми языков на английский и обратно.
Чтобы отметить эту веху, Франц Оч, возглавляющий группу машинного перевода Google, написал о ее преобразованиях в течение многих лет в блоге Google:
Оч был принят на работу в Google в 2004 году из DARPA, где он работал над новым, основанным на данных подходом к машинному переводу, который он изначально скептически относился к масштабированию до масштабов Google.
Первоначально системе требовалось 40 часов и 1000 машин, чтобы перевести 1000 предложений, но к концу апреля 2006 года была запущена онлайн-версия арабско-английской системы — и с тех пор она расширилась. Он резюмирует текущую ситуацию:
За день мы переводим примерно столько текста, сколько вы найдете в 1 миллионе книг. Другими словами: то, что все профессиональные переводчики в мире производят за год, наша система переводит примерно за один день. По этой оценке, большая часть переводов на планете в настоящее время выполняется с помощью Google Translate.

Средства перевода Google используются еще шире, если учесть, как виджет перевода встроен в такие веб-сайты, как этот, позволяя пользователям читать веб-страницы на любом из более чем пятидесяти языков.
Более того, Translate API, который теперь является платным, является одним из самых популярных API Google, поскольку это означает, что продукты и услуги могут достигать глобальной аудитории, и всем пользователям не нужен общий язык.
Всего несколько лет назад любой эксперт в области искусственного интеллекта предсказал бы, что путь к машинному переводу почти наверняка можно найти в изучении грамматики, синтаксиса и сложных математических систем, моделирующих основные закономерности языка. Было бы огромным шоком узнать, что самый успешный метод перевода, используемый сегодня, по сути, является статистическим и работает так хорошо, потому что есть так много данных, которые можно использовать.
Google Translate, пожалуй, один из лучших примеров «больших данных» в действии.


Добавить комментарий