Google AI на вводе-выводе


Google Research имеет новое название Google AI, а также совершенно новый веб-сайт, а на Google I / O он показал последние достижения по нескольким направлениям, в том числе Google Assistant, который звонит по телефону, чтобы забронировать столик в ресторане с помощью Google Duplex.

Обзор Google I / O 2018 Сундара Пичаи озаглавлен «Решение проблем с ИИ для всех», и в нем он ссылается на основную миссию Google:
Потребность в полезной и доступной информации сегодня так же актуальна, как и при основании компании Google почти два десятилетия назад. Что изменилось, так это наша способность систематизировать информацию и решать сложные проблемы реального мира благодаря достижениям в области искусственного интеллекта.
Первые проблемы реального мира Пичай выбрал в качестве примеров:
огромная возможность для ИИ трансформировать многие области
были в здравоохранении. Он сослался на прошлые достижения нейронной сети, которая могла обнаруживать признаки диабетической ретинопатии с помощью медицинских изображений глаза и модели глубокого обучения, которая могла бы использовать те же изображения для прогнозирования риска сердечного приступа или инсульта у пациента с удивительно высокой степенью точность. Он сообщил, что модели искусственного интеллекта способны прогнозировать медицинские события, такие как повторная госпитализация и продолжительность пребывания в больнице, путем анализа фрагментов информации, содержащихся в обезличенных медицинских записях, в которых говорится:
Это мощные инструменты в руках врача, которые могут существенно повлиять на состояние здоровья пациентов. Сегодня мы собираемся опубликовать статью об этом исследовании и работаем с больницами и медицинскими учреждениями, чтобы увидеть, как использовать эти идеи на практике.
Обращаясь к реальной проблеме в сфере доступности — к проблеме попытки следить за разговором по телевизору, когда люди разговаривают друг с другом, — Пичаи представил Looking to Listen — технологию искусственного интеллекта, которая использует звуковые и визуальные сигналы вместе, чтобы изолировать говорящих и субтитры каждого один отдельно.
ИИ применяется в Gmail с функцией интеллектуального ввода, в которой на основе понимания контекста электронного письма предлагаются фразы, которые помогут вам быстро и эффективно написать электронное письмо.
Больше ИИ вносит улучшения в Карты Google, которые теперь предоставляют информацию о компаниях, которые вы ищете, включая часы работы и наличие парковок; Google Lens, который встраивается в ряд камер и позволяет вам указывать на цель — будь то здание, афиша концерта или объект в витрине магазина, чтобы получить информацию о ней; и Google Новости, которые были переработаны для использования искусственного интеллекта:
Обновленные новости Google используют новый набор методов искусственного интеллекта, чтобы получать постоянный поток информации, поступающей в Интернет, анализировать ее в реальном времени и систематизировать в сюжетные линии. Такой подход означает, что Новости Google понимают людей, места и вещи, вовлеченные в историю, по мере ее развития, и связывают их отношения друг с другом. По сути, эта технология позволяет нам синтезировать информацию и собирать ее таким образом, чтобы помочь вам понять, что происходит, и каковы были последствия или реакция.
Именно достижения искусственного интеллекта в Google Assistant кажутся наиболее захватывающими, но краткий обзор других улучшений в Google Assistant, которые не требуют большого или какого-либо интеллекта:

Новые голоса: теперь вы можете выбирать из шести новых голосов, включая голос Джона Легенда.
Продолжение разговора: в ближайшие недели вам больше не нужно будет повторять «Окей, Google» для каждого последующего запроса, поскольку Ассистент сможет понять, когда вы говорите с ним, а не с кем-то другим, и ответит соответствующим образом.
Множественные действия: Google Ассистент сможет понять более сложные запросы, такие как «Какая погода сейчас в Нью-Йорке и в Остине?»
Довольно, пожалуйста: появится позже в этом году, функция, обеспечивающая положительное подкрепление, когда дети вежливо просят
Настраиваемые и запланированные подпрограммы: у Google Assistant уже есть шесть готовых подпрограмм, которые помогут вам выполнить несколько задач с помощью одной команды. Теперь вы можете создать свой собственный. Позднее этим летом вы сможете планировать рутины на определенный день или время либо с помощью приложения «Ассистент», либо с помощью приложения Google Clock для Android.

Google Assistant уже может заказать вам кофе или купить билеты в кино онлайн, но развитие технологий для Google Assistant, Google Duplex, означает, что в будущем он может совершать телефонные звонки от вашего имени, как показано в этом ролике, где Google Assistant делает бронирование:

Согласно сообщению в блоге Google AI Янива Левиафана, руководителя Google Duplex, и Йоси Матиаса, вице-президента по разработке, Google, Duplex:
Google Duplex, новая технология для естественного общения, позволяющая выполнять «реальные» задачи по телефону. Технология направлена на выполнение определенных задач, таких как планирование определенных типов встреч. Для таких задач система делает общение максимально естественным, позволяя людям разговаривать нормально, как если бы они разговаривали с другим человеком, без необходимости адаптации к машине.
Они добавляют:
Одна из ключевых идей исследования заключалась в том, чтобы ограничить Duplex закрытыми доменами, которые достаточно узки, чтобы их можно было всесторонне исследовать. Дуплекс может вести естественные разговоры только после того, как прошел глубокую подготовку в таких областях. Он не может вести общие разговоры.
В их сообщении также объясняется, что Duplex — это рекуррентная нейронная сеть, построенная с использованием TensorFlow Extended:
Чтобы добиться высокой точности, мы обучили RNN Duplex на базе анонимных данных телефонных разговоров. Сеть использует выходные данные технологии автоматического распознавания речи (ASR) Google, а также функции из звука, истории разговора, параметров разговора (например, желаемый сервис для встречи или текущее время дня) и больше. Мы тренировали нашу модель понимания отдельно для каждой задачи, но использовали общий корпус для разных задач. Наконец, мы использовали оптимизацию гиперпараметров из TFX для дальнейшего улучшения модели.

Наряду с возможностями распознавания речи и преобразования текста в речь, которые были усовершенствованы в течение нескольких лет, эта технология справляется с тем фактом, что одно и то же предложение может иметь очень разные значения в зависимости от контекста. Например, при бронировании бронирования «ОК для 4 человек» может означать время бронирования или количество людей, и часто релевантным контекстом может быть несколько предложений назад, проблема, которая усугубляется увеличением количества ошибок по словам в телефонных звонках.
Таким образом, в будущем вместо того, чтобы делать свои собственные телефонные звонки, пользователи будут просто взаимодействовать с Google Assistant. Это будет иметь то преимущество, что:
Дуплекс позволяет делегировать связь с поставщиками услуг в асинхронном режиме, например, запрашивая резервирование в нерабочее время или с ограниченными возможностями подключения. Это также может помочь решить проблему доступности и языковых барьеров, например, позволяя пользователям с нарушениями слуха или пользователям, не говорящим на местном языке, выполнять задачи по телефону.
Этим летом Google AI намерен начать тестирование технологии Duplex в Google Assistant, чтобы помочь пользователям выполнять ограниченный круг задач, включая бронирование столиков в ресторане, планирование встреч в парикмахерской и подтверждение часов работы по телефону.


Добавить комментарий