Google признает, что вирусное видео с искусственным интеллектом было отредактировано, чтобы выглядеть лучше


Видео, демонстрирующее возможности модели искусственного интеллекта (ИИ) Google, которое казалось слишком хорошим, чтобы быть правдой, может быть именно таким.

Демо-версия Gemini, которую просмотрели на YouTube 1,6 миллиона человек, демонстрирует замечательный процесс, в котором ИИ реагирует в режиме реального времени на голосовые подсказки и видео.

Ключевые моменты из демонстрации Google Gemini
Ключевые моменты из демонстрации Google Gemini

Тогда в Google заявили, что все не так, как казалось — ради демо-версии они ускорили ответы.

Но теперь они признали, что ИИ вообще не реагировал на голос или видео.

Как впервые сообщило Bloomberg, Google подтвердил BBC, что на самом деле это было сделано путем подсказки ИИ путем «использования кадров неподвижных изображений из отснятого материала и подсказок с помощью текста».

«В демонстрационном видео «Наши практические занятия с Gemini» показаны реальные подсказки и результаты Gemini», — сказал представитель Google.

«Мы сделали это, чтобы продемонстрировать диапазон возможностей Gemini и вдохновить разработчиков».

Демонстрация

В видеоролике человек задает ряд вопросов искусственному интеллекту Google, показывая объекты на экране.

Например, в какой-то момент демонстрант держит резиновую утку и спрашивает Близнецов, будет ли она плавать.

Первоначально он не уверен, из какого материала он сделан, но после того, как человек сжимает его — и замечает, что это вызывает скрипящий звук — ИИ правильно идентифицирует объект.

Однако то, что происходит на видео на первый взгляд, сильно отличается от того, что на самом деле произошло при создании подсказок.

ИИ фактически показали неподвижное изображение утки и спросили, из какого материала она сделана. Затем ему была предоставлена ​​текстовая подсказка, объясняющая, что утка издает пищащий звук при сжатии, что привело к правильной идентификации.

В другом впечатляющем моменте человек выполняет перфорацию чашек и шариков — магический трюк, при котором мяч спрятан под одной из трех движущихся чашек — и ИИ может определить, куда он переместился.

Но опять же, поскольку ИИ не реагировал на видео, на самом деле это было достигнуто путем показа ему серии неподвижных изображений.

В своем блоге Google объяснил, что на самом деле он сообщил ИИ, где мяч находится под тремя чашками, и показал ему изображения, на которых изображены меняющиеся чашки.

Это не совсем то же самое, что ИИ, реагирующий на живое видео
Это не совсем то же самое, что ИИ, реагирующий на живое видео

Google пояснил, что демоверсия была создана на основе фрагментов видео, чтобы «проверить возможности Gemini в решении широкого круга задач».

Хотя эпизоды были сокращены и использовались кадры, закадровый голос из видео взят непосредственно из письменных подсказок, переданных в Gemini.

Но в видео есть еще один элемент, который еще больше искажает истину.

В какой-то момент пользователь кладет карту мира и просит ИИ: «На основе того, что вы видите, придумайте идею игры… и используйте смайлы».

ИИ в ответ, очевидно, изобретает игру под названием «Угадай страну», в которой он дает подсказки (например, кенгуру и коала) и реагирует на правильное предположение пользователя, указывающего на страну (в в данном случае Австралия).

Предположение- деревенская игра, как показано в демоверсии
Предположение- деревенская игра, как показано в демоверсии

Но на самом деле, если верить блогу Google, эту игру придумал вовсе не ИИ.

Вместо этого ИИ получил следующие инструкции: «Давайте сыграем в игру. Подумайте о стране и дайте мне подсказку. Подсказка должна быть достаточно конкретной, чтобы существовала только одна правильная страна. Я попробую». указывая на страну на карте», — гласила подсказка.

Затем пользователь привел ИИ примеры правильного и неправильного ответа.

После этого Gemini смогла генерировать подсказки и определять, указывал ли пользователь на правильную страну или нет, по кадрам карты.

Это впечатляет, но это не то же самое, что утверждать, что игру изобрел ИИ.

Модель искусственного интеллекта Google впечатляет, несмотря на использование неподвижных изображений и текстовых подсказок, но эти факты означают, что ее возможности очень похожи на возможности GPT-4 OpenAI.

Примечательно, что видео было выпущено всего через две недели после периода беспрецедентного хаоса в сфере искусственного интеллекта, последовавшего за драматическим увольнением и повторным назначением Сэма Альтмана на пост генерального директора OpenAI.

Неясно, какая из двух систем более продвинута, но Google, возможно, уже догоняет ее после того, как Альтман сообщил Financial Times, что фирма работает над следующей версией своего ИИ.


Добавить комментарий