Инструмент Google Pixel для изменения лица вызывает споры о манипуляциях с искусственным интеллектом


Камера никогда не лжет. Кроме того, конечно, так оно и есть – и, кажется, с каждым днём всё чаще.

В эпоху смартфонов цифровое редактирование на лету для улучшения фотографий стало обычным явлением: от улучшения цвета до настройки уровня освещенности.

Никогда не бывает легко заставить всех выглядеть правильно при групповой фотографии
Никогда не бывает легко заставить всех выглядеть правильно при групповой фотографии

Теперь новое поколение инструментов для смартфонов на базе искусственного интеллекта (ИИ) усиливает дискуссию о том, что значит фотографировать реальность.

Последние смартфоны Google, выпущенные на прошлой неделе, Pixel 8 и Pixel 8 Pro, пошли на шаг дальше, чем устройства других компаний. Они используют ИИ, чтобы изменять выражения лиц людей на фотографиях.

У всех нас был такой опыт: один человек на групповом снимке отводит взгляд от камеры или не улыбается. Телефоны Google теперь могут просматривать ваши фотографии, чтобы смешивать и сопоставлять прошлые выражения, используя машинное обучение, чтобы вставить улыбку из другой фотографии в изображение. Google называет это Best Take.

Устройства также позволяют пользователям стирать, перемещать и изменять размеры ненужных элементов на фотографии — от людей до зданий — «заполняя» оставшееся пространство с помощью так называемого Magic Editor. При этом используется так называемое глубокое обучение — алгоритм искусственного интеллекта, который определяет, какие текстуры должны заполнить пробел, анализируя окружающие пиксели, которые он может видеть, используя знания, почерпнутые из миллионов других фотографий.

Это не обязательно должны быть снимки, сделанные на устройство. С помощью Pixel 8 Pro вы можете применить так называемый Magic Editor или Best Take к любым изображениям в вашей библиотеке Google Фото.

«Отвратительно и жутко»

У некоторых наблюдателей это поднимает новые вопросы о том, как мы фотографируем.

Технические комментаторы и рецензенты по-разному описывали новую технологию искусственного интеллекта Google как потенциально «неприглядную» (The Verge), «жуткую» (Tech Radar) и потенциально «представляющую серьезную угрозу для людей (уже хрупкое) доверие к онлайн-контенту» (Cnet).

Эндрю Пирсолл, профессиональный фотограф и старший преподаватель журналистики Университета Южного Уэльса, согласен с тем, что манипуляции с искусственным интеллектом таят в себе опасность.

«Одна простая манипуляция, даже по эстетическим соображениям, может увести нас по темному пути», — сказал он.

Он сказал, что риски выше для тех, кто использует ИИ в профессиональном контексте, но есть последствия, которые должен учитывать каждый.

«Нужно быть очень осторожным с вопросом: «Когда вы переступаете черту?».

«Это очень тревожно, теперь вы можете мгновенно сфотографировать и удалить что-то на Ваш телефон. Я думаю, что мы движемся в царство своего рода фальшивого мира».

В беседе с BBC Исаак Рейнольдс из Google, возглавляющий команду по разработке системы камер для смартфонов компании, заявил, что компания берет на себя этические нормы. серьезно относится к своим потребительским технологиям.

Он сразу же отметил, что такие функции, как Best Take, ничего не «подделывают».

Это фотография была отредактирована с помощью редактора AI Magic Editor от Google, чтобы изменить положение и размер людей на переднем плане
Это фотография была отредактирована с помощью редактора AI Magic Editor от Google, чтобы изменить положение и размер людей на переднем плане

Качество камеры и программное обеспечение являются ключевыми факторами, позволяющими компании конкурировать с Samsung, Apple и другие — и эти функции искусственного интеллекта считаются уникальным преимуществом.

И все рецензенты, выражавшие обеспокоенность по поводу этой технологии, высоко оценили качество фотографий, получаемых с помощью камеры.

p> «Наконец-то вы можете сделать снимок, где все выглядят так, как вы хотите, — и это то, чего вы не могли сделать ни на одной камере смартфона, ни на какой камере», — сказал Рейнольдс.

«Если существовала версия [сделанной вами фотографии], где этот человек улыбался, она вам ее покажет. Но если бы не было версии, где они улыбались, да, вы этого не увидите», — пояснил он.

Для Рейнольдса финальное изображение становится «изображением момента». Другими словами, это Конкретный момент может и не случиться, но это картина, которую вы хотели, чтобы она произошла, созданная из множества реальных моментов.

«Люди не хотят реальности»

Профессор Рафал Мантюк, эксперт в области графики и дисплеи в Кембриджском университете, сказал, что важно помнить, что использование искусственного интеллекта в смартфонах не предназначено для того, чтобы фотографии выглядели как реальная жизнь.

«Люди не хотят запечатлевать реальность», — сказал он. — Они хотят делать красивые изображения. Весь конвейер обработки изображений в смартфонах предназначен для создания красивых, а не реальных изображений».

Физические ограничения смартфонов означают, что они полагаются на машинное обучение для «заполнения» несуществующей информации. на фотографии.

Это помогает улучшить масштабирование, улучшить фотографии при слабом освещении и — в случае с функцией Google Magic Editor — добавлять к фотографиям элементы, которых либо никогда не было, либо заменять элементы из других фотографий, например как замена хмурого взгляда улыбкой.

Манипуляции с фотографиями не новы — они так же стары, как и сам вид искусства. Но никогда еще не было так легко увеличить реальность благодаря искусственному интеллекту.

Ранее в этом году компания Samsung подверглась критике за то, как она использовала алгоритм глубокого обучения для улучшения качества фотографий Луны, сделанных на ее смартфоны. Тесты показали, что не имеет значения, насколько плохое изображение вы сделали изначально, оно всегда дает вам пригодное для использования изображение.

Другими словами, ваша фотография Луны не обязательно была фотографией Луны, на которую вы смотрели.

Компания признала критику, заявив, что работает над тем, чтобы «уменьшить любую потенциальную путаницу, которая может возникнуть между фотографированием настоящей Луны и изображением Луны».

Что касается новой технологии Google, Рейнольдс говорит, что компания добавляет к своим фотографиям метаданные — цифровой след изображения — используя отраслевой стандарт, чтобы отметить, когда используется искусственный интеллект.

«Это вопрос, о котором мы говорим внутри компании. И мы говорили об этом подробно. Потому что мы работаем над этими вещами уже много лет. Это разговор, и мы прислушиваемся к тому, что думают наши пользователи. говоря», — говорит он.

Google явно уверен, что пользователи согласятся: функции искусственного интеллекта в новых телефонах лежат в основе ее рекламной кампании.

Итак, есть ли грань, которую Google не переступит, когда дело доходит до манипулирования изображениями?

Рейнольдс сказал, что дебаты об использовании искусственного интеллекта слишком тонкие, чтобы просто указать на линию на песке и сказать, что она слишком далека.

«По мере того, как вы углубляетесь в создание функций, вы начинаете понимать, что линия — это своего рода чрезмерное упрощение того, что в конечном итоге оказывается очень сложным решением для каждой функции», — говорит он.

Несмотря на то, что эти новые технологии поднимают этические вопросы относительно того, что является реальностью, а что нет, профессор Мантюк сказал, что мы также должны учитывать ограничения наших собственных глаз.

Он сказал: «Тот факт, что мы видим резкие красочные изображения, объясняется тем, что наш мозг может реконструировать информацию и делать выводы даже о недостающей информации.

«Итак, вы можете жаловаться, что камеры делают «фальшивые вещи». ‘, но человеческий мозг на самом деле делает то же самое, но по-другому».


Добавить комментарий