//Без комментариев – Семантическое сжатие и Синтез лица

• Семантическое сжатие перцептивных изображений с использованием сетей Глубокой свертки 

• Синтез лица из особенностей идентификации лица

Иногда новости достаточно хорошо освещаются в других местах, и нам мало что остается добавить, кроме как довести их до вашего сведения.

Без комментариев-это формат, в котором мы представляем исходную исходную информацию, слегка отредактированную, чтобы вы могли решить, хотите ли вы следить за ней. 

Семантическое сжатие перцептивных изображений с использованием сетей глубокой свертки

Мы знаем, что сжатие изображений должно работать лучше, чем нынешние усилия. Jpeg хорош, но большинство изображений избыточны до такой степени, что вы могли бы адекватно описать их в нескольких словах!  ИИ, вероятно, можно было бы использовать для создания семантической модели изображения и создания хорошего сходства из нескольких байтов, но на данный момент это слишком сложно. Что вы можете сделать, так это использовать стандартное сжатие jpeg, но точно настроенное с помощью нейронной сети. Нейронная сеть находит наиболее важные области изображения и там сжатие Jpeg применяется слабо, но в областях, которые, по мнению сети, не волнуют человека, изображение сжимается более агрессивно:

Уже давно считается серьезной проблемой улучшение визуального качества изображения с потерями и сжатие видео. Последние достижения в области вычислительной мощности в сочетании с наличием больших наборов обучающих данных повысили интерес к применению CNN с глубоким обучением для решения задач распознавания и обработки изображений.

Здесь мы представляем мощный cnn, адаптированный к конкретной задаче понимания семантического изображения для достижения более высокого качества изображения при сжатии с потерями. Небольшое увеличение сложности встроено в кодер, который позволяет использовать стандартный готовый декодер jpeg. В то время как кодирование jpeg может быть оптимизировано для общих изображений, процесс в конечном счете не знает конкретного содержимого изображения, подлежащего сжатию.

Наша методика делает jpeg информативным контентом, проектируя и обучая модель для идентификации нескольких семантических областей в данном изображении. В отличие от методов обнаружения объектов, наша модель не требует маркировки позиций объектов и способна идентифицировать объекты за один проход. Мы представляем новую архитектуру cnn, направленную специально на сжатие изображений, которая генерирует карту, выделяющую семантически значимые области, чтобы они могли быть закодированы с более высоким качеством по сравнению с фоновыми областями. Добавляя полный набор функций для каждого класса, а затем принимая пороговое значение по сумме всех активаций функций, мы создаем карту, которая выделяет семантически значимые области, чтобы они могли быть закодированы с лучшим качеством по сравнению с фоновыми областями.

Представлены эксперименты с набором данных Kodak PhotoCD и эталонным набором данных MIT Saliency, в которых наш алгоритм обеспечивает более высокое качество изображения при том же сжатом размере.

Синтез лица из особенностей идентификации лица

Исследование Google. Массачусетский университет и Массачусетский технологический институт внедрили способ создания полной фронтальной фотографии с использованием фотографий, сделанных под любым углом. Хитрость заключается в том, чтобы создать 3D – модель лица, а затем визуализировать ее. Предположительно это означает, что вы можете создать фотографию, сделанную под любым углом:

Мы представляем метод синтеза фронтального изображения лица человека с нейтральным выражением лица с учетом входной фотографии лица. Это достигается путем обучения генерированию ориентиров и текстур лица из объектов, извлеченных из сети распознавания лиц.

В отличие от предыдущих подходов, наш вектор признаков кодирования в значительной степени инвариантен к освещению, позе и выражению лица. Используя эту инвариантность, мы тренируем нашу сеть декодеров, используя только фронтальные фотографии с нейтральным выражением лица. Поскольку эти фотографии хорошо выровнены, мы можем разложить их на разреженный набор ориентиров и выровненных текстурных карт. Затем декодер независимо предсказывает ориентиры и текстуры и объединяет их с помощью дифференцируемой операции искажения изображения.

Полученные изображения можно использовать для ряда приложений, таких как анализ атрибутов лица, настройка экспозиции и баланса белого или создание трехмерного аватара.

Также довольно ясно, что этот метод может быть использован для предоставления стандартных идентификационных фотографий из коллекции “случайных” изображений. 

И эта техника достаточно надежна, чтобы работать с ухудшенными фотографиями и иллюстрациями. Если вы всегда хотели узнать, как выглядел тогда клепальщик Рози:

Чтобы получать информацию о новых статьях на I Programmer, подпишитесь на нашу еженедельную рассылку,подпишитесь на RSS-канал и следуйте за нами в Twitter, Facebook, Google+ или Linkedin.

Комментарии

Сделайте комментарий или Просмотрите существующие комментарии С помощью Disqus

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *