Исследование показало, что обработка света улучшает зондирование роботов


Группа военных исследователей обнаружила, как человеческий мозг обрабатывает яркий и контрастный свет, что, по их словам, является ключом к улучшению восприятия роботов и позволяет автономным агентам объединяться с людьми.

По словам исследователей, для обеспечения автономии, которая является главным приоритетом армии, машинное распознавание должно быть устойчивым к изменяющимся условиям.

«Когда мы разрабатываем алгоритмы машинного зрения, изображения реального мира обычно сжимаются до более узкого диапазона, как это делает камера мобильного телефона, в процессе, называемом тональным картированием», – сказал Андре Харрисон, исследователь из отдела развития боевых возможностей армии США. Научно-исследовательская лаборатория командования армии. «Это может способствовать хрупкости алгоритмов машинного зрения, потому что они основаны на искусственных изображениях, которые не совсем соответствуют шаблонам, которые мы видим в реальном мире».

Разрабатывая новую систему с отображением 100 000: 1, команда обнаружила вычисления мозга в более реальных условиях, чтобы они могли встроить в датчики биологическую устойчивость, – сказал Харрисон.

Современные алгоритмы зрения основаны на исследованиях на людях и животных с компьютерными мониторами, которые имеют ограниченный диапазон яркости примерно 100: 1, то есть соотношение между самыми яркими и самыми темными пикселями. В реальном мире это изменение может быть отношением 100 000 к 1, что называется расширенным динамическим диапазоном или HDR.

«Изменения и значительные различия в освещении могут бросить вызов армейским системам: дроны, летящие под пологом леса, могут быть сбиты с толку из-за изменений отражательной способности, когда ветер дует сквозь листву, или автономные транспортные средства, движущиеся по пересеченной местности, могут не распознавать выбоины или другие препятствия, потому что “условия освещения немного отличаются от тех, на которых были обучены их алгоритмы зрения”, – сказал военный исследователь доктор Чоу По Хунг.

Исследовательская группа стремилась понять, как мозг автоматически принимает входные данные 100 000: 1 из реального мира и сжимает их до более узкого диапазона, что позволяет людям интерпретировать форму. Команда изучила раннюю визуальную обработку в HDR, изучив, как взаимодействуют простые функции, такие как яркость HDR и края, как способ раскрыть основные механизмы мозга.

«Мозг имеет более 30 зрительных областей, и у нас все еще есть лишь элементарное представление о том, как эти области преобразуют изображение глаза в трехмерную форму», – сказал Хунг. «Наши результаты исследований яркости HDR, основанные на человеческом поведении и записях скальпа, показывают, насколько мало мы действительно знаем о том, как преодолеть разрыв между лабораториями и реальными средами. Но эти результаты выводят нас из этой коробки, показывая, что наши предыдущие предположения, сделанные на основе стандартных компьютерных мониторов, имеют ограниченную возможность обобщения на реальный мир, и они раскрывают принципы, которые могут направлять наше моделирование к правильным механизмам “.

Journal of Vision опубликовал результаты исследования команды: “Резкое затемнение при яркости с высоким динамическим диапазоном (HDR) вызывает облегчение для целей с высокой контрастностью и группировку по сходству яркости”.

Исследователи заявили, что открытие того, как световые и контрастные края взаимодействуют в визуальном представлении мозга, поможет повысить эффективность алгоритмов восстановления истинного трехмерного мира при реальной освещенности за счет исправления неоднозначностей, которые неизбежны при оценке трехмерной формы из 2D-информация.

«За миллионы лет эволюции наш мозг выработал эффективные средства для восстановления трехмерного изображения на основе двумерной информации», – сказал Хунг. «Это давняя проблема, которая продолжает ставить перед учеными, занимающимися машинным зрением, проблему, даже с учетом последних достижений в области ИИ».

Помимо видения автономии, это открытие также будет полезно для разработки других устройств с поддержкой ИИ, таких как радар и удаленное распознавание речи, которые зависят от восприятия в широком динамическом диапазоне.

На основе своих результатов исследователи работают с партнерами из академических кругов над разработкой вычислительных моделей, в частности с импульсными нейронами, которые могут иметь преимущества как для вычислений HDR, так и для более энергоэффективной обработки изображений – оба важных аспекта для маломощных дронов. .

«Проблема динамического диапазона – это не просто проблема восприятия», – сказал Хунг. «Это также может быть более общей проблемой в вычислениях мозга, потому что отдельные нейроны имеют десятки тысяч входных данных. Как вы создаете алгоритмы и архитектуры, которые могут прослушивать правильные входные данные в разных контекстах? Мы надеемся, что, работая над этой проблемой в на сенсорном уровне мы можем подтвердить, что находимся на правильном пути, чтобы иметь нужные инструменты при создании более сложных ИИ “.


Добавить комментарий