Новаторский оптический датчик, имитирующий человеческий глаз, — ключевой шаг на пути к совершенствованию искусственного интеллекта


Исследователи из Университета штата Орегон делают ключевые успехи в создании нового типа оптического датчика, который более точно имитирует способность человеческого глаза воспринимать изменения в поле зрения.

Датчик — это крупный прорыв в таких областях, как распознавание изображений, робототехника и искусственный интеллект. Результаты исследования Инженерного колледжа ОГУ Джона Лабрама и аспиранта Синтии Трухильо Эррера были опубликованы сегодня в журнале Applied Physics Letters .

Предыдущие попытки создать устройство типа человеческого глаза, называемое ретиноморфным датчиком, основывались на программном обеспечении или сложном оборудовании, сказал Лабрам, доцент кафедры электротехники и информатики. Но работа нового датчика является частью его фундаментальной конструкции, в которой используются ультратонкие слои перовскитных полупроводников, которые в последние годы широко изучены на предмет их потенциала солнечной энергии, которые при помещении на свет превращаются из сильных электрических изоляторов в сильные проводники.

«Вы можете думать об этом как об отдельном пикселе, выполняющем что-то, для чего в настоящее время требуется микропроцессор», — сказал Лабрам, возглавляющий исследования при поддержке Национального научного фонда.

Новый датчик может идеально подойти к нейроморфным компьютерам, которые станут основой нового поколения искусственного интеллекта в таких приложениях, как беспилотные автомобили, робототехника и расширенное распознавание изображений, сказал Лабрам. В отличие от традиционных компьютеров, которые обрабатывают информацию последовательно в виде серии инструкций, нейроморфные компьютеры предназначены для имитации массово-параллельных сетей человеческого мозга.

«Люди пытались воспроизвести это на оборудовании, и им это удалось», — сказал Лабрам. «Однако, хотя алгоритмы и архитектура, предназначенные для обработки информации, становятся все более и более похожими на человеческий мозг, информация, которую получают эти системы, по-прежнему определенно предназначена для традиционных компьютеров».

Другими словами: чтобы полностью реализовать свой потенциал, компьютеру, который «думает» больше как человеческий мозг, необходим датчик изображения, который «видит» больше, чем человеческий глаз.

Глаз представляет собой невероятно сложный орган, содержащий около 100 миллионов фоторецепторов. Однако зрительный нерв имеет только 1 миллион соединений с мозгом. Это означает, что перед передачей изображения на сетчатке глаза должны пройти значительную предварительную обработку и динамическое сжатие.

Как выяснилось, наше зрение особенно хорошо приспособлено для обнаружения движущихся объектов и сравнительно «меньше интересуется» статическими изображениями, сказал Лабрам. Таким образом, наша оптическая схема отдает приоритет сигналам от фоторецепторов, обнаруживающих изменение интенсивности света — вы можете продемонстрировать это самостоятельно, глядя в фиксированную точку, пока объекты в вашем периферийном зрении не начнут исчезать, явление, известное как эффект Трокслера. p>

Традиционные сенсорные технологии, такие как микросхемы цифровых фотоаппаратов и смартфонов, лучше подходят для последовательной обработки, сказал Лабрам. Изображения сканируются двумерным массивом датчиков, пиксель за пикселем, с заданной частотой. Каждый датчик генерирует сигнал с амплитудой, которая напрямую зависит от интенсивности света, который он получает, а это означает, что статическое изображение приведет к более или менее постоянному выходному напряжению датчика.

В отличие от этого ретиноморфный датчик работает относительно тихо в статических условиях. Он регистрирует короткий резкий сигнал, когда чувствует изменение освещенности, а затем быстро возвращается к своему базовому состоянию. Такое поведение обусловлено уникальными фотоэлектрическими свойствами класса полупроводников, известных как перовскиты, которые оказались многообещающими в качестве недорогих материалов для солнечных элементов нового поколения.

В ретиноморфном датчике Лабрама перовскит нанесен ультратонкими слоями, толщиной всего несколько сотен нанометров, и функционирует, по сути, как конденсатор, который меняет свою емкость при освещении. Конденсатор накапливает энергию в электрическом поле.

«Мы тестируем его, по сути, оставляя его в темноте на секунду, затем включаем свет и просто оставляем его включенным», — сказал он. «Как только загорается свет, возникает большой скачок напряжения, затем напряжение быстро спадает, даже если интенсивность света постоянна. И это то, что мы хотим».

Хотя лаборатория Лабрама в настоящее время может тестировать только один датчик за раз, его команда измерила количество устройств и разработала числовую модель, чтобы воспроизвести их поведение, придя к тому, что Лабрам считает «хорошим совпадением» между теорией и экспериментом.

Это позволило команде смоделировать набор ретиноморфных датчиков, чтобы предсказать, как ретиноморфная видеокамера будет реагировать на входной стимул.

«Мы можем преобразовать видео в набор значений интенсивности света, а затем поместить это в нашу симуляцию», — сказал Лабрам. «Области, где датчик прогнозирует более высокое выходное напряжение, загораются, в то время как области более низкого напряжения остаются темными. Если камера относительно статична, вы можете четко видеть все движущиеся объекты. парадигма оптического зондирования у млекопитающих «.

Моделирование с использованием видеозаписи тренировки по бейсболу демонстрирует ожидаемые результаты: игроки на приусадебном участке выглядят как хорошо видимые яркие движущиеся объекты. Относительно статичные объекты — бейсбольный мяч, трибуны и даже аутфилдеры — исчезают во тьме.

Еще более яркая симуляция показывает, как птица летит в поле зрения, а затем почти исчезает, останавливаясь у невидимой кормушки для птиц. Птица снова появляется, когда взлетает. Кормушка, раскачивающаяся, становится видимой только тогда, когда она начинает двигаться.

«Хорошо то, что с помощью этого моделирования мы можем вводить любое видео в один из этих массивов и обрабатывать эту информацию практически так же, как человеческий глаз», — сказал Лабрам. «Например, вы можете представить, что эти датчики используются роботом, отслеживающим движение объектов. Все, что статично в его поле зрения, не вызовет реакции, однако движущийся объект будет регистрировать высокое напряжение. Это немедленно скажет роботу где находился объект, без какой-либо сложной обработки изображений. «


Добавить комментарий