Нейронная сеть NVIDIA управляет автомобилем


NVIDIA сильно продвинулась в области ИИ, как в аппаратном, так и в программном обеспечении. Теперь он реализовал сквозной нейросетевой подход к управлению автомобилем. Это гораздо больший прорыв, чем победа в Го, и он поднимает фундаментальные вопросы о том, какие системы мы готовы использовать для вождения автомобилей.

Термин «сквозной» в искусственном интеллекте стал означать предоставление нейронной сети самых основных необработанных данных в качестве входных данных и прямое подключение выходных данных ко всему, что напрямую влияет на эти входы. Это должно контрастировать с подачей некоторых сильно предварительно обработанных данных и возможностью вывода управлять чем-то более высокоуровневым.
NVIDIA сообщает о результатах своего сквозного проекта беспилотных автомобилей под названием Dave-2, и в этом случае исходный вход — это просто видео с видом на дорогу, а выход — угол поворота рулевого колеса. Нейронная сеть между ними учится управлять, показывая видео о вождении человека и о том, что в результате человек-водитель сделал с рулевым колесом. Можно сказать, что сеть научилась водить машину, сидя рядом с водителем-человеком.
«Данные о тренировках были собраны при вождении по широкому кругу дорог и в различных условиях освещения и погодных условий. Большинство данных о дорогах было собрано в центре Нью-Джерси, хотя данные о шоссе также были собраны из Иллинойса, Мичигана, Пенсильвании и Нью-Йорка. . Другие типы дорог включают двухполосные дороги (с разметкой полос и без нее), жилые дороги с припаркованными автомобилями, туннели и грунтовые дороги. Данные собирались в ясную, облачную, туманную, снежную и дождливую погоду как днем, так и ночью. В некоторых случаях солнце находилось низко в небе, в результате чего блики отражались от поверхности дороги и рассеивались от лобового стекла ».

Сравните это с традиционным подходом к беспилотному автомобилю, который разбивает задачу на различные компоненты — обнаружение полосы движения, обнаружение других автомобилей, определение местоположения ограждения и так далее. В большинстве случаев также требуется подробная и точная карта дороги, а программа, по сути, представляет собой набор правил if..then .., которые используют входные функции для детерминированной генерации выходных данных. Такой подход к беспилотным автомобилям предполагает определенную степень проверяемости, которая дает уверенность в том, что конструкция работает, а почему — нет. Например, недавняя автокатастрофа Google с автопилотом с автобусом привела к тому, что в систему был добавлен детектор автобуса, чтобы это больше не повторилось. Проблема этого «инженерного» подхода в том, что система не может справиться ни с чем новым, с чем она сталкивается. Если этого нет… тогда машина не справится.
В то время как NVIDIA называет Dave-2 системой с автоматическим управлением, она ограничена только одним аспектом вождения автомобиля — рулевым управлением, которое включает в себя восприятие и то, что у человека было бы координацией глаз. Хотя это фундаментальный аспект вождения, он не учитывает другие важные вопросы, связанные с запуском, остановкой и контролем скорости.
Как нейронная сеть, Dave-2 может обобщать ситуации, в которых она никогда не обучалась, или, по крайней мере, мы надеемся, что это возможно. Это означает, что беспилотный автомобиль, использующий сквозной подход, мог бы быть более производительным, но, возможно, и менее предсказуемым. Поскольку не существует if … тогда правил для изучения, гораздо сложнее узнать, что будет делать нейронная сеть, поскольку способ ее работы распределяется по сети. Хотя вы, возможно, не сможете указать на конкретный «детектор шины», сеть все равно избежит столкновения с шиной.
После обучения Дэйву-2 пришлось использовать одну камеру, обращенную вперед:
Сетевая архитектура представляла собой глубокую сверточную сеть с 27 миллионами соединений и 250 000 параметров.

После тестирования на симуляторе Дэйва-2 вывели на дорогу — настоящую дорогу. Производительность не была идеальной, но система действительно управляла автомобилем в течение 98% времени, оставляя человеку только 2% управления.
Вы можете посмотреть видео об этом в действии:

Мне кажется, что он слишком сильно дрейфует по своей полосе, чтобы быть водителем-человеком, но это может быть проблема контура управления, а не глубокая проблема ИИ.
Изучение структуры сети позволяет предположить, что она научилась обнаруживать полезные особенности дороги, но, конечно же, ее не обучили изучать особенности дороги, только выходы рулевого управления.

Разумно предположить, что такой подход превосходит полностью спроектированные решения, но собираетесь ли вы ему доверять:
«По сравнению с явной декомпозицией проблемы, такой как обнаружение разметки полос, планирование пути и контроль, наша сквозная система оптимизирует все этапы обработки одновременно. Мы утверждаем, что это в конечном итоге приведет к повышению производительности и уменьшению размеров систем. Лучшая производительность приведет к тому, что внутренние компоненты самооптимизируются, чтобы максимизировать общую производительность системы, вместо оптимизации выбранных человеком промежуточных критериев, например, обнаружения полосы движения. Такие критерии по понятным причинам выбираются для простоты интерпретации человеком, что не гарантирует автоматически максимальную производительность системы ».
Нужно ли нам понимать систему, чтобы быть уверенным, что она будет работать? Если мы извлечем уроки из традиционного программного обеспечения с ошибками, ответ будет отрицательным.


Добавить комментарий