Рабочие роботы, которые учатся на ошибках


Практика ведет к совершенству – это пословица, которая помогла людям стать очень ловкими, и теперь этот подход применяется к роботам.

Ученые-компьютерщики из Университета Лидса используют методы искусственного интеллекта (ИИ) автоматического планирования и обучения с подкреплением, чтобы «обучить» робота находить объект в загроможденном пространстве, таком как складская полка или холодильник. – и переместите его.

Цель состоит в том, чтобы развить роботизированную автономию, чтобы машина могла оценить уникальные обстоятельства, представленные в задаче, и найти решение – подобно тому, как робот передает навыки и знания новой проблеме.

Исследователи из Лидса представляют свои выводы сегодня (понедельник, 4 ноября) на Международной конференции по интеллектуальной робототехнике и системам в Макао, Китай.

Большая проблема заключается в том, что в ограниченном пространстве роботизированная рука может быть не в состоянии схватить объект сверху. Вместо этого он должен спланировать последовательность движений, чтобы достичь целевого объекта, возможно, манипулируя другими элементами в сторону. Мощность компьютера, необходимая для планирования такой задачи, настолько велика, что робот часто останавливается на несколько минут. И когда он выполняет ход, он часто терпит неудачу.

Развивая идею совершенствования практики, компьютерные ученые из Лидса объединяют две идеи искусственного интеллекта.

Один из них – автоматическое планирование. Робот может «видеть» проблему через систему зрения, по сути, через изображение. Программное обеспечение в операционной системе робота имитирует возможную последовательность движений, которые он может сделать, чтобы достичь целевого объекта.

Но моделирование, которое «отрепетировал» робот, не отражает сложности реального мира, и когда они реализованы, робот не может выполнить задачу. Например, он может сбивать предметы с полки.

Команда Лидса объединила планирование с другой техникой искусственного интеллекта, называемой обучением с подкреплением.

При обучении с подкреплением компьютер выполняет серию попыток проб и ошибок – всего около 10 000 – чтобы дотянуться до объектов и переместить их. Благодаря этим попыткам проб и ошибок робот «узнает», какие действия, которые он запланировал, с большей вероятностью завершатся успехом.

Компьютер сам занимается обучением, начиная со случайного выбора запланированного действия, которое может сработать. Но по мере того, как робот учится методом проб и ошибок, он становится более искусным в выборе тех запланированных ходов, которые имеют больше шансов на успех.

Доктор Маттео Леонетти из Школы вычислительной техники сказал: «Искусственный интеллект хорошо помогает роботам рассуждать – например, мы видели, как роботы участвовали в играх в шахматы с гроссмейстерами.

«Но роботы не очень хороши в том, что делают люди очень хорошо: они очень мобильны и ловки. Эти физические навыки были встроены в человеческий мозг – результат эволюции и того, как мы практикуемся, практикуемся и тренируемся.

/ p>

«И эту идею мы применяем к следующему поколению роботов».

По словам Виссама Беджани, аспиранта, написавшего исследовательскую работу, робот развивает способность обобщать, применять задуманное к уникальному стечению обстоятельств.

Он сказал: «Наша работа важна, потому что она сочетает в себе планирование с обучением с подкреплением. Многие исследования, направленные на развитие этой технологии, сосредоточены только на одном из этих подходов.

«Наш подход подтвержден результатами, которые мы наблюдали в лаборатории робототехники университета.

“С одной проблемой, когда робот должен был переместить большое яблоко, он сначала переместился в левую сторону яблока, чтобы убрать беспорядок, прежде чем манипулировать яблоком.

«При этом беспорядок не выпадал за пределы полки»

Доктор Мехмет Догар, доцент факультета вычислительной техники, также принимал участие в исследовании. Он сказал, что такой подход ускорил время “размышлений” робота в десять раз – решения, на которые уходило 50 секунд, теперь занимают 5 секунд.

Исследование получило финансирование от Исследовательского совета Великобритании по инженерным и физическим наукам в рамках проекта по изучению «физики человека» в робототехнике.


Добавить комментарий