Сдача теста Тьюринга подрывает репутацию


Чат-бот Юджин Густман, запрограммированный на «личность» 13-летнего украинского мальчика, «прошел» тест Тьюринга, убедив судей в 33% случаев, что это был человек, а не компьютерная программа.

Мероприятие было организовано Школой системной инженерии Университета Рединга в партнерстве с RoboLaw, финансируемой ЕС организацией, изучающей регулирование появляющихся роботизированных технологий, и состоялось в Королевском обществе в Лондоне 7 июня 2014 года, в 60-ю годовщину Тьюринга. смерть.

Профессор Кевин Уорвик, который также организовал крупнейший тест Тьюринга в истории в Блетчели-парке, приуроченный к 100-летию со дня рождения Тьюринга 23 июня 2012 года, сказал в своем заявлении:

«В области искусственного интеллекта нет более знаковой и противоречивой вехи, чем тест Тьюринга, когда компьютер убеждает достаточное количество следователей поверить в то, что это не машина, а человек. эта веха была достигнута в Королевском обществе в Лондоне, в доме британской науки и арене многих великих достижений в области человеческого понимания на протяжении веков. Эта веха войдет в историю как одна из самых захватывающих ».

Однако, прежде чем мы признаем, что это настоящий прорыв для ИИ, нам, возможно, нужно задать больше вопросов о том, является ли это доказательством того, что компьютеры могут научиться думать, или что компьютеры могут обучаться трюкам,

Алан Тьюринг предложил идею «Игры в имитацию», которую мы теперь называем тестом Тьюринга, чтобы ответить на вопрос «Могут ли машины думать?» подробности – в статье 1950 года Computing Machinery and Intelligence, опубликованной в журнале Mind.

Тьюринг постановил, что компьютерная программа, которая могла бы убедить судей-людей в том, что они разговаривают с другим человеком в 30% случаев, «выиграет» его тест – и Евгений Густман, запрограммированный Владимиром Веселовым, который родился в России и сейчас живет в США. Штаты, и уроженец Украины Евгений Демченко, который сейчас живет в России, первым превысил этот порог.

Юджин Гроссман, прозванный «Самым странным существом в мире», также выиграл первый приз на конкурсе к 100-летию Тьюринга в 2012 году, но в этом случае он убедил судей только в 29% случаев.

Формат двух мероприятий был одинаковым.

Судьи обмениваются печатными сообщениями с другими невидимыми людьми – одними людьми, а другие – программами «чат-ботов». Они видят два ответа «одновременного сравнения» на вводимые данные и должны решить, кто из них – человек, а какой – чат-бот.

Для теста Тьюринга 2014 года было проведено в общей сложности 150 одновременных сравнительных тестов, каждое с 5-минутным «разговором», и четыре сеанса, каждая из которых состояла из 25 тестов, были открыты для широкой публики. Во время каждого раунда скрытые пары переключаются между тестами, а судьи – между сессиями.

Участвовали пять чат-ботов, и в их состав вошли Cleverbot, занявший третье место в 2012 году, и бывшие победители Lobner Prize, Elbot и Ultra Hal. В состав судей вошли актер Роберт Ллевеллин, сыгравший робота Крайтена в научно-фантастическом комедийном сериале «Красный карлик», и лорд Шарки, который в прошлом году возглавил успешную кампанию по посмертному помилованию Алана Тьюринга.

Больше всего здесь судят над роботами или судьями?

Например, человек может приписать опечатки другому человеку, однако чат-бот может быть запрограммирован так, чтобы допускать такие ошибки. Однако чат-бот с меньшей вероятностью, чем человек, поймет ошибки – но пробовали ли судьи использовать такие уловки, чтобы попытаться различить их?

Наверняка создатели Евгения Гроссмана придумали удачный ход. На вопрос в 2012 году: почему он придал своему творению личность 13-летнего украинца, Веселов объяснил:

«13 лет не слишком стар, чтобы знать все, и не слишком молод, чтобы ничего не знать».

В тесте Тьюринга использование неуклюжего подростка в качестве собеседника кажется уловкой.

Если вы хотите попробовать поговорить с Юджином и посмотреть, убедит ли он его, вы можете сделать это онлайн – хотя, когда мы пытались сегодня, сайт не работал из-за перегрузки – это один из способов отличить чат-бота от человека!

Цирк, который в настоящее время окружает постановки теста Тьюринга, где чат-боты соревнуются, чтобы узнать, кто лучше всех говорит по-английски, просто ставит под сомнение всю эту идею. Заголовки в средствах массовой информации, такие как «Тест Тьюринга пройден», просто абсурд и свидетельствуют о глубоком непонимании. Возможно, нам не стоит быть слишком жесткими, ведь именно организаторы подобных мероприятий добиваются огласки и способствуют распространению недоразумений.

Был ли пройден тест Тьюринга?

Нет.

Даже не близко.

Даже со стартовой площадки.

Эти уловки использовались со времен Элизы, первого чат-бота. Они могут быть умными. Они могут быть даже полезны, но ИИ – нет.


Добавить комментарий