ИИ превосходит человеческих чемпионов по покеру


Libratus, искусственный интеллект, разработанный в Карнеги-Меллон, в настоящее время сразится с четырьмя лучшими в мире профессиональными игроками в покер в 20-дневном матче в казино Rivers в Питтсбурге, в котором будет сыграно 120 000 рук в безлимитный техасский холдем.

В казино Rivers многое поставлено на карту. Четыре покерных профи, Джейсон Лес, Донг Ким, Даниэль Маколэй и Джимми Чоу разделят призовой фонд в размере 200 000 долларов, который будет вручен даже в случае победы Libratus. С другой стороны, создатели ИИ, профессор Туомас Сандхольм и доктор философии студент Ноам Браун надеется доказать, что Libratus, на которую было потрачено 15 миллионов основных часов вычислений в Питтсбургском суперкомпьютерном центре (PSC), может побить лучших игроков с высокими ставками.
Соревнование началось 11 января и объявлено как повторный матч, поскольку он следует за аналогичным событием в 2015 году, когда Claudico, предыдущий алгоритм игры в покер от Карнеги-Меллона, проиграл 732 713 долларов после 80 000 розыгрышей за две недели. Учитывая, что ставка составила 170 миллионов долларов, проигрыш менее чем на миллион долларов был достаточно близок, чтобы считаться ничьей, поэтому на этот раз проводится больше игр, чтобы обеспечить статистически значимый результат. не из-за удачи, четыре профи будут объединены в пары, чтобы сыграть одинаковые матчи – игрок A в каждой паре получит те же карты, что и компьютер против игрока B, и наоборот. Один из игроков в каждой из этих пар будет играть на полу казино, а его противник будет изолирован в отдельной комнате.

Когда игра началась, Эндрю Мур, декан Школы компьютерных наук Карнеги-Меллона, сказал:
«Многие люди в сообществе ИИ внимательно следят за этим событием. Победа над некоторыми из лучших игроков в игре будет значительным достижением для ИИ и станет возможным только в том случае, если Libratus сможет успешно блефовать и иным образом вводить в заблуждение своих противников-людей».
В этом видео о мероприятии Brains vs AI профессор Сандхольм и Ноам Браун объяснят, почему этот вид покера является эталоном, когда дело доходит до искусственного интеллекта, и как их алгоритмы могут использоваться в более широком наборе ситуаций:

Браун говорит об успехе, достигнутом компьютерами в играх с идеальной информацией в Chess and Go, и указывает, что покер ближе к ситуациям реального мира, которые имеют дело со скрытой информацией и неопределенностью. Он объясняет, что AlphaGo не умеет блефовать и его легко победить в покере, отмечая это:
«элемент неопределенности полностью меняет динамику, и именно к этому элементу обращается Liberatus и разработанные для него алгоритмы.
Сандхольм напоминает нам, что лимитный техасский холдем был практически оптимально решен в 2015 году Университетом Альберты (см. Сортировка покера – знакомство с Цефеем), и продолжает описывать безлимитную версию следующим образом:
«последний рубеж на обозримом горизонте решения игр в ИИ».
Он также отмечает, что Libratus AI не является программой для покера. Его алгоритм может быть применен к любому количеству ситуаций, связанных с неполной и вводящей в заблуждение информацией – деловые переговоры, военная стратегия, кибербезопасность и даже дизайн лечения.
Более широкое значение матча Brains vs. AI заключается в том, что Libratus превращается в общий искусственный интеллект, который может решать любую ситуацию, с которой он сталкивается, а не только конкретную область, такую как го или покер.
Как говорит Браун:
Если ИИ собирается достичь этой цели, ему нужно будет решить проблему неопределенности, которая часто возникает в реальной жизни. Мы считаем, что алгоритмы, используемые в этом боте, расширяют поле для решения этих проблем и решают вопрос: «Как вы справляетесь с неопределенностью в реальном мире?»

Так как же продвигается этот исторический матч?
До его начала производители ставок отдавали предпочтение игрокам-людям 4 или 5 к 1 над Libratus. Однако к концу первого дня Libratus оказался впереди на 82000 долларов. Он повторил свой успех во второй и третий дни и опередил на 193 000 долларов. Однако на четвертый день люди начали побеждать, и к концу шестого дня отрыв Libratus сократился до 51000 долларов.
В этот момент Джейсон Лес, который также играл в конкурсе 2015 года против Клаудико, написал по электронной почте:
Мы плохо начали, что, я думаю, вполне ожидаемо. Те первые руки, которые мы разыгрываем, не имея представления о том, как играет наш оппонент, и нам потребовалось время, чтобы изучить и понять, что происходит.
Лес намекнул, что профи покера нашли слабые места, которые нужно использовать, и каждый вечер собираются вместе, чтобы разработать стратегии.
Однако ночью, когда люди спят, Libratus возвращается в PSC, где компьютер Bridges выполняет вычисления, чтобы помочь с его конечной игрой. Эта дополнительная помощь, похоже, окупается, и Libratus в настоящее время уверенно движется вперед.
С 11:00 до 19:00 на сайте Brains vs Artificial Intelligence идет прямая трансляция, и вы можете следить за матчами на Twitch.tv.


Добавить комментарий