Игрок в покер с искусственным интеллектом Ленгпудаши подметает доску


Искусственный интеллект под названием Ленгпудаши, новейший покерный автомат из Университета Карнеги-Меллона, всесторонне обыграл команду из шести человек во главе с чемпионом Мировой серии Аланом Ду и выиграл 792 327 долларов виртуальных фишек в 36 000 раздач за 5 дней.

Ленгпудаши, чье имя означает «мастер холодного покера», является последним творением профессора CMU Туомаса Сандхольма и Ноама Брауна, его аспиранта. Это преемник Libratus, который, как мы сообщали ранее в этом году, AI Beats Top Poker Players победил четырех профессионалов в покере мирового класса в 20-дневном матче-марафоне в Rivers Casino в Питтсбурге, в котором было сыграно 120 000 рук.
Местом проведения матча Ленгпудаши был курортный конференц-центр на китайском острове Хайнань, где за 5 дней было проведено 36 000 раздач. ИИ бросила вызов команде Dragon, возглавляемой венчурным капиталистом и игроком-любителем в покер Аланом «Юэ» Ду, который вошел в историю в 2016 году, когда он победил 863 игрока и стал первым китайским игроком, выигравшим золотой браслет WSOP.

Туомас Сандхольм беседует с игроком Team Dragon Poker Кай-Фу Ли, главой Sinovation Ventures, которая организовала соревнование.

Ноам Браун и Алан Дю Источник: Sinovation Ventures
Алан Ду, который объясняет, что покер – популярная игра среди венчурных капиталистов, потому что:
«Каждая разыгрываемая вами рука похожа на предприятие, в котором вы пытаетесь оценить риск и рентабельность инвестиций»
применили новый подход к игре против ИИ – по сути, пытались играть в его собственную игру. В его команду входили компьютерные ученые и инвесторы, которые пытались применить свои знания машинного обучения и теории игр в своей игре, которая включает в себя блеф, а также подсчет карт и другие вычисления.
Это звучит как хорошая стратегия, учитывая утверждение профессора Сандхольма о том, что Ленгпудаши научился блефовать не путем имитации успешных игроков в покер и анализа исторических данных, а на основе теории игр, сказав:
«Его стратегии были рассчитаны только на основе правил игры».
Ноам Браун поддержал это мнение, сказав:
«Люди думают, что блеф – это очень человечно, но оказывается, что это неправда. Компьютер может на собственном опыте понять, что если у него слабая рука и он блефует, он может заработать больше денег ».
Кажется, что деньги – отличный мотиватор для того типа обучения с подкреплением, которое происходит здесь.
Компания Strategic Machine, основанная Сандхольмом и Брауном, получает от этого конкурса 290000 долларов и будет использовать их для продолжения разработки технологии искусственного интеллекта для широкого набора приложений: покер и другие развлекательные игры, бизнес-стратегия, переговоры, кибербезопасность, физическая безопасность и т. Д. военные приложения, стратегическое ценообразование, финансы, аукционы, политические кампании и планирование лечения.


Добавить комментарий