Изучение AlphaGo Teach


DeepMind выпустила AlphaGo Teach, интерактивный инструмент, который можно использовать для изучения начальных ходов игры в го. Он позволяет вам опробовать альтернативные ходы и показывает вероятность победы черных для каждого из них, а также ходы, которые AlphaGo предпримет в ответ.

Для тех, кто не знает истории, AlphaGo – это программа на основе нейронных сетей, разработанная командой Google DeepMind, чья карьера игрока в го длилась менее 18 месяцев. Первая заявленная победа была в том, что в январе 2016 года AlphaGo обыграла чемпиона Европы по го со счетом 5 игр до 0. Затем AlphaGo обыграла Ли Сидола, корейского игрока, который занял второе место в мире 4 игры против 1 в очной игре на мероприятии в Сеуле. в марте 2016 года. Следующие новости пришли о том, что он был таинственным игроком, который обошел лучших игроков мира в декабре прошлого года, а затем на саммите Future of Go в мае 2017 года, организованном в сотрудничестве между Google, China Go Association и Китайское правительство победило первого в мире игрока в го, Кэ Цзе, 19-летнего китайского игрока, со счетом 5 против 0.
Одним из удивительных результатов стремительного восхождения AlphaGo к превосходству над игроками-людьми является то, что он возродил интерес к игре среди существующих игроков и привлек к ней новичков. Лиан Сиоа, один из лучших китайских профессионалов, принимавший участие в показательном матче Pair Go на Future of Go Summit, в котором у обеих сторон был товарищ по команде AlphaGo, подытожил положительное отношение к внедрению методов искусственного интеллекта в традиционную для его страны игру на мастерство и стратегия:
AlphaGo действительно может расширить кругозор игры в го. Это могло бы привнести в Go больше воображения.
После триумфа на Future of Go Summit AlphaGo официально отказалась от игры в го, и теперь, как и положено ушедшему на пенсию после успешной карьеры, делится своим опытом. Как только Саммит закончился, стала доступна серия игр с самостоятельной игрой, то есть AlphaGo, играющая как в черные, так и в белые камни, чтобы игроки-люди могли изучать удивительные ходы и новые стратегии, используемые ИИ. Теперь, в качестве дополнительного вклада DeepMind, AlphaGo была отведена роль наставника, чтобы игроки-люди могли воспользоваться своей мудростью для открытия игр.

AlphaGo Teach не поможет новичкам в игре. Его предназначенная роль – помочь тем, кто уже знает его правила и обладает определенным опытом, найти новые и творческие способы игры в го. Это интерактивный инструмент, который позволяет вам исследовать, как ходы Alpha Go сравниваются с движениями игроков-людей, используя 6000 самых популярных начальных последовательностей с использованием данных из 231 игры с участием людей и 75 игр AlphaGo, сыгранных против игроков-людей. .

Есть два способа взаимодействия с инструментом. Вы можете щелкнуть любой из контуров кругов фиолетовым (ходы, которые может сделать человек) или зеленым (ходы, которые будет делать AlphaGo. По ходу игры вы обнаружите, что в выборе, который нужно сделать, меньше или совсем нет степеней свободы. Если вы обнаружите, что этот режим не отвечает, используйте Firefox Quantum, который работал, когда Chrome не работал. Альтернативой является нажатие клавиш со стрелками, чтобы сделать выбор AlphaGo одним движением, 10 ходов или до конца. Стрелки назад позволяют вам перемотать точка, где вы можете сделать альтернативный выбор.
Одна из интересных вещей, которые вы обнаружите, перематывая игру, заключается в том, что AlphaGo не обязательно выбирает ход с наибольшей вероятностью. Это поведение – это то, что игроки-люди теперь могут изучать и чему могут научиться.


Добавить комментарий