AlphaGo проиграла игру — счет стал 3-1


Оппонент AlphaGo, Ли Седол, выиграл четвертую игру в Deep Mind Challenge, доказав, что человек все еще может перехитрить машину. Вот наша обновленная история об этом революционном матче.

Проигрыш в игре не влияет на окончательный результат матча из 5 игр, но он важен психологически не только для Ли и его коллег-профессиональных игроков в го, но и для исследователей ИИ. Еще есть за что поиграть! На пресс-конференции после матча генеральный директор Deep Mind Деми Хассабис сказал, что очень доволен результатом:
«… вот почему мы приехали сюда — испытать AlphaGo на пределе возможностей».

Табло показывает, что Ли выиграл после 180 ходов. Как и в предыдущих матчах, он использовал все свое время и два периода овертайма бай-ёми. Выступая после матча Ли Седол сказал:
«Меня никогда так не поздравляли только потому, что я выиграл одну игру».
Согласно блогу Google:
Ли Седол вернулся сегодня [суббота, 12 марта] после трех поражений подряд, чтобы обыграть AlphaGo в четвертой игре. Играя белыми, Ли выиграл отставкой после 180 ходов.
AlphaGo удерживала сильные позиции в первой половине игры, но комментаторы отметили, что Ли Седол сделал блестящий 78-й ход, за которым последовала ошибка AlphaGo на 79-м.
Вот что сказали американские и корейские комментаторы. Майкл Редмонд, получивший 9 дан Го, заявил:

«Сегодняшняя игра была еще одним примером того, как AlphaGo играет в очень интересную и хорошую игру. Однако 78-й ход Ли Седола был действительно блестящим и позволил ему выиграть ».

Сон Тэгон, также получивший 9 дан, сказал:

«Кажется, Ли Седол теперь лучше читает AlphaGo и лучше понимает, как AlphaGo движется. В пятом матче это будет гораздо более тесная битва, чем раньше, поскольку мы знаем друг друга лучше. Профессиональные игроки в го сказали, что они стали больше интересоваться го после того, как стали свидетелями новаторских приемов AlphaGo. Люди начали переосмысливать ходы, которые раньше считались нежелательными или плохими. AlphaGo может помочь нам мыслить нестандартно в играх го ».
Деми Хассабис написала в Твиттере:

Суббота, 12 марта
AlphaGo от Google выиграла Deep Mind Challenge, выиграв третий матч подряд против 18-кратного чемпиона мира Ли Седола. Вот наш обновленный рассказ об этом историческом прорыве в области искусственного интеллекта.

Положение доски в конце третьей игры выглядит поразительно иначе. На этот раз AlphaGo одержала победу, отказавшись от участия после 176 ходов. Ли потратил все свое время и два периода сверхурочной работы бай-ёми, в то время как у AlphaGo оставалось 8:31 на часах.
Согласно Google:
AlphaGo создал большую территорию на доске, но Ли Седол использовал несколько новаторских тактик, чтобы начать огромную битву коо по принципу «все или ничего» и усложнить ситуацию. В результате битвы ко победила AlphaGo.
Подводя итоги этого третьего матча из 5-ти, который проходит в Сеуле, корейский комментатор Ли Хёнук, 8 дан, сказал:
«Ли Седол сыграл хорошо. Как профессиональный игрок, я хотел бы выразить свое уважение его трем играм подряд против AlphaGo, которые сыграли почти идеально. Ли сделал несколько разнообразных ходов в конце сегодняшней игры, чтобы больше узнать об AlphaGo. Я тоже с нетерпением жду оставшихся игр ».
Майкл Редмонд, 9 дан, американский комментатор сказал:
«Можно утверждать, что в первых двух играх Ли Седол играл иначе, чем его истинный стиль, пытаясь найти слабое место в компьютере. Сегодня Ли определенно играл в свою игру, от сильного дебюта до сложных ходов в финальном ко. AlphaGo был готов ко всему, включая бои ко, и смог одержать победу. Я хотел бы поздравить людей, которые действительно сделали это достижение возможным, потому что это произведение искусства ».
Демис Хассабис, основатель и генеральный директор DeepMind и человек, инициировавший проект AlphaGo, написал в Твиттере:

Хотя AlphaGo уже выиграла матч, в серии из 5 игр еще предстоит сыграть в два раунда, чтобы определить окончательный счет матча. Четвертая игра состоится в воскресенье, 13 марта, а финальная — во вторник, 15 марта. Конечно, Ли Седолу еще есть за что поиграть — сможет ли лучший человек в мире превзойти алгоритмический подход DeepMind.

Пятница, 11 марта

После успеха в первом матче, о котором сообщается ниже, AlphaGo снова предприняла ряд творческих ходов, которые удивили экспертов-комментаторов во втором матче.
Американский комментатор сказал:
«Я был впечатлен игрой AlphaGo. Открытие было потрясающе красивым. Судя по тому, что я видел в других играх, AlphaGo всегда была сильна в конце и середине игры, но на этот раз это было распространено на начало игры. Это была красивая, новаторская игра ».
Ю Чанхёк, 9 дан, корейский комментатор, сказал:
«Во время первого матча Ли Седол делал сложные шаги, чтобы взволновать AlphaGo, но не смог этого сделать. Сегодня он попробовал обратное — перестраховался и вошел в эндшпиль. Используя периоды байоми, он допустил несколько ошибок, которые, я думаю, и привели к поражению ».
Эта вторая игра длилась более 4 часов, и Ли Сед-ол и AlphaGo использовали все свои два часа времени, плюс более известное как сверхурочное время byō-yomi.

Вы можете увидеть 90-секундное резюме игры в следующем видео, которое намного лучше, чем видео из первой игры.

Среда, 9 марта
Программа Google DeepMind AlphaGo выиграла первую игру в своем матче против легендарного игрока в го Ли Седола. Хорошо, это может быть только первая игра в серии из пяти, но это такой большой шаг вперед, что это ИИ-эквивалент высадки на Луну.

Вы не можете винить Демиса Хассабиса в том, что он немного переборщил — это действительно потрясающе.
Возможно, что более удивительно, так это то, что методы, которые использовались для создания AlphaGo, по сути, представляют собой подходы, над которыми ИИ работал долгое время — нейронные сети и обучение с подкреплением. Это не означает, что все было легко сделать правильно, но все это скорее случай «большего», чем «радикально другого».
Архитектура сети под названием AlphaGo, разработанная командой Google Deep Mind, нова тем, что в ней используются две отдельные нейронные сети в традиционной схеме обучения с подкреплением «актер-критик». Первая сеть выбирает возможные ходы, а вторая оценивает их с точки зрения того, какое преимущество этот ход даст в будущем. Такой подход позволил AlphaGo извлечь уроки из 30 миллионов человеческих игр в го, а затем продолжить улучшать его производительность, играя миллионы игр против самого себя.
Еще в октябре AlphaGo обыграла чемпиона Европы по го (Google AI превосходит профессионального игрока в го), а Google устроил более жесткое тестирование программного обеспечения в стиле классических матчей по игре в шахматы. Чемпионом мира, южнокорейцем Ли Седолом, был предложен матч из пяти игр в Сеуле с призовым фондом в 1 миллион долларов, и теперь этот матч начался.

AlphaGo выиграла первую игру. Согласно пресс-релизу DeepMind:
AlphaGo берет первую игру против Ли Седола. В целом, они сражались лицом к лицу в игре, наполненной сложными боями. Ли Седол делал очень агрессивные шаги, но AlphaGo не отступал от боев. AlphaGo отнимал почти все время по сравнению с Ли Седолом, у которого на часах оставалось почти 30 минут.

Результат: W + Res
Количество ходов: 186
Время заняло Блэк (Ли Седол): 1:31:32
Время, снятое белыми (AlphaGo): 1:54:30

Вы можете посмотреть запись прямой трансляции ниже — матч начинается примерно через 27 минут, и вас нужно предупредить, что это не очень хорошее видео с множеством глюков и ужасными комментаторами:

По мнению игровых экспертов, Ли, казалось, имел преимущество на протяжении большей части игры, но за последние 20 минут AlphaGo произвела ходы, которые сделали победу неизбежной.
Некоторые аналитики с тревогой заявляют, что человек никогда бы не сделал ранний ход. Может ли быть, что эта первая победа в матче связана с тем, что игрок-человек не понимает природу своего машинного противника?
Утверждается, что знаменитая шахматная победа Deep Blue над Каспаровым произошла из-за ошибки, из-за которой делался случайный ход, который Каспаров не смог понять и приписал превосходному интеллекту. Говорят, что он проиграл игру из-за вызванного ею беспокойства. Если это так, то вы можете ожидать, что Ли Седол улучшится, когда он привыкнет к своему оппоненту.
На самом деле не имеет значения, нервировал ли AlphaGo Ли, играя нечеловеческим образом. Тот факт, что программа берет на себя человека высшего уровня и воспринимается всерьез, все еще является эквивалентом ИИ высадки на Луну.
Следите за обновлениями по оставшимся матчам.


Добавить комментарий