OpenAI обыграла Grok Илона Маска в шахматном турнире ИИ


OpenAI, создатель ChatGPT, обыграла Grok Илона Маска в финале турнира за звание лучшего шахматиста с искусственным интеллектом (ИИ).

Исторически технологические компании часто использовали шахматы для оценки прогресса и способностей компьютеров, а современные шахматные машины практически непобедимы даже против лучших игроков-людей.

На чёрно-белой шахматной доске вертикально стоит чёрный король. Вокруг него лежат опрокинутые белые пешки.

Но в этом соревновании участвовали не компьютеры, разработанные для шахмат, а ИИ-программы для повседневного использования.

Модель o3 от OpenAI вышла непобеждённой в турнире и победила модель Grok 4 от xAI в финале, что подлило масла в огонь непрекращающегося соперничества между двумя компаниями.

Маск и Сэм Альтман, соучредители OpenAI, утверждают, что их новейшие модели — самые умные в мире.

Модель Gemini от Google заняла третье место на турнире, обойдя другую модель OpenAI.

Однако эти ИИ, несмотря на свою способность справляться со многими повседневными задачами, продолжают совершенствоваться в шахматах: Grok допустил ряд ошибок в финальных партиях, в том числе неоднократно потерял ферзя.

«Вплоть до полуфинала казалось, что ничто не сможет остановить Grok 4 на пути к победе», — написал в своей статье Педро Пиньята, автор Chess.com.

«Несмотря на несколько минут слабости, ИИ X казался безусловно сильнейшим шахматистом… Но эта иллюзия развеялась в последний день турнира».

Он сказал, что «неузнаваемая» и «ошибочная» игра Grok позволила o3 одержать серию «убедительных побед».

«Grok допустил столько ошибок в этих играх, а OpenAI — нет», — сказал гроссмейстер Хикару Накамура во время своей прямой трансляции финала.

Перед финалом в четверг Маск написал в публикации на X, что предыдущий успех xAI в турнире был «побочным эффектом», и что компания «почти не потратила усилий на шахматы».

Почему ИИ играет в шахматы?

Турнир по шахматам с ИИ проходил на платформе Kaggle, принадлежащей Google, которая позволяет специалистам по данным оценивать результаты своих соревнований.

Восемь крупных языковых моделей от Anthropic, Google, OpenAI, xAI, а также китайских разработчиков DeepSeek и Moonshot AI сражались друг с другом в ходе трёхдневного турнира Kaggle.

Разработчики ИИ используют тесты, известные как бенчмарки, для проверки навыков своих моделей в таких областях, как рассуждение или программирование.

Будучи сложными стратегическими играми, основанными на правилах, шахматы и го часто использовались для оценки способности модели обучаться наилучшим способам достижения определённого результата — в данном случае, перехитрить соперников и победить.

AlphaGo, компьютерная программа, разработанная лабораторией искусственного интеллекта Google DeepMind для игры в китайскую стратегическую игру го для двух игроков, одержала серию побед над чемпионами по го в конце 2010-х годов.

Южнокорейский мастер го Ли Седоль ушёл в отставку после нескольких поражений от AlphaGo в 2019 году.

«Есть нечто, что невозможно победить», — заявил он информационному агентству Yonhap.

Сэр Демис Хассабис, один из соучредителей DeepMind, сам в прошлом был шахматным вундеркиндом.

Тем временем, в конце 1990-х годов чемпионы по шахматам соревновались с мощными компьютерами.

Российский гроссмейстер Гарри Каспаров, в частности, проиграл первую партию из серии суперкомпьютеру IBM Deep Blue в 1996 году, а также матч-реванш в 1997 году.
Российский гроссмейстер Гарри Каспаров, в частности, проиграл первую партию из серии суперкомпьютеру IBM Deep Blue в 1996 году, а также матч-реванш в 1997 году.

Победа Deep Blue считалась знаменательным событием, продемонстрировавшим, что компьютеры могут сравниться с некоторыми человеческими навыками.

Спустя 20 лет Каспаров сравнил его интеллект с будильником, но сказал: «Проигрыш будильнику стоимостью 10 миллионов долларов (7,6 миллиона фунтов стерлингов) не принес мне облегчения».


Добавить комментарий