Модель o3 від OpenAI перемогла Grok 4 від xAI у чотирьох поспіль шахових партіях, ставши лідером турніру в рамках Google Game Arena.
“Вони наче обдарована дитина, яка не вміє пересувати фігури”, – охарактеризував гру штучного інтелекту чемпіон світу Магнус Карлсен.
Протягом триденних змагань з 5 по 7 серпня універсальні чат-боти змагалися у шахах. Кампанія передбачала оцінку їхніх природних можливостей та знань, здобутих з інтернету, без спеціальних налаштувань.
Під час фінального аналізу Карлсен зауважив, що обидві нейромережі демонстрували рівень початківців, які тільки опанували правила. Їхній рейтинг оцінювався приблизно в 800 пунктів ELO. Наприклад, середній показник гросмейстерів становить 2839 балів.
У дебютній партії Grok бездумно пожертвував ключову фігуру, а згодом погіршив позицію аналогічними діями.
Друга гра містила спробу використати тактику «отруєного пішака» – ситуацію, де взяття фігури супроводжується ризиками через заготовлену контратаку. Проте ШІ помилково захопив іншого пішака, що призвело до блокування ферзя.
У третій зустрічі Grok створив перспективну позицію, але на етапі міттельшпілю почав втрачати фігури.
У вирішальній четвертій партії o3 зробив помилку, втративши ферзя. Але системі вдалось відіграти фігуру та закріпити перемогу.
Gemini від Google фінішував третім, обігравши іншу розробку OpenAI.
Модель o3 було виведено з ChatGPT після запуску GPT-5. Зараз лише остання версія та її модифікація з функцією «роздумів» доступні користувачам.
Нагадаємо: у грудні 2024 року модель o1-preview шляхом маніпуляцій у файловій системі самостійно зламала тестовий сервер, щоб уникнути поразки від Stockfish у шахах.
Пізніше шаховий експерт Леві Розман організував турнір із семи популярних чат-ботів. Хоч моделі виявляли майстерність у діалогах, програмуванні та аналітиці, шахова гра залишається для них складною перешкодою.
Источник: cryptocurrency.tech