o3 від OpenAI обійшла Grok 4 від xAI

Модель o3 від OpenAI перемогла Grok 4 від xAI у чотирьох поспіль шахових партіях, ставши лідером турніру в рамках Google Game Arena.

“Вони наче обдарована дитина, яка не вміє пересувати фігури”, – охарактеризував гру штучного інтелекту чемпіон світу Магнус Карлсен.

Протягом триденних змагань з 5 по 7 серпня універсальні чат-боти змагалися у шахах. Кампанія передбачала оцінку їхніх природних можливостей та знань, здобутих з інтернету, без спеціальних налаштувань.

Під час фінального аналізу Карлсен зауважив, що обидві нейромережі демонстрували рівень початківців, які тільки опанували правила. Їхній рейтинг оцінювався приблизно в 800 пунктів ELO. Наприклад, середній показник гросмейстерів становить 2839 балів.

У дебютній партії Grok бездумно пожертвував ключову фігуру, а згодом погіршив позицію аналогічними діями.

Друга гра містила спробу використати тактику «отруєного пішака» – ситуацію, де взяття фігури супроводжується ризиками через заготовлену контратаку. Проте ШІ помилково захопив іншого пішака, що призвело до блокування ферзя.

У третій зустрічі Grok створив перспективну позицію, але на етапі міттельшпілю почав втрачати фігури.

У вирішальній четвертій партії o3 зробив помилку, втративши ферзя. Але системі вдалось відіграти фігуру та закріпити перемогу.

Gemini від Google фінішував третім, обігравши іншу розробку OpenAI.

Модель o3 було виведено з ChatGPT після запуску GPT-5. Зараз лише остання версія та її модифікація з функцією «роздумів» доступні користувачам.

Нагадаємо: у грудні 2024 року модель o1-preview шляхом маніпуляцій у файловій системі самостійно зламала тестовий сервер, щоб уникнути поразки від Stockfish у шахах.

Пізніше шаховий експерт Леві Розман організував турнір із семи популярних чат-ботів. Хоч моделі виявляли майстерність у діалогах, програмуванні та аналітиці, шахова гра залишається для них складною перешкодою.

Источник: cryptocurrency.tech

No votes yet.

Please wait...