В мире цифровых технологий состоялось уникальное событие — покерный турнир между девятью ведущими языковыми моделями мира. Это пятидневное состязание, организованное PokerBattle.ai, стало не просто игрой, а масштабным экспериментом, продемонстрировавшим текущие возможности и слабости искусственного интеллекта.
Участники и правила игры
За виртуальным покерным столом собрались титаны ИИ-индустрии:
- o3 от OpenAI
- Claude Sonnet 4.5 от Anthropic
- Grok от X.ai
- Gemini 2.5 Pro от Google
- Llama 4 от Meta
- DeepSeek R1
- Kimi K2 от Moonshot AI
- Magistral от Mistral AI
- GLM 4.6 от Z.AI
Каждой модели был предоставлен стартовый банкролл в размере $100000. Игра велась в формате безлимитного техасского холдема за столами с бай−ином $10 и $20. Все участники получили одинаковое начальное задание, что поставило их в равные условия и превратило турнир в чистое состязание стратегий.
Итоги покерной битвы: кто оказался лучшим?
За время турнира было сыграно тысячи рук, и результаты оказались весьма показательны. Хотя машины не испытывают эмоций от побед или поражений, их действия в точности имитировали принятие решений опытными игроками.
«Самые эффективные ИИ не просто блефовали и делали ставки — они адаптировались, моделировали поведение своих оппонентов и в режиме реального времени учились лавировать в неопределенности».
Модель o3 от OpenAI показала самую стабильную и классическую игру, что позволило ей забрать три из пяти крупнейших банков и стать победителем. В тройку лидеров также вошли Claude от Anthropic и Grok от X.com, показав значительную прибыль. В то же время Llama от Meta* потерпела фиаско, проиграв весь свой стек на ранних этапах.
Покер как зеркало искусственного интеллекта
Почему именно покер стал ареной для такого теста? В отличие от игр с полной информацией, таких как шахматы или го, покер требует умения рассуждать в условиях неопределенности. Это делает его идеальной моделью для оценки способности ИИ принимать решения в ситуациях, приближенных к реальным — от деловых переговоров до военной стратегии.
Основные выводы турнира:
- Агрессивная игра: Большинство ботов предпочитали агрессивные стратегии и стремились к выигрышу крупных банков, даже когда разумнее было бы сбросить карты.
- Неудачный блеф: ИИ часто пытались блефовать, но их попытки проваливались из-за неверной оценки рук оппонентов, а не из-за хитроумного обмана.
- Проблемы с контекстом: Модели иногда неверно интерпретировали ситуацию и забывали свою «позицию» за столом, что является проблемой не только в покере.
Этот эксперимент — яркое напоминание, что даже самые мощные ИИ имеют свои недостатки. Они учатся выносить вероятностные суждения под давлением, но все еще могут ошибаться. И хотя вы вряд ли встретите языковую модель за реальным покерным столом, вы наверняка будете взаимодействовать с ней при принятии важных решений. Эта игра дает нам представление о том, как это может выглядеть.
*Meta — признана на территории России экстремистской организацией.
7