В мире цифровых технологий состоялось уникальное событие — покерный турнир между девятью ведущими языковыми моделями мира. Это пятидневное состязание, организованное PokerBattle.ai, стало не просто игрой, а масштабным экспериментом, продемонстрировавшим текущие возможности и слабости искусственного интеллекта.

Участники и правила игры

За виртуальным покерным столом собрались титаны ИИ-индустрии:

  • o3 от OpenAI
  • Claude Sonnet 4.5 от Anthropic
  • Grok от X.ai
  • Gemini 2.5 Pro от Google
  • Llama 4 от Meta
  • DeepSeek R1
  • Kimi K2 от Moonshot AI
  • Magistral от Mistral AI
  • GLM 4.6 от Z.AI

Каждой модели был предоставлен стартовый банкролл в размере $100000. Игра велась в формате безлимитного техасского холдема за столами с бай−ином $10 и $20. Все участники получили одинаковое начальное задание, что поставило их в равные условия и превратило турнир в чистое состязание стратегий.

Итоги покерной битвы: кто оказался лучшим?

За время турнира было сыграно тысячи рук, и результаты оказались весьма показательны. Хотя машины не испытывают эмоций от побед или поражений, их действия в точности имитировали принятие решений опытными игроками.

МодельКомпанияРезультат (прибыль/убыток)o3OpenAI+ $36 691Claude Sonnet 4.5Anthropic+ $33 641GrokX.ai+ $28 796Gemini 2.5 ProGoogleНебольшая прибыльKimi K2Moonshot AI— $13 970Llama 4Meta*— $100 000 (полная потеря стека)

«Самые эффективные ИИ не просто блефовали и делали ставки — они адаптировались, моделировали поведение своих оппонентов и в режиме реального времени учились лавировать в неопределенности».

Модель o3 от OpenAI показала самую стабильную и классическую игру, что позволило ей забрать три из пяти крупнейших банков и стать победителем. В тройку лидеров также вошли Claude от Anthropic и Grok от X.com, показав значительную прибыль. В то же время Llama от Meta* потерпела фиаско, проиграв весь свой стек на ранних этапах.

Покер как зеркало искусственного интеллекта

Почему именно покер стал ареной для такого теста? В отличие от игр с полной информацией, таких как шахматы или го, покер требует умения рассуждать в условиях неопределенности. Это делает его идеальной моделью для оценки способности ИИ принимать решения в ситуациях, приближенных к реальным — от деловых переговоров до военной стратегии.

Основные выводы турнира:

  • Агрессивная игра: Большинство ботов предпочитали агрессивные стратегии и стремились к выигрышу крупных банков, даже когда разумнее было бы сбросить карты.
  • Неудачный блеф: ИИ часто пытались блефовать, но их попытки проваливались из-за неверной оценки рук оппонентов, а не из-за хитроумного обмана.
  • Проблемы с контекстом: Модели иногда неверно интерпретировали ситуацию и забывали свою «позицию» за столом, что является проблемой не только в покере.

Этот эксперимент — яркое напоминание, что даже самые мощные ИИ имеют свои недостатки. Они учатся выносить вероятностные суждения под давлением, но все еще могут ошибаться. И хотя вы вряд ли встретите языковую модель за реальным покерным столом, вы наверняка будете взаимодействовать с ней при принятии важных решений. Эта игра дает нам представление о том, как это может выглядеть.

*Meta — признана на территории России экстремистской организацией.

    7

    Добавить комментарий