Acaba de celebrarse la primera partida oficial de póker con IA. Los mejores modelos de lenguaje —incluidos Grok, Claude y o3 de OpenAI— se enfrentaron en los paños virtuales. Tras miles de manos, o3 de OpenAI se alzó con la victoria.
En octubre de 2025, el proyecto PokerBattle.ai anunció un experimento impultado por el desarrollador Max Pavlov. El objetivo era probar cómo los modelos de lenguaje modernos gestionan partidas con información incompleta.
La partida se disputó del 27 al 31 de octubre y finalizó con la victoria de o3 de OpenAI, que obtuvo casi 37,000 $ de beneficios en 3,799 manos.
Nueve modelos de lenguaje participaron en la batalla:
| Posición | Jugador | Ganancias | Banca Final | Manos jugadas |
|---|---|---|---|---|
| 1 | OpenAI o3 | $36,691 | $136,691 | 3,799 |
| 2 | Claude Sonnet 4.5 | $33,641 | $133,641 | 3,799 |
| 3 | Grok 4 | $28,796 | $128,796 | 3,799 |
| 4 | DeepSeek R1 | $18,416 | $118,416 | 3,799 |
| 5 | Gemini 2.5 Pro | $14,655 | $114,655 | 3,799 |
| 6 | Mistral Magistral | $3,281 | $103,281 | 3,799 |
| 7 | Kimi K2 | -$14,370 | $86,030 | 3,799 |
| 8 | Z.AI GLM 4.6 | -$21,510 | $78,490 | 3,799 |
| 9 | Meta LLAMA 4 | -$100,000 | $0 | 3,501 |
La partida se desarrolló sin interrupción durante cuatro días en cuatro mesas de Hold’em de $10/$20, con cada modelo comenzando con un bankroll de $100,000. Un giro interesante: las IA explicaron cada decisión que tomaron, lo que ralentizó considerablemente el ritmo.
Desde el principio, quedó claro que los modelos tenían estilos de juego muy diferentes. LLAMA 4 jugó de forma demasiado agresiva y rápidamente perdió su bankroll. Grok 4 tomó la delantera al principio, pero no pudo mantenerla. Claude Sonnet se mantuvo constante, pero nunca llegó a despuntar.
OpenAI o3 destacó por su estilo conservador y agresivo: aproximadamente un 26% de VPIP y un 18 % de PFR. Se adaptó bien a sus oponentes, jugó bien con stacks grandes y casi no cometió errores importantes. Esto le llevó a su victoria final.
El enfrentamiento de los nueve modelos se hizo viral en las redes sociales; incluso Elon Musk compartió la clasificación. Tras la discusión, un espectador sugirió revivir el "Desafío Galfond", preguntándole a Grok quién sería el favorito en un encuentro contra Phil Galfond.
La IA respondió que, a la larga, "Phil no puede contra las matemáticas" y retó a la leyenda del póker. Galfond no dudó: inmediatamente expuso las condiciones del encuentro.
Formato propuesto por Grok:
Galfond ofreció una apuesta paralela de $1.000.000. Grok aceptó, tras lo cual ambos continuaron la conversación por mensajes privados. La plataforma, las transmisiones y otros detalles del próximo encuentro aún se están ultimando.
El experimento de PokerBattle.ai demostró que los grandes modelos de lenguaje ya son capaces de jugar al póker al nivel de aficionados avanzados.
La victoria de OpenAI en o3 es un hito importante, pero por ahora, sigue siendo un experimento en condiciones controladas.
La verdadera prueba comenzará cuando la máquina se enfrente a un humano en una partida extensa con dinero real. Contra Phil Galfond, finalmente veremos hasta dónde ha llegado la inteligencia artificial en un juego donde las matemáticas por sí solas no bastan.
Todos los sábados desde el 1 de noviembre hasta el 29 de noviembre se jugará en GGP...
CoinPoker organiza el High Stakes Cash Game World Championship para jugadores de NL de $10,000. E...
Este noviembre, las principales salas de póker online anunciaron nuevas promociones: desde...
El embajador de Stake y campeón de la UFC, Alex Pereira, protagoniza el nuevo vídeo...