OpenAI gana la batalla de póker de IA

Autor

Vargoso

Publicado

2/11/2025

Actualizado

2/11/2025

Acaba de celebrarse la primera partida oficial de póker con IA. Los mejores modelos de lenguaje —incluidos Grok, Claude y o3 de OpenAI— se enfrentaron en los paños virtuales. Tras miles de manos, o3 de OpenAI se alzó con la victoria.

La primera partida de póker entre IA

En octubre de 2025, el proyecto PokerBattle.ai anunció un experimento impultado por el desarrollador Max Pavlov. El objetivo era probar cómo los modelos de lenguaje modernos gestionan partidas con información incompleta.

La partida se disputó del 27 al 31 de octubre y finalizó con la victoria de o3 de OpenAI, que obtuvo casi 37,000 $ de beneficios en 3,799 manos.

Nueve modelos de lenguaje participaron en la batalla:

Posición	Jugador	Ganancias	Banca Final	Manos jugadas
1	OpenAI o3	$36,691	$136,691	3,799
2	Claude Sonnet 4.5	$33,641	$133,641	3,799
3	Grok 4	$28,796	$128,796	3,799
4	DeepSeek R1	$18,416	$118,416	3,799
5	Gemini 2.5 Pro	$14,655	$114,655	3,799
6	Mistral Magistral	$3,281	$103,281	3,799
7	Kimi K2	-$14,370	$86,030	3,799
8	Z.AI GLM 4.6	-$21,510	$78,490	3,799
9	Meta LLAMA 4	-$100,000	$0	3,501

La partida se desarrolló sin interrupción durante cuatro días en cuatro mesas de Hold’em de $10/$20, con cada modelo comenzando con un bankroll de $100,000. Un giro interesante: las IA explicaron cada decisión que tomaron, lo que ralentizó considerablemente el ritmo.

El desarrollo de la batalla

Desde el principio, quedó claro que los modelos tenían estilos de juego muy diferentes. LLAMA 4 jugó de forma demasiado agresiva y rápidamente perdió su bankroll. Grok 4 tomó la delantera al principio, pero no pudo mantenerla. Claude Sonnet se mantuvo constante, pero nunca llegó a despuntar.

OpenAI o3 destacó por su estilo conservador y agresivo: aproximadamente un 26% de VPIP y un 18 % de PFR. Se adaptó bien a sus oponentes, jugó bien con stacks grandes y casi no cometió errores importantes. Esto le llevó a su victoria final.

Desafiando a Galfond

El enfrentamiento de los nueve modelos se hizo viral en las redes sociales; incluso Elon Musk compartió la clasificación. Tras la discusión, un espectador sugirió revivir el "Desafío Galfond", preguntándole a Grok quién sería el favorito en un encuentro contra Phil Galfond.

La IA respondió que, a la larga, "Phil no puede contra las matemáticas" y retó a la leyenda del póker. Galfond no dudó: inmediatamente expuso las condiciones del encuentro.

Formato propuesto por Grok:

PLO $100/$200
Duración: 50.000 manos
Entrada: 200 ciegas grandes

Galfond ofreció una apuesta paralela de $1.000.000. Grok aceptó, tras lo cual ambos continuaron la conversación por mensajes privados. La plataforma, las transmisiones y otros detalles del próximo encuentro aún se están ultimando.

Conclusión

El experimento de PokerBattle.ai demostró que los grandes modelos de lenguaje ya son capaces de jugar al póker al nivel de aficionados avanzados.

La victoria de OpenAI en o3 es un hito importante, pero por ahora, sigue siendo un experimento en condiciones controladas.

La verdadera prueba comenzará cuando la máquina se enfrente a un humano en una partida extensa con dinero real. Contra Phil Galfond, finalmente veremos hasta dónde ha llegado la inteligencia artificial en un juego donde las matemáticas por sí solas no bastan.