Pluribus: ¿el bot-killer de la industria del póker online?

Autor
Vargoso
Publicado
15/7/2019
Actualizado
6/12/2019

Menos de 24h después de una publicación científica y de Facebook acerca de un superbot — Pluribus (una IA que supuestamente puede ganar en 6-max contra pros reales), muchas fuentes incluyendo periódicos, revistas, foros de póker, etc. empezaron a contar los días antes de la muerte del póker online, difundiendo rumores a la velocidad de un incendio forestal. En este artículo intentaremos entender que sucedió realmente.

57309c39d2cd9c399efb575b22d26e07

Pluribus: ¿de qué es capaz el nuevo bot de póker?

Teniendo en cuenta la complejidad de la información acerca de Pluribus, no entraremos en detalle con textos técnicos acerca de su historia, win rates, y principios de operación, y en vez de esto, miraremos una breve lista de sus características, logros, y más importante aún, nos enfocaremos en nuestra propia interpretación del posible impacto de Pluribus en la industria del póker online moderna.

¿Cuáles son las diferencias fundamentables entre Pluribus y otros bots de póker?

  1. Juega 6-max. Todos los bots anteriores, incluyendo el predecesor de Pluribus — Libratus (en 2017 fue el primer bot en vencer al equipo de profesionales de Douglas Polk), solo jugaban heads-up. Sus algoritmos, basados en el equilibrio de Nash, no podían considerar todas las variables en un juego con múltiples jugadores;
  2. Consumo de recursos. De acuerdo con los desarrolladores, Pluribus utilizó una computadora con 128GB de RAM y dos procesadores de 14 núcleos durante el juego, y un servicio en la nube de $150. Por supuesto, este es un equipo poderoso, pero está lejos de las supercomputadoras universitarias que valen millones de dólares;
  3. Nuevo algoritmo para la selección de soluciones. Fue esta mejora la que permitió a Pluribus ir más allá del heads-up y reducir el consumo de recursos. Este bot no revisa todas las posibles soluciones en cada caso, sino que con base a las manos que ya ha jugado, aprende e inmediatamente descarta árboles de solución innecesarios y agrupa aquellos restantes de acuerdo con cada caso.

Algunas fuentes incluyen en esta lista la habilidad de autoaprendizaje del bot (inicialmente solo se le cargaron reglas de póker), pero Libratus también se basada en la base de datos de manos en vez de soluciones pre-fabricadas.

¿En qué condiciones y a quienes venció Pluribus?

La principal razón para la rápida difusión de la información acerca del bot fueron sus resultados contra un grupo de 15 voluntarios, la mayoría de ellos jugadores de póker muy reconocidos: Chris Ferguson, Nick Petrangelo, Greg Merson, Darren Elias, casi todos jugadores de MTT. Como dato interesante, el artículo de Facebook también lista a Linus "LLinusLLove" Loeliger, uno de los jugadores de cash más fuertes del mundo, pero no hay una sola mención sobre él en el artículo científico. Aquí puedes elegir a quien creerle: Facebook o la ciencia.

El juego se desarrolló en el siguiente formato:

  • Una mesa 6-max 50/100 con un stack fijo de 10,000 fichas, sin rake, sin rake, y con bancos de tiempo muy extensos;
  • Tres jugadores en un formato 5 bots + 1 humano que mostraron al final de 10,000 manos un win rate promedio de 3,27 bb/100;
  • El resto de los jugadores participaron un promedio de 4 horas en un formato 1 bot + 5 personas, y al final el bot terminó ganando 4,7bb/100.

A continuación, un vídeo de 5 minutos de Pluribus vs. oponentes reales:

Por lo tanto, todos pueden ver como juega el bot, y sacar sus propias conclusiones sobre sus habilidades.

Pluribus: oportunidades reales e impacto en el póker online

Como resultado, tenemos lo siguiente:

El nuevo bot d epóker, Pluribus, en condiciones que nunca antes habían sido vistas (y no severán en el póker online), mostró un win rate positivo en mesas libres, sin considerar el rake, contra un grupo de jugadores de torneos en vivo (algunos de los cuales con dificultad podrán vencer NL50 hoy en PokerStars). Esto de por sí, es un muy buen resultado para la industria de la inteligencia artificial, que trabaja en ambientes con información incompleta y que podría ayudar a la sociedad en distintos campos. Pero, nosotros estamos interesados en cómo la aparición de Pluribus afectará el póker online moderno. Para un mejor entendimiento, debemos mencionar algunos hechos:

  • El algoritmo de minimización  de pérdidas utilizado (Minimización de Arrepentimiento Monte Carlo Contra factual) es bien conocido por casi todos los solvers;
  • Antes de jugar con personas reales, Pluribus jugó contra si mismo en un servidor con 64 núcleos durante ocho días; esto quiere decir que el proceso de auto-entrenamiento del bot, en teoría, empezó con ocho días de cálculos en un solver con un hardware muy potente, mientras que lo más seguro es que sus rivales no sabían nada acerca de GTO en mesas libres.

El pesimismo en la comunidad del póker debido a la aparición de Pluribus se basó en el hecho de que la información que recibieron fue que un bot autónomo de 6-max con un bajo consumo de recursos había sido creado, y que nuevas versiones o copias podrían ser compradas por algunos cientos de dólares y ser utilizadas en cualquier nivel en un computador casero. Y como resultado, el póker online moderno, como un juego de personas vs. personas, moriría, siguiendo por ejemplo la misma suerte del ajedrez online.

Los miedos son bien fundados, pero no consideran algunos hechos:

  • Primero, los desarrolladores de Pluribus no van a compartir sus algoritmos, y no los utilizarán en póker online. Esto es, el desarrollo de un bot por personas más deshonestas puede llevar más de un año;
  • Segundo, incluso un bot similar a Pluribus no está entrenado para jugar en salas de póker modernas, y dicha adaptación toma tiempo y trae más problemas pues los comentarios sobre su bajo consumo de recursos fueron exagerados, dado que el entrenamiento inicial de dicho bot aún requiere el uso de un computador muy costoso y poderoso;
  • Tercero, incluso si en cinco años hay bots 100 veces mejores que Pluribus, listos para jugar en condiciones reales en salas reales (con rake, stacks dinámicos, bancos de tiempo pequeños, y en varias mesas a la vez), y disponibles para ser comprados a relativamente bajo precio y trabajar en computadoras promedio, esto no quiere decir que las salas de póker estarán sentadas viendo durante todo este tiempo como se desarrolla el software que acabará son su negocio.

El último punto es la diferencia que existe entre el póker online moderno y el ajedrez online, que definitivamente perdió la guerra contra los bots. No solo este elemento pospone la muerte del póker online, pues los dos primero dan la oportunidad de evitar dicho resultado. No vamos a considerar todas las opciones para cambiar las salas de póker, las cuales pueden hacer la vida complicada a los bots, o incluso hacer imposible que puedan utilizarse, pero de seguro dichas medidas aparecerán. Después de todo, incluso aquellas personas que piensan que bots perdedores o even pueden ser beneficiosos para crear acción y generar rake, no pueden negar (con excepción de los amantes del dinero rápido) que bots como Pluribus no son necesarios en las mesas.

Conclusión

Ahora mismo, la desventaja real para la industria del póker online debido a la aparición de Pluribus es la incitación creada por el boom de información que surgió alrededor del tema, lo cual está sujeto a las opiniones de la prensa no relacionada con el póker.  Después de leer los titulares sobre programas que pueden vencer a jugadores profesionales en una mesa de 6-max, jugadores principiantes o personas que quieran empezar a jugar, obviamente tendrán menos deseos de depositar su dinero en dicha industria.

Además, es vital entender que los oponentes de Pluribus fueron jugadores que, en principio, no juegan mesas libres de manera profesional online (solo la elección de Ferguson vale la pena, y ya conocemos su historia), y difícilmente podrían mostrar win rates positivas en niveles bajos en PokerStars. Además, los juegos se llevaron a cabo es un escenario ideal sin rake, bancos de tiempo enormes, y stacks fijos.

Combatir a los bots, incluso en estado actual, es crucial para el futuro del póker online. Pero sim importar que "regalos" recibamos del progreso tecnológico, si los jugadores y afiliados unimos fuerzas para luchar contra este desastre, la posible muerte del póker online se convertirá en un proyecto muy, muy distante.

Síguenos en Twitter para estar al tanto de todas las noticias EV+ que publicamos.

Posts relacionados