Pluribus, la primera IA que vence al póker ante varios rivales simultáneos
Hace poco más de dos años que una Inteligencia Artificial de nombre Libratus hacía historia al vencer por primera vez al hombre jugando al póker en la modalidad de Texas Hold’em en partidas mano a mano, es decir, en las que se enfrentan dos jugadores.
Aquel experimento con Libratus supuso un hito histórico para esta rama de la ciencia, pues lograr superar el raciocinio de un jugador profesional en un juego de información incompleta como es el póker se había intentado en múltiples ocasiones, pero hasta entonces no se había conseguido.
Pues bien, a partir de ese momento los creadores de Libratus, el profesor Tuomas Sandholm y su alumno Noam Brown en la Carnegie Mellon University de Pensilvania, se pusieron manos a la obra para desarrollar su software e ir un poco más lejos con la intención de enfrentarlo en una mesa con al menos otros cinco jugadores.
La complejidad que le otorga la cantidad de variables que supone aumentar el número de jugadores lo convertía en un importante desafío, pero el ‘bot’, en esta ocasión Pluribus, de nuevo ha salido airoso.
Los rivales no eran cualquier cosa, sino que se reunía a un grupo de 15 jugadores profesionales de póker entre los que se encontraban algunos de los más prestigiosos del planeta. Uno de los más destacados ha sido sin duda Chris Ferguson, el mediático jugador estadounidense que acumula casi 10 millones de dólares en ganancias de torneos en vivo y que ha conseguido hasta 6 brazaletes de campeón en las Series Mundiales de Póker (WSOP). Eso sí, tampoco ha podido evitar morder el polvo ante Pluribus.
No hay que perder de vista que el póker es sin lugar a dudas el deporte mental que más se le ha resistido a las IA, y ello ha provocado durante años una incansable carrera en la búsqueda de una máquina capaz de superar al ser humano, que en ocasiones nos recordaba aquellos modelos para vencer a la probabilidad a la hora de enfrentarse a una ruleta y que en su día se prolongaron por décadas sin una solución concluyente.
El nuevo proyecto de Pluribus
Para este nuevo proyecto los científicos han contado incluso con el apoyo de la división de IA de Facebook y del Pentágono a través de la Oficina de Investigaciones del Ejercito, además de la Fundación Nacional para la Ciencia de EE UU. Al margen de esto, el fundador y CEO de la red social, Mark Zuckerberg, repartía 50.000 euros entre los 15 jugadores profesionales que se distribuirían en función de sus méritos mientras disputaban 10.000 manos frente a Pluribus durante 12 días. No cabe duda que estas entidades están más que interesadas en aplicaciones que pueden llegar a partir de estas tecnologías, al igual que sucede con muchas otras empresas y gobiernos de países, incluido España.
Al igual que Libratus, el nuevo ‘bot’ comienza su aprendizaje desde cero y jugando miles de manos contra sí mismo, de modo aleatorio al principio y posteriormente aprendiendo de su experiencia. De este modo, antes de tomar una decisión durante el desarrollo de una mano, compara la situación con lo almacenado y valora si puede mejorarlo.
Una de las claves del éxito de Pluribus es simplificar en gran medida su juego en lo que se refiere a la información que maneja y la toma de decisiones, enfocando su mirada a lo que vendrá después en lugar de tratar de adelantar acontecimientos. Además, a diferencia de los humanos que tienen en cuenta multitud de factores durante una mano, Pluribus no baraja más de cinco para hacer la mejor jugada. Por ejemplo, durante las combinaciones tiene en cuenta especialmente el valor de las jugadas ganadoras, como parejas, dobles parejas, trio, color, etcétera, pero no valora en el sentido estratégico si un trio puede ser de cuatros o de cincos. Aparte de ello, es totalmente capaz de echar faroles sin que se pueda detectar un patrón en su conducta, o sea, lo que para el ‘bot’ sería un éxito al mostrar su cara de póker.
Para Darren Elias, uno de sus rivales y recordman de títulos World Poker Tour, el fuerte de Pluribus es su facilidad para aplicar estrategias mixtas, o lo que es lo mismo, cambiar su forma de juego de manera completamente aleatoria y consistente. Justamente lo que pretende lograr todo buen jugador humano y que muy pocos consiguen.
En resumen, que en un tiempo récord ha aparecido un nuevo rival en las mesas capaz de dominar un juego con hasta 1.326 manos iniciales posibles y 2.598.960 combinaciones de cartas distintas.