Este es el único sistema de IA que ha mejorado el desempeño de jugadores de póker en una partida con participantes múltiples.
En los últimos años, ha habido grandes avances en IA y los juegos han servido para facilitar este progreso. En el pasado dichos avances se han producido, sobre todo, en juegos con dos jugadores.
Para sus experimentos, los autores del estudio, Noam Brown y Tuomas Sandholm, emplearon la "abstracción de acción" y la "abstracción de información" para reducir el número de acciones que IA necesitaba tomar en cuenta en una partida.
Para ello, desarrollaron un programa de IA, que bautizaron como "Pluribus", que aprendió a jugar partidas sin límite de seis jugadores de póker "Texas Hold'em" compitiendo contra cinco copias de sí misma.
Al jugar contra esas cinco réplicas, este sistema de IA produjo una estrategia de juego fuera de línea, que los científicos denominaron plan de acción, con lo que a la hora de jugar contra oponentes reales "Pluribus" mejoró dicha estrategia buscando otra más efectiva en tiempo real para enfrentarse a las situaciones que se encontró durante la partida.
Cuando se puso la IA contra cinco jugadores de élite profesionales de póker, o cinco copias de Pluribus contra un competidor real, el ordenador actuó significativamente mejor en unas 10.000 manos del juego de cartas.
"Pluribus" confirmó la noción humana convencional por la que igualar una apuesta "ciega grande", en vez de tirar las cartas o subirla, no es la mejor opción para los jugadores, excepto para el que tenga la "ciega pequeña", que ya dispone de la mitad de la apuesta "ciega grande" del bote según las reglas, dijo el estudio.
En consecuencia, ese jugador debe invertir solo la mitad de lo que han de poner los otros para igualar la apuesta.
latimes.com
Etiquetas: InteligenciaArtificial Facebook