Este es el algoritmo al que ningún humano ha logrado ganar jugando al póker

Calcula y se anticipa a todos los movimientos posibles en menos de una milésima de segundo.

Por primera vez, un algoritmo informático es mucho mejor jugando al Texas Hold'em Poker que cualquier ser humano. El desarrollo de este algoritmo, que hasta ahora está siendo todo un éxito, no se va a limitar al terreno de los juegos de azar, ya que también puede ayudar a desarrollar estrategias que maximicen el rendimiento en una negociación comercial o minimicen el riesgo de ataques terroristas, incluso si un adversario conoce la estrategia de defensa.

La programación de este algoritmo, y su resultado en las pruebas que se han llevado a cabo, ha supuesto un gran paso hacia la comprensión de los juegos que están más cerca de los problemas del mundo real. De hecho, se basa en la misma tecnología con la que se creó el súper ordenador que derrotó al campeón de ajedrez ruso Garry Kasparov en 1997.

Cada partida es perfecta

El algoritmo es el primero en abordar un juego basado en información imperfecta que va cambiando continuamente, y en el que los participantes no tienen un conocimiento completo de todas las jugadas anteriores. Así como los jugadores de póquer deben actuar sin saber qué cartas tiene su oponente, los investigadores quieren algoritmos que puedan tomar decisiones efectivas basadas en conjuntos de datos sólidos pero incompletos.

Durante décadas, los científicos han tratado de crear algoritmos capaces de derrotar a seres humanos combinando la destreza de cálculo de la computación con las estrategias de toma de decisiones de la teoría de juegos. Esta teoría pertenece a la rama de las matemáticas que calcula estrategias óptimas en encuentros competitivos. En 2007, un grupo de investigadores crearon un algoritmo imbatible para el juego de las damas, simulando las acciones de los jugadores que hacían el movimiento perfecto en cada turno. Fue un logro impresionante, pero el algoritmo tenía una tarea relativamente sencilla: para cada turno, revisaría las posiciones de todas las piezas, evaluaría sus opciones y luego escogería la mejor opción.

Todo se basa en los datos

En cualquier juego de azar, los humanos están muy limitados en lo que se refiere a almacenar los datos de cada una de las jugadas o conocer qué cartas quedan en la baraja teniendo en cuenta las que se han repartido. Otro problema es que los jugadores, en este caso de póquer, son impredecibles. En las damas, la mejor jugada en una situación determinada es la misma para todos los juegos. Pero en el póquer es aconsejable tirarse un farol de vez en cuando para despistar al oponente. Y es aquí donde el humano tiene cierta ventaja, ya que la mayoría de los algoritmos no pueden hacer frente a ese tipo de incertidumbres en el juego.

Al generar un conjunto óptimo de probabilidades para cada escenario posible en una mano, los investigadores se aseguraron de que el algoritmo nunca perdería dinero a largo plazo a pesar de perder algunas manos. Más allá del póquer, los científicos pueden aplicar esta combinación sin precedentes de inteligencia artificial y teoría de juegos a problemas importantes del mundo real.

REFERENCIAS:

Science (artículo) / Centro de Investigación Thomas J. Watson de IBM de Nueva York / Universidad de Alberta / Computer Poker Research Group.

Continúa leyendo