La IA ya supera a los humanos en los videojuegos

Deepmind de Google, coopera y aprende por sí sola para atacar y ganar a los humanos en Quake III.

Las máquinas, al parecer, pueden cooperar para hacer frente a su enemigo. ¿El dominio de un  videojuego se traducirá también a otras aplicaciones?

 

La inteligencia artificial ya ha superado a los humanos en juegos como Chess and Go, pero un nuevo algoritmo de DeepMind ahora parece capaz de dejar de lado su racha competitiva para meterse de lleno en algo mucho más desafiante: la cooperación.

De acuerdo con un estudio publicado en la revista Science, los investigadores de DeepMind han diseñado
"agentes" automatizados para que se unan a máquinas y seres humanos para jugar una versión del videojuego Quake III Arena en modo 'Capture the Flag' (CTF), capturar la bandera.

 

Un gran paso



En el campo de la inteligencia artificial, 
esto constituye un gran avance. Nunca antes una máquina ha sido lo suficientemente competente en interacciones sociales complejas, como para predecir cómo se comportarán los demás, para navegar y ganar en juegos de varios jugadores... DeepMind ha calificado el triunfo como "rendimiento a nivel humano"; pero, por supuesto, incluso los juegos más complejos siguen estando muy lejos de la vida real.

En el modo CTF de Quake III, cada uno de los grupos de jugadores intenta capturar la mayor cantidad posible de banderas del otro equipo. Después de comenzar en los campos base en los extremos opuestos de un mapa, los jugadores se lanzan alrededor de un intrincado laberinto de obstáculos, intentando robar la bandera del otro lado y traerla de vuelta a su lado del mapa. Si un jugador es alcanzado por un oponente, es forzado a volver a la base para "reaparecer" y comenzar la caza desde cero.

En el transcurso de 450.000 juegos, comparables a cuatro años de partidas de CTF, los agentes de IA aprendieron a maniobrar a través del laberinto mientras eliminaban y evadían a los oponentes. Las IAs tenían acceso a las mismas reglas que un jugador humano y cada uno aprendía independientemente de su propia experiencia. Al principio, los agentes IA tomaron decisiones al azar, pero a través de una técnica de prueba y error de fuerza bruta, cada uno comenzó a archivar consejos y trucos que aumentarían su tasa de éxito.

 

Máquina VS Humano



Luego,
los investigadores probaron a sus agentes de IA recién entrenados en un torneo que incluyó a 40 jugadores humanos. En algunos casos, los jugadores humanos fueron emparejados con compañeros de IA; en otros, intentaron vencerlos; la salvedad residía en que ninguno de los participantes humanos sabía si sus compañeros de equipo u oponentes eran humanos o máquinas.

Sin embargo, a diferencia de las personas, las IA son capaces de procesar información y reacción casi instantáneamente durante el juego, por lo que
DeepMind incorporó un retraso de 267 milisegundos en el programa. Pero este retoque no nivela completamente el campo de juego.

En promedio,
los equipos IA-IA y humano-IA capturaron más banderas que los pares humano-humano. Y cuando los jugadores humanos expusieron qué compañeros de equipo preferían, la mayoría de ellos eran máquinas.

Sin embargo, en una prueba separada, dos evaluadores de juegos profesionales pudieron superar a los agentes de inteligencia artificial después de 6 horas de entrenamiento en un mapa avanzado.

 

Desde que concluyó el proyecto Quake III Arena, los ingenieros de DeepMind ya han diseñado un segundo sistema que ahora ha dominado la configuración multijugador en Starcraft II, un clásico juego de estrategia ambientado en el espacio. Pero el equipo tiene sus miras puestas en mucho más. Con el tiempo, planean presentar a sus IAs muchos más desafíos.

Pero
la IA aún tiene mucho que aprender y pasará mucho tiempo antes de que estén listos para aplicaciones más avanzadas (y de mayor envergadura).

Incluso los agentes que están acumulando puntos en Quake III Arena no están realmente colaborando como lo hacen los humanos, comenta Mark Riedl, un experto en inteligencia artificial de la
Georgia Tech College of Computing que no participó en el estudio que recoge Science. Cada uno responde individualmente a las condiciones que observa en el juego, mientras que los jugadores humanos pueden comunicarse entre ellos a través de mensajes o mediante una conversación real.

En un campo de batalla real, a la IA aún le quedan muchos escalones por subir y es poco probable que sea pronto. Pero es un avance. La máquina puede aprender sola y, por el momento, la meta de DeepMind no es acabar con nosotros, sino
aumentar su inteligencia para llevar a cabo de forma autónoma tareas cada vez más complejas.

 

Referencia: Human-level performance in 3D multiplayer games with population-based reinforcement learning. Max Jaderberg,Wojciech M. Czarnecki, Iain Dunning, Luke Marris, Guy Lever, Antonio Garcia Castañeda, Charles Beattie, Neil C. Rabinowitz, Ari S. Morcos, Avraham Ruderman, Nicolas Sonnerat, Tim Green, Louise Deason, Joel Z. Leibo, David Silver, Demis Hassabis, Koray Kavukcuoglu, Thore Graepel. Science 31 May 2019: Vol. 364, Issue 6443, pp. 859-865 DOI: 10.1126/science.aau6249

 

 

 

Sarah Romero

Sarah Romero

Fagocito ciencia ficción en todas sus formas. Fan incondicional de Daneel Olivaw y, cuando puedo, terraformo el planeta rojo o cazo cylons. Hasta que viva en Marte puedes localizarme por aquí.

Continúa leyendo