Una IA puede jugar los 57 juegos de Atari

La inteligencia artificial llamada Agent57 ha aprendido a jugar a los 57 videojuegos Atari en el entorno de aprendizaje Arcade, una colección de juegos clásicos que los investigadores utilizan para probar los límites de sus modelos de aprendizaje profundo. Desarrollado por DeepMind, Agent57 utiliza el mismo algoritmo de aprendizaje de refuerzo profundo para lograr niveles de juego sobrehumanos incluso en juegos con los que las IAs anteriores han tenido dificultades. Ser capaz de aprender 57 tareas diferentes hace que Agent57 sea más versátil que los anteriores IA de juegos.

La inteligencia artificial que juega a videojuegos

Lo cierto es que los videojuegos son una gran manera de probar las IA. Proporcionan una variedad de retos que obligan a una IA a idear una serie de estrategias y, sin embargo, tienen una clara medida de éxito, una puntuación contra la que entrenarse.

Hay cuatro juegos Atari en particular que han demostrado ser más difíciles de superar. En «La venganza y la trampa de Moctezuma», la IA debe probar muchas estrategias diferentes antes de dar con una ganadora. Y en Solaris y Esquí puede haber largas esperas entre la acción y la recompensa, lo que hace difícil para que una IA pueda aprender qué movimientos son los que mejor se pagan.

Para afrontar estos retos, Agent57 reúne múltiples mejoras que DeepMind ha hecho a su red Deep-Q, la IA que venció por primera vez a un puñado de juegos de Atari en 2012, incluyendo una forma de memoria que le permite basar sus decisiones en cosas que ha visto anteriormente en el juego y sistemas de recompensa que animan a la IA a explorar sus opciones más a fondo antes de decidirse por una estrategia. Estas diversas técnicas son gestionadas por un metacontrolador, que equilibra las compensaciones entre seguir adelante con una estrategia particular y hacer más exploración.

¿Por qué ha supuesto un reto que una inteligencia artificial juegue a videojuegos?

A pesar de su éxito, los mejores modelos de aprendizaje profundo que tenemos hoy en día no son muy versátiles. La mayoría tienden a ser buenos en una cosa y sólo en una cosa. Entrenar una IA para sobresalir en más de una tarea es uno de los mayores retos abiertos en el aprendizaje profundo. La capacidad de aprender 57 tareas diferentes hace que el Agente57 sea más versátil que las IA de juegos anteriores, pero todavía no puede aprender a jugar más de un juego a la vez. Agent57 puede aprender a jugar 57 juegos, pero no puede aprender a jugar 57 juegos a la vez. Necesita volver a entrenarse para cada nuevo juego aunque puede usar el mismo algoritmo para hacerlo. De esta manera el Agent57 es similar al AlphaZero, el algoritmo de aprendizaje de refuerzo profundo de DeepMind, que puede aprender a jugar al ajedrez, al Go y al shogi, pero de nuevo, no todos a la vez.

En definitiva, la verdadera versatilidad, que le llega tan fácilmente a un niño humano, está todavía muy lejos del alcance de AIs.

Noticias y Publicaciones

Nace el primer diccionario multilingüe de terminología Big Data del mundo

Nace el primer diccionario multilingüe de terminología Big Data del mundo

Pretende ofrecer una terminología estándar que facilite la colaboración y entendimiento en Big Data 20 volúmenes componen La Terminología de Big Data, el primer diccionario multilingüe sobre términos y jerga de Big Data, llevado a cabo por el Laboratorio Clave de Estrategia de Big Data en China. ...
La investigación open source sube de nivel con Linux Foundation Research

La investigación open source sube de nivel con Linux Foundation Research

La Linux Foundation Research ​ampliará la comprensión de los proyectos de código abierto con ideas nunca antes vistas La Fundación Linux, una organización sin ánimo de lucro que fomenta la innovación masiva a través del código abierto, ha creado recientemente la Linux Foundation Research, una ...
La Responsabilidad Social Corporativa, más importante aún en la etapa post-COVID

La Responsabilidad Social Corporativa, más importante aún en la etapa post-COVID

En OpenSistemas somos un equipo comprometido con la Responsabilidad Social Corporativa en distintos aspectos de nuestra cultura. Uno de ellos, el deporte. Desde hace años, apoyamos iniciativas de clubes deportivos, como Judo Fontenebro. Con Judo Fontenebro nos sentimos muy identificados, tanto en ...

Al hacer clic en "Aceptar todas las cookies", acepta que las cookies se guarden en su dispositivo para mejorar la navegación del sitio, analizar el uso del sitio y colaborar con nuestros estudios de marketing.    Política de Cookies

Los ajustes de cookies en esta web están configurados para «permitir las cookies» y ofrecerte la mejor experiencia de navegación posible. Si sigues usando esta web sin cambiar tus ajustes de cookies o haces clic en «Aceptar», estarás dando tu consentimiento a esto.

Cerrar