DeepMind, conocida por sus avances en juegos como Go y ajedrez, sorprende nuevamente con su última investigación. Han presentado un agente de IA llamado Scalable Instructable Multiworld Agent (SIMA), capaz de comprender y ejecutar tareas en juegos 3D basándose en instrucciones en lenguaje natural.
En colaboración con estudios como Hello Games, Tuxedo Labs y Coffee Stain, DeepMind entrenó a SIMA en nueve juegos diferentes, incluyendo No Man’s Sky, Teardown, Valheim y Goat Simulator 3. Este agente de IA generalista puede realizar una amplia gama de tareas, desde navegación simple hasta fabricación de objetos, todo sin necesidad del código fuente del juego ni acceso a API.
Lo más impresionante es que SIMA puede operar en casi cualquier entorno virtual, utilizando la misma entrada de teclado y ratón que un humano. Se evalúa en cientos de habilidades básicas, como girar a la derecha, recoger objetos y realizar tareas basadas en menús, todo en respuesta a instrucciones en lenguaje natural.
Aunque aún en etapas tempranas, esta investigación muestra el potencial de desarrollar agentes de IA generalistas impulsados por el lenguaje. DeepMind espera que futuras versiones del agente mejoren su capacidad para comprender y ejecutar tareas más complejas, lo que podría revolucionar la forma en que interactuamos con los videojuegos.
Beneficios de SIMA:
- Capacidad para comprender y ejecutar tareas en múltiples entornos de videojuegos.
- Funciona en versiones comerciales de juegos sin necesidad de acceso al código fuente.
- Utiliza instrucciones en lenguaje natural, lo que facilita su interacción con los usuarios.
- Puede realizar una amplia gama de tareas, desde navegación hasta fabricación de objetos.
SIMA representa un emocionante paso adelante en la inteligencia artificial aplicada a los videojuegos, abriendo nuevas posibilidades para la creación de agentes más versátiles y generalizables en el futuro.
Google DeepMind