Google ha comenzado a desplegar Veo, su generador de videos basado en inteligencia artificial, para clientes empresariales, y ya ha presentado una nueva versión, Veo 2, que está disponible en una vista previa para los probadores tempranos. Esta actualización promete una mayor comprensión de los elementos cinematográficos, permitiendo que los usuarios hagan referencias a géneros de cine, efectos visuales específicos y tipos de lentes en sus instrucciones para el modelo. Además, la compañía ha destacado que Veo 2 muestra avances significativos en la comprensión de la física real y el movimiento humano, un desafío persistente para los modelos generativos. Aunque aún no se han probado estos avances en situaciones complejas, como en la creación de un video de una rutina de gimnasia, Google asegura que los artefactos visuales, como los dedos adicionales, aparecerán con menos frecuencia.
En paralelo, Google ha mejorado su modelo de texto a imagen, Imagen 3. Esta nueva versión produce imágenes más brillantes, bien compuestas y con una mayor precisión en la representación de estilos artísticos diversos. La fidelidad a las indicaciones de los usuarios también ha mejorado, respondiendo a las críticas anteriores sobre su capacidad para seguir los prompts de manera fiel. Imagen 3 ya está disponible para más de 100 países a través de Google Labs y su plataforma ImageFX.
Veo 2, por su parte, será accesible de forma gradual para los usuarios de Google Labs en Estados Unidos, pero con una limitación de hasta ocho segundos de metraje en calidad 720p. En comparación, otras plataformas, como Sora, permiten generar hasta 20 segundos de video en 1080p, pero requieren una suscripción mensual de $200. Esta implementación refleja el esfuerzo continuo de Google por mejorar la capacidad de sus herramientas basadas en IA, adaptándolas mejor a las necesidades y expectativas de sus usuarios.