Google presenta Veo 3.1, su modelo de IA más avanzado para crear video y audio hiperrealistas

Google ha lanzado Veo 3.1, la última versión de su innovador modelo de inteligencia artificial (IA) que permite generar videos a partir de imágenes fijas y descripciones textuales. Este sistema incluye funciones creativas mejoradas que otorgan a los usuarios un mayor control sobre la narrativa de los resultados obtenidos.

“Veo 3.1 proporciona un audio más enriquecido, un control narrativo superior y un realismo incrementado. Se trata de una versión avanzada basada en Veo 3, que ofrece una mayor fidelidad a las instrucciones y una calidad audiovisual optimizada al transformar imágenes en videos”, declaró la compañía.

El nuevo modelo se ha integrado en Flow, el motor de IA cinematográfica de Google. Con esta integración, la herramienta ha añadido por primera vez audio a funciones ya existentes como “Ingredientes a video”, que permite crear clips a partir de varias imágenes de referencia para definir personajes, objetos y estilos visuales; “Fotogramas a video”, que conecta una imagen inicial y una final para generar una transición fluida, y “Extender”, que toma el último segundo de un clip para producir automáticamente un material ampliado de más de un minuto, manteniendo la estética y narrativa del contenido original.

Además, Flow ahora permite añadir o eliminar elementos de una escena, ofreciendo a los usuarios la capacidad de ajustar detalles como sombras e iluminación para lograr una apariencia más natural.

Innovaciones en la Narrativa Audiovisual

“Con funciones de edición más precisas, audio en todas las herramientas existentes y resultados de mayor calidad gracias a Veo 3.1, estamos abriendo nuevas posibilidades para una narración audiovisual más rica y potente directamente desde Flow”, aseguró el equipo de desarrollo de Google.

La empresa también informó que, además de su integración en Flow, Veo 3.1 estará disponible en la aplicación de Gemini y en las API de Vertex y Gemini.


Los videos generados por Veo 3.1 son reconocidos por su realismo, un aspecto que podría dificultar la identificación de estos contenidos como producciones creadas con IA.

Este sistema ha reavivado las preocupaciones sobre el aumento del fenómeno de spam conocido como AI slop o “basura digital”. Esta tendencia, que ha crecido con la expansión de sistemas generativos en plataformas de consumo masivo, no solo complica la distinción entre lo auténtico y lo artificial, sino que también contribuye a la saturación y a la pérdida de confianza de los usuarios.

Desafíos en la Propiedad Intelectual

Google no ha proporcionado detalles específicos sobre el proceso de entrenamiento de Veo 3.1. Sin embargo, un reportaje reciente de CNBC reveló que la compañía ha estado utilizando la vasta biblioteca de YouTube para entrenar sus modelos de IA, incluidos Gemini y Veo 3. Según la empresa, solo se utiliza “una parte” del contenido disponible (más de 20,000 millones de materiales) y se respetan acuerdos específicos con creadores y medios para proteger su propiedad intelectual.

“Siempre hemos utilizado contenido de YouTube para mejorar nuestros productos, y eso no ha cambiado con la IA. También reconocemos la necesidad de establecer salvaguardas, por lo que hemos invertido en protecciones que permitan a los creadores mantener el control sobre su imagen y semejanza en esta nueva era”, declaró un vocero de la plataforma. Sin embargo, varios creadores han afirmado no estar informados sobre estas prácticas ni sobre los convenios mencionados.

El informe advierte que el uso de estos videos con fines de entrenamiento podría desencadenar una crisis de propiedad intelectual. Citando a expertos bajo anonimato, se señala que “aunque el resultado final de Veo 3 no replique directamente obras existentes, el contenido generado alimenta herramientas comerciales que compiten con los creadores cuyos materiales sirvieron de base para el entrenamiento, sin crédito, consentimiento ni compensación”.