¡La herramienta de generación de videos con IA de Google, "Flow", evoluciona! La cámara con IA que también genera sonido: Veo 3.1 cambia las fronteras de la "dirección, edición y sonido".

2025年10月17日 01:10

El 15 de octubre (hora local), Google anunció la última versión de su modelo de generación de video "Veo 3.1" y una gran actualización de su herramienta de creación de películas AI "Flow" que incorpora este modelo. En Flow, ahora es posible realizar ediciones más avanzadas como el ajuste de luces y sombras, y se generan voces nativas en múltiples funciones. Esto marca una evolución desde el uso tradicional de conectar clips generados cortos hacia una "experiencia de creación de video" que permite alternar entre dirección y edición. The Verge

¿Qué hay de nuevo?: La relación entre las funciones de edición de Flow y Veo 3.1

Según el informe de The Verge, Flow permite añadir y ajustar "luces y sombras" a los videos generados por AI, logrando una composición más natural. Aunque el resultado es tan natural que es difícil detectar que fue generado por AI, la alta realidad de este avance también invita a reflexionar sobre su impacto en el entorno informativo. Además, se han añadido voces generadas de manera transversal a funciones existentes como "Ingredients to Video" (composición de escenas a partir de múltiples imágenes de referencia), "Frames to Video" (generación de intermedios desde cuadros de inicio/final) y "Scene Extension/Extend" (extensión de escenas desde el último segundo hasta aproximadamente un minuto). The Verge

Google explica que Veo 3.1 en sí ha mejorado la calidad de conversión de imagen a video y la adherencia a los prompts, reforzando la expresión de "textura", "sensación física" y "calidad táctil". Dentro de Flow, se pueden insertar objetos de manera natural con "Insert", integrando automáticamente sombras e iluminación. Por otro lado, la función de "Remove" para eliminar elementos innecesarios también está "próximamente disponible". blog.google

¿Dónde se puede usar? ¿Cuál es la duración?

Google ha anunciado que, además de integrar Veo 3.1 en Flow, también estará disponible en Gemini API (para desarrolladores), Vertex AI (para empresas) y la aplicación Gemini. The Verge informa que Veo 3.1 está disponible como una "vista previa de pago" en Gemini API al mismo rango de precios que Veo 3. Informes externos mencionan que, aunque la generación básica de clips es de 4, 6 y 8 segundos a partir de texto/imágenes, la función de extensión de escenas de Flow permite una expansión efectiva a clips más largos (algunos informes sugieren hasta 148 segundos, aunque esto depende de las restricciones de UI y API, por lo que la duración real puede variar según el entorno).

El protagonismo del "sonido": El significado de la generación de voces nativas

La generación de sonido que comenzó con la generación Veo 3 ha aumentado su riqueza contextual (diálogos, sonidos ambientales, efectos de sonido) en la versión 3.1. Para usos que desean crear video y sonido de manera integral, como materiales de marketing o videos de capacitación, podría reducirse la necesidad de "ajustar el sonido en un DAW separado". Hay informes que enfatizan el efecto en contextos laborales, y muchas voces esperan una simplificación del flujo de trabajo de producción. Venturebeat

Revisiones iniciales de los creadores: La atmósfera en las redes sociales

Inmediatamente después del anuncio, en las redes sociales, Demis Hassabis de Google promocionó Veo 3.1 como "sonido más rico y realismo". La cuenta oficial de Google Flow también enumeró "mejora en la voz" y "mayor precisión en la edición". Desde cuentas tecnológicas, se reportó rápidamente "Veo 3.1 Fast / Quality disponible" y "disponible en vista previa de pago en Gemini API". Estas evaluaciones se centran principalmente en las características funcionales, y el entusiasmo es notable. X (anteriormente Twitter)

Por otro lado, en Reddit se comparte activamente la verificación práctica. Hay comentarios positivos como "puedes crear tomas de un minuto con Scene Extension" y "es interesante 'Ingredients to Video' que sintetiza a partir de imágenes". Sin embargo, también hay críticas como "la representación de la rotación de las ruedas es antinatural" y "el consumo de créditos en Fast y Quality no compensa la salida". En comparación con competidores como Sora 2, hay opiniones de que "Veo es bueno en actuación y voz humana", mientras que otros señalan que "queda una apariencia de imagen fija", lo que divide las evaluaciones. La comunidad observa una "oscilación" típica del despliegue inicial. Reddit

Se han creado hilos donde se comentan la coherencia temporal del modelo y la integración del sonido. También se observa un rápido movimiento en el ecosistema circundante, como la presentación de productos con capas propias sobre Veo 3.1 por parte de emprendedores. news.ycombinator.com

Utilidad en el trabajo: Cómo dibujar un flujo de trabajo mínimo

La calidad de generación ha mejorado constantemente, pero el verdadero valor está en la "reducción del flujo de trabajo".

Preproducción: ① Boceto de storyboard→② Imágenes de materiales (personajes, accesorios, lugares)→③ Decidir la política de sonido (entorno/efectos/diálogos).
Prompt: Agrupar materiales con "Ingredients to Video", fijar inicio/fin según sea necesario con "Frames to Video".
Edición: Ajustar con deslizadores de color, exposición y sombras, organizar la pantalla con "Insert/Remove", y conectar tomas con "Extend". La atracción de 3.1 es que permite repetir rápidamente el ciclo de "dirección→ajuste de sonido→redirección".
blog.google

Riesgos y precauciones: Lo que significa el aumento del realismo

The Verge señala que el fortalecimiento de Flow facilita la creación de videos "difíciles de detectar como generados por AI". Para no fomentar la difusión de desinformación en espacios anónimos, es importante que el equipo establezca la indicación de créditos e historial de derivación, así como la gestión de salida con marcas de agua y C2PA. La mejora en la capacidad de generación también exige una actualización de la ética de producción. The Verge

Impacto en el mercado: La dinámica con la competencia

TechCrunch y 9to5Google consideran a Veo 3.1 junto con el fortalecimiento de la edición de Flow, evaluando positivamente la adherencia a los prompts y la mejora de calidad de imagen a video. Engadget también informó sobre "progresos en la generación de video a partir de imágenes". Aunque las evaluaciones comparativas con Sora 2, Runway Gen-3, Pika, etc., están divididas, es cierto que el "entorno de producción integral (Flow+Gemini+Vertex AI)" de Google reduce las barreras de la división del trabajo. En el uso empresarial, hay espacio para expandir el uso transversal en capacitación, promoción y dirección dentro de juegos, utilizando como arma la "integración completa hasta el sonido". TechCrunch　9to5Google

Conclusión: La era de Veo 3.1 en "dirección×edición×sonido"

La combinación de Veo 3.1 y Flow ha presentado una "nueva normalidad" en la producción de video AI, donde se maneja **dirección (generación) y edición (ajuste) y sonido (el núcleo de la historia)** en el mismo lugar. Aunque el entusiasmo y la evaluación en el campo aún están fluctuando, ahora que se puede profundizar desde un enfoque de "un solo prompt" a "diseño de materiales→sonido contextual→edición local", los creadores sienten que han recuperado su "sensación de tacto". Lo que queda es ver hasta dónde se puede cubrir con la operación la ética, los créditos y el manejo de derechos de autor. Esa será la próxima área de competencia. The Verge

Artículos de referencia

La herramienta de generación de video AI de Google mejora las funciones de edición y sonido
Fuente: https://www.theverge.com/news/800371/google-veo-3-1-flow-audio

¡La herramienta de generación de videos con IA de Google, "Flow", evoluciona! La cámara con IA que también genera sonido: Veo 3.1 cambia las fronteras de la "dirección, edición y sonido".

¿Qué hay de nuevo?: La relación entre las funciones de edición de Flow y Veo 3.1

¿Dónde se puede usar? ¿Cuál es la duración?

El protagonismo del "sonido": El significado de la generación de voces nativas

Revisiones iniciales de los creadores: La atmósfera en las redes sociales

Utilidad en el trabajo: Cómo dibujar un flujo de trabajo mínimo

Riesgos y precauciones: Lo que significa el aumento del realismo

Impacto en el mercado: La dinámica con la competencia

Conclusión: La era de Veo 3.1 en "dirección×edición×sonido"

OpenAI, ¿reinventando la "composición" musical? ─ La ambición y el impacto de las herramientas de música generativa de OpenAI: El futuro de la creación transformado por la música generativa de OpenAI

¿Hasta qué punto es "original" la IA generativa?: El punto crítico del copyright a través de huellas digitales - Una nueva técnica de negociación de derechos que convierte lo "similar" en una etiqueta de precio

La música AI pasa de "generación" a "producción": ¿Qué cambia con Google×ProducerAI?

¡La IA genera partituras automáticamente! El día en que tu smartphone se convierte en una partitura: Cambios en el aprendizaje musical con SongScription

"Todo el registro de vida por 49 dólares" - El impacto de la adquisición de Bee por Amazon: La sorpresa del dispositivo portátil de IA "Bee"

cookie_banner_title

¿Qué hay de nuevo?: La relación entre las funciones de edición de Flow y Veo 3.1

¿Dónde se puede usar? ¿Cuál es la duración?

El protagonismo del "sonido": El significado de la generación de voces nativas

Revisiones iniciales de los creadores: La atmósfera en las redes sociales

Utilidad en el trabajo: Cómo dibujar un flujo de trabajo mínimo

Riesgos y precauciones: Lo que significa el aumento del realismo

Impacto en el mercado: La dinámica con la competencia

Conclusión: La era de Veo 3.1 en "dirección×edición×sonido"

OpenAI, ¿reinventando la "composición" musical? ─ La ambición y el impacto de las herramientas de música generativa de OpenAI: El futuro de la creación transformado por la música generativa de OpenAI

¿Hasta qué punto es "original" la IA generativa?: El punto crítico del copyright a través de huellas digitales - Una nueva técnica de negociación de derechos que convierte lo "similar" en una etiqueta de precio

La música AI pasa de "generación" a "producción": ¿Qué cambia con Google×ProducerAI?

¡La IA genera partituras automáticamente! El día en que tu smartphone se convierte en una partitura: Cambios en el aprendizaje musical con SongScription

"Todo el registro de vida por 49 dólares" - El impacto de la adquisición de Bee por Amazon: La sorpresa del dispositivo portátil de IA "Bee"