Saltar al contenido principal
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Logo
  • Todos los artículos
  • 🗒️ Registrarse
  • 🔑 Iniciar sesión
    • 日本語
    • English
    • 中文
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message Política de privacidad cookie_banner_and Política de cookies cookie_banner_more_info

Configuración de cookies

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

¡La herramienta de generación de videos con IA de Google, "Flow", evoluciona! La cámara con IA que también genera sonido: Veo 3.1 cambia las fronteras de la "dirección, edición y sonido".

¡La herramienta de generación de videos con IA de Google, "Flow", evoluciona! La cámara con IA que también genera sonido: Veo 3.1 cambia las fronteras de la "dirección, edición y sonido".

2025年10月17日 01:10

El 15 de octubre (hora local), Google anunció la última versión de su modelo de generación de video "Veo 3.1" y una gran actualización de su herramienta de creación de películas AI "Flow" que incorpora este modelo. En Flow, ahora es posible realizar ediciones más avanzadas como el ajuste de luces y sombras, y se generan voces nativas en múltiples funciones. Esto marca una evolución desde el uso tradicional de conectar clips generados cortos hacia una "experiencia de creación de video" que permite alternar entre dirección y edición. The Verge


¿Qué hay de nuevo?: La relación entre las funciones de edición de Flow y Veo 3.1

Según el informe de The Verge, Flow permite añadir y ajustar "luces y sombras" a los videos generados por AI, logrando una composición más natural. Aunque el resultado es tan natural que es difícil detectar que fue generado por AI, la alta realidad de este avance también invita a reflexionar sobre su impacto en el entorno informativo. Además, se han añadido voces generadas de manera transversal a funciones existentes como "Ingredients to Video" (composición de escenas a partir de múltiples imágenes de referencia), "Frames to Video" (generación de intermedios desde cuadros de inicio/final) y "Scene Extension/Extend" (extensión de escenas desde el último segundo hasta aproximadamente un minuto). The Verge


Google explica que Veo 3.1 en sí ha mejorado la calidad de conversión de imagen a video y la adherencia a los prompts, reforzando la expresión de "textura", "sensación física" y "calidad táctil". Dentro de Flow, se pueden insertar objetos de manera natural con "Insert", integrando automáticamente sombras e iluminación. Por otro lado, la función de "Remove" para eliminar elementos innecesarios también está "próximamente disponible". blog.google


¿Dónde se puede usar? ¿Cuál es la duración?

Google ha anunciado que, además de integrar Veo 3.1 en Flow, también estará disponible en Gemini API (para desarrolladores), Vertex AI (para empresas) y la aplicación Gemini. The Verge informa que Veo 3.1 está disponible como una "vista previa de pago" en Gemini API al mismo rango de precios que Veo 3. Informes externos mencionan que, aunque la generación básica de clips es de 4, 6 y 8 segundos a partir de texto/imágenes, la función de extensión de escenas de Flow permite una expansión efectiva a clips más largos (algunos informes sugieren hasta 148 segundos, aunque esto depende de las restricciones de UI y API, por lo que la duración real puede variar según el entorno).


El protagonismo del "sonido": El significado de la generación de voces nativas

La generación de sonido que comenzó con la generación Veo 3 ha aumentado su riqueza contextual (diálogos, sonidos ambientales, efectos de sonido) en la versión 3.1. Para usos que desean crear video y sonido de manera integral, como materiales de marketing o videos de capacitación, podría reducirse la necesidad de "ajustar el sonido en un DAW separado". Hay informes que enfatizan el efecto en contextos laborales, y muchas voces esperan una simplificación del flujo de trabajo de producción. Venturebeat


Revisiones iniciales de los creadores: La atmósfera en las redes sociales

 


Inmediatamente después del anuncio, en las redes sociales, Demis Hassabis de Google promocionó Veo 3.1 como "sonido más rico y realismo". La cuenta oficial de Google Flow también enumeró "mejora en la voz" y "mayor precisión en la edición". Desde cuentas tecnológicas, se reportó rápidamente "Veo 3.1 Fast / Quality disponible" y "disponible en vista previa de pago en Gemini API". Estas evaluaciones se centran principalmente en las características funcionales, y el entusiasmo es notable. X (anteriormente Twitter)


Por otro lado, en Reddit se comparte activamente la verificación práctica. Hay comentarios positivos como "puedes crear tomas de un minuto con Scene Extension" y "es interesante 'Ingredients to Video' que sintetiza a partir de imágenes". Sin embargo, también hay críticas como "la representación de la rotación de las ruedas es antinatural" y "el consumo de créditos en Fast y Quality no compensa la salida". En comparación con competidores como Sora 2, hay opiniones de que "Veo es bueno en actuación y voz humana", mientras que otros señalan que "queda una apariencia de imagen fija", lo que divide las evaluaciones. La comunidad observa una "oscilación" típica del despliegue inicial. Reddit

Se han creado hilos donde se comentan la coherencia temporal del modelo y la integración del sonido. También se observa un rápido movimiento en el ecosistema circundante, como la presentación de productos con capas propias sobre Veo 3.1 por parte de emprendedores. news.ycombinator.com


Utilidad en el trabajo: Cómo dibujar un flujo de trabajo mínimo

La calidad de generación ha mejorado constantemente, pero el verdadero valor está en la "reducción del flujo de trabajo".

  • Preproducción: ① Boceto de storyboard→② Imágenes de materiales (personajes, accesorios, lugares)→③ Decidir la política de sonido (entorno/efectos/diálogos).

  • Prompt: Agrupar materiales con "Ingredients to Video", fijar inicio/fin según sea necesario con "Frames to Video".

  • Edición: Ajustar con deslizadores de color, exposición y sombras, organizar la pantalla con "Insert/Remove", y conectar tomas con "Extend". La atracción de 3.1 es que permite repetir rápidamente el ciclo de "dirección→ajuste de sonido→redirección".
    blog.google


Riesgos y precauciones: Lo que significa el aumento del realismo

The Verge señala que el fortalecimiento de Flow facilita la creación de videos "difíciles de detectar como generados por AI". Para no fomentar la difusión de desinformación en espacios anónimos, es importante que el equipo establezca la indicación de créditos e historial de derivación, así como la gestión de salida con marcas de agua y C2PA. La mejora en la capacidad de generación también exige una actualización de la ética de producción. The Verge


Impacto en el mercado: La dinámica con la competencia

TechCrunch y 9to5Google consideran a Veo 3.1 junto con el fortalecimiento de la edición de Flow, evaluando positivamente la adherencia a los prompts y la mejora de calidad de imagen a video. Engadget también informó sobre "progresos en la generación de video a partir de imágenes". Aunque las evaluaciones comparativas con Sora 2, Runway Gen-3, Pika, etc., están divididas, es cierto que el "entorno de producción integral (Flow+Gemini+Vertex AI)" de Google reduce las barreras de la división del trabajo. En el uso empresarial, hay espacio para expandir el uso transversal en capacitación, promoción y dirección dentro de juegos, utilizando como arma la "integración completa hasta el sonido". TechCrunch 9to5Google



Conclusión: La era de Veo 3.1 en "dirección×edición×sonido"

La combinación de Veo 3.1 y Flow ha presentado una "nueva normalidad" en la producción de video AI, donde se maneja **dirección (generación) y edición (ajuste) y sonido (el núcleo de la historia)** en el mismo lugar. Aunque el entusiasmo y la evaluación en el campo aún están fluctuando, ahora que se puede profundizar desde un enfoque de "un solo prompt" a "diseño de materiales→sonido contextual→edición local", los creadores sienten que han recuperado su "sensación de tacto". Lo que queda es ver hasta dónde se puede cubrir con la operación la ética, los créditos y el manejo de derechos de autor. Esa será la próxima área de competencia. The Verge


Artículos de referencia

La herramienta de generación de video AI de Google mejora las funciones de edición y sonido
Fuente: https://www.theverge.com/news/800371/google-veo-3-1-flow-audio

← Volver a la lista de artículos

Contacto |  Términos de servicio |  Política de privacidad |  Política de cookies |  Configuración de cookies

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Todos los derechos reservados.