Zum Hauptinhalt springen
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Logo
  • Alle Artikel
  • 🗒️ Registrieren
  • 🔑 Anmelden
    • 日本語
    • English
    • 中文
    • Español
    • Français
    • 한국어
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message Datenschutzrichtlinie cookie_banner_and Cookie-Richtlinie cookie_banner_more_info

Cookie-Einstellungen

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

Googles KI-Video-Generierungstool „Flow“ entwickelt sich weiter! KI-Kamera erzeugt jetzt auch Ton: Veo 3.1 verändert die Grenzen von „Inszenierung, Bearbeitung und Sound“

Googles KI-Video-Generierungstool „Flow“ entwickelt sich weiter! KI-Kamera erzeugt jetzt auch Ton: Veo 3.1 verändert die Grenzen von „Inszenierung, Bearbeitung und Sound“

2025年10月17日 01:14

Am 15. Oktober (Ortszeit) kündigte Google die neueste Version des Videoerzeugungsmodells "Veo 3.1" und ein großes Update des AI-Filmmaking-Tools "Flow" an, das dieses Modell integriert. In Flow ist es nun möglich, in die Bearbeitung der "Postproduktion" einzutauchen, wie z.B. die Anpassung von Licht und Schatten, und es werden native Audios in mehreren Funktionen generiert. Dies markiert einen Wandel von der herkömmlichen Nutzung, bei der kurze generierte Clips aneinandergereiht werden, hin zu einem "Filmerlebnis", bei dem Inszenierung und Bearbeitung im Wechsel erfolgen. The Verge


Was ist neu: Die Beziehung zwischen den Bearbeitungsfunktionen von Flow und Veo 3.1

Laut einem Bericht von The Verge ermöglicht Flow das nachträgliche Hinzufügen und Anpassen von "Licht und Schatten" in AI-generierten Videos, was eine natürlichere Komposition ermöglicht. Während das Endergebnis so natürlich wird, dass es schwer zu erkennen ist, dass es AI-generiert ist, regt die hohe Realitätstreue auch zum Nachdenken über die Auswirkungen auf die Informationsumgebung an. Darüber hinaus wurde generierter Ton in bestehende Funktionen wie "Ingredients to Video" (Zusammenstellung von Szenen aus mehreren Referenzbildern), "Frames to Video" (Erzeugung von Zwischenbildern aus Start- und Endframes) und "Scene Extension/Extend" (Verlängerung der Szene von der letzten Sekunde auf bis zu etwa eine Minute) integriert. The Verge


Veo 3.1 selbst hat laut Google die Qualität der Umwandlung von Bild zu Video und die Befolgung von Eingabeaufforderungen verbessert, und die Darstellung von "Textur", "Oberfläche" und "Physikalität" wurde verstärkt. Innerhalb von Flow können Objekte durch "Insert (Einfügen)" natürlich eingefügt werden, wobei Schatten und Beleuchtung automatisch angepasst werden. Umgekehrt ist auch eine Funktion zum Entfernen unnötiger Elemente durch "Remove (Entfernen)" in Kürze verfügbar. blog.google


Wo kann es verwendet werden? Wie lang kann es sein?

Google hat angekündigt, Veo 3.1 nicht nur in Flow zu integrieren, sondern es auch über die Gemini API (für Entwickler), Vertex AI (für Unternehmen) und die Gemini-App verfügbar zu machen. The Verge berichtet, dass Veo 3.1 im gleichen Preissegment wie Veo 3 liegt und als "kostenpflichtige Vorschau" über die Gemini API genutzt werden kann. Externe Berichte erwähnen, dass Clips von 4, 6 und 8 Sekunden aus Text/Bild generiert werden können und durch die Szenenverlängerungsfunktion von Flow praktisch auf längere Dauer erweitert werden können (einige Berichte sprechen von maximal etwa 148 Sekunden, aber die tatsächliche Länge hängt von den Einschränkungen der Benutzeroberfläche und der API ab und kann je nach Umgebung variieren).


Der Fokus auf "Ton": Die Bedeutung der nativen Audiogenerierung

Die mit der Veo 3-Generation begonnene Audiogenerierung hat in 3.1 an Kontextanpassung (Dialoge, Umgebungsgeräusche, Soundeffekte) gewonnen. Für Anwendungen, die Bild und Ton in einem Schritt erstellen möchten, wie z.B. Marketingmaterialien oder Schulungsvideos, könnte die bisher notwendige "Nachbearbeitung in einer separaten DAW" reduziert werden. Berichte, die die Auswirkungen im praktischen Kontext hervorheben, sind ebenfalls erschienen, und es gibt viele Stimmen, die eine Vereinfachung der Produktionspipeline erwarten. Venturebeat


Erste Bewertungen von Kreativen: Die Stimmung in den sozialen Medien

 


Unmittelbar nach der Ankündigung bewarb Demis Hassabis von Google Veo 3.1 auf sozialen Medien als "reichhaltigerer Klang und Realismus". Auch das offizielle Google Flow-Konto listete "erweiterte Audiofunktionen" und "verbesserte Bearbeitungsgenauigkeit" auf. Tech-Accounts berichteten über die Einführung von "Veo 3.1 Fast / Quality" und die Verfügbarkeit als kostenpflichtige Vorschau über die Gemini API. Diese Berichte konzentrieren sich hauptsächlich auf die Bewertung der Funktionen, und der Hype ist stark. X (formerly Twitter)


Auf Reddit wird hingegen intensiv über praktische Tests berichtet. Es gibt positive Stimmen wie "Mit Scene Extension können einminütige Aufnahmen erstellt werden" und "Ingredients to Video, das Bilder als Material kombiniert, ist interessant", aber auch kritische Anmerkungen wie "Die Darstellung der Radrotation ist unnatürlich" und "Der Output steht in keinem Verhältnis zum Kreditverbrauch bei Fast und Quality". Im Vergleich zu Konkurrenten wie Sora 2 gibt es Meinungen, dass "Veo bei menschlicher Darstellung und Stimme gut ist", während andere bemängeln, dass "es noch wie ein Standbild wirkt". Die Community beobachtet derzeit die typischen "Schwankungen" einer frühen Einführung. Reddit

Es gibt auch Threads, die die zeitliche Konsistenz des Modells und die Integration von Ton bewerten. Unternehmer präsentieren Produkte, die auf Veo 3.1 basieren, was auf schnelle Bewegungen im umgebenden Ökosystem hinweist. news.ycombinator.com


Nutzen für die Praxis: Gestaltung eines minimalen Workflows

Die Generierungsqualität hat sich stetig verbessert, aber der wahre Wert liegt in der "Verkürzung des Workflows".

  • Pre-Production: ① Grobe Skizzen → ② Materialbilder (Charaktere, Requisiten, Orte) → ③ Festlegung der Tonstrategie (Umgebung, Effekte, Dialoge).

  • Prompt: Material mit "Ingredients to Video" bündeln und bei Bedarf Start/Ende mit "Frames to Video" fixieren.

  • Bearbeitung: Farben, Belichtung und Schatten mit Schiebereglern anpassen, Bildschirm mit "Insert/Remove" ordnen und Aufnahmen mit "Extend" verbinden. Diese Iteration von "Inszenierung → Tonanpassung → erneute Inszenierung" in kurzer Zeit ist der Reiz von 3.1.
    blog.google


Risiken und Vorsorge: Was die Zunahme der Realitätsnähe bedeutet

The Verge weist darauf hin, dass die Verstärkung von Flow es einfacher macht, "schwer als AI-generiert zu erkennende" Videos zu erstellen. Um die Verbreitung von Fehlinformationen in anonymen Räumen nicht zu fördern, ist es wichtig, dass das Team Credits und Ableitungshistorien klar angibt und Ausgabeverwaltung wie Wasserzeichen oder C2PA einrichtet. Die Verbesserung der Generierungsfähigkeiten erfordert gleichzeitig ein Update der Produktionsethik. The Verge


Auswirkungen auf den Markt: Dynamik im Wettbewerb

TechCrunch und 9to5Google betrachten Veo 3.1 in Verbindung mit der Verstärkung der Bearbeitungsfunktionen von Flow und bewerten die Verbesserung der Befolgung von Eingabeaufforderungen und der Qualität von Bild zu Video positiv. Auch Engadget berichtete über "Fortschritte bei der Videoerzeugung aus Bildern". Die vergleichende Bewertung mit Sora 2, Runway Gen-3, Pika und anderen ist unterschiedlich, aber es steht fest, dass Googles "integrierte Produktionsumgebung (Flow+Gemini+Vertex AI)" die Barrieren der Arbeitsteilung senkt. In der Unternehmensnutzung gibt es Potenzial für eine breite Anwendung in Schulungen, Promotionen und In-Game-Inszenierungen, indem "alles inklusive Ton in einem Durchgang" als Waffe eingesetzt wird. TechCrunch 9to5Google



Zusammenfassung: Die Ära von Veo 3.1 und die Kombination von "Inszenierung×Bearbeitung×Ton"

Die Kombination von Veo 3.1 und Flow hat ein neues "Normal" in der AI-Filmproduktion eingeführt, bei dem **Inszenierung (Erzeugung),Bearbeitung (Anpassung) undTon (Kern der Geschichte)** im gleichen Raum ablaufen. Während der Hype und die Bewertung vor Ort noch schwanken, gibt es jetzt die Möglichkeit, von einem rein promptbasierten Ansatz zu einem "Materialdesign→Kontextton→lokale Bearbeitung" überzugehen, was den Kreativen das Gefühl gibt, "ihre eigene Handschrift" zurückzubekommen. Die Frage ist nun, wie weit Ethik, Credits und Urheberrecht in der Praxis umgesetzt werden können. Das ist der nächste entscheidende Punkt. The Verge


Referenzartikel

Googles AI-Videoerzeugungstool verbessert Bearbeitungs- und Audiomöglichkeiten
Quelle: https://www.theverge.com/news/800371/google-veo-3-1-flow-audio

← Zurück zur Artikelliste

Kontakt |  Nutzungsbedingungen |  Datenschutzrichtlinie |  Cookie-Richtlinie |  Cookie-Einstellungen

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Alle Rechte vorbehalten.