In 30 Sekunden massenhaft „ähnliche Musik“ produzieren – Die neue Funktion von Gemini konfrontiert uns mit der Realität des Urheberrechts

In 30 Sekunden massenhaft „ähnliche Musik“ produzieren – Die neue Funktion von Gemini konfrontiert uns mit der Realität des Urheberrechts

„Die Idee, die man hat, direkt in Klang umzusetzen.“ Diese Erfahrung rückt nun endlich als Standardfunktion in Chat-Apps näher.

Google hat das Musikgenerierungsmodell „Lyria 3“ von Google DeepMind in die Gemini-App integriert, sodass 30-sekündige Musiktracks aus Texten und Bildern generiert werden können. Ziel ist es weniger, „Meisterwerke automatisch zu erzeugen“, sondern vielmehr einen leichten und einfach zu teilenden Einstieg in die kreative Gestaltung von Alltagsnachrichten und Erinnerungen mit Hintergrundmusik zu bieten.


Was jetzt möglich ist: 30 Sekunden „passender Klang“ erscheinen im Handumdrehen

Es gibt drei wesentliche Punkte in diesem Update.
Der erste Punkt ist, dass die „Komposition“ innerhalb des Gemini-Bildschirms abgeschlossen wird. Es ist nicht notwendig, zu einer anderen App zu wechseln; man ruft einfach die Musikgenerierung aus dem Werkzeugmenü auf und gibt einen Prompt ein, um einen 30-sekündigen Track zu erhalten.

Der zweite Punkt ist, dass die Eingabe nicht nur auf „Text“ beschränkt ist. Neben der Möglichkeit, Genre, Stimmung und Tempo per Text zu spezifizieren, gibt es auch eine Option, Musik basierend auf Fotos oder Videos zu erstellen. Beispielsweise könnte man ein Foto eines Hundes beim Wandern übergeben und ein Lied mit Text erstellen lassen, das zur Stimmung passt.


Der dritte Punkt ist, dass die Liedtexte und das Teilen in einem „Paket“ enthalten sind. Lyria 3 kann die Liedtexte automatisch generieren, ohne dass der Nutzer sie bereitstellen muss, und das fertige Lied wird mit einem Cover-Art für die gemeinsame Nutzung versehen. Google bezeichnet dies als eine „unterhaltsame und einzigartige Methode, um sich ungezwungen auszudrücken“.


Die Bereitstellungsbedingungen richten sich an Personen ab 18 Jahren und werden in mehreren Sprachen, einschließlich Japanisch, angeboten. Zunächst wird es auf dem Desktop bereitgestellt und schrittweise auf mobile Geräte ausgeweitet.


Wird der „AI-generierte Klang“ verschwinden? Lyria 3 betont „Realismus“ und „Kontrolle“

Google hebt hervor, dass es möglich ist, „realistischere und komplexere Musik“ zu erstellen. Neben der automatischen Generierung von Texten wurden die Kontrollelemente für Stil, Gesang und Tempo verbessert. Das bedeutet, dass es nicht nur ein einfaches „Glücksspiel“ ist, sondern eher in die Richtung geht, das Bild näher zu bringen.


Allerdings gibt es derzeit eine Begrenzung auf 30 Sekunden. Auf sozialen Netzwerken wird dies unterschiedlich bewertet: „Kurz, aber für Kurzvideos oder Memes ausreichend“ oder „Gerade weil es kurz ist, könnte die Massenproduktion beschleunigt werden“. In der Ära der Kurzvideos hat Musik oft in den ersten Sekunden mehr Wert als in voller Länge. Die 30 Sekunden scheinen genau darauf abzuzielen.


Auswirkungen auf YouTube Shorts: Wird das „Vorproduzieren“ von BGM zur Norm?

Google bringt Lyria 3 auch in YouTubes Dream Track ein, um die Erstellung von Soundtracks für Kurzvideos zu unterstützen. Wenn kurze AI-Musik das „letzte Puzzlestück der Videobearbeitung“ wird, wird sich der Produktionsfluss der Kreativen definitiv ändern.


Hier kommen die „Schnelligkeit der Generierung“ und die „niedrige Sprachbarriere“ ins Spiel. Es ist normalerweise aufwendig, viele BGM-Muster an das Tempo des Videos anzupassen, aber wenn man einfach die Stimmung im Chat mitteilen kann und Vorschläge erhält, erhöht sich die Anzahl der Versuche, auch außerhalb professioneller Umgebungen. Auf sozialen Netzwerken gibt es auch positive Beiträge, die es aus der Perspektive von Marketing oder Prototyping als „schnelle Erstellung von Entwürfen“ betrachten.


Der heißeste Diskussionspunkt: Urheberrecht und „Was sind die Trainingsdaten?“

Wenn es um AI-Musik geht, tauchen immer die Themen Urheberrecht und Trainingsdaten auf. Google erklärt, dass es sich nicht um das Imitieren bestehender Künstler handelt, sondern um originellen Ausdruck, und selbst wenn ein bestimmter Künstlername eingegeben wird, wird dies als „Stimmung oder Atmosphäre“ interpretiert. Zudem wird auf Filter hingewiesen, die Ähnlichkeiten mit bestehenden Inhalten überprüfen, sowie auf eine Meldestelle für Rechtsverletzungen.


Auf der anderen Seite gibt es in externen Medien und in der Branche Stimmen, die darauf hinweisen, dass die Details der Trainingsdaten nicht offengelegt werden. Im Bereich der AI-Musik gab es bereits Klagen und Konflikte, und auch diesmal könnte die „Transparenz“ entscheidend für die Akzeptanz sein.


„Den von AI erstellten Klang“ erkennen: Die Bedeutung von SynthID und Erkennungsfunktionen

Ein weiterer wichtiger Aspekt ist das Einbetten von Identifikationsinformationen in generierte Musik durch „SynthID“. Tracks, die mit Gemini erstellt wurden, erhalten ein Wasserzeichen, und die Funktion, zu überprüfen, ob dieser Sound von Googles AI erstellt wurde, wird erweitert. Es geht darum, die Erkennung von Bildern und Videos auch auf Audio auszuweiten.


Auch in den Reaktionen auf sozialen Netzwerken gibt es unterschiedliche Bewertungen. Die Befürworter sehen es positiv: „Wenn es eine Kennzeichnung gibt, ist das beruhigend“ oder „Zumindest kann es verhindern, dass jemand vorgibt, es sei von einem Menschen erstellt“. Die Skeptiker hingegen fragen: „Kann das Wasserzeichen nicht umgangen werden?“ oder „Wenn die Erkennung nicht zum allgemeinen Standard wird, hat es wenig Bedeutung“. Zudem gibt es Bedenken, dass die Eigenschaft der „Massenproduktion von 30 Sekunden“ ein Nährboden für Streaming-Betrug oder Inhaltsbetrug sein könnte.


Reaktionen auf sozialen Netzwerken: Begeisterung und Ablehnung wachsen gleichzeitig

Das Symbolische an diesem Thema ist, dass „Es sieht spaßig aus!“ und „Es ist beängstigend“ gleichzeitig im Trend liegen.


Positive Seite (Spiel, Ausdruck, Zeitersparnis)

  • Die Idee, „alltägliche Ereignisse mit BGM zu versehen“, ist intuitiv und leicht zu einem Meme zu machen. Als Beispiel zeigt Google, dass selbst ein albernes Thema wie „R&B der Sockenliebe“ funktioniert.

  • Aus der Perspektive von Marketing und Planung wird der Vorteil hervorgehoben, dass man schnell Entwürfe für Musik erstellen kann, wobei der Wert nicht in der „vollständigen Ersetzung“ für professionelle Zwecke, sondern im „Prototyping“ liegt.


Bedenken (Missbrauch, Urheberrecht, Kennzeichnung)

  • In der Reddit-Community für AI-Musik wird die AI als Unterstützung für die Kreativität akzeptiert, jedoch gibt es Stimmen, die das Problem darin sehen, dass „massiv produziert wird und es als menschliches Werk ausgegeben wird / betrügerisch Geld verdient wird“.

  • In den Branchenmedien gibt es Bedenken über die mangelnde Transparenz der Trainingsdaten, und es herrscht die Meinung, dass es nicht ausreicht, nur „verantwortungsvolle Entwicklung“ zu propagieren.


Letztendlich konzentriert sich der Unterschied in den Reaktionen auf die Frage „Für wen ist diese Funktion gedacht?“. Wenn es um die Erweiterung des persönlichen Spiels oder Ausdrucks geht, wird es eher begrüßt. Aber sobald es um die Monetarisierung auf Distributionsplattformen oder das Eindringen in den bestehenden Musikvertrieb geht, verwandeln sich die Themen Rechte, Kennzeichnung und Missbrauch schnell in „gesellschaftliche Probleme“.


Was in Zukunft passieren könnte: Wird Musik von einem „Produkt“ zu einem „erzeugten Gefühl“?

Die Integration von Lyria 3 symbolisiert einen Trend, bei dem Musik sich von etwas, das „erstellt und fertiggestellt wird“, zu etwas entwickelt, das „bei Bedarf erzeugt wird“. BGM für Kurzvideos, Jingles für Präsentationen, Soundtracks für persönliche Jahrestage – solche „Klänge, die nur im Moment des Konsums wertvoll sind“, passen gut zu generativer AI.


Andererseits, wenn die Diskussion über Rechte und Transparenz nicht Schritt hält, könnte die Bequemlichkeit direkt zum Brennstoff für Widerstand werden. Dass Google SynthID und Erkennungsfunktionen in den Vordergrund stellt, zeigt, dass sie sich dieser Zündstoffe bewusst sind.


30 Sekunden „passende Musik“ können sowohl ein harmloser Spaß als auch ein großer industrieller Konflikt werden. Was die neuen Funktionen von Gemini wirklich in Frage stellen, ist vielleicht weniger die Zukunft der Musik, sondern vielmehr „wie weit die Regeln für Kreativität und Vertrieb neu gestaltet werden können“.



Quellen-URL