Crear música "aparentemente auténtica" en 30 segundos: La realidad de los derechos de autor que plantea la nueva función de Gemini

Crear música "aparentemente auténtica" en 30 segundos: La realidad de los derechos de autor que plantea la nueva función de Gemini

"Convertir la 'atmósfera' que se te ocurre directamente en sonido". Esa experiencia finalmente se está acercando a ser una función estándar en las aplicaciones de chat.

Google ha integrado el modelo de generación de música "Lyria 3" de Google DeepMind en la aplicación Gemini, permitiendo generar pistas musicales de 30 segundos a partir de texto o imágenes. El objetivo no es tanto la "producción automática de grandes éxitos", sino más bien una entrada ligera y fácil de compartir para añadir BGM a mensajes y recuerdos cotidianos.


Lo que ahora es posible: obtener instantáneamente un "sonido que se siente adecuado" de 30 segundos

Hay tres puntos clave en esta ocasión.
El primero es que la "composición" se completa dentro de la pantalla de Gemini. No es necesario cambiar a otra aplicación; simplemente llama a la generación de música desde el menú de herramientas e ingresa un prompt para recibir una pista de 30 segundos.

El segundo es que la entrada no se limita solo a "texto". No solo se puede especificar "género", "estado de ánimo", "tempo", etc. a través de texto, sino que también se ha preparado una guía para crear canciones basadas en fotos o videos. Por ejemplo, se puede proporcionar una foto de un perro durante una caminata y crear una canción con letra que coincida con esa atmósfera.


El tercero es que se ofrece un "paquete completo" que incluye letra y opciones de compartir. Lyria 3 puede generar letras automáticamente sin que el usuario las proporcione, y la canción terminada viene con una portada para compartir. Google lo posiciona como "una forma divertida y única de expresarse fácilmente".


Las condiciones de provisión son para mayores de 18 años y se ofrece en varios idiomas, incluido el japonés. Primero se proporcionará en escritorio y luego se expandirá gradualmente a dispositivos móviles.


¿Desaparecerá la "sensación de IA generativa"? Lyria 3 enfatiza la "realidad" y el "control"

En las explicaciones de Google destaca la afirmación de que se puede crear música "más realista y compleja". Además de la generación automática de letras, se menciona como mejora la facilidad para controlar elementos como el estilo, la vocalización y el tempo. En otras palabras, no es simplemente un "gacha", sino que se ha orientado hacia una dirección que se acerca más a la imagen deseada.


Sin embargo, actualmente hay una limitación de 30 segundos. En las redes sociales, las opiniones están divididas: "es corto, pero suficiente para videos cortos o memes" y "precisamente porque es corto, parece que la producción en masa se acelerará". En la era de los videos cortos, la música a menudo tiene valor en los "pocos segundos iniciales" más que en la duración completa. Los 30 segundos parecen estar diseñados precisamente para eso.


Impacto en YouTube Shorts: ¿Se convertirá en norma tener BGM "preparado"?

Google también ha introducido Lyria 3 en Dream Track de YouTube, apoyando la creación de bandas sonoras para videos cortos. Si la música AI de corta duración se convierte en "la última pieza de la edición de video", el flujo de trabajo de los creadores cambiará definitivamente.


Aquí es donde entran en juego la "velocidad de generación" y la "baja barrera del idioma". Probar múltiples BGM para adaptarse al tempo del video generalmente requiere esfuerzo, pero si simplemente comunicar el estado de ánimo en un chat genera opciones, el número de intentos aumentará incluso fuera de entornos profesionales. En las redes sociales, también hay publicaciones que lo ven positivamente desde la perspectiva del marketing y la creación rápida de borradores.


El punto más candente: derechos de autor y "qué es el dato de aprendizaje"

Cuando surge el tema de la música AI, siempre aparece la cuestión de los derechos de autor y los datos de aprendizaje. Google ha declarado que no se trata de "imitar a artistas existentes, sino de expresión original", y explica que incluso si se introduce el nombre de un artista específico, se interpretará como "atmósfera o estado de ánimo". Además, se menciona un filtro para verificar similitudes con contenido existente y un canal para reportar infracciones de derechos.


Por otro lado, medios externos y comentarios de la industria señalan que "no se ha revelado el detalle de las fuentes de aprendizaje". Ha habido antecedentes de litigios y conflictos en torno a la música AI, y en esta ocasión también, la "transparencia que se pueda ofrecer" parece ser crucial para la aceptación.


Distinguir "sonido hecho por IA": el significado de SynthID y la función de detección

Otro aspecto importante es "SynthID", que incrusta información de identificación en la música generada. Las pistas creadas en Gemini tienen una marca de agua, y la función para verificar "si este audio fue creado por la IA de Google" también se expandirá en Gemini. Es decir, la detección se extiende al audio, además de las imágenes y videos.


En las reacciones de las redes sociales, las opiniones están divididas. Los que lo acogen ven "tranquilidad si hay etiquetado" y "al menos se puede disuadir el 'fingir que lo hizo un humano'". Por otro lado, los escépticos señalan "¿no se puede eludir la marca de agua?" y "si la detección no se convierte en un estándar general, su significado es limitado". Además, debido a la naturaleza de "producción en masa de 30 segundos", persisten preocupaciones de que podría convertirse en un caldo de cultivo para el fraude de streaming y el engaño de contenido.


Reacciones en las redes sociales: el entusiasmo y el rechazo crecen al mismo tiempo

Lo emblemático de este tema es que "¡parece divertido!" y "da miedo" se vuelven virales al mismo tiempo.


Lado positivo (juego, expresión, ahorro de tiempo)

  • La idea de "añadir BGM a eventos cotidianos" es intuitiva y fácil de convertir en meme. Como ejemplo, Google ha demostrado que incluso temas tontos como "R&B del amor de los calcetines" pueden funcionar.

  • Desde el ámbito del marketing y la planificación, se habla de la ventaja de poder crear rápidamente propuestas de sonido, destacando su valor como "prototipado" en lugar de un "reemplazo completo" para uso profesional.


Lado de las preocupaciones (uso indebido, derechos de autor, etiquetado)

  • En la comunidad de música AI de Reddit, aunque se acepta la IA como asistente de creación, se observa preocupación por las acciones de "producir en masa y fingir que son obras humanas / ganar dinero de manera fraudulenta".

  • En los medios de la industria, hay una percepción de preocupación por la falta de transparencia en los datos de aprendizaje, y solo "promover un desarrollo responsable" no es suficiente para convencer.


Al final, el punto de divergencia en las reacciones se centra en "¿para quién es esta función?". Si se trata de una extensión del juego o la expresión personal, es más probable que sea bien recibida. Sin embargo, desde el momento en que se monetiza en plataformas de distribución o se introduce en la distribución musical existente, los derechos, el etiquetado y las medidas contra el uso indebido se convierten rápidamente en un "problema social".


Lo que podría suceder: ¿la música pasará de ser un "producto creado" a un "estado de ánimo generado"?

La integración de Lyria 3 simboliza la tendencia de la música a pasar de ser "algo que se crea y se completa" a "algo que se genera cuando se necesita". BGM para videos cortos, jingles para presentaciones, bandas sonoras para días personales especiales: esos "sonidos que solo necesitan tener valor en el momento del consumo" son compatibles con la IA generativa.


Por otro lado, si el debate sobre derechos y transparencia no avanza, la conveniencia se convertirá en combustible para la oposición. Google probablemente está al tanto de este riesgo al destacar SynthID y las funciones de detección.


La "música que se siente adecuada" de 30 segundos puede convertirse tanto en un simple juego como en un gran choque industrial. La nueva función de Gemini podría estar cuestionando no tanto el futuro de la música, sino "hasta qué punto se pueden rehacer las reglas de creación y distribución".



Fuente URL