30초 만에 '그럴듯한 음악'을 대량 생산할 수 있는 ─ Gemini의 새로운 기능이 직면한 저작권의 현실

30초 만에 '그럴듯한 음악'을 대량 생산할 수 있는 ─ Gemini의 새로운 기능이 직면한 저작권의 현실

「떠오른 '분위기'를 그대로 소리로 만든다」。그런 체험이 드디어 채팅 앱의 표준 기능에 가까워졌다.

Google은 Gemini 앱에 Google DeepMind의 음악 생성 모델 "Lyria 3"을 통합하여, 텍스트나 이미지에서 30초의 음악 트랙을 생성할 수 있게 했다. 목표는 '명곡의 자동 제조'라기보다는, 일상의 메시지나 추억에 BGM을 붙이는 것 같은, 가볍고 공유하기 쉬운 창작의 입구라고 한다.


무엇이 가능해졌는가: 30초의 '그럴듯한 소리'가 즉석에서 나오는

이번 포인트는 세 가지가 있다.
첫 번째는, Gemini 화면 내에서 '작곡'이 완료된다는 것. 별도의 앱으로 이동할 필요 없이, 도구 메뉴에서 음악 생성을 호출하고 프롬프트를 입력하기만 하면 30초의 트랙이 반환된다.

두 번째는, 입력이 '문자만'으로 제한되지 않는다는 것. 텍스트로 '장르', '무드', '템포' 등을 지정할 뿐만 아니라, 사진이나 동영상을 참고하여 곡을 만드는 경로도 준비되었다. 예를 들어 하이킹 중인 개의 사진을 제공하고, 그 분위기에 맞는 가사가 포함된 곡을 만드는 사용 방법이 예상된다.


세 번째는, 가사와 공유까지 포함하여 '원 패키지'로 되어 있다는 점이다. Lyria 3은 사용자가 가사를 준비하지 않아도 자동 생성할 수 있으며, 완성된 곡에는 공유용 커버 아트도 붙는다. Google은 이를 '가볍게 표현하기 위한, 재미있고 독특한 방법'으로 위치시킨다.


제공 조건으로는, 18세 이상을 대상으로 하며, 여러 언어(일본어 포함)로 전개된다. 먼저 데스크톱에서 제공하고, 모바일로 단계적으로 확장할 설명도 있다.


'생성 AI스러움'은 사라질까? Lyria 3이 강조하는 '현실감'과 '제어'

Google의 설명에서 두드러지는 것은, '더 현실적이고, 더 복잡한 음악'을 만들 수 있다는 주장이다. 가사의 자동 생성에 더해, 스타일, 보컬, 템포 등의 요소를 제어하기 쉽게 한 점을 개선점으로 꼽고 있다. 즉, 단순한 '가챠'가 아니라, 어느 정도 이미지에 맞추는 방향으로 맞췄다.


하지만 현재 시점에서는 30초라는 제한이 있다. SNS에서도 '짧지만, 쇼트 비디오나 밈 용도로는 충분하다', '오히려 짧기 때문에 대량 생산이 가속될 것 같다'는 평가가 엇갈리기 쉽다. 쇼트 비디오 시대의 음악은, 풀 길이보다 '잡기의 수십 초'가 가치를 가지는 장면이 많다. 30초는, 바로 그곳을 노린 설계로 보인다.


YouTube Shorts로의 파급: BGM의 '미리 만들기'가 당연해질까

Google은 YouTube의 Dream Track에도 Lyria 3을 도입하여, 쇼트 비디오용 사운드트랙 만들기를 지원한다. 짧은 AI 음악이 '비디오 편집의 마지막 조각'이 된다면, 크리에이터의 제작 흐름은 확실히 변할 것이다.


여기서 효과를 발휘하는 것이 '생성의 속도'와 '언어의 장벽의 낮음'이다. 영상의 템포에 맞춰 여러 패턴의 BGM을 시도하는 것은 원래 수고가 들지만, 채팅으로 기분을 전하기만 하면 후보가 나온다면, 프로의 현장이 아니더라도 시도 횟수가 늘어난다. SNS상에서도, 마케팅이나 시제품의 관점에서 '러프안을 빠르게 만들 수 있다'고 긍정적으로 받아들이는 게시물이 나오고 있다.


가장 불타기 쉬운 논점: 저작권과 '학습 데이터는 무엇인가'

AI 음악의 화제가 나오면, 반드시 세트로 떠오르는 것이 저작권과 학습 데이터다. Google은 '기존 아티스트의 모방이 아니라, 오리지널 표현을 위해'라고 명확히 하며, 특정 아티스트 이름을 넣은 경우도 '분위기나 무드'로 해석한다고 설명하고 있다. 덧붙여, 기존 콘텐츠와의 유사성을 체크하는 필터나, 권리 침해의 신고 창구에도 언급하고 있다.


한편, 외부 미디어나 업계계의 논조에서는 '학습원의 세부 사항은 밝혀지지 않았다'는 지적도 나오고 있다. AI 음악을 둘러싸고는 소송이나 대립이 계속되어 온 경위가 있으며, 이번에도 '얼마나 투명성을 낼 수 있는가'가 받아들임을 좌우할 것 같다.


'AI가 만든 소리'를 구별하기: SynthID와 검출 기능의 의미

또 하나 중요한 것은, 생성 음악에 식별 정보를 삽입하는 'SynthID'다. Gemini에서 만들어진 트랙에는 워터마크가 부여되며, 더 나아가 Gemini 측에서 '이 음성이 Google의 AI로 만들어졌는지'를 확인하는 기능도 확장된다. 이미지·비디오에 이어 음성에도 검출을 확장한다는 것이다.


SNS의 반응에서도, 여기는 평가가 엇갈렸다. 환영하는 측은 '라벨링이 있다면 안심', '적어도 '인간이 만든 척'을 억제할 수 있다'고 본다. 반대로 회의적인 측은 '워터마크는 회피되지 않을까', '검출이 일반 표준이 되지 않으면 의미가 얕다'고 지적한다. 더 나아가 '30초의 대량 생산'이라는 성질상, 스트리밍 부정이나 콘텐츠 사기의 온상이 될 수 있다는 불안도 뿌리 깊다.


SNS의 리액션: 열광과 거부감이 동시에 증가

이번 화제에서 상징적인 것은, '재미있어 보인다!'와 '무섭다'가 동시에 화제가 되는 점이다.


긍정적인 측면 (놀이·표현·시간 절약)

  • '일상의 사건에 BGM을 붙인다'는 발상이 직관적이며, 밈화되기 쉽다. 실례로 Google은 '양말의 사랑의 R&B' 같은, 장난스러운 주제도 성립할 수 있음을 보여주고 있다.

  • 마케팅·기획 현장에서는, 러프한 음안을 짧은 시간에 만들 수 있는 이점이 언급되며, 프로 용도의 '완전 대체'가 아니라 '프로토타이핑'으로서의 가치가 주목받고 있다.


우려 측면 (부정 이용·저작권·표시)

  • Reddit의 AI 음악 관련 커뮤니티에서는, 창작 보조로서의 AI는 용인하면서도, '대량 생산하여 인간의 작품이라고 속이거나/사기적으로 벌어들이는' 행위야말로 문제라는 취지의 목소리가 보인다.

  • 업계 미디어에서는, 학습 데이터의 투명성 부족을 우려하는 시각이 있으며, '책임 있는 개발'을 내세우기만으로는 납득하기 어려운 분위기도 있다.


결국 반응의 분기점은 '이것은 누구를 위한 기능인가'에 집약된다. 개인의 놀이나 표현의 확장이라면 환영받기 쉽다. 그러나, 배포 플랫폼에서의 수익화나, 기존의 음악 유통에 들어가는 순간부터, 권리·표시·부정 대책이 한꺼번에 '사회적 문제'로 변한다.


앞으로 일어날 일: 음악은 '제작물'에서 '생성되는 기분'으로?

Lyria 3의 통합이 상징하는 것은, 음악이 '만들어 완성하는 것'에서 '필요할 때 생성하는 것'으로 다가가는 조짐이다. 쇼트 비디오의 BGM, 프레젠테이션의 징글, 개인적인 기념일의 사운드트랙──그런 '소비의 순간에만 가치가 있으면 되는 소리'는, 생성 AI와 궁합이 좋다.


한편, 권리와 투명성의 논의가 따라잡지 못하면, 편리함은 그대로 반발의 연료가 되기도 한다. Google이 SynthID나 검출 기능을 전면에 내세우는 것은, 그 불씨를 자각하고 있기 때문일 것이다.


30초의 '그럴듯한 음악'은, 사소한 놀이에도, 거대한 산업 충돌에도 될 수 있다. Gemini의 새로운 기능이 정말로 묻고 있는 것은, 음악의 미래라기보다는, '창작과 유통의 규칙을 어디까지 다시 만들 수 있는가'일지도 모른다.



출처 URL