สร้างเพลงที่ดูเหมือนจริงได้ใน 30 วินาที - ความเป็นจริงของลิขสิทธิ์ที่ฟังก์ชันใหม่ของ Gemini เผชิญหน้า

สร้างเพลงที่ดูเหมือนจริงได้ใน 30 วินาที - ความเป็นจริงของลิขสิทธิ์ที่ฟังก์ชันใหม่ของ Gemini เผชิญหน้า

“ความคิดที่เกิดขึ้นในใจ” กลายเป็นเสียงเพลงได้ทันที ประสบการณ์นี้กำลังเข้าใกล้การเป็นฟังก์ชันมาตรฐานในแอปแชทแล้ว

Google ได้รวมโมเดลการสร้างเสียงเพลงของ Google DeepMind ที่ชื่อว่า "Lyria 3" เข้าไปในแอป Gemini ซึ่งสามารถสร้างแทร็กเพลง 30 วินาทีจากข้อความหรือภาพได้ เป้าหมายไม่ใช่การสร้างเพลงฮิตอัตโนมัติ แต่เป็นการสร้างสรรค์ที่เบาและแชร์ง่าย เช่น การเพิ่ม BGM ให้กับข้อความหรือความทรงจำในชีวิตประจำวัน


สิ่งที่ทำได้ในตอนนี้: เสียงเพลง 30 วินาทีที่ดูเหมือนจริงสามารถสร้างได้ทันที

จุดเด่นของครั้งนี้มีอยู่สามข้อ
ข้อแรกคือ การสร้างเพลงสามารถทำได้ในหน้าจอของ Gemini โดยไม่ต้องย้ายไปแอปอื่น เพียงแค่เรียกใช้การสร้างเพลงจากเมนูเครื่องมือและใส่คำสั่ง ก็จะได้แทร็ก 30 วินาที

ข้อที่สองคือ การป้อนข้อมูลไม่ได้จำกัดแค่ "ข้อความ" เท่านั้น นอกจากจะระบุ "แนวเพลง" "อารมณ์" "จังหวะ" ด้วยข้อความแล้ว ยังสามารถใช้ภาพถ่ายหรือวิดีโอเป็นแนวทางในการสร้างเพลงได้ เช่น การให้ภาพถ่ายของสุนัขขณะเดินป่าและสร้างเพลงที่มีเนื้อร้องที่เข้ากับบรรยากาศ


ข้อที่สามคือ การรวมเนื้อเพลงและการแชร์ไว้ใน "แพ็คเกจเดียว" Lyria 3 สามารถสร้างเนื้อเพลงอัตโนมัติได้โดยไม่ต้องให้ผู้ใช้เตรียมเนื้อเพลงเอง และยังมีภาพปกสำหรับการแชร์เพลงที่สร้างเสร็จแล้ว Google มองว่านี่เป็น "วิธีที่สนุกและไม่ซ้ำใครในการแสดงออกอย่างง่ายดาย"


เงื่อนไขการให้บริการคือ สำหรับผู้ที่มีอายุ 18 ปีขึ้นไป และรองรับหลายภาษา (รวมถึงภาษาญี่ปุ่น) โดยจะเริ่มให้บริการจากเดสก์ท็อปก่อนและขยายไปยังมือถือในภายหลัง


“ความรู้สึกของ AI ที่สร้างขึ้น” จะหายไปหรือไม่? Lyria 3 เน้น "ความสมจริง" และ "การควบคุม"

คำอธิบายของ Google ที่โดดเด่นคือ การสร้างเพลงที่ "สมจริงและซับซ้อนมากขึ้น" นอกจากการสร้างเนื้อเพลงอัตโนมัติแล้ว ยังปรับปรุงให้ควบคุมองค์ประกอบต่างๆ เช่น สไตล์ เสียงร้อง จังหวะ ได้ง่ายขึ้น ซึ่งหมายความว่าไม่ใช่แค่ "การสุ่ม" แต่เป็นการเข้าใกล้ภาพลักษณ์ที่ต้องการ


อย่างไรก็ตาม ขณะนี้ยังมีข้อจำกัดที่ 30 วินาที บนโซเชียลมีเดียมีการแสดงความคิดเห็นว่า "แม้จะสั้น แต่ก็เพียงพอสำหรับวิดีโอสั้นหรือมีม" หรือ "เพราะสั้นจึงอาจทำให้การผลิตเพิ่มขึ้น" ในยุคของวิดีโอสั้น เพลงที่มีคุณค่าในหลายๆ สถานการณ์คือ "ช่วงไม่กี่วินาทีที่ดึงดูด" 30 วินาทีดูเหมือนจะเป็นการออกแบบที่มุ่งเน้นไปที่จุดนั้น


การแพร่กระจายไปยัง YouTube Shorts: การสร้าง BGM ล่วงหน้าอาจกลายเป็นเรื่องปกติ

Google ได้นำ Lyria 3 ไปยัง Dream Track ของ YouTube เพื่อสนับสนุนการสร้างซาวด์แทร็กสำหรับวิดีโอสั้น หากเพลง AI ขนาดสั้นกลายเป็น "ชิ้นสุดท้ายของการตัดต่อวิดีโอ" กระบวนการสร้างของผู้สร้างจะเปลี่ยนไปอย่างแน่นอน


สิ่งที่มีผลคือ "ความเร็วในการสร้าง" และ "การลดกำแพงภาษา" การลอง BGM หลายๆ แบบให้เข้ากับจังหวะของวิดีโอเป็นเรื่องที่ยุ่งยาก แต่ถ้าเพียงแค่บอกความรู้สึกในแชทแล้วได้ตัวเลือกออกมา แม้จะไม่ใช่ในสถานที่ทำงานมืออาชีพ การลองหลายครั้งก็จะเพิ่มขึ้น บนโซเชียลมีเดีย มีการโพสต์ที่มองในแง่ดีจากมุมมองของการตลาดและการทดลองว่า "สามารถสร้างแนวคิดคร่าวๆ ได้อย่างรวดเร็ว"


ประเด็นที่ร้อนแรงที่สุด: ลิขสิทธิ์และ "ข้อมูลการเรียนรู้คืออะไร"

เมื่อพูดถึงเพลง AI สิ่งที่มักจะปรากฏขึ้นคือ ลิขสิทธิ์และข้อมูลการเรียนรู้ Google ได้กล่าวอย่างชัดเจนว่า "ไม่ใช่การเลียนแบบศิลปินที่มีอยู่ แต่เพื่อการแสดงออกที่เป็นต้นฉบับ" และเมื่อใส่ชื่อศิลปินเฉพาะก็จะตีความเป็น "บรรยากาศหรืออารมณ์" นอกจากนี้ยังกล่าวถึงฟิลเตอร์ที่ตรวจสอบความคล้ายคลึงกับเนื้อหาที่มีอยู่และช่องทางรายงานการละเมิดสิทธิ์


ในทางกลับกัน สื่อภายนอกและแนวโน้มของอุตสาหกรรมได้ชี้ให้เห็นว่า "รายละเอียดของแหล่งการเรียนรู้ยังไม่ชัดเจน" การฟ้องร้องและความขัดแย้งเกี่ยวกับเพลง AI ยังคงดำเนินต่อไป และครั้งนี้ก็อาจจะขึ้นอยู่กับว่า "สามารถแสดงความโปร่งใสได้มากน้อยเพียงใด"


การแยกแยะ "เสียงที่ AI สร้างขึ้น": ความหมายของ SynthID และฟังก์ชันการตรวจจับ

อีกสิ่งที่สำคัญคือ "SynthID" ที่ฝังข้อมูลระบุตัวตนในเพลงที่สร้างขึ้น แทร็กที่สร้างใน Gemini จะมีลายน้ำ และ Gemini ยังขยายฟังก์ชันการตรวจสอบว่า "เสียงนี้สร้างโดย AI ของ Google หรือไม่" ซึ่งเป็นการขยายการตรวจจับจากภาพและวิดีโอไปยังเสียง


ในปฏิกิริยาของโซเชียลมีเดีย มีการแบ่งความคิดเห็นในเรื่องนี้ ฝ่ายที่ยินดีต้อนรับมองว่า "ถ้ามีการติดฉลากก็สบายใจ" "อย่างน้อยก็ยับยั้งการแกล้งทำเป็น 'มนุษย์สร้าง'" ในทางกลับกัน ฝ่ายที่สงสัยชี้ให้เห็นว่า "ลายน้ำอาจหลีกเลี่ยงได้" "ถ้าการตรวจจับไม่กลายเป็นมาตรฐานทั่วไปก็ไม่มีความหมาย" นอกจากนี้ยังมีความกังวลอย่างมากว่า ด้วยลักษณะของ "การผลิตจำนวนมากใน 30 วินาที" อาจกลายเป็นแหล่งเพาะพันธุ์ของการสตรีมที่ไม่ถูกต้องหรือการฉ้อโกงเนื้อหา


ปฏิกิริยาของโซเชียลมีเดีย: ความตื่นเต้นและความกลัวเพิ่มขึ้นพร้อมกัน

สิ่งที่เป็นสัญลักษณ์ในหัวข้อนี้คือ "ดูน่าสนุก!" และ "น่ากลัว" ที่กลายเป็นกระแสพร้อมกัน


ฝ่ายบวก (การเล่น การแสดงออก การประหยัดเวลา)

  • แนวคิดในการ "เพิ่ม BGM ให้กับเหตุการณ์ในชีวิตประจำวัน" เป็นสิ่งที่เข้าใจง่ายและกลายเป็นมีมได้ง่าย ตัวอย่างเช่น Google แสดงให้เห็นว่าหัวข้อที่ตลกขบขันเช่น "ความรักของถุงเท้าในแนว R&B" ก็สามารถทำได้

  • จากมุมมองของการตลาดและการวางแผน มีการพูดถึงข้อดีของการสร้างแนวคิดเสียงคร่าวๆ ได้ในเวลาสั้นๆ และไม่ใช่การทดแทนการใช้งานมืออาชีพอย่างสมบูรณ์ แต่เป็นการให้คุณค่าในฐานะ "การสร้างต้นแบบ"


ฝ่ายกังวล (การใช้งานที่ไม่ถูกต้อง ลิขสิทธิ์ การแสดงผล)

  • ในชุมชนเพลง AI ของ Reddit มีเสียงที่ยอมรับ AI ในฐานะผู้ช่วยสร้างสรรค์ แต่ยังมีการกล่าวถึงปัญหาของการ "ผลิตจำนวนมากและแกล้งทำเป็นผลงานของมนุษย์ / หาเงินอย่างฉ้อโกง"

  • ในสื่ออุตสาหกรรม มีความกังวลเกี่ยวกับความโปร่งใสของข้อมูลการเรียนรู้ และมีบรรยากาศที่การประกาศ "การพัฒนาที่รับผิดชอบ" เพียงอย่างเดียวไม่เพียงพอ


ในที่สุด จุดที่แยกปฏิกิริยาออกคือ "ฟังก์ชันนี้สำหรับใคร" หากเป็นการขยายการเล่นหรือการแสดงออกของบุคคลก็จะได้รับการต้อนรับ แต่เมื่อเริ่มสร้างรายได้บนแพลตฟอร์มการกระจายหรือเข้าสู่การกระจายเพลงที่มีอยู่ ปัญหาด้านสิทธิ์ การแสดงผล และการป้องกันการฉ้อโกงจะกลายเป็น "ปัญหาทางสังคม"


สิ่งที่อาจเกิดขึ้นต่อไป: เพลงจะกลายเป็น "สิ่งที่สร้างขึ้น" หรือ "ความรู้สึกที่ถูกสร้างขึ้น"?

การรวม Lyria 3 เป็นสัญลักษณ์ของการที่เพลงกำลังเคลื่อนจาก "สิ่งที่สร้างและเสร็จสมบูรณ์" ไปสู่ "สิ่งที่สร้างขึ้นเมื่อจำเป็น" BGM ของวิดีโอสั้น, จิงเกิลของการนำเสนอ, ซาวด์แทร็กของวันครบรอบส่วนตัว ── เสียงที่มีค่าเพียงในช่วงเวลาของการบริโภคเหล่านั้นเหมาะสมกับ AI ที่สร้างขึ้น


ในทางกลับกัน หากการอภิปรายเกี่ยวกับสิทธิ์และความโปร่งใสไม่ทันตาม ความสะดวกสบายก็อาจกลายเป็นเชื้อเพลิงของการต่อต้าน Google ที่นำเสนอ SynthID และฟังก์ชันการตรวจจับอย่างเต็มที่นั้นน่าจะเป็นเพราะตระหนักถึงเชื้อไฟนี้


เพลง "ที่ดูเหมือนจริง 30 วินาที" สามารถกลายเป็นการเล่นที่เล็กน้อยหรือการปะทะกันของอุตสาหกรรมขนาดใหญ่ ฟังก์ชันใหม่ของ Gemini อาจถามถึงอนาคตของเพลงน้อยกว่า "กฎของการสร้างและการกระจายสามารถสร้างใหม่ได้มากแค่ไหน"



แหล่งที่มา URL