ยุค AI การพัฒนาทางวัฒนธรรมจะหยุดลงหรือไม่? ความสะดวกสบายที่มาพร้อมกับ "การทำให้เป็นเนื้อเดียวกัน" — อนาคตที่เหลือเพียงการแสดงออกที่ AI เลือกได้ง่าย

ยุค AI การพัฒนาทางวัฒนธรรมจะหยุดลงหรือไม่? ความสะดวกสบายที่มาพร้อมกับ "การทำให้เป็นเนื้อเดียวกัน" — อนาคตที่เหลือเพียงการแสดงออกที่ AI เลือกได้ง่าย

เมื่อ AI สร้างเนื้อหาเพิ่มมากขึ้น ความกังวลว่า "อินเทอร์เน็ตจะเต็มไปด้วยเนื้อหาที่สร้างโดย AI และในที่สุด AI จะเรียนรู้จาก AI จนเสื่อมคุณภาพ" ได้ถูกพูดถึงหลายครั้ง อย่างไรก็ตาม การวิจัยล่าสุดที่ Phys.org นำเสนอได้ย่นย่อความกังวลในอนาคตนั้นลง ข้อสรุปคือ การทำให้วัฒนธรรมเป็นเนื้อเดียวกันอาจเกิดขึ้นได้โดยไม่ต้องรอการเรียนรู้ซ้ำ และสาเหตุมาจากการใช้งานซ้ำๆ เองมากกว่า “ความฉลาดของโมเดล”.


1) การทดลอง "เกมส่งข้อความด้วยภาพ" — ลองให้ AI เล่นกันเอง

สิ่งที่นักวิจัยทำไม่ใช่การต่อสู้ด้วยโปรมต์ที่แปลกประหลาด กลไกนั้นเรียบง่ายและน่ากลัวเพราะเหตุนี้
เชื่อมต่อ AI ที่สร้างภาพจากข้อความ กับ AI ที่แปลงภาพเป็นข้อความ (คำบรรยาย) และทำซ้ำวงจรต่อไปนี้.

  • ข้อความ (โปรมต์) → การสร้างภาพ

  • ภาพที่สร้าง → การแปลงเป็นคำบรรยาย (คำอธิบาย)

  • คำอธิบายนั้น → กลายเป็นโปรมต์สำหรับการสร้างภาพถัดไป

  • ทำซ้ำหลายสิบครั้ง หลายร้อยครั้ง


จุดสำคัญคือ ไม่ได้ให้ AI เรียนรู้เพิ่มเติม ไม่ใช่เรื่องการป้อนข้อมูลใหม่เพื่อให้ “คุณภาพการเรียนรู้ลดลง” แต่เพียงแค่การใช้งานซ้ำๆ ก็ทำให้ผลลัพธ์ถูกดึงไปในทิศทางที่คล้ายกัน..


จริงๆ แล้ว ไม่ว่าจุดเริ่มต้นของโปรมต์จะหลากหลายแค่ไหน หรือการตั้งค่าความสุ่มในการสร้างจะเปลี่ยนไปอย่างไร ในที่สุดผลลัพธ์ก็จะรวมไปที่**“ภาพลักษณ์ที่ปลอดภัย”** ที่จำกัดมาก ชื่อนี้ที่นักวิจัยตั้งให้คือ "visual elevator music" (ดนตรีลิฟต์ทางสายตา) แม้จะดูดีแต่เนื้อหาบางเบา สบายใจแต่ไม่ทิ้งอะไรไว้ — เป็นสุดยอดของ “ความเหมือน”

.


2) ทำไมถึงรวมกัน? — AI เหลือแค่สิ่งที่ "อธิบายง่าย"

ปรากฏการณ์นี้ไม่ได้จบแค่ "เพราะ AI ขาดความคิดสร้างสรรค์" แต่มันเป็นโครงสร้างมากกว่า
ในการแปลงภาพ→ข้อความ→ภาพองค์ประกอบที่อธิบายได้ง่ายจะรอดชีวิต และองค์ประกอบที่อธิบายได้ยากจะถูกตัดออกง่าย

.


ตัวอย่างเช่น ความตึงเครียดในละครการเมือง การเสียดสี กลิ่นอายของยุคสมัย ความสัมพันธ์ระหว่างตัวละคร ความหมายของสายตา บรรยากาศของสถานที่ สิ่งเหล่านี้อธิบายได้ยากในขั้นตอนการแปลงเป็นคำบรรยาย จึงมักถูกแทนที่ด้วยคำนามทั่วไปและคำคุณศัพท์ที่ปลอดภัย

.


จากนั้นในการสร้างครั้งถัดไป ภาพลักษณ์ทั่วไปที่สอดคล้องกับ “คำที่อธิบายง่าย” นั้นจะถูกเลือก ยิ่งทำซ้ำมากเท่าไร เจตนาที่ควรจะเป็นแก่นของผลงานก็จะระเหยไป และเหลือเพียงฉากที่มีคะแนนเฉลี่ยที่ไม่โดนใจใคร.

.


สิ่งที่น่าสนใจคือสิ่งนี้เกิดขึ้นก่อนที่จะเกิด "การล่มสลายของโหมด" หรือ "การปนเปื้อนของข้อมูลการเรียนรู้" กล่าวคือ ก่อนที่ AI ในอนาคตจะเรียนรู้จากสิ่งที่ AI สร้างขึ้น “การสร้าง→สรุป→สร้างใหม่” ซึ่งเป็นท่อส่งทางวัฒนธรรม จะทำงานในทิศทางที่ทำให้ความหมายบางลงโดยธรรมชาติ

.


3) การวิจัยเป็น “สุดโต่ง” หรือไม่? — แต่ในความเป็นจริงมันวนเวียนในชีวิตประจำวันมากกว่า

คุณอาจคิดว่า “ไม่มีใครทำลูป AI ที่ไม่มีที่สิ้นสุดในชีวิตจริง” แต่รอบที่เปลี่ยนรูปแบบได้กลายเป็นเรื่องปกติในชีวิตประจำวันของเรา

.
  • ภาพถูกย่อให้เป็นคำบรรยายสั้นๆ (คำบรรยาย/ข้อความแสดงแทน)

  • บทความถูกย่อให้เป็นหัวข้อย่อย

  • การย่อถูกบรรจุใหม่เป็นภาพขนาดย่อหรือวิดีโอสั้น

  • การจัดอันดับทำให้ “รูปแบบที่แข็งแกร่ง” ยังคงอยู่ และรูปแบบที่คล้ายกันถูกเลียนแบบ

  • มีการเพิ่มขั้นตอนที่มนุษย์ “เลือกเท่านั้น” จากตัวเลือกของ AI ที่สร้างขึ้น


สิ่งที่ถูกทำซ้ำคือการผ่านคุณค่าของผลงานผ่าน “การแปลหลายชั้น” และ “การคัดเลือก” การแปลและการคัดเลือกเป็นสิ่งจำเป็น แต่ยิ่งทำซ้ำมากเท่าใด สิ่งที่เหลืออยู่จะเป็นสิ่งที่เป็นแบบอย่าง ปลอดภัย อธิบายได้ และปลอดภัยในเชิงพาณิชย์ การวิจัยได้แสดงให้เห็นถึงแรงกดดันนั้นในรูปแบบย่อ

.


4) การตอบสนองต่อ “การหยุดชะงักทางวัฒนธรรมเป็นความตื่นตระหนกทางศีลธรรม”

เสียงที่กล่าวว่า "วัฒนธรรมจะพังทลาย" เมื่อมีเทคโนโลยีใหม่เกิดขึ้นมีมาตั้งแต่อดีต ภาพถ่ายไม่ได้ฆ่าภาพวาด ภาพยนตร์ไม่ได้ฆ่าการแสดงบนเวที และดิจิทัลได้สร้างการแสดงออกใหม่ๆ เป็นความจริง

.


แต่จุดสนใจในครั้งนี้ไม่ใช่การที่ "เครื่องมือใหม่ออกมา" แต่เป็นจุดที่วัฒนธรรมถูกสร้างใหม่ซ้ำๆ ผ่านอุปกรณ์การสร้าง การสรุป การแนะนำ และการจัดอันดับแบบเดียวกันในระดับโลก.

.


เทคโนโลยีในอดีตได้เพิ่มวิธีการแสดงออก แต่ตอนนี้ไม่เพียงแต่เพิ่มวิธีการแสดงออกเท่านั้น แต่ความหมายยังถูกบีบอัดและสร้างใหม่หลายครั้ง “ระหว่างการกระจาย”. ยิ่งไปกว่านั้น การบีบอัดนั้นมีแนวโน้มที่จะมุ่งไปสู่ “ค่าเฉลี่ย” โดยไม่ได้ตั้งใจ ดังนั้นนี่จึงกลายเป็นปัญหาการออกแบบระบบนิเวศข้อมูลสมัยใหม่ มากกว่าความกังวลแบบย้อนยุค

.


5) “ผลิตได้จำนวนมาก = นวัตกรรม” ไม่ใช่

AI ที่สร้างขึ้นสามารถสร้างความหลากหลายได้มาก แต่สิ่งที่การวิจัยชี้ให้เห็นคือ การระเบิดของปริมาณไม่เท่ากับการขยายพื้นที่สำรวจ.
ไม่ว่าคุณจะสร้างภาพออกมากี่หมื่นภาพ หากเป็นเพียงความแตกต่างเล็กน้อยใน “หุบเขาแคบๆ” เดิม ภูมิทัศน์ทางวัฒนธรรมก็จะไม่ขยายออกไป ในทางกลับกัน หุบเขาเฉลี่ยอาจลึกขึ้นเท่านั้น

.


6) แล้วจะทำอย่างไร? — การออกแบบที่ต่อต้าน “แรงดึงดูดไปสู่ค่าเฉลี่ย”

ไม่จำเป็นต้องจบด้วยความสิ้นหวัง สิ่งที่การวิจัยแสดงให้เห็นคือ “หากปล่อยไว้จะรวมกัน” ไม่ใช่ “จะหยุดชะงักแน่นอน” ทิศทางของมาตรการตอบโต้มีให้เห็นแล้ว

.
  • ให้รางวัลกับการเบี่ยงเบน: ใส่เกณฑ์การประเมินที่ให้ความสำคัญกับองค์ประกอบ โครงสร้าง และคำศัพท์ที่หายาก (เรียกว่า “คะแนนต่อต้านความปลอดภัย”)

  • การกระจายที่ไม่ละทิ้งบริบท: แนบเจตนาการสร้าง แหล่งอ้างอิง และบันทึกพื้นหลังกับผลงาน เพื่อเสริมข้อมูลที่ตกหล่นจากการสรุป

  • ออกแบบวิธีการเลือก: กำหนด “สิ่งที่ต้องการทำลาย/สิ่งที่ต้องการหลีกเลี่ยง” ก่อนการสร้างจากตัวเลือก

  • ข้อจำกัดความหลากหลายของการแนะนำ: กำหนดความหลากหลายขั้นต่ำในการเปิดเผยเพื่อไม่ให้รูปแบบเดียวกันปรากฏซ้ำๆ


กล่าวอีกนัยหนึ่ง ยิ่ง AI ถูกใช้เป็น “เครื่องสร้างค่าเฉลี่ย” มากเท่าไร ค่าเฉลี่ยก็จะยิ่งแข็งแกร่งขึ้นเท่านั้น ดังนั้นจึงจำเป็นต้องสร้างวงจรที่ทำให้การเบี่ยงเบนจากค่าเฉลี่ยเป็นประโยชน์.


7) ปฏิกิริยาของ SNS — แบ่งออกเป็น “เข้าใจ” “สุดท้ายก็ข้อมูล” “ต้องการมนุษย์”

 


เมื่อหัวข้อนี้แพร่กระจายใน SNS ปฏิกิริยาแบ่งออกเป็นสามระดับอุณหภูมิ

.

(1) กลุ่มที่ “เข้าใจในเชิงประสบการณ์”

มีโพสต์จำนวนมากที่แสดงความเห็นด้วยอย่างแรงกล้ากับคำอุปมา “visual elevator music” ยิ่งคนที่เคยใช้ AI สร้างเนื้อหาจะพูดถึง “ความรู้สึกเหมือนถูกละเลยแม้จะดูดี” หรือ “ความรู้สึกเดจาวูที่น่าขนลุก” ซึ่งเป็นการพูดถึง “ความบางเบา” ของเนื้อหา ผลการทดลองเชื่อมโยงกับความรู้สึกของผู้ใช้

.

(2) กลุ่มที่ “สุดท้ายก็ข้อมูลและอคติ”

การวิจัยที่แสดงถึงการรวมกันของ 12 มอทิฟ ถูกมองว่าไม่ใช่แค่ “คุณสมบัติของโมเดล” แต่ยังสะท้อนถึง “ความเอนเอียงของภาพถ่ายที่มนุษย์ถ่าย (สิ่งที่ถ่ายได้ง่าย)” กล่าวคือ AI ไม่ได้สร้างจากศูนย์ แต่ขยายพฤติกรรมการถ่ายภาพและสิ่งที่ขายดีของสังคมมนุษย์. นี่รวมถึงการย้อนกลับว่า “ก่อนที่จะโทษ AI ว่าการบริโภควัฒนธรรมของมนุษย์นั้นมีความเป็นเนื้อเดียวกันอยู่แล้วหรือไม่”

.

(3) กลุ่มที่ “ดังนั้นจึงต้องการการคัดเลือกโดยมนุษย์”

ยิ่ง AI หมุนเวียนตัวเองมากเท่าไร คุณค่าของการแก้ไข การรับรู้ความงาม และการให้บริบทโดยมนุษย์ ก็ยิ่งเพิ่มขึ้นเท่านั้น ไม่ใช่แค่ “มนุษย์เลือกในที่สุดจึงไม่เป็นไร” แต่เป็นการที่ “ต้องมีการออกแบบเพื่อไม่ให้ความหมายหายไประหว่างทางเพื่อให้มนุษย์สามารถเลือกได้ในที่สุด”

.

โดยรวมแล้ว บรรยากาศของ SNS ไม่ได้เป็นการยกย่อง AI หรือปฏิเสธ AI แต่มุ่งเน้นไปที่การที่มนุษย์จะควบคุมทิศทางที่ “แรงดึงดูดกลับไปสู่ค่าเฉลี่ย”.


8) บทสรุป — การทำให้วัฒนธรรมเป็นเนื้อเดียวกันไม่ใช่เรื่องของประสิทธิภาพ แต่เป็น “วิธีการหมุนเวียน”

จุดที่น่ากลัวที่สุดของการวิจัยนี้คือไม่ต้องการเจตนาร้ายหรือการสมรู้ร่วมคิด แม้จะไม่รอการปนเปื้อนจากการเรียน