เพียงคำเดียวก็สามารถเผยบุคลิกภาพได้? ยุคที่ AI สร้างสรรค์สามารถอ่านความเป็น "ตัวคุณ"

เพียงคำเดียวก็สามารถเผยบุคลิกภาพได้? ยุคที่ AI สร้างสรรค์สามารถอ่านความเป็น "ตัวคุณ"

"ตอนนี้คุณคิดอะไรอยู่?"


ถ้ามีคนถามคุณแบบนั้น และคุณพูดออกมาทันทีในไม่กี่วินาทีเกี่ยวกับสิ่งที่เกิดขึ้นวันนี้ ความกังวลเล็กๆ ความสุข หรือการสนทนาที่ไม่มีความหมายอะไรเป็นพิเศษ คำพูดที่ไม่มีจุดหมายเหล่านี้สามารถทำให้ AI ประเมินแนวโน้มบุคลิกภาพของคุณได้อย่างแม่นยำ การวิจัยเช่นนี้ได้ขยายขอบเขตของจิตวิทยาและ AI ไปอีกขั้น


การวินิจฉัยบุคลิกภาพกำลังเริ่มเปลี่ยนแปลง

การประเมินบุคลิกภาพในอดีตมักจะใช้แบบสอบถาม (เช่น "คุณคิดว่าคุณเป็นคนเปิดเผยไหม" "คุณเป็นคนรอบคอบไหม") เนื่องจากมีประสิทธิภาพและง่ายต่อการจัดการทางสถิติ แต่ก็มีการวิพากษ์วิจารณ์ว่าบุคลิกภาพของคนมักจะปรากฏในบริบทและสถานการณ์ และการตอบแบบเลือกตอบอาจพลาดบางอย่างไป


ในที่นี้ AI ที่สร้างขึ้นหรือโมเดลภาษาขนาดใหญ่ (LLM) เข้ามามีบทบาท ในการวิจัยนี้ LLM ที่ใช้ในเชิงพาณิชย์และทั่วไป (เช่น ChatGPT, Claude, LLaMA เป็นต้น) ถูกนำมาใช้ในการอ่าน "คำพูดของตัวเอง" ของผู้คนและประเมินบุคลิกภาพในห้าด้านใหญ่ (การเปิดเผย, การร่วมมือ, ความซื่อสัตย์, แนวโน้มทางประสาท, การเปิดกว้าง) จุดสำคัญคือการใช้ LLM ที่มีอยู่ทั่วไปโดยไม่ต้องฝึกฝนเฉพาะทางจิตวิทยา


การทดลองคือ "การพูดคนเดียว" และ "บันทึกประจำวัน"

การออกแบบการวิจัยแบ่งเป็นสองประเภทหลัก หนึ่งคือการให้ผู้เข้าร่วมพูดหรือเขียนสิ่งที่คิดขึ้นมาในหัวแบบอิสระ อีกหนึ่งคือการบันทึกเหตุการณ์ในชีวิตประจำวันเหมือนบันทึกวิดีโอสั้นๆ จาก "เศษภาษาธรรมชาติ" เหล่านี้ LLM จะประเมินการตอบแบบสอบถามบุคลิกภาพและตรวจสอบว่ามันสอดคล้องกับการประเมินตนเองของบุคคลนั้นมากน้อยเพียงใด


ผลลัพธ์แสดงให้เห็นว่าคะแนนบุคลิกภาพที่ LLM ให้มีแนวโน้มคล้ายกับการประเมินตนเอง และการใช้ LLM หลายตัวและการเฉลี่ยผลลัพธ์ทำให้มีความมั่นคงมากขึ้น นอกจากนี้ยังมีการชี้ให้เห็นว่า LLM ทำได้ดีกว่าวิธีการวิเคราะห์ข้อความแบบดั้งเดิม


สิ่งสำคัญที่นี่คือการมองข้ามเรื่อง "การทำนายบุคลิกภาพที่ถูกต้องหรือไม่" และมุ่งเน้นไปที่ "ในภาษาประจำวันมีเบาะแสของบุคลิกภาพที่เข้มข้นกว่าที่คิด" นักวิจัยเน้นว่าบุคลิกภาพไม่ได้ปรากฏเฉพาะเมื่อแนะนำตัวเอง แต่ถูกถักทออยู่ในกระแสความคิดและการพูดในชีวิตประจำวัน


ไม่ใช่แค่บุคลิกภาพ: ยังเกี่ยวข้องกับพฤติกรรม อารมณ์ และสุขภาพจิต

การวิจัยยังรายงานว่าคะแนนบุคลิกภาพที่ LLM ประเมินสามารถเชื่อมโยงกับอารมณ์ประจำวัน ความเครียด และพฤติกรรมทางสังคม ซึ่งหมายความว่าการประเมินบุคลิกภาพอาจไม่ใช่แค่การติดป้าย แต่ยังอาจเชื่อมโยงกับตัวชี้วัดชีวิตจริง


ตัวอย่างเช่น ในด้านสุขภาพจิต อาจสามารถรับเบาะแสจากบันทึกหรือการสนทนาสั้นๆ แม้ในสถานการณ์ที่บุคคลไม่สามารถทำการทดสอบยาวๆ ได้ ในการศึกษาและการโค้ชชิ่ง อาจสามารถปรับวิธีการให้ข้อเสนอแนะตามลักษณะบุคลิกภาพได้ ในการวิจัยทางคลินิก อาจเปิดทางให้จัดการข้อมูลเชิงคุณภาพในเชิงปริมาณได้


อย่างไรก็ตาม สิ่งที่ไม่ควรเข้าใจผิดคือ "AI สามารถวินิจฉัยได้" การวิจัยแสดงให้เห็นเพียงว่า "คะแนนลักษณะที่ประเมินมีความสัมพันธ์ทางสถิติกับตัวชี้วัดเฉพาะ" การวินิจฉัยทางการแพทย์หรือการตัดสินใจในการรักษาต้องการข้อกำหนดในมิติอื่น เช่น ความรับผิดชอบในการอธิบาย การตรวจสอบความเอนเอียง และการจัดการความเสี่ยงเมื่อเกิดการวินิจฉัยผิดพลาด


"แม่นยำกว่าครอบครัว" — เบื้องหลังของการแสดงออกที่กระตุ้นความสนใจ

ในบริบทของการรายงาน ข่าวที่ว่า "แม่นยำกว่าการประเมินของครอบครัวหรือเพื่อน" มักจะดึงดูดความสนใจ ในการวิจัยมีการเน้นย้ำถึงความสอดคล้องกับการประเมินตนเอง และในบางกรณีอาจดีกว่าการประเมินของผู้อื่น


อย่างไรก็ตาม จำเป็นต้องอ่านอย่างมีสติ ครอบครัวหรือเพื่อนรู้จัก "ชีวิตทั้งหมด" ของคุณ แต่การประเมินอาจมีอคติจากความสัมพันธ์ (อาจจะอ่อนโยนหรือเข้มงวดเกินไป หรือถูกดึงดูดโดยความประทับใจในสถานการณ์เฉพาะ) ในขณะที่ LLM มองเห็นเฉพาะข้อมูลภาษาที่ได้รับ แต่มีความแข็งแกร่งในลักษณะทางสถิติของรูปแบบภาษา ดังนั้นจึงไม่ใช่เรื่องของ "ใครรู้จักมนุษย์ดีกว่า" แต่เป็นเรื่องของ "ใช้วัสดุอะไรและมีเกณฑ์อะไรในการประเมิน"


ปฏิกิริยาที่อาจแพร่กระจายบนโซเชียลมีเดีย: ความตื่นเต้นและความหวาดกลัว

เมื่อมีการวิจัยเช่นนี้ออกมา ปฏิกิริยาบนโซเชียลมีเดียมักจะแบ่งออกเป็นสองขั้ว ที่นี่เราจะสร้างตัวอย่างโพสต์จากประเด็นที่คาดว่าจะเกิดขึ้นจากเนื้อหาบทความ (เป็นตัวอย่างเพื่อความเข้าใจบรรยากาศ ไม่ใช่คำพูดของผู้ใช้เฉพาะ)


1) ฝ่าย "น่าสนใจ! ใช้เพื่อความเข้าใจตนเองได้"

  • ตัวอย่างโพสต์:
    "การวินิจฉัยบุคลิกภาพน่าเบื่อ แต่ถ้ารู้ได้จากการพูดคนเดียวก็สบาย"
    "แทนที่จะย้อนดูบันทึกประจำวัน ให้ AI สรุปและแสดงแนวโน้มบุคลิกภาพให้ก็ได้"
    "เป็นประโยชน์ในการเริ่มต้นการโค้ชชิ่ง สามารถสังเกตนิสัยของตัวเองได้"

กลุ่มนี้คาดหวังว่าความช่วยเหลือตนเอง การโค้ชชิ่ง และการวิเคราะห์ตนเองจะมี "แรงเสียดทาน" ลดลง โดยเฉพาะอย่างยิ่งคนที่ไม่คุ้นเคยกับจิตวิทยาอาจรู้สึกว่า "คำพูดธรรมชาติดูเหมือนตัวเองมากกว่า"

2) ฝ่าย "นี่มันสังคมเฝ้าระวังใช่ไหม?"

  • ตัวอย่างโพสต์:
    "ถ้าสามารถประเมินบุคลิกภาพจากการสนทนาไม่กี่วินาที อนาคตจะใช้ในการสัมภาษณ์ โฆษณา ประกันภัยแน่นอน"
    "ถ้าผู้ช่วยเสียงประเมินตลอดเวลา ความเป็นส่วนตัวคืออะไร?"
    "การถูกติดป้ายว่า 'คุณมีแนวโน้มทางประสาทสูง' โดยไม่ได้รับอนุญาตน่ากลัวเกินไป"


กลุ่มนี้มีจินตนาการถึงการใช้งานในทางที่ผิด ภาษาอยู่ในทุกที่ในชีวิตประจำวัน เช่น โซเชียลมีเดีย อีเมล แชท และบันทึกการประชุม หากการ "ประเมิน" เกิดขึ้นโดยไม่รู้ตัวและถูกใช้ในการประเมินโดยที่บุคคลไม่รู้ ก็ไม่สามารถปฏิเสธได้

3) ฝ่าย "ถ้าแม่นยำ อธิบายเหตุผลด้วย"

  • ตัวอย่างโพสต์:
    "สุดท้ายแล้ว วลีไหนที่เป็นตัวชี้วัดการเปิดเผย?"
    "อยากรู้ว่ามีความเอนเอียง (เพศ วัฒนธรรม ภาษา) หรือไม่"
    "สัญญาณที่ AI มองเห็นกับแนวคิดที่จิตวิทยาคาดหวังตรงกันหรือไม่?"


กลุ่มนี้ให้ความสำคัญกับความโปร่งใสและความยุติธรรม แม้ว่า LLM จะมีความแม่นยำสูง แต่ถ้าไม่สามารถอธิบายเหตุผลได้ การนำไปใช้ในสถานการณ์จริงจะยาก โดยเฉพาะในด้านการจ้างงาน การให้เครดิต และประกันภัย การมีระบบที่สามารถอธิบายได้และมีการคัดค้านเป็นสิ่งจำเป็น

4) ฝ่าย "การวิจัยน่าสนใจ แต่ควรระวังการพูดเกินจริง"

  • ตัวอย่างโพสต์:
    "หัวข้อ 'แม่นยำกว่าครอบครัว' แรงเกินไป การประเมินคือความสอดคล้องกับการรายงานตนเองในห้าด้านใหญ่"
    "การเก็บข้อมูลอาจทำให้แม่นยำขึ้น ควรระมัดระวังในการทั่วไป"
    "บันทึกประจำวันหรือการพูดคนเดียวมีแนวโน้มที่จะเผยความในใจ ดังนั้นอาจเป็นเรื่องปกติ"


กลุ่มนี้ไม่ได้ปฏิเสธผลการวิจัย แต่ต้องการปรับ "ขอบเขตการใช้งาน" และ "ความแรงของคำพูด" พวกเขาระวังว่าเมื่อเป็นที่นิยมในโซเชียลมีเดียแล้ว อาจมีบริการ AI วินิจฉัยบุคลิกภาพที่ผิดพลาดเกิดขึ้น


เราควรมีปฏิสัมพันธ์อย่างไร

อนาคตที่การวิจัยนี้แสดงให้เห็นคือการผสมผสานระหว่างความสะดวกสบายและความเสี่ยง ดังนั้นจึงจำเป็นต้องพิจารณาวิธีการป้องกันทั้งในระดับบุคคลและสังคม


สิ่งที่บุคคลสามารถทำได้

  • อย่าแปะบันทึกประจำวัน บันทึกการสนทนา หรือบันทึกเสียงลงในบริการภายนอกอย่างง่ายดาย (โดยเฉพาะข้อมูลส่วนบุคคล ข้อมูลสุขภาพ ข้อมูลครอบครัว)

  • แยก "ข้อมูลที่วิเคราะห์ได้" ออกจาก "ข้อมูลที่ไม่ต้องการให้ใครเห็น"

  • จัดการผลลัพธ์การประเมินเป็น "เทอร์โมมิเตอร์" มากกว่า "กระจก" (สามารถเปลี่ยนแปลงได้ตามสถานการณ์และมีข้อผิดพลาด)

สิ่งที่สังคมต้องการ

  • ออกแบบกฎที่ชัดเจนเกี่ยวกับวัตถุประสงค์การใช้การประเมินและห้ามการประเมินบุคลิกภาพโดยไม่ได้รับความยินยอม

  • ในพื้นที่ที่มีความเสี่ยงสูง (การจ้างงาน การประกันภัย การประเมินการศึกษา การยุติธรรม) ต้องมีระบบการตรวจสอบ การอธิบาย และการช่วยเหลือเป็นมาตรฐาน

  • บังคับให้มีการตรวจสอบต่อเนื่องเกี่ยวกับความแตกต่างของคุณลักษณะ (วัฒนธรรม ภาษา อายุ)

  • ไม่ควรสับสนระหว่างการวิจัยและการใช้งานเชิงพาณิชย์ ("สามารถทำได้" และ "ควรใช้" เป็นเรื่องที่แตกต่างกัน)


"ความเป็นตัวคุณ" รั่วไหลออกมาในคำพูด

ในที่สุด แก่นแท้ของการวิจัยนี้คือความเรียบง่าย
คนเราไม่ได้พูดถึงบุคลิกภาพ แต่กำลังพูดถึงบุคลิกภาพ ##HTML_TAG_217