แซม อัลท์แมน พูดถึงความท้าทายของ GPT-5 และการกลับมาของ 4o: เบนช์คือที่สุด ประสบการณ์ยังไม่สมบูรณ์? “Chart Crime” ในงานเปิดตัว GPT-5 และต้นทุนของความไว้วางใจ

2025年08月10日 11:52

1. เกิดอะไรขึ้น? ไทม์ไลน์ 48 ชั่วโมง

วันที่ 7 สิงหาคม (เวลาสหรัฐฯ) OpenAI ได้ประกาศเปิดตัว "GPT-5" เรือธงใหม่ โดยมีการเปลี่ยนแปลงไปสู่ "โมเดลรวม" ที่มีตัวสลับการตอบสนองแบบรวดเร็วและแบบ "คิด" ในเบื้องหลังเป็นแกนหลัก วันที่ 8 สิงหาคม Sam Altman CEO และทีมงานได้จัด AMA บน Reddit โดยอธิบายว่า "วันแรกมีปัญหาร้ายแรง (sev) กับตัวสลับ ทำให้การสลับอัตโนมัติเสียหายในบางช่วงเวลา ซึ่งทำให้รู้สึกว่า 'GPT-5 โง่ลง'" และสัญญาว่าจะเพิ่มขีดจำกัดอัตราของ Plus เป็นสองเท่าและปรับปรุงการแสดงผลว่าโมเดลใดกำลังตอบคำถาม นอกจากนี้ยังยืนยันว่าจะพิจารณาการให้บริการ 4o ต่อไปใน Plus ตามคำขอที่เข้มแข็ง

2. เป้าหมายของ GPT-5—กำจัด "ภาระการเลือกโมเดล"

ในประกาศอย่างเป็นทางการ OpenAI ได้กำหนดให้ GPT-5 เป็น "ระบบรวมหนึ่งเดียว" โดยปกติจะใช้โมเดลที่เบาและฉลาด ส่วนปัญหาที่ยากจะใช้โมเดล "คิด" (GPT-5 Thinking/Pro) ซึ่งตัวสลับจะตัดสินใจอัตโนมัติ มีการปรับปรุงการติดตามคำสั่งและความถูกต้อง รวมถึงการปรับปรุงในด้านโค้ด การสร้างสรรค์ และสุขภาพ กล่าวคือ UX ที่ไม่ต้องให้ผู้ใช้คิดว่า "จะเลือกโมเดลใด" เป็นแกนหลักOpenAI

การออกแบบนี้เป็นที่ยินดีสำหรับผู้ใช้ส่วนใหญ่ แต่สำหรับผู้ใช้หนักที่เคยใช้ "บุคลิกของโมเดล" อาจมองว่าเป็นการลดสิทธิ์ในการเลือก เหตุการณ์ครั้งนี้ทำให้ช่องว่างนี้ปรากฏชัดเจน

3. ปรากฏการณ์ "คืน 4o"—ความรู้สึกจาก SNS

หลังการประกาศ มีโพสต์จำนวนมากใน Reddit เช่น r/ChatGPT ว่า "GPT-5 มีบทความที่แข็ง" "การสร้างสรรค์ลดลง" "คิดถึงเสียงและความรู้สึกของ 4o" มีการเรียกร้อง "Bring back 4o" "#keep4o" และแชร์เว็บไซต์ลงชื่อ ในขณะเดียวกันก็มีการตอบรับว่า "5 เร็วกว่าและมีประสิทธิภาพ" "โค้ดดีขึ้น" วันที่ 9-10 สิงหาคม มีรายงานว่า "4o กลับมาใน 'การแสดงผลแบบเลกาซี' ของ Plus" และมีเสียงยืนยันว่ามีการสลับได้จริงTechRadarReddit

มีรายงานจากสื่อว่า "4o กำลังกลับมา" ซึ่งแสดงถึงการตอบสนองต่อเสียงของผู้ใช้อย่างรวดเร็ว แต่มีรายงานจากผู้ใช้ว่ามีความแตกต่างในเวลาในแง่ของภูมิภาค แผน และแอปTom's Guide

4. ความผิดพลาด "แผนภูมิอาชญากรรม"—ความเชื่อถือในการมองเห็น

ในงานเปิดตัว มีข้อผิดพลาดเช่นตัวเลขและความสูงของแท่งไม่ตรงกัน ทำให้เกิดประเด็น "แผนภูมิอาชญากรรม (แผนภูมิที่ผิดพลาดทางสถิติ)" Altman ยอมรับใน X ว่าเป็น "ความผิดพลาดใหญ่" และมีการขอโทษจากภายในบริษัท แผนภูมิในบล็อกอย่างเป็นทางการถูกต้อง แต่ความผิดพลาดในการมองเห็นในงานสดเป็น "ความเจ็บปวดในการประชาสัมพันธ์ผลิตภัณฑ์ที่เน้นความถูกต้อง" The Verge ได้ตรวจสอบความไม่สอดคล้องกันอย่างละเอียด และมีการเสียดสีในอินเทอร์เน็ตเพิ่มขึ้นThe Verge

เหตุการณ์นี้ให้ข้อคิดสองประการ ประการแรก วิธีการพูดถึง "ตัวเลข" ของผู้ขาย AI มีผลโดยตรงต่อความเชื่อถือในผลิตภัณฑ์ ประการที่สอง แม้ว่าโมเดลจะฉลาด แต่ "กระบวนการมองเห็นและตรวจสอบของมนุษย์" เป็นสิ่งที่แยกต่างหาก และสุดท้ายมนุษย์ต้องรักษาไว้

5. อย่างไรก็ตาม "เนื้อใน" กำลังพัฒนาอยู่หรือไม่

จากมุมมองของนักพัฒนาและนักวิจัย มีการประเมินว่า GPT-5 มีการปรับปรุงในด้านการติดตามคำสั่ง ความเสถียรของการสร้างโค้ด และความถูกต้องเมื่อคิดนาน ในขณะเดียวกัน Simon Willison นักรีวิว ได้แชร์ตัวอย่าง "จุดอ่อน" โดยเมื่อเขาปล่อยให้โมเดลจัดเรียงตารางอัตโนมัติ มันผิดพลาด และต้องใช้ Python แก้ไข กล่าวคือไม่ใช่ "อเนกประสงค์" แต่ความรู้ในการปฏิบัติงานที่รวมถึง "วิธีหลีกเลี่ยงความล้มเหลวและการชดเชยด้วยการรวมกัน" มีความสำคัญOpenAISimon Willison’s Weblog

6. การดำเนินการของ OpenAI และจุดสนใจในอนาคต

ใน AMA มีการแสดงถึงการเพิ่มขีดจำกัดอัตราของ Plus การทำให้การเลือกโมเดลโปร่งใส และการพิจารณาการให้บริการ 4o ต่อไป ปัญหาการสลับในช่วงเปิดตัวเป็น "การโจมตีครั้งแรกของประสบการณ์" ที่ใหญ่ แต่ถ้าอัลกอริทึมการสลับได้รับการปรับปรุง ประโยชน์ของ UX รวมจะเด่นขึ้น ปัญหาคือจะทำอย่างไรให้ "ความหลากหลายของความชอบ" และ "ความสะดวกของการรวม" อยู่ร่วมกันได้ การเลือกเลกาซีและ "การปรับแต่งสไตล์และบุคลิกภาพในระดับละเอียด" จะเป็นกุญแจ

7. เคล็ดลับการใช้งานสำหรับผู้ใช้ประเภทต่างๆ

ผู้สร้างสรรค์ส่วนบุคคล: หากให้ความสำคัญกับ "ความรู้สึก" ของเรื่องราวและบทสนทนา ในตอนนี้ควรใช้ 4o (ถ้าใช้ได้) และ 5 ควบคู่กันเพื่อเปรียบเทียบ ให้ GPT-5 "ใช้สไตล์นี้" "เพิ่มอารมณ์" อย่างชัดเจน หากล้มเหลวให้ใช้การเชื่อมต่อเครื่องมือเป็นประกัน เช่น "สร้างตาราง→ใช้ Python สร้างตารางแล้วจัดเรียงใหม่"RedditSimon Willison’s Weblog
นักพัฒนา: ไม่ควรพึ่งพาตัวสลับ ให้ระบุ "โหมดคิด" ในขั้นตอนสำคัญ และให้มีการตรวจสอบ (ประเภท ทดสอบ lint) เป็นพื้นฐาน ไม่ควรปล่อยให้การมองเห็นถูกสร้างอัตโนมัติ ควรตรวจสอบหน่วย แกน และอัตราส่วนสองครั้งThe Verge
การนำเข้าในองค์กร: ในช่วงแรกควรคาดการณ์ "ความผันผวนของประสบการณ์" และติดตามด้วย SLO มากกว่า SLA ควรทำให้ชัดเจนนโยบายการเลือกโมเดล และออกแบบการแสดงผลให้ผู้ใช้ทราบว่า "ขณะนี้ใช้โมเดลใด" และเส้นทางการยกระดับ (การบังคับคิดนาน การตรวจสอบโดยมนุษย์)

8. ข้อสรุป—แม้ในยุคของการรวม การเลือกได้ยังคงเป็นอาวุธ

GPT-5 ได้แสดงทิศทางที่ชัดเจนว่า "ทำให้ใช้งานง่ายสำหรับคนส่วนใหญ่" ในขณะเดียวกัน ประสบการณ์ AI ขึ้นอยู่กับ "ความชอบ" พอๆ กับ "ประสิทธิภาพ" เหตุการณ์ครั้งนี้ไม่ใช่แค่เรื่องของข้อบกพร่องหรือความผิดพลาดในการมองเห็น แต่เป็นการเปิดเผยปัญหาการออกแบบที่หลีกเลี่ยงไม่ได้ในการทำให้ AI เป็นที่นิยม—วิธีการรวม "การรวม" และ "บุคลิกภาพ"

บทความอ้างอิง

Sam Altman กล่าวถึงการเปิดตัว GPT-5 ที่ "ไม่ราบรื่น" การคืน 4o และ "อาชญากรรมแผนภูมิ"
ที่มา: https://techcrunch.com/2025/08/08/sam-altman-addresses-bumpy-gpt-5-rollout-bringing-4o-back-and-the-chart-crime/

1. เกิดอะไรขึ้น? ไทม์ไลน์ 48 ชั่วโมง

2. เป้าหมายของ GPT-5—กำจัด "ภาระการเลือกโมเดล"

3. ปรากฏการณ์ "คืน 4o"—ความรู้สึกจาก SNS

4. ความผิดพลาด "แผนภูมิอาชญากรรม"—ความเชื่อถือในการมองเห็น

5. อย่างไรก็ตาม "เนื้อใน" กำลังพัฒนาอยู่หรือไม่

6. การดำเนินการของ OpenAI และจุดสนใจในอนาคต

7. เคล็ดลับการใช้งานสำหรับผู้ใช้ประเภทต่างๆ

8. ข้อสรุป—แม้ในยุคของการรวม การเลือกได้ยังคงเป็นอาวุธ

การปฏิวัติ AI! ChatGPT สนับสนุนการช้อปปิ้งออนไลน์และการเตรียมการนำเสนอของคุณอย่างเต็มที่

AI จะทำงานได้ดีด้วยโฆษณาหรือไม่: การนำโฆษณา ChatGPT มาใช้แสดงให้เห็นถึง "ความเป็นจริงของ AI สำหรับผู้บริโภค"

อาลีบาบาเปิดทางสู่อนาคตการเขียนโค้ดด้วย AI! เปิดตัวโมเดลโอเพ่นซอร์สล้ำสมัย

1 GPU สามารถสร้างเสียง 1 นาทีใน 1 วินาที ไมโครซอฟท์เปิดตัว AI ภายใน ─ Copilot จะพัฒนา "หัวใจ" ด้วยตัวเองหรือไม่

cookie_banner_title

1. เกิดอะไรขึ้น? ไทม์ไลน์ 48 ชั่วโมง

2. เป้าหมายของ GPT-5—กำจัด "ภาระการเลือกโมเดล"

3. ปรากฏการณ์ "คืน 4o"—ความรู้สึกจาก SNS

4. ความผิดพลาด "แผนภูมิอาชญากรรม"—ความเชื่อถือในการมองเห็น

5. อย่างไรก็ตาม "เนื้อใน" กำลังพัฒนาอยู่หรือไม่

6. การดำเนินการของ OpenAI และจุดสนใจในอนาคต

7. เคล็ดลับการใช้งานสำหรับผู้ใช้ประเภทต่างๆ

8. ข้อสรุป—แม้ในยุคของการรวม การเลือกได้ยังคงเป็นอาวุธ

การปฏิวัติ AI! ChatGPT สนับสนุนการช้อปปิ้งออนไลน์และการเตรียมการนำเสนอของคุณอย่างเต็มที่

AI จะทำงานได้ดีด้วยโฆษณาหรือไม่: การนำโฆษณา ChatGPT มาใช้แสดงให้เห็นถึง "ความเป็นจริงของ AI สำหรับผู้บริโภค"

อาลีบาบาเปิดทางสู่อนาคตการเขียนโค้ดด้วย AI! เปิดตัวโมเดลโอเพ่นซอร์สล้ำสมัย

1 GPU สามารถสร้างเสียง 1 นาทีใน 1 วินาที ไมโครซอฟท์เปิดตัว AI ภายใน ─ Copilot จะพัฒนา "หัวใจ" ด้วยตัวเองหรือไม่