ข้ามไปที่เนื้อหาหลัก
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア โลโก้
  • บทความทั้งหมด
  • 🗒️ สมัครสมาชิก
  • 🔑 เข้าสู่ระบบ
    • 日本語
    • English
    • 中文
    • Español
    • Français
    • 한국어
    • Deutsch
    • हिंदी
cookie_banner_title

cookie_banner_message นโยบายความเป็นส่วนตัว cookie_banner_and นโยบายคุกกี้ cookie_banner_more_info

การตั้งค่าคุกกี้

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

แซม อัลท์แมน พูดถึงความท้าทายของ GPT-5 และการกลับมาของ 4o: เบนช์คือที่สุด ประสบการณ์ยังไม่สมบูรณ์? “Chart Crime” ในงานเปิดตัว GPT-5 และต้นทุนของความไว้วางใจ

แซม อัลท์แมน พูดถึงความท้าทายของ GPT-5 และการกลับมาของ 4o: เบนช์คือที่สุด ประสบการณ์ยังไม่สมบูรณ์? “Chart Crime” ในงานเปิดตัว GPT-5 และต้นทุนของความไว้วางใจ

2025年08月10日 11:52

1. เกิดอะไรขึ้น? ไทม์ไลน์ 48 ชั่วโมง

วันที่ 7 สิงหาคม (เวลาสหรัฐฯ) OpenAI ได้ประกาศเปิดตัว "GPT-5" เรือธงใหม่ โดยมีการเปลี่ยนแปลงไปสู่ "โมเดลรวม" ที่มีตัวสลับการตอบสนองแบบรวดเร็วและแบบ "คิด" ในเบื้องหลังเป็นแกนหลัก วันที่ 8 สิงหาคม Sam Altman CEO และทีมงานได้จัด AMA บน Reddit โดยอธิบายว่า "วันแรกมีปัญหาร้ายแรง (sev) กับตัวสลับ ทำให้การสลับอัตโนมัติเสียหายในบางช่วงเวลา ซึ่งทำให้รู้สึกว่า 'GPT-5 โง่ลง'" และสัญญาว่าจะเพิ่มขีดจำกัดอัตราของ Plus เป็นสองเท่าและปรับปรุงการแสดงผลว่าโมเดลใดกำลังตอบคำถาม นอกจากนี้ยังยืนยันว่าจะพิจารณาการให้บริการ 4o ต่อไปใน Plus ตามคำขอที่เข้มแข็ง


2. เป้าหมายของ GPT-5—กำจัด "ภาระการเลือกโมเดล"

ในประกาศอย่างเป็นทางการ OpenAI ได้กำหนดให้ GPT-5 เป็น "ระบบรวมหนึ่งเดียว" โดยปกติจะใช้โมเดลที่เบาและฉลาด ส่วนปัญหาที่ยากจะใช้โมเดล "คิด" (GPT-5 Thinking/Pro) ซึ่งตัวสลับจะตัดสินใจอัตโนมัติ มีการปรับปรุงการติดตามคำสั่งและความถูกต้อง รวมถึงการปรับปรุงในด้านโค้ด การสร้างสรรค์ และสุขภาพ กล่าวคือ UX ที่ไม่ต้องให้ผู้ใช้คิดว่า "จะเลือกโมเดลใด" เป็นแกนหลักOpenAI


การออกแบบนี้เป็นที่ยินดีสำหรับผู้ใช้ส่วนใหญ่ แต่สำหรับผู้ใช้หนักที่เคยใช้ "บุคลิกของโมเดล" อาจมองว่าเป็นการลดสิทธิ์ในการเลือก เหตุการณ์ครั้งนี้ทำให้ช่องว่างนี้ปรากฏชัดเจน


3. ปรากฏการณ์ "คืน 4o"—ความรู้สึกจาก SNS

หลังการประกาศ มีโพสต์จำนวนมากใน Reddit เช่น r/ChatGPT ว่า "GPT-5 มีบทความที่แข็ง" "การสร้างสรรค์ลดลง" "คิดถึงเสียงและความรู้สึกของ 4o" มีการเรียกร้อง "Bring back 4o" "#keep4o" และแชร์เว็บไซต์ลงชื่อ ในขณะเดียวกันก็มีการตอบรับว่า "5 เร็วกว่าและมีประสิทธิภาพ" "โค้ดดีขึ้น" วันที่ 9-10 สิงหาคม มีรายงานว่า "4o กลับมาใน 'การแสดงผลแบบเลกาซี' ของ Plus" และมีเสียงยืนยันว่ามีการสลับได้จริงTechRadarReddit


มีรายงานจากสื่อว่า "4o กำลังกลับมา" ซึ่งแสดงถึงการตอบสนองต่อเสียงของผู้ใช้อย่างรวดเร็ว แต่มีรายงานจากผู้ใช้ว่ามีความแตกต่างในเวลาในแง่ของภูมิภาค แผน และแอปTom's Guide


4. ความผิดพลาด "แผนภูมิอาชญากรรม"—ความเชื่อถือในการมองเห็น

ในงานเปิดตัว มีข้อผิดพลาดเช่นตัวเลขและความสูงของแท่งไม่ตรงกัน ทำให้เกิดประเด็น "แผนภูมิอาชญากรรม (แผนภูมิที่ผิดพลาดทางสถิติ)" Altman ยอมรับใน X ว่าเป็น "ความผิดพลาดใหญ่" และมีการขอโทษจากภายในบริษัท แผนภูมิในบล็อกอย่างเป็นทางการถูกต้อง แต่ความผิดพลาดในการมองเห็นในงานสดเป็น "ความเจ็บปวดในการประชาสัมพันธ์ผลิตภัณฑ์ที่เน้นความถูกต้อง" The Verge ได้ตรวจสอบความไม่สอดคล้องกันอย่างละเอียด และมีการเสียดสีในอินเทอร์เน็ตเพิ่มขึ้นThe Verge


เหตุการณ์นี้ให้ข้อคิดสองประการ ประการแรก วิธีการพูดถึง "ตัวเลข" ของผู้ขาย AI มีผลโดยตรงต่อความเชื่อถือในผลิตภัณฑ์ ประการที่สอง แม้ว่าโมเดลจะฉลาด แต่ "กระบวนการมองเห็นและตรวจสอบของมนุษย์" เป็นสิ่งที่แยกต่างหาก และสุดท้ายมนุษย์ต้องรักษาไว้


5. อย่างไรก็ตาม "เนื้อใน" กำลังพัฒนาอยู่หรือไม่

จากมุมมองของนักพัฒนาและนักวิจัย มีการประเมินว่า GPT-5 มีการปรับปรุงในด้านการติดตามคำสั่ง ความเสถียรของการสร้างโค้ด และความถูกต้องเมื่อคิดนาน ในขณะเดียวกัน Simon Willison นักรีวิว ได้แชร์ตัวอย่าง "จุดอ่อน" โดยเมื่อเขาปล่อยให้โมเดลจัดเรียงตารางอัตโนมัติ มันผิดพลาด และต้องใช้ Python แก้ไข กล่าวคือไม่ใช่ "อเนกประสงค์" แต่ความรู้ในการปฏิบัติงานที่รวมถึง "วิธีหลีกเลี่ยงความล้มเหลวและการชดเชยด้วยการรวมกัน" มีความสำคัญOpenAISimon Willison’s Weblog


6. การดำเนินการของ OpenAI และจุดสนใจในอนาคต

ใน AMA มีการแสดงถึงการเพิ่มขีดจำกัดอัตราของ Plus การทำให้การเลือกโมเดลโปร่งใส และการพิจารณาการให้บริการ 4o ต่อไป ปัญหาการสลับในช่วงเปิดตัวเป็น "การโจมตีครั้งแรกของประสบการณ์" ที่ใหญ่ แต่ถ้าอัลกอริทึมการสลับได้รับการปรับปรุง ประโยชน์ของ UX รวมจะเด่นขึ้น ปัญหาคือจะทำอย่างไรให้ "ความหลากหลายของความชอบ" และ "ความสะดวกของการรวม" อยู่ร่วมกันได้ การเลือกเลกาซีและ "การปรับแต่งสไตล์และบุคลิกภาพในระดับละเอียด" จะเป็นกุญแจ


7. เคล็ดลับการใช้งานสำหรับผู้ใช้ประเภทต่างๆ

  • ผู้สร้างสรรค์ส่วนบุคคล: หากให้ความสำคัญกับ "ความรู้สึก" ของเรื่องราวและบทสนทนา ในตอนนี้ควรใช้ 4o (ถ้าใช้ได้) และ 5 ควบคู่กันเพื่อเปรียบเทียบ ให้ GPT-5 "ใช้สไตล์นี้" "เพิ่มอารมณ์" อย่างชัดเจน หากล้มเหลวให้ใช้การเชื่อมต่อเครื่องมือเป็นประกัน เช่น "สร้างตาราง→ใช้ Python สร้างตารางแล้วจัดเรียงใหม่"RedditSimon Willison’s Weblog

  • นักพัฒนา: ไม่ควรพึ่งพาตัวสลับ ให้ระบุ "โหมดคิด" ในขั้นตอนสำคัญ และให้มีการตรวจสอบ (ประเภท ทดสอบ lint) เป็นพื้นฐาน ไม่ควรปล่อยให้การมองเห็นถูกสร้างอัตโนมัติ ควรตรวจสอบหน่วย แกน และอัตราส่วนสองครั้งThe Verge

  • การนำเข้าในองค์กร: ในช่วงแรกควรคาดการณ์ "ความผันผวนของประสบการณ์" และติดตามด้วย SLO มากกว่า SLA ควรทำให้ชัดเจนนโยบายการเลือกโมเดล และออกแบบการแสดงผลให้ผู้ใช้ทราบว่า "ขณะนี้ใช้โมเดลใด" และเส้นทางการยกระดับ (การบังคับคิดนาน การตรวจสอบโดยมนุษย์)


8. ข้อสรุป—แม้ในยุคของการรวม การเลือกได้ยังคงเป็นอาวุธ

GPT-5 ได้แสดงทิศทางที่ชัดเจนว่า "ทำให้ใช้งานง่ายสำหรับคนส่วนใหญ่" ในขณะเดียวกัน ประสบการณ์ AI ขึ้นอยู่กับ "ความชอบ" พอๆ กับ "ประสิทธิภาพ" เหตุการณ์ครั้งนี้ไม่ใช่แค่เรื่องของข้อบกพร่องหรือความผิดพลาดในการมองเห็น แต่เป็นการเปิดเผยปัญหาการออกแบบที่หลีกเลี่ยงไม่ได้ในการทำให้ AI เป็นที่นิยม—วิธีการรวม "การรวม" และ "บุคลิกภาพ"


บทความอ้างอิง

Sam Altman กล่าวถึงการเปิดตัว GPT-5 ที่ "ไม่ราบรื่น" การคืน 4o และ "อาชญากรรมแผนภูมิ"
ที่มา: https://techcrunch.com/2025/08/08/sam-altman-addresses-bumpy-gpt-5-rollout-bringing-4o-back-and-the-chart-crime/

Powered by Froala Editor

← กลับไปที่รายการบทความ

contact |  ข้อกำหนดการใช้งาน |  นโยบายความเป็นส่วนตัว |  นโยบายคุกกี้ |  การตั้งค่าคุกกี้

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア สงวนลิขสิทธิ์