सैम ऑल्टमैन, GPT-5 की चुनौतियों और 4o की वापसी के बारे में बात करते हैं: बेंच सबसे मजबूत, अनुभव अधूरा? GPT-5 के लॉन्च इवेंट में "चार्ट क्राइम" और विश्वास की लागत

सैम ऑल्टमैन, GPT-5 की चुनौतियों और 4o की वापसी के बारे में बात करते हैं: बेंच सबसे मजबूत, अनुभव अधूरा? GPT-5 के लॉन्च इवेंट में "चार्ट क्राइम" और विश्वास की लागत

1. क्या हुआ? 48 घंटे की समयरेखा

8 अगस्त (अमेरिकी समयानुसार), OpenAI ने नया फ्लैगशिप "GPT-5" लॉन्च किया। यह एक रीयल-टाइम राउटर के माध्यम से "सोचने" और त्वरित प्रतिक्रिया देने वाले सिस्टम के बीच स्विच करता है, जिससे "एकीकृत मॉडल" की दिशा में कदम बढ़ाया गया। अगले दिन, सैम ऑल्टमैन सीईओ और अन्य ने Reddit पर AMA आयोजित किया और बताया कि "पहले दिन राउटर में गंभीर समस्या (sev) थी, जिसके कारण स्वचालित स्विचिंग बंद हो गई थी। इस वजह से 'GPT-5 बेवकूफ हो गया' जैसा महसूस हुआ।" उन्होंने Plus की दर सीमा को दोगुना करने और यह दिखाने का वादा किया कि कौन सा मॉडल जवाब दे रहा है। इसके अलावा, "4o को वापस लाने" की मांग पर, उन्होंने Plus में इसे जारी रखने पर विचार करने का आश्वासन दिया।


2. GPT-5 का उद्देश्य—"मॉडल चयन का बोझ" हटाना

OpenAI ने आधिकारिक घोषणा में GPT-5 को "एक एकीकृत प्रणाली" के रूप में परिभाषित किया। यह बताया गया कि सामान्यतः हल्के और स्मार्ट मॉडल का उपयोग किया जाएगा, जबकि कठिन समस्याओं के लिए "सोचने" वाले मॉडल (GPT-5 Thinking/Pro) का राउटर स्वचालित रूप से चयन करेगा। निर्देश पालन और तथ्यात्मकता में सुधार, कोडिंग, रचनात्मकता और स्वास्थ्य क्षेत्रों में बेंचमार्क सुधार भी घोषित किए गए। इसका मुख्य उद्देश्य उपयोगकर्ताओं को "कौन सा मॉडल चुनना है" यह सोचने से मुक्त करना है।OpenAI


यह डिज़ाइन अधिकांश उपयोगकर्ताओं के लिए स्वागत योग्य है। लेकिन "मॉडल की विशेषताओं" का उपयोग करने वाले भारी उपयोगकर्ताओं के लिए, इसे चयन के अधिकार में कमी के रूप में देखा जा सकता है। हाल की घटना में यह अंतर स्पष्ट रूप से सामने आया।


3. "4o को वापस लाओ" घटना—SNS पर वास्तविक अनुभव

घोषणा के तुरंत बाद, Reddit के r/ChatGPT जैसे प्लेटफार्मों पर "GPT-5 की भाषा कठोर है", "रचनात्मकता की भावना कम हो गई है", "4o की आवाज़ और बातचीत की भावना की याद आती है" जैसी पोस्टों की बाढ़ आ गई। "Bring back 4o", "#keep4o" जैसे आह्वान और हस्ताक्षर साइटों की साझेदारी भी देखी गई। वहीं, "5 अधिक तेज़ और व्यावहारिक है", "कोडिंग बेहतर हो गई है" जैसी प्रतिक्रियाएं भी कम नहीं थीं। 9-10 अगस्त के बीच, "Plus के 'विरासत प्रदर्शन' में 4o वापस आ गया/क्रमशः लागू हो रहा है" जैसी रिपोर्टें बढ़ीं, और वास्तव में स्विच करने में सक्षम होने की कई आवाजें उठीं।TechRadarReddit


मीडिया में भी "4o वापस आ रहा है" की रिपोर्टें आईं, जिससे यह स्पष्ट हुआ कि उपयोगकर्ताओं की आवाज़ को जल्दी से सुना गया। हालांकि, क्षेत्र, योजना और ऐप के प्रतिबिंब में समयांतराल की रिपोर्टें मिश्रित हैं।Tom's Guide


4. "चार्ट क्राइम" का दर्द—दृश्यता की विश्वसनीयता

घोषणा के दौरान, संख्याओं और बार की ऊंचाई में असंगति जैसी गलतियों के कारण "चार्ट क्राइम (सांख्यिकीय रूप से दोषपूर्ण चार्ट)" चर्चा में रहा। ऑल्टमैन ने X पर इसे "बड़ी गलती" के रूप में स्वीकार किया और कंपनी से माफी भी आई। आधिकारिक ब्लॉग के चार्ट सही थे, लेकिन लाइव प्रस्तुति में दृश्यता की गलती "तथ्यात्मकता को बेचने वाले उत्पाद के प्रचार के रूप में दर्दनाक" थी। The Verge ने विशेष रूप से असंगतियों की जांच की, और इंटरनेट पर व्यंग्य भी बढ़ गया।The Verge


इस घटना ने दो संकेत दिए। पहला, AI विक्रेताओं की "संख्याओं की प्रस्तुति" उत्पाद की विश्वसनीयता से सीधे जुड़ी होती है। दूसरा, भले ही मॉडल बुद्धिमान हो, "मानव दृश्यता और सत्यापन प्रक्रिया" अलग होती है, और अंततः इसे मानव द्वारा सुरक्षित किया जाना चाहिए।


5. फिर भी "अंदरूनी" विकास कर रहा है या नहीं

डेवलपर्स और शोधकर्ताओं के दृष्टिकोण से, GPT-5 के निर्देश पालन, कोड जनरेशन की स्थिरता, और दीर्घकालिक विचार के दौरान तथ्यात्मकता में सुधार की प्रशंसा की गई है। दूसरी ओर, समीक्षक साइमन विलिसन ने एक उदाहरण साझा किया जहां मॉडल को टेबल को स्वचालित रूप से संरेखित करने दिया गया, लेकिन त्रुटि हुई, जिसे Python के माध्यम से ठीक किया गया। इसका मतलब है कि यह "सर्वज्ञ" नहीं है, लेकिन "कैसे विफलताओं से बचें और संयोजन के माध्यम से उन्हें पूरा करें" जैसे व्यावहारिक ज्ञान महत्वपूर्ण हो जाता है।OpenAISimon Willison’s Weblog


6. OpenAI की "रणनीति" और भविष्य के फोकस

AMA में, Plus की दर सीमा को दोगुना करने, मॉडल चयन की पारदर्शिता, और 4o की निरंतरता पर विचार करने की बात कही गई। लॉन्च के तुरंत बाद राउटर की समस्या एक "अनुभव की पहली चोट" है, लेकिन अगर स्विचिंग एल्गोरिदम में सुधार होता है, तो एकीकृत UX के लाभ सामने आएंगे। सवाल यह है कि "विविधता की पसंद" और "एकीकरण की सरलता" को कैसे मिलाएं। विरासत चयन और "शैली और व्यक्तित्व की सूक्ष्म कस्टमाइजेशन" महत्वपूर्ण होंगे।


7. उपयोगकर्ता-विशिष्ट व्यावहारिक सुझाव

  • व्यक्तिगत रचनाकार: यदि आप कहानी और बातचीत की "गर्मी" को महत्व देते हैं, तो फिलहाल 4o (यदि उपलब्ध हो) और 5 का संयोजन करें। GPT-5 को "इस शैली में", "भावनात्मक रूप से मजबूत" जैसे स्पष्ट शैली निर्देश दें। विफलता के मामले में, "टेबल बनाएं → Python में टेबल बनाएं और फिर व्यवस्थित करें" जैसे टूल एकीकरण का उपयोग करें।RedditSimon Willison’s Weblog

  • डेवलपर्स: राउटर पर निर्भर न रहें, महत्वपूर्ण प्रक्रियाओं में "सोच मोड को स्पष्ट करें", और सत्यापन प्रक्रियाओं (प्रकार, परीक्षण, लिंट) को प्राथमिकता दें। दृश्यता को स्वचालित जनरेशन पर न छोड़ें, इकाई, अक्ष और अनुपात की डबल चेकिंग करें।The Verge

  • कॉर्पोरेट अपनाने: प्रारंभ में "अनुभव की अस्थिरता" की अपेक्षा करें, SLA के बजाय SLO के साथ निगरानी करें। मॉडल चयन नीति को स्पष्ट करें, और उपयोगकर्ताओं के लिए "वर्तमान में कौन सा मॉडल है" की प्रदर्शनी और एस्केलेशन पथ (दीर्घकालिक मजबूरी, मानव सत्यापन) को डिज़ाइन करें।


8. निष्कर्ष—एकीकरण के युग में भी, चुनने की स्वतंत्रता एक हथियार है

GPT-5 ने "अधिकांश लोगों के लिए उपयोग को आसान बनाने" की दिशा स्पष्ट की है। दूसरी ओर, AI अनुभव "प्रदर्शन" के समान "पसंद" पर निर्भर करता है। हाल की घटना सिर्फ एक खराबी या दृश्यता की गलती की बात नहीं है। "एकीकरण" और "व्यक्तित्व" को कैसे संतुलित करें—AI के जनसाधारण में अपरिहार्य डिज़ाइन चुनौती को स्पष्ट रूप से उजागर किया गया।


संदर्भ लेख

सैम ऑल्टमैन ने "असहज" GPT-5 के लॉन्च, 4o की वापसी, और "चार्ट क्राइम" पर टिप्पणी की
स्रोत: https://techcrunch.com/2025/08/08/sam-altman-addresses-bumpy-gpt-5-rollout-bringing-4o-back-and-the-chart-crime/