सैम ऑल्टमैन, GPT-5 की चुनौतियों और 4o की वापसी के बारे में बात करते हैं: बेंच सबसे मजबूत, अनुभव अधूरा? GPT-5 के लॉन्च इवेंट में "चार्ट क्राइम" और विश्वास की लागत

2025年08月10日 11:53

1. क्या हुआ? 48 घंटे की समयरेखा

8 अगस्त (अमेरिकी समयानुसार), OpenAI ने नया फ्लैगशिप "GPT-5" लॉन्च किया। यह एक रीयल-टाइम राउटर के माध्यम से "सोचने" और त्वरित प्रतिक्रिया देने वाले सिस्टम के बीच स्विच करता है, जिससे "एकीकृत मॉडल" की दिशा में कदम बढ़ाया गया। अगले दिन, सैम ऑल्टमैन सीईओ और अन्य ने Reddit पर AMA आयोजित किया और बताया कि "पहले दिन राउटर में गंभीर समस्या (sev) थी, जिसके कारण स्वचालित स्विचिंग बंद हो गई थी। इस वजह से 'GPT-5 बेवकूफ हो गया' जैसा महसूस हुआ।" उन्होंने Plus की दर सीमा को दोगुना करने और यह दिखाने का वादा किया कि कौन सा मॉडल जवाब दे रहा है। इसके अलावा, "4o को वापस लाने" की मांग पर, उन्होंने Plus में इसे जारी रखने पर विचार करने का आश्वासन दिया।

2. GPT-5 का उद्देश्य—"मॉडल चयन का बोझ" हटाना

OpenAI ने आधिकारिक घोषणा में GPT-5 को "एक एकीकृत प्रणाली" के रूप में परिभाषित किया। यह बताया गया कि सामान्यतः हल्के और स्मार्ट मॉडल का उपयोग किया जाएगा, जबकि कठिन समस्याओं के लिए "सोचने" वाले मॉडल (GPT-5 Thinking/Pro) का राउटर स्वचालित रूप से चयन करेगा। निर्देश पालन और तथ्यात्मकता में सुधार, कोडिंग, रचनात्मकता और स्वास्थ्य क्षेत्रों में बेंचमार्क सुधार भी घोषित किए गए। इसका मुख्य उद्देश्य उपयोगकर्ताओं को "कौन सा मॉडल चुनना है" यह सोचने से मुक्त करना है।OpenAI

यह डिज़ाइन अधिकांश उपयोगकर्ताओं के लिए स्वागत योग्य है। लेकिन "मॉडल की विशेषताओं" का उपयोग करने वाले भारी उपयोगकर्ताओं के लिए, इसे चयन के अधिकार में कमी के रूप में देखा जा सकता है। हाल की घटना में यह अंतर स्पष्ट रूप से सामने आया।

3. "4o को वापस लाओ" घटना—SNS पर वास्तविक अनुभव

घोषणा के तुरंत बाद, Reddit के r/ChatGPT जैसे प्लेटफार्मों पर "GPT-5 की भाषा कठोर है", "रचनात्मकता की भावना कम हो गई है", "4o की आवाज़ और बातचीत की भावना की याद आती है" जैसी पोस्टों की बाढ़ आ गई। "Bring back 4o", "#keep4o" जैसे आह्वान और हस्ताक्षर साइटों की साझेदारी भी देखी गई। वहीं, "5 अधिक तेज़ और व्यावहारिक है", "कोडिंग बेहतर हो गई है" जैसी प्रतिक्रियाएं भी कम नहीं थीं। 9-10 अगस्त के बीच, "Plus के 'विरासत प्रदर्शन' में 4o वापस आ गया/क्रमशः लागू हो रहा है" जैसी रिपोर्टें बढ़ीं, और वास्तव में स्विच करने में सक्षम होने की कई आवाजें उठीं।TechRadarReddit

मीडिया में भी "4o वापस आ रहा है" की रिपोर्टें आईं, जिससे यह स्पष्ट हुआ कि उपयोगकर्ताओं की आवाज़ को जल्दी से सुना गया। हालांकि, क्षेत्र, योजना और ऐप के प्रतिबिंब में समयांतराल की रिपोर्टें मिश्रित हैं।Tom's Guide

4. "चार्ट क्राइम" का दर्द—दृश्यता की विश्वसनीयता

घोषणा के दौरान, संख्याओं और बार की ऊंचाई में असंगति जैसी गलतियों के कारण "चार्ट क्राइम (सांख्यिकीय रूप से दोषपूर्ण चार्ट)" चर्चा में रहा। ऑल्टमैन ने X पर इसे "बड़ी गलती" के रूप में स्वीकार किया और कंपनी से माफी भी आई। आधिकारिक ब्लॉग के चार्ट सही थे, लेकिन लाइव प्रस्तुति में दृश्यता की गलती "तथ्यात्मकता को बेचने वाले उत्पाद के प्रचार के रूप में दर्दनाक" थी। The Verge ने विशेष रूप से असंगतियों की जांच की, और इंटरनेट पर व्यंग्य भी बढ़ गया।The Verge

इस घटना ने दो संकेत दिए। पहला, AI विक्रेताओं की "संख्याओं की प्रस्तुति" उत्पाद की विश्वसनीयता से सीधे जुड़ी होती है। दूसरा, भले ही मॉडल बुद्धिमान हो, "मानव दृश्यता और सत्यापन प्रक्रिया" अलग होती है, और अंततः इसे मानव द्वारा सुरक्षित किया जाना चाहिए।

5. फिर भी "अंदरूनी" विकास कर रहा है या नहीं

डेवलपर्स और शोधकर्ताओं के दृष्टिकोण से, GPT-5 के निर्देश पालन, कोड जनरेशन की स्थिरता, और दीर्घकालिक विचार के दौरान तथ्यात्मकता में सुधार की प्रशंसा की गई है। दूसरी ओर, समीक्षक साइमन विलिसन ने एक उदाहरण साझा किया जहां मॉडल को टेबल को स्वचालित रूप से संरेखित करने दिया गया, लेकिन त्रुटि हुई, जिसे Python के माध्यम से ठीक किया गया। इसका मतलब है कि यह "सर्वज्ञ" नहीं है, लेकिन "कैसे विफलताओं से बचें और संयोजन के माध्यम से उन्हें पूरा करें" जैसे व्यावहारिक ज्ञान महत्वपूर्ण हो जाता है।OpenAISimon Willison’s Weblog

6. OpenAI की "रणनीति" और भविष्य के फोकस

AMA में, Plus की दर सीमा को दोगुना करने, मॉडल चयन की पारदर्शिता, और 4o की निरंतरता पर विचार करने की बात कही गई। लॉन्च के तुरंत बाद राउटर की समस्या एक "अनुभव की पहली चोट" है, लेकिन अगर स्विचिंग एल्गोरिदम में सुधार होता है, तो एकीकृत UX के लाभ सामने आएंगे। सवाल यह है कि "विविधता की पसंद" और "एकीकरण की सरलता" को कैसे मिलाएं। विरासत चयन और "शैली और व्यक्तित्व की सूक्ष्म कस्टमाइजेशन" महत्वपूर्ण होंगे।

7. उपयोगकर्ता-विशिष्ट व्यावहारिक सुझाव

व्यक्तिगत रचनाकार: यदि आप कहानी और बातचीत की "गर्मी" को महत्व देते हैं, तो फिलहाल 4o (यदि उपलब्ध हो) और 5 का संयोजन करें। GPT-5 को "इस शैली में", "भावनात्मक रूप से मजबूत" जैसे स्पष्ट शैली निर्देश दें। विफलता के मामले में, "टेबल बनाएं → Python में टेबल बनाएं और फिर व्यवस्थित करें" जैसे टूल एकीकरण का उपयोग करें।RedditSimon Willison’s Weblog
डेवलपर्स: राउटर पर निर्भर न रहें, महत्वपूर्ण प्रक्रियाओं में "सोच मोड को स्पष्ट करें", और सत्यापन प्रक्रियाओं (प्रकार, परीक्षण, लिंट) को प्राथमिकता दें। दृश्यता को स्वचालित जनरेशन पर न छोड़ें, इकाई, अक्ष और अनुपात की डबल चेकिंग करें।The Verge
कॉर्पोरेट अपनाने: प्रारंभ में "अनुभव की अस्थिरता" की अपेक्षा करें, SLA के बजाय SLO के साथ निगरानी करें। मॉडल चयन नीति को स्पष्ट करें, और उपयोगकर्ताओं के लिए "वर्तमान में कौन सा मॉडल है" की प्रदर्शनी और एस्केलेशन पथ (दीर्घकालिक मजबूरी, मानव सत्यापन) को डिज़ाइन करें।

8. निष्कर्ष—एकीकरण के युग में भी, चुनने की स्वतंत्रता एक हथियार है

GPT-5 ने "अधिकांश लोगों के लिए उपयोग को आसान बनाने" की दिशा स्पष्ट की है। दूसरी ओर, AI अनुभव "प्रदर्शन" के समान "पसंद" पर निर्भर करता है। हाल की घटना सिर्फ एक खराबी या दृश्यता की गलती की बात नहीं है। "एकीकरण" और "व्यक्तित्व" को कैसे संतुलित करें—AI के जनसाधारण में अपरिहार्य डिज़ाइन चुनौती को स्पष्ट रूप से उजागर किया गया।

संदर्भ लेख

सैम ऑल्टमैन ने "असहज" GPT-5 के लॉन्च, 4o की वापसी, और "चार्ट क्राइम" पर टिप्पणी की
स्रोत: https://techcrunch.com/2025/08/08/sam-altman-addresses-bumpy-gpt-5-rollout-bringing-4o-back-and-the-chart-crime/

1. क्या हुआ? 48 घंटे की समयरेखा

2. GPT-5 का उद्देश्य—"मॉडल चयन का बोझ" हटाना

3. "4o को वापस लाओ" घटना—SNS पर वास्तविक अनुभव

4. "चार्ट क्राइम" का दर्द—दृश्यता की विश्वसनीयता

5. फिर भी "अंदरूनी" विकास कर रहा है या नहीं

6. OpenAI की "रणनीति" और भविष्य के फोकस

7. उपयोगकर्ता-विशिष्ट व्यावहारिक सुझाव

8. निष्कर्ष—एकीकरण के युग में भी, चुनने की स्वतंत्रता एक हथियार है

AI आखिरकार विज्ञापनों से चलेगा: ChatGPT विज्ञापन की शुरूआत "उपभोक्ता AI की वास्तविकता" को दर्शाती है

OpenAI ने एलन मस्क के Grok को मात दी! Kaggle में AI शिखर संघर्ष: OpenAI o3 की शानदार जीत, Grok4 क्यों विफल हुआ?

राजनीति और खरीदारी दोनों में "AI से परामर्श" का युग: समझाने वाले चैटबॉट के पीछे क्या हो रहा है

1GPU पर 1 मिनट की ऑडियो को 1 सेकंड में उत्पन्न करना। माइक्रोसॉफ्ट, इन-हाउस AI की शुरुआत ─ क्या Copilot का "दिल" इन-हाउस बनेगा?

cookie_banner_title

1. क्या हुआ? 48 घंटे की समयरेखा

2. GPT-5 का उद्देश्य—"मॉडल चयन का बोझ" हटाना

3. "4o को वापस लाओ" घटना—SNS पर वास्तविक अनुभव

4. "चार्ट क्राइम" का दर्द—दृश्यता की विश्वसनीयता

5. फिर भी "अंदरूनी" विकास कर रहा है या नहीं

6. OpenAI की "रणनीति" और भविष्य के फोकस

7. उपयोगकर्ता-विशिष्ट व्यावहारिक सुझाव

8. निष्कर्ष—एकीकरण के युग में भी, चुनने की स्वतंत्रता एक हथियार है

AI आखिरकार विज्ञापनों से चलेगा: ChatGPT विज्ञापन की शुरूआत "उपभोक्ता AI की वास्तविकता" को दर्शाती है

OpenAI ने एलन मस्क के Grok को मात दी! Kaggle में AI शिखर संघर्ष: OpenAI o3 की शानदार जीत, Grok4 क्यों विफल हुआ?

राजनीति और खरीदारी दोनों में "AI से परामर्श" का युग: समझाने वाले चैटबॉट के पीछे क्या हो रहा है

1GPU पर 1 मिनट की ऑडियो को 1 सेकंड में उत्पन्न करना। माइक्रोसॉफ्ट, इन-हाउस AI की शुरुआत ─ क्या Copilot का "दिल" इन-हाउस बनेगा?