मुख्य सामग्री पर जाएं
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア लोगो
  • सभी लेख
  • 🗒️ रजिस्टर
  • 🔑 लॉगिन
    • 日本語
    • English
    • 中文
    • Español
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
cookie_banner_title

cookie_banner_message गोपनीयता नीति cookie_banner_and कुकी नीति cookie_banner_more_info

कुकी सेटिंग्स

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

ChatGPT-5 वास्तव में निराशाजनक है?── पुराने मॉडल में जो नहीं कर सकता था / अन्य कंपनियों की अब भी श्रेष्ठता की पूरी जाँच

ChatGPT-5 वास्तव में निराशाजनक है?── पुराने मॉडल में जो नहीं कर सकता था / अन्य कंपनियों की अब भी श्रेष्ठता की पूरी जाँच

2025年08月12日 23:22

1. सबसे पहले "उम्मीदों से कम" के तर्क की वास्तविकता को व्यवस्थित करना

  • घोषणा के तुरंत बाद से ही सोशल मीडिया और मीडिया में समर्थन और विरोध के विचार टकरा रहे हैं। "उपयोगकर्ताओं की उम्मीदें अत्यधिक थीं", "उपयोगिता में सुधार हुआ है लेकिन यह कोई क्रांति नहीं है" जैसे विचार सामने आए। Axios ने गणित और भूगोल की त्रुटियों की रिपोर्ट, देरी के प्रति असंतोष, और "पीएच.डी. स्तर" के बयान के अंतर को इंगित किया है। Axios

  • ऐसी स्थिति का माहौल, मॉडल के एकीकरण और सुरक्षा और उपयोगिता पर जोर देने के लिए OpenAI के दिशा परिवर्तन के कारण है, जो कि दर्शकों की शानदार "उछाल" की उम्मीदों से मेल नहीं खाता। OpenAI



2. GPT-5 में "पुराने मॉडल में नहीं कर सकने वाली चीजें"

2-1. एकीकृत प्रणाली: स्वचालित रूप से "सोचने की मात्रा" और मार्ग का अनुकूलन

GPT-5 एक हल्का प्रतिक्रिया मॉडल + गहरा तर्क मॉडल (GPT-5 Thinking/Pro) + रीयल-टाइम राउटर का "एकीकरण" है। उपयोगकर्ता के निर्देशों या कार्य की कठिनाई के अनुसार, यह तेज़ प्रतिक्रिया से लेकर गहरी सोच तक भिन्न हो सकता है। यह "जल्दी से निपटने वाले कार्यों को तेजी से और कठिन समस्याओं को गहराई से सोचने" का अनुभव डिफ़ॉल्ट बनाता है। OpenAI



2-2. कोडिंग और एजेंट कार्यों में व्यापक सुधार

डेवलपर्स के लिए घोषणा में, SWE-bench Verified 74.9% और लंबी टूल श्रृंखला (समानांतर सहित) की ताकत को दिखाया गया, और verbosity या reasoning_effort जैसे उत्तर की लंबाई और सोच की मात्रा को नियंत्रित करने के नए पैरामीटर, **"साधारण टेक्स्ट में कॉल किए जा सकने वाले कस्टम टूल"** भी जोड़े गए। व्यावसायिक कार्यों में "समाप्त करने की क्षमता" में वृद्धि हुई है। OpenAI



2-3. चैट अनुभव: व्यक्तित्व प्रीसेट और आवाज का विकास

Fortune ने व्यंग्यात्मक (Cynic) / रोबोट (Robot) / सुनने वाला (Listener) / गीक (Nerd) जैसे कस्टमाइज़ करने योग्य "व्यक्तित्व" प्रीसेट और आवाज अनुभव का सुधार को पेश किया। स्वर के सूक्ष्म समायोजन को आसान बना दिया गया है, जिससे उपयोग के अनुसार बातचीत शैली को बदलना आसान हो गया है। फॉर्च्यून



2-4. व्यावसायिक क्षेत्र में विस्तार (कॉर्पोरेट उपयोग)

OpenAI ने लिखने, बनाने, खोजने के प्रमुख कार्यों में सटीकता, गति, और तर्क के उन्नयन पर जोर दिया। कॉर्पोरेट वर्कफ़्लो में स्वचालन और सहयोग को ध्यान में रखते हुए, **"नए श्रम युग"** की घोषणा की है। OpenAI



3. फिर भी असंतोष क्यों?──प्रारंभिक प्रतिक्रिया का अंतर

  • नाटकीय छलांग की प्रतीक्षा करने की उम्मीदों के मुकाबले, **"बड़ा मामूली अपडेट"** के रूप में दिखाई देने वाला बिंदु।

  • राउटर के व्यवहार और कुछ सटीकता के बारे में प्रारंभिक भ्रम और त्रुटि रिपोर्ट।

  • पुराने मॉडल (4o आदि) की तुलना में **"तापमान" और "सहानुभूति" का अंतर के प्रति संवेदनशील उपयोगकर्ता समूह।
    इनमें से अधिकांश
    लॉन्च के शुरुआती "आदत और समायोजन" चरण** के कारण हैं, और OpenAI सुधार जारी रखने की स्थिति दिखा रहा है। Axios



4. अन्य कंपनियां अभी भी बेहतर हैं (उपयोग के अनुसार)

4-1. गहरी सोच को उपयोगकर्ता द्वारा नियंत्रित करना: Anthropic Claude

  • Extended Thinking को ON/OFF किया जा सकता है, और डेवलपर्स **"सोच बजट (thinking budget)" भी सेट कर सकते हैं। जटिल कार्यों में सोच टोकन को बढ़ाने से सटीकता नियमित रूप से बढ़ती है**। SWE-bench और TAU-bench आदि में भी ताकत दिखाई गई। Anthropic+1

  • इसके अलावा पिछली बातचीत की खोज और संदर्भ की अनुमति देने वाले मेमोरी अपडेट भी प्रगति कर रहे हैं (Max/Team/Enterprise प्राथमिकता के साथ)। लंबे प्रोजेक्ट्स को फिर से शुरू करने में यह सहायक है। The Verge

इस तरह उपयोग करें:

  • गणित, विज्ञान, डिज़ाइन समीक्षा आदि, "सोचने का समय" जानबूझकर बढ़ाकर सटीकता को प्राप्त करना चाहते हैं।

  • सुरक्षा और नीति अनुपालन को प्राथमिकता देने वाली टीम। Anthropic



4-2. अनुसंधान, एकीकरण, लंबी संदर्भ: Google Gemini

  • 2.0 Pro/Flash/Flash-Lite में गति, लागत, क्षमता का विभाजन स्पष्ट है। 2M टोकन स्तर का लंबा संदर्भ, खोज और कोड निष्पादन जैसे टूल एकीकरण को आधिकारिक रूप से पूर्वनिर्धारित किया गया है। blog.google

  • गहरा अनुसंधान और कैनवास (कोड निर्माण और पूर्वावलोकन के साथ कार्यक्षेत्र), **2.5 प्रो (प्रयोग)** की "सोच" को भी विस्तारित किया गया है। शिक्षा के लिए AI प्रो का जापान में प्रदान जैसे इकोसिस्टम को मजबूत करना भी इसकी विशेषता है। Geminiblog.google

इस तरह उपयोग करें:

  • Google ऐप्स के साथ एकीकृत अनुसंधान, योजना, और दस्तावेजीकरण (YouTube/Maps/Drive आदि)।

  • बड़ी मात्रा में दस्तावेज़ विश्लेषण और लंबे समय तक प्रोजेक्ट प्रबंधन।



4-3. स्व-होस्टिंग/कस्टम स्वतंत्रता: Meta Llama (ओपन सिस्टम)

  • Llama 3.1 (अधिकतम 405B) को "ओपन के लिए सबसे मजबूत" के रूप में रिपोर्ट किया गया है, और इसके बाद Llama 3.2 में विज़न समर्थन और एज ऑप्टिमाइज़ेशन का विस्तार किया गया है। लागत और गोपनीयता आवश्यकताओं के लिए "स्वयं संचालित" करना चाहने वाले व्यवसायों के लिए यह उपयुक्त है। The VergeAI Meta+1

इस तरह उपयोग करें:

  • ऑन-प्रिमाइसेस/विशेष विनियमों के तहत संचालन, सूक्ष्म समायोजन और तर्क लागत का अनुकूलन को प्राथमिकता देने वाले परिदृश्य।

  • मोबाइल/एज पर वास्तविक समय प्रसंस्करण।



5. निष्कर्ष──"उम्मीदों से कम" या "सुनिश्चित प्रगति"

  • GPT-5 एकीकृत बुद्धिमत्ता संचालन (सोच की मात्रा और रूटिंग) के साथ "व्यावसायिक सुगमता"

← लेख सूची पर वापस जाएं

contact |  सेवा की शर्तें |  गोपनीयता नीति |  कुकी नीति |  कुकी सेटिंग्स

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア सभी अधिकार सुरक्षित।