1GPU पर 1 मिनट की ऑडियो को 1 सेकंड में उत्पन्न करना। माइक्रोसॉफ्ट, इन-हाउस AI की शुरुआत ─ क्या Copilot का "दिल" इन-हाउस बनेगा?

1GPU पर 1 मिनट की ऑडियो को 1 सेकंड में उत्पन्न करना। माइक्रोसॉफ्ट, इन-हाउस AI की शुरुआत ─ क्या Copilot का "दिल" इन-हाउस बनेगा?

इन-हाउस मॉडल के माध्यम से "सह-अस्तित्व प्रतिस्पर्धा" का मार्ग प्रशस्त करना

माइक्रोसॉफ्ट ने इन-हाउस AI के व्यापक उपयोग की दिशा में कदम बढ़ाया है। घोषणा 28 अगस्त 2025 (स्थानीय समय) को की गई थी। The Verge ने इसे "OpenAI के साथ जटिल साझेदारी में एक नया मोड़" के रूप में वर्णित किया और इसे GPT-5 और DeepSeek के समकक्ष "प्रतिस्पर्धी मॉडल" के रूप में स्थान दिया। इसका मतलब है कि कंपनी OpenAI के साथ सहयोग करते हुए, खुद भी अग्रणी भूमिका में "सह-अस्तित्व प्रतिस्पर्धा" के चरण में प्रवेश कर चुकी है।The Verge


MAI-Voice-1: 1GPU पर 1 सेकंड से कम में 1 मिनट की आवाज़

मुख्य आकर्षणों में से एक आवाज़ उत्पन्न करने वाला मॉडल "MAI-Voice-1" है। आधिकारिक घोषणा के अनुसार, यह एकल GPU पर 1 मिनट की आवाज़ को 1 सेकंड से कम समय में संश्लेषित करने की दक्षता प्राप्त करता है। इसे पहले से ही "Copilot Daily" में समाचार पढ़ने और "पॉडकास्ट शैली" में विषयों की व्याख्या करने की सुविधा में शामिल किया गया है, और Copilot Labs के डेमो में वक्ता की आवाज़ और बोलने की शैली को बदलते हुए आज़माया जा सकता है।Microsoft AI


MAI-1-preview: H100 के लगभग 15,000 यूनिट्स से प्रशिक्षित MoE LLM

एक और नया चेहरा "MAI-1-preview" है, जो निर्देशों का पालन करने में कुशल Mixture-of-Experts प्रकार का बड़ा भाषा मॉडल है। पूर्व और पश्चात प्रशिक्षण के लिए NVIDIA H100 के लगभग 15,000 यूनिट्स का उपयोग किया गया है, और सबसे पहले इसे समुदाय मूल्यांकन मंच "LMArena" पर सार्वजनिक परीक्षण के लिए शुरू किया गया है, और सीमित API एक्सेस के माध्यम से भी प्रतिक्रिया एकत्र की जा रही है। कुछ हफ्तों के भीतर Copilot के विशिष्ट टेक्स्ट उपयोगों के लिए चरणबद्ध रोलआउट की भी घोषणा की गई है।Microsoft AIPYMNTS.com


"उपभोक्ता अनुकूल" डिज़ाइन विचारधारा

Microsoft AI के Mustafa Suleyman ने इन-हाउस मॉडल की प्राथमिकता को "उपभोक्ता अनुभव" पर रखने की बात कही है। विज्ञापन और उपभोक्ता टेलीमेट्री जैसे अपने डेटा संसाधनों का उपयोग करते हुए, "AI साथी" के लिए अनुकूलित करने का विचार है। उत्पाद-नेतृत्व वाली प्रणाली की दिशा में कदम बढ़ाते हुए, यह समझा जा सकता है कि Copilot के "दैनिक मार्ग" को सुधारने के लिए इन-हाउस मॉडल का उपयोग किया जा रहा है।The Verge


Copilot का "सर्वोत्तम मॉडल का संयोजन" की ओर अग्रसर होना

कंपनी ने OpenAI और ओपन सोर्स के "सर्वोत्तम मॉडल" का संयोजन जारी रखने की योजना बनाई है, जबकि MAI-1-preview का उपयोग Copilot की कुछ विशेषताओं में शुरू किया जाएगा। महत्वपूर्ण बात यह है कि "प्रत्येक उपयोग मामले के लिए सर्वोत्तम मॉडल का संयोजन" की सोच है। वर्तमान चरण में यह पूर्ण प्रतिस्थापन नहीं है, बल्कि उपयोग के विभाजन की सटीकता ही सफलता का निर्धारण करेगी।Microsoft AI


इन्फ्रास्ट्रक्चर की महत्वाकांक्षा: GB200 क्लस्टर का संचालन

घोषणा में यह भी उल्लेख किया गया है कि अगली पीढ़ी के NVIDIA GB200 क्लस्टर का संचालन चल रहा है। इसका मतलब है कि कंपनी इन-हाउस मॉडल को "निरंतर और बड़े पैमाने पर" सुधारने की योजना को धीरे-धीरे तैयार कर रही है। प्रशिक्षण और अनुमान लागत को कम करते हुए बार-बार अपडेट करने की संचालन क्षमता प्रतिस्पर्धा में अंतर लाएगी।Microsoft AI


उपयोग का अनुभव: Copilot Labs और LMArena

अनुभव मार्ग पहले से ही खुला है। आवाज़ उत्पन्न करने वाला MAI-Voice-1 Copilot Labs से आज़माया जा सकता है। LLM पक्ष का MAI-1-preview LMArena पर मूल्यांकन में भाग ले सकता है, और कंपनी सीमित API के माध्यम से भी परीक्षकों की भर्ती कर रही है। उत्पाद में कार्यान्वयन से पहले, समुदाय के साथ मिलकर "आदतें" और "विशेषज्ञता के क्षेत्र" को समझने की प्रक्रिया है।Microsoft AI


सोशल मीडिया की प्रतिक्रिया: उम्मीद और चिंता का "द्वंद्व"

 


X (पूर्व में Twitter) पर Suleyman ने स्वयं "पहले इन-हाउस मॉडल" की घोषणा की। तकनीकी खातों ने इसे तेजी से साझा किया, और "OpenAI पर निर्भरता से रणनीतिक स्वतंत्रता की ओर एक कदम" के रूप में सकारात्मक रूप से इसे देखा गया।X (formerly Twitter)


दूसरी ओर, PhoneArena जैसी साइटों ने "किसी की भी आवाज़ को वास्तविक रूप में उत्पन्न करने के युग" के प्रति चिंता व्यक्त की। आवाज़ डीपफेक के प्रसार और सत्यापन के साधनों की स्थापना की मांग करने वाले विचार भी प्रचलित हैं। Reddit पर "सुरक्षा कैसे सुनिश्चित की जाएगी" जैसे चिंताओं और OpenAI के साथ संबंधों की पुनर्परिभाषा पर चर्चा हो रही है।PhoneArenaReddit


रणनीतिक प्रभाव: OpenAI के साथ "नया संतुलन"

यह इन-हाउस मॉडल OpenAI और माइक्रोसॉफ्ट के संबंधों को तुरंत "समाप्त" नहीं करता है। हालांकि, जैसा कि The Verge ने बताया, यह नया चरण कंपनी को "शीर्ष मॉडल के आपूर्तिकर्ता" के साथ-साथ "प्रतिस्पर्धी" के रूप में भी प्रस्तुत करता है। यदि Copilot का मुख्य भाग स्व-निर्मित किया जा सकता है, तो भेदभाव की गति को कंपनी की सुविधानुसार तेज किया जा सकता है।The Verge


आगे के मूल्यांकन बिंदु

  1. क्षमता: LMArena आदि पर वास्तविक माप में कितना ऊँचा स्थान प्राप्त करता है।

  2. अनुभव: Copilot में चरणबद्ध परिचय के साथ, उत्तर की गुणवत्ता, प्रतिक्रिया गति, और आवाज़ की प्राकृतिकता में सुधार होता है या नहीं।

  3. सुरक्षा: आवाज़ की जालसाजी का पता लगाना, लेबलिंग, दुरुपयोग के समय दर नियंत्रण और ट्रेसबिलिटी।

  4. आर्थिकता: एकल GPU पर तेज़ उत्पादन आदि, अनुमान लागत का संचालन पर कैसे प्रभाव पड़ता है।

  5. शासन: OpenAI और अन्य मॉडल के संयोजन की डिजाइन पारदर्शिता और जिम्मेदारी की सीमाओं को कैसे बनाए रखती है।Microsoft AI


निष्कर्ष: इन-हाउस "उद्देश्य" नहीं बल्कि "साधन" है

इन-हाउस मॉडल का उपयोग OpenAI के साथ प्रतिस्पर्धा करने के लिए "उद्देश्य" नहीं है। यह Copilot अनुभव को उपयोगकर्ता के दैनिक जीवन में शामिल करने के लिए, कंपनी की गति से सुधारने का "साधन" है। MAI-Voice-1 और MAI-1-preview का प्रकाशन केवल उस कहानी का प्रारंभिक अध्याय है। अगले अध्याय की कुंजी, वास्तविक प्रदर्शन डेटा और सुरक्षित संचालन, और "सर्वोत्तम मॉडल का संयोजन" को कितनी अच्छी तरह से पूरा किया जा सकता है, में है।Microsoft AI


संदर्भ लेख

माइक्रोसॉफ्ट ने पहला इन-हाउस AI मॉडल लॉन्च किया
स्रोत: https://www.theverge.com/news/767809/microsoft-in-house-ai-models-launch-openai