2025 में, एआई "बोलने" से "चलने" की ओर — एआई एजेंट के वर्ष की सच्चाई और 2026 के लिए होमवर्क

2025 में, एआई "बोलने" से "चलने" की ओर — एआई एजेंट के वर्ष की सच्चाई और 2026 के लिए होमवर्क

2025 में, "एआई एजेंट" एक 'अवधारणा' से 'इन्फ्रास्ट्रक्चर' की ओर—और 2026 में, हमारे सामने आने वाली चुनौतियाँ

2025 वह वर्ष था जब जनरेटिव एआई "अच्छे लेखन के लिए एक उपयोगी उपकरण" से "बाहरी उपकरणों का उपयोग करने वाला, कई चरणों को आगे बढ़ाने वाला, और कुछ हद तक 'स्वायत्त' रूप से काम पूरा करने वाला" एक इकाई में विकसित हुआ। अनुसंधान प्रयोगशालाओं और डेमो में चर्चा किए गए 'एजेंट' ने दैनिक उत्पादों और कार्य डिजाइनों में प्रवेश किया, और अंततः इसे वास्तविक इन्फ्रास्ट्रक्चर के रूप में देखा जाने लगा—यह 2025 में हुआ।The Dispatch


हालांकि, यह परिवर्तन "भविष्य आ गया" जैसी एक सरल कहानी नहीं है। जितना अधिक एआई एजेंट कर सकते हैं, उतनी ही अधिक सुरक्षा, मूल्यांकन विधियाँ, मानकीकरण, शासन, रोजगार और निगरानी, बिजली और डेटा केंद्र जैसी सामाजिक कार्यान्वयन से जुड़ी चुनौतियाँ सामने आती हैं। और 2026 वह वर्ष हो सकता है जब हम इन चुनौतियों से निपटने का प्रयास करेंगे।



"एआई एजेंट" की परिभाषा का परिवर्तन: अकादमिक शब्दावली से उत्पाद विनिर्देश तक

एआई क्षेत्र में "एजेंट" शब्द का उपयोग लंबे समय से होता आ रहा है। पारंपरिक रूप से, इसे पर्यावरण का अवलोकन करने, अनुमान लगाने और कार्य करने वाली प्रणाली के रूप में अकादमिक ढांचे में चर्चा की गई थी। हालांकि, 2025 के 'एजेंट' को अधिक व्यावहारिक रूप से पुनर्परिभाषित किया गया है। बड़े भाषा मॉडल (एलएलएम) बाहरी उपकरणों को बुलाते हैं, एपीआई का उपयोग करते हैं, और कार्यों को स्वायत्त रूप से आगे बढ़ाते हैं—इस "कार्य करने की क्षमता" को प्रमुखता दी गई है।The Dispatch


इस प्रवृत्ति को तेज करने वाले तत्वों में से एक एलएलएम और बाहरी उपकरणों को मानक रूप से जोड़ने की प्रणाली है। लेख में बताया गया है कि 2024 के अंत में जारी किया गया Anthropic का Model Context Protocol (MCP) एलएलएम के लिए "टेक्स्ट के बाहर जाने" के लिए एक महत्वपूर्ण आधार बन गया।The Dispatch
संक्षेप में, एजेंट का सार "स्मार्ट लेखन" नहीं बल्कि "सिस्टम के बीच में काम को पूरा करने की क्षमता" में स्थानांतरित हो गया।



2025 को आकार देने वाले मील के पत्थर: प्रतिस्पर्धा, मानक, और 'ब्राउज़र का पुनः आविष्कार'

1) ओपन मॉडल प्रतिस्पर्धा का तेजी से बढ़ना

2025 की शुरुआत में, चीन का DeepSeek-R1 'ओपन वेट' के रूप में उभरा, जिसने यह सवाल उठाया कि कौन उच्च प्रदर्शन वाले मॉडल बना सकता है—लेख इसे याद करता है।The Dispatch

इसके अलावा, अमेरिका की प्रमुख प्रयोगशालाएँ (OpenAI, Anthropic, Google, xAI आदि) और चीन की टेक कंपनियाँ (Alibaba, Tencent, DeepSeek आदि) मॉडल रिलीज़ और इकोसिस्टम विस्तार को आगे बढ़ा रही हैं, और प्रतिस्पर्धा भू-राजनीति को शामिल करते हुए 'दीर्घकालिक संघर्ष' का रूप ले रही है।The Dispatch


2) एजेंटों के बीच बातचीत की दुनिया: Agent2Agent और मानकीकरण

एक और महत्वपूर्ण मोड़ Google द्वारा प्रस्तावित Agent2Agent (A2A) प्रोटोकॉल था। जबकि MCP का ध्यान "उपकरणों के उपयोग" पर केंद्रित था, A2A "एजेंटों के बीच कैसे समन्वय किया जाए" पर ध्यान केंद्रित करता है। दोनों को एक साथ उपयोग करने के लिए डिज़ाइन किया गया था, और बाद में Linux Foundation को दान किए जाने के कारण, मानकीकरण की प्रक्रिया और मजबूत हो गई।The Dispatch


मानकीकरण धीमा हो सकता है, लेकिन यह अत्यधिक प्रभावी है। क्योंकि जब आपसी कनेक्शन की लागत कम हो जाती है, तो एजेंट 'कुछ अग्रणी कंपनियों के खिलौने' से 'कई कंपनियों द्वारा अपनाए जा सकने वाले घटक' बन जाते हैं।


3) "एजेंट-आधारित ब्राउज़र" के रूप में अगला प्रवेश बिंदु

2025 के मध्य में "एजेंट-आधारित ब्राउज़र" उभरने लगे, लेख में इसका उल्लेख है। यह विचार है कि ब्राउज़र न केवल जानकारी खोजे और पढ़े, बल्कि आरक्षण और खरीदारी जैसे 'कार्यों' को भी पूरा करे।The Dispatch

यह न केवल यूएक्स में बदलाव है, बल्कि अधिकार डिज़ाइन में भी बदलाव है। अर्थात्, यदि ब्राउज़र "आपकी ओर से कार्य करता है", तो लॉगिन जानकारी, भुगतान, व्यक्तिगत जानकारी, ब्राउज़िंग इतिहास आदि के प्रबंधन का महत्व बढ़ जाता है।


4) वर्कफ्लो बिल्डर के माध्यम से लोकतंत्रीकरण की प्रगति

n8n जैसे वर्कफ्लो निर्माण उपकरणों का प्रसार भी कस्टम एजेंटों को 'बनाने में सक्षम लोगों' की सीमा को विस्तारित करता है।The Dispatch
"केवल कोड लिखने में सक्षम लोगों की स्वचालन" से "उन लोगों की स्वचालन जो व्यवसाय को समझते हैं" की ओर। जब यह प्रगति होती है, तो एजेंटों का प्रसार दर तेजी से बढ़ेगा।



जितना अधिक शक्तिशाली, उतना ही खतरनाक: "नई शक्ति" और "नया जोखिम"

2025 में एजेंटों के विकास की विशेषता यह थी कि उनकी क्षमताओं के साथ-साथ जोखिम भी प्रकट हुए। लेख में Claude Code एजेंट का उल्लेख है, जिसे साइबर हमलों के आंशिक स्वचालन में दुरुपयोग किया गया था, और यह दिखाया गया कि "दोहरावदार और तकनीकी कार्यों को स्वचालित करने की शक्ति दुर्भावनापूर्ण गतिविधियों की बाधाओं को भी कम करती है"।The Dispatch


और भी अधिक चिंताजनक यह है कि एजेंटों के 'कनेक्ट' होने से कमजोरियाँ बढ़ जाती हैं। यदि एकल एलएलएम गलत उत्तर देता है, तो क्षति सीमित हो सकती है, लेकिन उपकरणों का आह्वान, ब्राउज़र संचालन, और अन्य एजेंटों के साथ समन्वय के संयोजन से "गलतियाँ कार्यों में बदल सकती हैं" की संभावना बढ़ जाती है।The Dispatch


और जब गलतियाँ कार्यों में बदल जाती हैं, तो सुरक्षा 'बाद में जोड़े गए चेकलिस्ट' के रूप में पर्याप्त नहीं होती।



2026 के फोकस पॉइंट्स: मूल्यांकन, शासन, और "क्या बड़ा मॉडल बेहतर है?"

1) बेंचमार्क का पुन: डिज़ाइन: "परिणाम" के बजाय "प्रक्रिया" को मापना

पारंपरिक बेंचमार्क एकल मॉडल के प्रदर्शन की तुलना के लिए उपयुक्त थे। लेकिन एजेंट "मॉडल + उपकरण + मेमोरी + निर्णय लेने की तर्कशक्ति" का एक जटिल रूप हैं। इसलिए 2026 में, 'स्कोर' से अधिक 'किस प्रक्रिया से यह किया गया' महत्वपूर्ण होगा, लेख का यह कहना है।The Dispatch

यह मानव के लिए "उत्तर सही है या नहीं" से अधिक "बीच का चरण दिखाओ" के समान है। विश्वसनीय एजेंट बनाने के लिए प्रक्रिया दृश्यता और मूल्यांकन विधियों का मानकीकरण अपरिहार्य है।


2) शासन और मानक संगठन: Agentic AI Foundation

2025 के अंत में Linux Foundation द्वारा Agentic AI Foundation (AAIF) की स्थापना यह संकेत देती है कि "जीत का तरीका स्वामित्व मानकों में नहीं, बल्कि पारस्परिक संचालन में है"। लेख में AAIF के W3C जैसी भूमिका निभाने की संभावना का उल्लेख है।The Dispatch


जब पारस्परिक संचालन बढ़ता है, तो सुविधा बढ़ती है, लेकिन जब दुर्घटनाएँ होती हैं, तो जिम्मेदारी की सीमाएँ (कौन कितना जिम्मेदार है) स्पष्ट नहीं होती हैं, तो इसे अपनाना मुश्किल हो जाता है। 2026 में 'प्रसार के लिए जिम्मेदारी डिज़ाइन' की आवश्यकता होगी।


3) "बड़े मॉडल" बनाम "छोटे और विशेषीकृत मॉडल"

मॉडल जितना बड़ा होता है, वह उतना ही सर्वव्यापी होता है, लेकिन एजेंट के रूप में यह हमेशा सबसे अच्छा समाधान नहीं होता। छोटे, कार्य-विशिष्ट मॉडल के लिए कई क्षेत्रों में लाभकारी हो सकते हैं, लेख में यह चर्चा बढ़ रही है।The Dispatch


मौके पर महत्वपूर्ण यह है कि "हर चीज़ कर सकने की क्षमता" से अधिक "इस कार्य को निश्चित रूप से करना"। 2026 में, उपयोगकर्ता 'उद्देश्य के अनुसार मॉडल का चयन' करने के युग में प्रवेश करेंगे, और चयन की जिम्मेदारी भी उपयोगकर्ता की ओर स्थानांतरित होगी।



फिर भी बनी रहने वाली सामाजिक चुनौतियाँ: बिजली, रोजगार, निगरानी, और विनियमन

लेख में केवल तकनीकी चुनौतियों की बात नहीं की गई है। डेटा केंद्रों का विस्तार बिजली ग्रिड पर भार डालता है और स्थानीय समुदायों को प्रभावित करता है। कार्यस्थलों में स्वचालन बढ़ता है, जिससे रोजगार के प्रतिस्थापन और निगरानी की चिंताएँ बढ़ती हैं।The Dispatch


और सुरक्षा के मामले में, उपकरण कनेक्शन और बहु-स्तरीय एजेंटकरण जोखिम को 'गुणा' करते हैं। विशेष रूप से अप्रत्यक्ष प्रॉम्प्ट इंजेक्शन (वेब पर एम्बेडेड निर्देशों को एजेंट द्वारा पढ़ा जाना और अनपेक्षित कार्य करना) के प्रति सतर्कता की आवश्यकता है, लेख में यह कहा गया है।The Dispatch


विनियमन के बारे में भी, यूरोप और चीन की तुलना में अमेरिका में निगरानी सीमित है, यह मुद्दा उठाया गया है, और भविष्य में "पहुंच", "जवाबदेही", "सीमा निर्धारण" के बिना जीवन इन्फ्रास्ट्रक्चर में घुसपैठ करने का खतरा बना रहता है।The Dispatch

इसलिए, एजेंटों को 'सिर्फ सॉफ्टवेयर घटक' के रूप में नहीं, बल्कि 'सामाजिक तकनीकी प्रणाली' के रूप में देखा जाना चाहिए, और सख्त इंजीनियरिंग, डिज़ाइन, और दस्तावेज़ीकरण की आवश्यकता है—यह लेख का निष्कर्ष है।##HTML_TAG