AI के अदालत में खड़े होने का दिन हकीकत बन रहा है? "वकील सुरक्षित हैं" की धारणा कुछ ही हफ्तों में हिल गई — AI एजेंटों के प्रदर्शन में उछाल का कारण

AI के अदालत में खड़े होने का दिन हकीकत बन रहा है? "वकील सुरक्षित हैं" की धारणा कुछ ही हफ्तों में हिल गई — AI एजेंटों के प्रदर्शन में उछाल का कारण

"AI वकील नहीं बन सकता" — कुछ समय पहले तक, ऐसा विश्वास था। इसका कारण सरल था: जब पेशेवर "व्यावहारिक" कार्य दिए गए, तो AI ने उम्मीद के मुताबिक अच्छा प्रदर्शन नहीं किया। लेकिन, कुछ ही हफ्तों में यह विश्वास हिल गया।


TechCrunch ने Mercor द्वारा जारी किए गए AI एजेंट मूल्यांकन "APEX-Agents" की रैंकिंग में बदलाव को कवर किया। पिछले महीने तक, प्रमुख लैब्स का प्रदर्शन लगभग 25% से कम था, और "कम से कम फिलहाल के लिए वकील सुरक्षित हैं" का विचार कायम था। लेकिन इस हफ्ते, Anthropic के Opus 4.6 ने रैंकिंग को हिला दिया, और एक बार में लगभग 30% तक पहुंच गया, और अधिक प्रयासों के साथ औसतन 45% तक बढ़ गया। ये आंकड़े अभी भी "उत्तीर्ण" नहीं कहे जा सकते, लेकिन वृद्धि की दर जबरदस्त है। Mercor के CEO Brendan Foody ने इस अल्पकालिक वृद्धि को "अविश्वसनीय" कहा।



"APEX-Agents" क्या मापता है

APEX-Agents की विशेषता यह है कि यह केवल ज्ञान परीक्षण नहीं है, बल्कि निवेश बैंकिंग विश्लेषक, सलाहकार, कॉर्पोरेट कानून जैसे "उच्च मूल्य वाले व्हाइट-कॉलर कार्यों" के समान वातावरण में एजेंट की कार्यक्षमता को मापने का प्रयास करता है। Mercor के अनुसार, इसमें कई ऐप्स का उपयोग, लंबी योजना, विशेषज्ञता और तर्क की आवश्यकता होती है, और इसमें 33 "दुनिया" और 480 कार्य और मूल्यांकन मानदंड शामिल हैं। इसके अलावा, डेटा और मूल्यांकन के लिए एक प्रणाली (Archipelago) भी उपलब्ध कराई गई है। संक्षेप में, यह "वास्तविक समस्याओं" के बजाय "वास्तविक कार्यस्थल" बनाने और वहां की कार्यक्षमता को अंकित करने का विचार है।


इस डिज़ाइन का कानून के क्षेत्र के साथ अच्छा तालमेल है। कानूनी कार्य में, अनुच्छेद, मिसाल, आंतरिक नीतियां, अनुबंध की शर्तें, और पक्षकारों की परिस्थितियों जैसी बिखरी हुई सामग्री को जोड़कर एक तार्किक निष्कर्ष और दस्तावेज़ में बदलना होता है। इसके अलावा, सामग्री एकसमान नहीं होती। आंतरिक दस्तावेज़, ईमेल, चैट, बाहरी कानून और मार्गदर्शन एक साथ प्रभाव डालते हैं। जैसा कि TechCrunch ने पिछले महीने के लेख में बताया था, मॉडल का ठोकर खाने का कारण "कई डोमेन में जानकारी की खोज और एकीकरण" था।



Opus 4.6 के साथ स्कोर क्यों बढ़ा

इस तेजी से वृद्धि के पीछे की कुंजी Anthropic द्वारा Opus 4.6 में पेश किए गए "agent teams" हैं। एक एजेंट के क्रम में कार्य करने के बजाय, कई एजेंट कार्यों को विभाजित करते हैं और समानांतर में समायोजित करते हैं — यह मानव टीम के कार्य की नकल करने वाला डिज़ाइन है। TechCrunch के अनुसार, यह सुविधा API उपयोगकर्ताओं/सदस्यों के लिए अनुसंधान पूर्वावलोकन के रूप में उपलब्ध कराई गई है, और इसके अलावा संदर्भ लंबाई का विस्तार (1 मिलियन टोकन) और PowerPoint में साइड पैनल एकीकरण जैसे "कार्यस्थल केंद्रित" सुधार किए गए हैं।


APEX-Agents जैसे "कई चरणों में प्रगति करने वाले", "बीच में नीति को समायोजित करने वाले", "परिणाम को समायोजित करने वाले" प्रकार के कार्यों में, एकल बुद्धिमत्ता की तुलना में, विभाजन, पुनः प्रयास, और आत्म-जांच अधिक प्रभावी होती है। TechCrunch ने भी Opus 4.6 की "agentic features" के मल्टी-स्टेप समस्याओं में सहायक होने की संभावना का उल्लेख किया है।


हालांकि, यहाँ महत्वपूर्ण बात "30%" के आंकड़े का अर्थ है। यह 100% से बहुत दूर है। यह अगले हफ्ते अचानक वकीलों के बेरोजगार होने की बात नहीं है। TechCrunch ने भी इस पर जोर दिया है। लेकिन साथ ही, "सुरक्षित होने का दावा करने" का आधार भी कमजोर हो गया है। पेशे का प्रतिस्थापन शून्य या सौ में नहीं होता। पहले "कम किया जा सकने वाला कार्य" कम किया जाता है।



प्रतिस्थापन से पहले क्या होगा: कानूनी कार्य का "विघटन"

कानूनी कार्य को विघटित करने से, AI के लिए उपयुक्त स्थान दिखाई देते हैं।

  • प्रारंभिक मसौदा: अनुबंध के प्रारूप, खंड प्रस्ताव, जोखिम क्षेत्रों की पहचान

  • अनुसंधान सहायता: मुद्दों की पहचान, कानून, मिसाल, मार्गदर्शन की पहचान

  • तुलना और सारांश: विपक्षी संशोधन का अंतर विवरण, वार्ता मुद्दों की सूची

  • मानक प्रतिक्रिया: सामान्य प्रश्नों के उत्तर, आंतरिक नियमों के अनुसार टेम्पलेट बनाना


इनमें "अंतिम जिम्मेदारी" या "निर्णय" की आवश्यकता होती है, लेकिन अधिकांश कार्य खोज, संगठन और लेखन में शामिल होते हैं। यदि एजेंट इसे सस्ते और तेज़ी से कर सकते हैं, तो कानूनी फर्मों या कॉर्पोरेट कानून के लागत संरचना में बदलाव आ सकता है।


दूसरी ओर, गवाही या भावनाओं का प्रबंधन, पक्षकारों के साथ विश्वास संबंध, मूल्य निर्णय का टकराव जैसे कार्य, जो केवल पाठ निर्माण से प्रतिस्थापित करना कठिन हैं, भी बने रहेंगे। इसका मतलब है कि कानूनी कार्य "पूरी तरह से गायब" होने के बजाय "रूप बदलने" की अधिक संभावना है।



सोशल मीडिया की प्रतिक्रिया: उम्मीद और ठंडे पानी का एक साथ उभरना

इस विषय पर सोशल मीडिया (फोरम और समुदाय) की प्रतिक्रिया आम तौर पर तीन तापमान क्षेत्रों में विभाजित होती है।


1) "सहायक उपकरण के रूप में पहले से ही उपयोगी। लेकिन बिना निगरानी के खतरनाक"

Reddit के कानून से संबंधित समुदाय में, एक वर्तमान वकील के रूप में दावा करने वाले पोस्टर ने कहा कि "कुछ कार्यों को आसान बनाता है, लेकिन इसमें भ्रम और अवधारणा की समझ की कमी होती है, और विशेषज्ञ की निगरानी आवश्यक है", और भविष्य के रूप में "अगली पीढ़ी का Westlaw (कानूनी अनुसंधान आधार)" की स्थिति का उल्लेख किया। पूर्ण स्वायत्त प्रतिस्थापन के प्रति संदेह है, लेकिन उपकरण के रूप में इसका प्रसार पहले से ही मान्य है।


2) "अदालत या आपराधिक कार्य असंभव। समाज इसे स्वीकार नहीं करेगा"

कानूनी समुदाय के एक अन्य थ्रेड में, आपराधिक रक्षा के संदर्भ में "प्रक्रिया के सूक्ष्म निर्णयों को AI द्वारा केस-बाय-केस आधार पर संभालना कल्पना करना कठिन है" और "AI द्वारा दोषी/सजा का निर्णय लेना एक डिस्टोपिया है" जैसी प्रतिक्रियाएं देखी गईं। यहाँ क्षमता से पहले, वैधता, पारदर्शिता और मानव स्वीकृति की समस्याएं हैं।


3) "जिम्मेदारी कौन लेगा? अनुबंध और प्रशासन बाधा बनेंगे"

Hacker News में, AI एजेंट को बेचने वाले पक्ष, आधार मॉडल प्रदाता, और ग्राहक में से कौन जिम्मेदारी लेगा, इस पर "अनुबंध और जिम्मेदारी की सीमा" की चर्चा हो रही है। टूटी हुई उत्पाद को बेचने वाला कौन है, SaaS की अनिश्चितता को अनुबंध में कैसे संभालें — जैसे-जैसे प्रदर्शन बढ़ता है, कानूनी कार्य "AI का उपयोग करने वाले पक्ष के कानूनी कार्य" के रूप में मांग में वृद्धि करता है, जो एक विडंबनापूर्ण संरचना है।


इसके अलावा, लीगल AI कंपनी Harvey ने Opus 4.6 को अपनी मूल्यांकन (BigLaw Bench) में उच्च अंक प्राप्त करने के रूप में प्रस्तुत किया है, और व्यावहारिक कार्यों (मुकदमेबाजी और लेनदेन क्षेत्र) में मजबूत प्रदर्शन दिखाया है। यह "अनुसंधान का अंक" नहीं बल्कि "उत्पाद कार्यस्थल" की गर्मी को दर्शाने वाली प्रतिक्रिया है।



"30%" के डर का असली कारण

तो, क्यों 30% के आसपास का स्कोर भी "खतरा" बन सकता है? इसके दो कारण हैं।


पहला कारण है, अंक प्राप्त करने वाले क्षेत्रों का असमान वितरण। कानूनी कार्यों में, कुछ ऐसे क्षेत्र होते हैं जहां कठिन निर्णयों की तुलना में अधिक मानकीकृत प्रक्रियाएं होती हैं। यदि केवल वही स्वचालित हो जाएं, तो उद्योग की भर्ती और प्रशिक्षण संरचना (जूनियर को अनुभव प्राप्त करने का स्थान) हिल सकती है।


दूसरा कारण है, पुनः प्रयास और विभाजन के माध्यम से व्यावहारिकता के करीब पहुंचना। APEX-Agents में भी, एकल प्रयास की तुलना में कई प्रयासों के साथ औसत बढ़ता है। इसका मतलब है कि "पहले चूकना" लेकिन "पुनः प्रयास करने पर सही करना" प्रकार की क्षमता बढ़ने से मानव समीक्षा लागत को कम किया जा सकता है।


यहां तक आते-आते, चर्चा का केंद्र "वकील गायब होंगे या नहीं" नहीं है।
"कौन सा काम पहले सस्ता होगा", और "कौन निगरानी करेगा, और कौन जिम्मेदारी लेगा" में बदल जाएगा।



आगामी वास्तविकता: कानूनी कार्य का "AI-आधारित" होना

संभावित वास्तविकता शायद इस प्रकार होगी।

  • कॉर्पोरेट कानून, अनुबंध समीक्षा और आंतरिक परामर्श की प्रारंभिक प्रतिक्रिया AI के माध्यम से करेगा, और वकील अपवाद प्रबंधन और वार्ता पर ध्यान देंगे

  • कानूनी फर्में, अनुसंधान और मसौदा की थ्रूपुट बढ़ाएंगी, और मूल्य संरचना (स्थिर लागत → परिणाम और मूल्य) की समीक्षा करेंगी

  • "AI का उपयोग करना" स्वयं नियंत्रण (लॉग, स्पष्टीकरण, ऑडिट, मॉडल अपडेट के समय पुनर्मूल्यांकन) एक नया अनुपालन क्षेत्र बनेगा

  • और, जिम्मेदारी की सीमा, छूट, और गारंटी की लेखन शैली परिष्कृत होगी, और "AI युग के अनुबंध कार्य" को मजबूत करेगी


AI वकील बन सकता है या नहीं, उससे ज्यादा महत्वपूर्ण है कि वकील AI को आधार मानकर अपने काम को पुनः संरचित करें। APEX-Agents के स्कोर में वृद्धि ने इस वास्तविकता को पहले ही उजागर कर दिया है।



स्रोत

  • TechCrunch (2026/02/06) "शायद AI एजेंट वकील बन सकते हैं": APEX-Agents में Opus 4.6 के स्कोर में तेजी का मुख्य लेख
    https://techcrunch.com/2026/02/06/maybe-ai-agents-can-be-lawyers-after-all/

  • Mercor "The APEX-Agents leaderboard": APEX-Agents का डिज़ाइन (33 worlds/480 tasks) और स्कोर सूची (Opus 4.6 का 29.8% आदि)
    https://www.mercor.com/apex/apex-agents-leaderboard/

  • TechCrunch (2026/02/05) "Anthropic releases Opus 4.6 with new ‘agent teams’": agent teams, 1 मिलियन टोकन संदर्भ, PowerPoint एकीकरण आदि की विशेषताओं का विवरण
    https://techcrunch.com/2026/02/05/anthropic-releases-opus-4-6-with-new-agent-teams/

  • TechCrunch (2026/01/22) "क्या AI एजेंट कार्यस्थल के लिए तैयार हैं? एक नया बेंचमार्क संदेह उठाता है": APEX-Agents की पृष्ठभूमि, पिछले महीने के "संघर्ष" संदर्भ
    https://techcrunch.com/2026/01/22/are-ai-agents-ready-for-the-workplace-a-new-benchmark-raises-doubts/

  • Reddit r/LawSchool "AI और भविष्य": वर्तमान वकील के दृष्टिकोण से "सहायक है लेकिन निगरानी आवश्यक" की प्रतिक्रिया का उदाहरण
    https://www.reddit.com/r/LawSchool/comments/1qvryim/ai_and_the_future/

  • Reddit r/Lawyertalk "बिल गेट्स के अनुसार, 2030 तक वकील पूरी तरह से AI द्वारा प्रतिस्थापित हो जाएंगे": आपराधिक और अदालत क्षेत्र के प्रतिस्थापन के प्रति संदेह और सामाजिक स्वीकृति की प्रतिक्रिया का उदाहरण
    ##