राजनीति और खरीदारी दोनों में "AI से परामर्श" का युग: समझाने वाले चैटबॉट के पीछे क्या हो रहा है

राजनीति और खरीदारी दोनों में "AI से परामर्श" का युग: समझाने वाले चैटबॉट के पीछे क्या हो रहा है

"मैं अपनी राय खुद बनाता हूँ" कितनी सच है?

"मैंने किसी के कहने पर नहीं, बल्कि खुद सोचकर इस राय तक पहुँचा हूँ।"
बहुत से लोग ऐसा मानना चाहते हैं।


हालांकि, ब्रिटिश सरकार के AI Security Institute (AISI) के नेतृत्व में एक शोध टीम द्वारा प्रस्तुत नवीनतम बड़े पैमाने पर अध्ययन ने इस "आत्मविश्वास" पर ठंडा पानी डाल दिया। यह दिखाया गया कि जब लोग राजनीतिक विषयों पर चैटबॉट्स के साथ बातचीत करते हैं, तो उनकी राय सांख्यिकीय रूप से महत्वपूर्ण स्तर पर बदल जाती है।गार्जियन


और सबसे अधिक लोगों के मन को प्रभावित करने वाला कोई नाटकीय कहानी या चतुराई से तैयार की गई मनोवैज्ञानिक तकनीक नहीं थी। यह बस "बड़ी मात्रा में तथ्य और डेटा प्रस्तुत करने वाला" चैटबॉट था।THE DECODER


इस शोध को समझाने वाला ZDNet का लेख "How chatbots can change your mind – a new study reveals what makes AI so persuasive" है। इसमें "मॉडल को अधिक प्रभावशाली बनाने के लिए प्रशिक्षित करने पर, भ्रम (हैलुसिनेशन) बढ़ता है" जैसे उत्तेजक वाक्यांश के माध्यम से AI युग की "प्रभावशीलता" की अनिश्चितता को चित्रित किया गया है।स्टार्टअप न्यूज


इस लेख में, हम इस शोध और लेख के मुख्य बिंदुओं को व्यवस्थित करते हुए, सोशल मीडिया पर प्रतिक्रियाओं को भी शामिल करते हुए "प्रभावशाली चैटबॉट्स" समाज को कितना बदल सकते हैं, इस पर विचार करेंगे।



76,000 लोग, 19 मॉडल, 707 विषय - अब तक का सबसे बड़ा "प्रभाव प्रयोग"

शोध टीम ने ब्रिटेन के लगभग 76,000 मतदाताओं को ऑनलाइन आमंत्रित किया और उन्हें 19 प्रकार के बड़े भाषा मॉडल (LLM) के साथ 1-1 बातचीत करने के लिए कहा। विषय ब्रिटिश राजनीति से संबंधित 707 मुद्दे थे। सार्वजनिक क्षेत्र के वेतन, हड़तालें, जीवन यापन की लागत में वृद्धि, आव्रजन नीति आदि, जो वास्तविक चुनावों में मुद्दे बन सकते हैं।गार्जियन


प्रयोग का प्रवाह इस प्रकार है:

  1. प्रतिभागी एक राजनीतिक दावे के प्रति अपनी सहमति की डिग्री को 0 से 100 अंक में उत्तर देते हैं।

  2. इसके बाद, वे चैटबॉट के साथ लगभग 10 मिनट तक, औसतन 7 बार बातचीत करते हैं।

  3. फिर से, वे उसी दावे के प्रति सहमति या असहमति को 0 से 100 अंक में उत्तर देते हैं।

यह पहले और बाद का अंतर "कितना प्रभावित हुआ" का संकेतक बनता है।गार्जियन


साथ ही, बातचीत के दौरान मॉडल द्वारा प्रस्तुत किए गए "तथ्यात्मक रूप से सत्यापित दावे" सभी लेबल किए गए और उनकी सटीकता की भी जाँच की गई। परिणामस्वरूप, कुल मिलाकर लगभग 500,000 तथ्यात्मक दावे उत्पन्न हुए, जिनकी औसत सटीकता "100 में से लगभग 77 अंक" बताई गई।THE DECODER



अप्रत्याशित विजेता: "सिर्फ जानकारी भरने" की रणनीति

शोध टीम ने चैटबॉट के बोलने के तरीके को भी 8 पैटर्न में विभाजित कर तुलना की। इसमें मनोविज्ञान और राजनीतिक अभियान के अध्ययन में प्रसिद्ध तकनीकें शामिल हैं।Science


  • कहानी सुनाना (कहानी के रूप में अपील करना)

  • नैतिक पुनःफ्रेमिंग (दूसरे के मूल्यों के अनुसार नैतिक रूप से पुनःफ्रेम करना)

  • गहरी बातचीत (पहले दूसरे के अनुभवों और भावनाओं को ध्यान से सुनना और फिर प्रभावित करना)

  • विपरीत राय के प्रति सहानुभूति दिखाना और धीरे-धीरे अपनी स्थिति की ओर ले जाना … आदि


और, इन सबके साथ तुलना में एक बहुत ही सरल "सूचना प्रॉम्प्ट" का परीक्षण किया गया।
सामग्री को संक्षेप में कहें तो,

जितने संभव हो उतने तथ्य, आँकड़े, और प्रमाण प्रस्तुत करते हुए, दूसरे को प्रभावित करें।

केवल यही निर्देश।


परिणाम, आश्चर्यजनक रूप से स्पष्ट थे।
सूचना प्रॉम्प्ट का उपयोग करने वाले चैटबॉट ने अन्य किसी भी रणनीति की तुलना में लगातार उच्च प्रभावशीलता दिखाई, और बेसलाइन प्रॉम्प्ट की तुलना में लगभग 27% अधिक प्रभावी पाया गया।THE DECODER


इसके अलावा, बातचीत में प्रस्तुत "तथ्यों की संख्या" जितनी अधिक होती है, लोगों के दृष्टिकोण में परिवर्तन की दर भी उतनी ही बढ़ती जाती है। एक विश्लेषण में कहा गया है कि "प्रत्येक सत्यापनीय दावे के बढ़ने पर, औसतन 0.3 अंक तक प्रभाव स्कोर बढ़ता है।"THE DECODER


सूचना घनत्व (information density) और प्रभावशीलता के बीच सहसंबंध 0.7 से अधिक था, और लगभग रैखिक संबंध देखा गया।ChatPaper

संक्षेप में, "जितने अधिक 'तथ्य' दिखते हैं" को प्रस्तुत करना सबसे शक्तिशाली प्रभाव तकनीक बन गया है।



प्रभावशीलता के बदले में खोने वाली "सटीकता"

हालांकि, इस जीत के पीछे एक काला पक्ष भी है।


AISI के विश्लेषण और AI सुरक्षा क्षेत्र के व्याख्यात्मक लेखों के अनुसार, जितने अधिक प्रभावी बनाने के लिए पोस्ट-ट्रेनिंग (अतिरिक्त प्रशिक्षण) किए गए मॉडल, तथ्यों की सटीकता में गिरावट की प्रवृत्ति स्पष्ट रूप से देखी गई।AICERTs - Empower with AI Certifications


  • कुल औसत में देखा जाए तो, तथ्यों का लगभग 77% सटीक था,

  • सबसे प्रभावशाली मॉडल समूहों में, गलत जानकारी की मात्रा लगभग 30% तक बढ़ गई थी।AICERTs - Empower with AI 


शोधकर्ताओं ने चेतावनी दी है कि पोस्ट-ट्रेनिंग के दौरान "कितना दूसरे के दृष्टिकोण को बदल सकते हैं" को पुरस्कार के रूप में मॉडल को अनुकूलित करने के परिणामस्वरूप, "तथ्यात्मकता" की बजाय "प्रभावशाली दावे कितने उत्पन्न कर सकते हैं" पर जोर दिया गया।AICERTs - Empower with AI Certifications


यह ZDNet के लेख का संदेश "प्रभावशीलता बढ़ाने पर भ्रम बढ़ता है" के साथ पूरी तरह मेल खाता है।स्टार्टअप न्यूज


प्रभावशीलता और सत्यता के बीच ट्रेडऑफ—यह संरचना ही है जो कई सोशल मीडिया उपयोगकर्ताओं को चिंतित कर रही है।



"व्यक्तिगतकरण" अपेक्षा के विपरीत प्रभावी नहीं था

एक और दिलचस्प बात यह है कि "व्यक्तिगत जानकारी का उपयोग करके व्यक्तिगतकरण" लगभग प्रभावहीन था।

शोध में, प्रतिभागियों की विशेषताओं (जैसे उम्र, लिंग, राजनीतिक झुकाव) को मॉडल को सिखाने वाले प्रॉम्प्ट्स या उस जानकारी के साथ पहले से ठीक किए गए मॉडल का भी परीक्षण किया गया। हालांकि, उनकी प्रभावशीलता मात्र 1 अंक से कम के अंतर तक सीमित रही।THE DECODER


बल्कि,

  • कौन सा मॉडल उपयोग किया जाता है (मॉडल का आकार और प्रदर्शन)

  • किस प्रकार का पोस्ट-ट्रेनिंग किया जाता है

  • कौन सी प्रॉम्प्ट रणनीति उपयोग की जाती है

जैसे **"डिजाइन पक्ष के विकल्प"** का प्रभाव प्रभावशीलता पर अत्यधिक बड़ा होता है।LinkedIn


अर्थात,

"आपके Facebook 'लाइक' इतिहास से व्यक्तित्व को पढ़कर, सटीक रूप से प्रभावित किया जाना"
की बजाय,
"किसी के लिए भी, बस बड़ी मात्रा में 'तथ्य' प्रस्तुत करने वाला AI"

वास्तव में अधिक प्रभावी होता है—कम से कम, प्रयोगशाला स्तर पर यह निष्कर्ष है।



प्रयोग के परिणाम: "कमजोर लेकिन नजरअंदाज नहीं किया जा सकता" प्रभाव

तो, कितनी प्रभावशीलता थी?


अन्य मीडिया के विश्लेषण के अनुसार, इस बातचीत के माध्यम से प्रभाव का औसत स्तर "कुछ अंक" था—कई मामलों में लगभग 5 अंक का परिवर्तन