मुख्य सामग्री पर जाएं
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア लोगो
  • सभी लेख
  • 🗒️ रजिस्टर
  • 🔑 लॉगिन
    • 日本語
    • English
    • 中文
    • Español
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
cookie_banner_title

cookie_banner_message गोपनीयता नीति cookie_banner_and कुकी नीति cookie_banner_more_info

कुकी सेटिंग्स

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

बेरोजगारी के संकेत "पोस्ट" में दिखाई देते हैं — एसएनएस आधिकारिक आंकड़ों से पहले अर्थव्यवस्था को दर्शाता है

बेरोजगारी के संकेत "पोस्ट" में दिखाई देते हैं — एसएनएस आधिकारिक आंकड़ों से पहले अर्थव्यवस्था को दर्शाता है

2026年01月01日 11:05

"आंकड़ों से तेज वास्तविकता" कहां है

बेरोजगारी दर और बेरोजगारी बीमा दावों जैसे रोजगार आंकड़े अर्थव्यवस्था के तापमान को मापने के उपकरण हैं। लेकिन तापमान मापने का उपकरण, मापने, रिकॉर्ड करने, संकलित करने और प्रकाशित करने में समय लेता है। संकट की शुरुआत में, यह "विलंब" कष्टदायक होता है।


तो क्या कोई तरीका है जिससे आधिकारिक डेटा से पहले "बेरोजगारी के संकेत" प्राप्त किए जा सकें — शोधकर्ताओं ने ध्यान केंद्रित किया सोशल मीडिया पर बिखरे हुए वास्तविक शब्दों पर। "नौकरी खो दी", "साक्षात्कार में असफल", "नौकरी ढूंढना कठिन है"। ये केवल शिकायतें नहीं हैं, बल्कि अर्थव्यवस्था की "ताजा खबर" बन सकते हैं। Phys.org


शोध के मुख्य बिंदु: JoblessBERT ने क्या किया

इस शोध (PNAS Nexus) में, सोशल मीडिया पोस्ट से "बेरोजगारी की आत्म-प्रकटीकरण" को एआई के माध्यम से पहचानने और अमेरिका के बेरोजगारी बीमा दावों (UI claims) को अधिकतम 2 सप्ताह पहले तक पूर्वानुमानित करने की रूपरेखा प्रस्तुत की गई है। मॉडल का नाम है JoblessBERT। यह BERT आधारित ट्रांसफार्मर वर्गीकरणकर्ता है, जिसे बेरोजगारी से संबंधित आत्म-प्रकटीकरण का पता लगाने के लिए विशेष रूप से समायोजित किया गया है। Phys.org


दो मुख्य बिंदु हैं।
(1) पोस्ट की विविधता को नहीं छोड़ना: स्लैंग, टाइपो, अनौपचारिक अभिव्यक्तियों (उदाहरण: "needa job" जैसी अभिव्यक्ति) को भी पकड़ना। पारंपरिक "विशिष्ट वाक्यांशों के 75 को शामिल करने" के तरीके (नियम-आधारित) की तुलना में, समान सटीकता बनाए रखते हुए, कहीं अधिक "बेरोजगारी जैसी आत्म-प्रकटीकरण" को खोजने में सक्षम। OUP Academic


(2) सोशल मीडिया के पूर्वाग्रह को सुधारकर "सूचकांक" बनाना: सोशल मीडिया जनसंख्या का प्रतिनिधित्व नहीं करता। इसलिए, अनुमानित उपयोगकर्ता विशेषताओं और जनगणना जनसंख्या अनुमानों का उपयोग करके, पोस्ट करने वाले के पूर्वाग्रह को सुधारकर (पोस्ट-स्ट्रैटिफिकेशन) "ट्विटर बेरोजगारी सूचकांक" बनाना और इसे सांख्यिकीय मॉडल में शामिल करना। OUP Academic


किस डेटा पर प्रशिक्षण दिया गया

शोध टीम ने जनवरी 2020 से दिसंबर 2022 के बीच एकत्र किए गए, अमेरिका आधारित 31.5 मिलियन सार्वजनिक पोस्ट का उपयोग किया। मुख्य रूप से उन उपयोगकर्ताओं पर ध्यान केंद्रित किया गया जिनकी प्रोफ़ाइल लोकेशन अमेरिका में थी, और उल्लेख संबंधों के माध्यम से नमूने का विस्तार करने के लिए "स्नोबॉल" संग्रह भी किया गया। OUP Academic


इसके अलावा, JoblessBERT को 8,838 लेबल वाले पोस्ट पर प्रशिक्षित किया गया था, और सक्रिय लर्निंग (अनिश्चित पोस्ट को प्राथमिकता देकर अतिरिक्त लेबलिंग करने की प्रक्रिया) के माध्यम से प्रदर्शन को बढ़ाया गया। OUP Academic


"सटीकता में सुधार" ही पर्याप्त नहीं: प्रतिनिधित्व की चुनौती

यदि नीति में सोशल मीडिया डेटा का उपयोग करना है, तो सबसे बड़ी चुनौती "पूर्वाग्रह" है। पोस्ट करने वाले लोग, न करने वाले लोग। उपयोग की वास्तविकता जो विशेष आयु समूहों या क्षेत्रों में झुकी हुई है। और बेरोजगार लोग हमेशा सोशल मीडिया पर अपनी स्थिति नहीं बताते।


शोध ने इस बिंदु को सीधे संबोधित किया, प्रोफाइल जानकारी से आयु, लिंग, स्थान का अनुमान लगाकर जनसांख्यिकी के अनुसार सुधार किया। आयु और लिंग के अनुमान के लिए, प्रोफाइल चित्र और मेटाडेटा का उपयोग करने वाले गहन शिक्षण मॉडल का उपयोग किया गया (जहां अनुमान नहीं लगाया जा सकता, वहां कमी को पूरा करने के उपाय भी शामिल हैं)। OUP Academic


यहां सोशल मीडिया पर भी मतभेद होते हैं। बाद में चर्चा करेंगे, लेकिन "सटीकता सुधार के लिए छवि से विशेषता अनुमान लगाना डरावना है" जैसी प्रतिक्रियाएं आम हैं, जबकि "गुमनामी और संकलन के साथ सार्वजनिक लाभ बड़ा है" जैसी समर्थन भी मिलती है।


सटीकता कितनी बढ़ी

शोध पत्र पहले आत्म-प्रकटीकरण का पता लगाने की प्रदर्शन की तुलना करता है। नियम-आधारित प्रणाली की सटीकता (प्रिसिजन) उच्च है लेकिन पुनर्प्राप्ति (रिकॉल) कम है। जबकि JoblessBERT, उच्च सटीकता बनाए रखते हुए, पुनर्प्राप्ति को बड़े पैमाने पर सुधारता है, और "पारंपरिक तरीकों की तुलना में लगभग तीन गुना अधिक संबंधित पोस्ट को पकड़ता है" की रिपोर्ट करता है। इसके अलावा, अभिव्यक्तियों की विविधता बढ़ने से "पकड़े जा सकने वाले उपयोगकर्ताओं" की संख्या बढ़ती है, जिससे बेरोजगार नमूने अधिक प्रतिनिधि बनते हैं। OUP Academic


और पूर्वानुमान के मामले में, बेरोजगारी बीमा दावों के प्रकाशन से पहले (अधिकतम 2 सप्ताह पहले) कितनी सटीकता से अनुमान लगाया जा सकता है, इसका मूल्यांकन किया गया, और उद्योग की सहमति पूर्वानुमान के मुकाबले RMSE को 54.3% सुधारने का उल्लेख किया गया। OUP Academic


कोरोना की शुरुआत में "तेजी से वृद्धि" को पहले से पहचानने का क्या अर्थ है

यह शोध प्रतीकात्मक रूप से 2020 के मार्च के बड़े बदलाव को दर्शाता है। महामारी घोषणा के तुरंत बाद के सप्ताह में, UI claims लगभग 250,000 के स्तर से 2.9 मिलियन तक तेजी से बढ़ गए, जहां सहमति पूर्वानुमान ने तेजी से वृद्धि को लगभग गलत समझा, जबकि सोशल मीडिया सूचकांक को शामिल करने वाले मॉडल ने तेजी से बदलाव को "महसूस" किया और पूर्वानुमान को काफी बढ़ा दिया। JoblessBERT मॉडल ने सप्ताह के अंत के 2 दिन पहले 2.66 मिलियन, और घोषणा के एक दिन पहले 2.8 मिलियन का पूर्वानुमान लगाया, जो वास्तविक 2.9 मिलियन के काफी करीब था। OUP Academic


यहां महत्वपूर्ण बात यह है कि, "सोशल मीडिया सर्वशक्तिमान" नहीं है, बल्कि **"संकट की शुरुआत में प्रभावी तात्कालिकता"** प्रदर्शित की गई है। मंदी के समय की तुलना में, जब अर्थव्यवस्था में अचानक बदलाव आते हैं, तो इसका मूल्य बढ़ता है। नीति के उपाय (अतिरिक्त लाभ, स्थानीय समर्थन, सेवा केंद्रों की वृद्धि आदि) जितनी जल्दी लागू किए जा सकते हैं, सोशल मीडिया से प्राप्त संकेत उतने ही आकर्षक हो जाते हैं।


"राष्ट्रीय" ही नहीं: राज्य और शहर स्तर की महत्वाकांक्षा

रोजगार की पीड़ा राष्ट्रीय औसत में नहीं दिखती। औद्योगिक संरचना, किराए, और प्रवासी अनुपात अलग होते हैं। शोध पत्र राज्य और शहर स्तर पर भी मॉडल का मूल्यांकन करता है, और उप-राष्ट्रीय निगरानी की संभावना को दर्शाता है। Phys.org


यदि यह कार्यान्वयन के लिए उपयुक्त है, तो "किस शहर के किस उद्योग में झटका आ रहा है" को आधिकारिक आंकड़ों से पहले समझा जा सकता है।


हालांकि सबसे बड़ा मुद्दा यह है कि क्या यह "निगरानी" नहीं बन जाएगा

सोशल मीडिया प्रतिक्रियाओं में सबसे पहले उठने वाला सवाल यह है।

  • बेरोजगारी की "आत्म-प्रकटीकरण" को एकत्र करना, कमजोर लोगों का पीछा करना नहीं होगा?

  • छवि से आयु और लिंग का अनुमान लगाना, व्यक्तिगत पहचान से संबंधित नहीं होगा?

  • सरकार या कंपनियां इसे "सुविधाजनक" तरीके से उपयोग कर, समर्थन के बजाय चयन में नहीं लगाएंगी?


शोध पत्र भी इन चिंताओं को ध्यान में रखते हुए, **गुमनाम संकेतों की "जिम्मेदार पहुंच"** और प्लेटफॉर्म के साथ सहयोग, विनियमन की प्रकृति तक चर्चा करता है। इसका मतलब है कि "कुछ भी प्राप्त कर सकते हैं" की स्थिति के बजाय, सार्वजनिक उद्देश्य के लिए, गोपनीयता की रक्षा करते हुए, अनुसंधान या निगरानी में उपयोग करने की प्रणाली की आवश्यकता है। OUP Academic


प्लेटफॉर्म निर्भरता की वास्तविकता: Twitter (X) होने की कमजोरी

एक और सोशल मीडिया की आलोचना यह है, "क्या यह Twitter (X) पर आधारित नहीं है?" उपयोगकर्ता आधार बदलता है, एपीआई की विनिर्देश और उपलब्धता भी बदलती है। शोध पत्र भी "विशिष्ट अवधि और विशिष्ट प्लेटफॉर्म पर आधारित प्रमाण" के रूप में जोर देता है, और इसे एक "अनुकूलनीय रूपरेखा" के रूप में प्रस्तुत करता है, न कि एक सार्वभौमिक उपकरण के रूप में। OUP Academic


इसका मतलब है कि भविष्य में अन्य सोशल मीडिया (Reddit, Threads, क्षेत्रीय सोशल मीडिया आदि) या अन्य भाषा क्षेत्रों में इसे स्थानांतरित करने की आवश्यकता होगी। यह "शोध के लिए दिलचस्प" है, जबकि "नीति कार्यान्वयन के लिए कठिन" बिंदु भी है।


सोशल मीडिया पर प्रतिक्रियाएं (प्रमुख बिंदुओं के अनुसार सारांश)

वास्तव में यह शोध, Phys.org के आधिकारिक खाते के माध्यम से भी प्रस्तुत किया गया है, और सोशल मीडिया पर साझा किए जाने वाले विषयों में से एक बन गया है। LinkedIn


इससे उत्पन्न (या उत्पन्न होने वाली) प्रतिक्रियाओं को प्रमुख बिंदुओं के अनुसार व्यवस्थित करने पर यह दिखता है।


1) प्रशंसा: "आंकड़ों की तात्कालिकता में सुधार सार्वजनिक लाभ है"

  • "आपातकालीन समय में, जैसे आपदा या महामारी, 2 सप्ताह पहले की जानकारी बड़ी बात है"

  • "यदि राज्य या शहर स्तर पर जल्दी पता चल जाए, तो सहायता समय पर पहुंच सकती है"
    (श

← लेख सूची पर वापस जाएं

contact |  सेवा की शर्तें |  गोपनीयता नीति |  कुकी नीति |  कुकी सेटिंग्स

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア सभी अधिकार सुरक्षित।