भविष्य का कार्यालय शांत नहीं होगा? वॉइस इनपुट एआई के द्वारा बदलता कार्य करने का तरीका

भविष्य का कार्यालय शांत नहीं होगा? वॉइस इनपुट एआई के द्वारा बदलता कार्य करने का तरीका

कीबोर्ड की आवाज़ गायब हो रही है, और ऑफिस में "फुसफुसाहट" बढ़ रही है

कभी, ऑफिस की आवाज़ का मतलब कीबोर्ड की टाइपिंग की आवाज़ होता था।

मीटिंग रूम से आने वाली आवाज़ें, स्लैक नोटिफिकेशन की छोटी इलेक्ट्रॉनिक ध्वनि, प्रिंटर की कार्यशीलता की आवाज़, किसी के मग को रखने की आवाज़। इनमें से, काम करने की भावना का सबसे बड़ा प्रतीक, निश्चित रूप से टाइपिंग थी। जब उंगलियाँ रुकतीं, तो सोचते थे। जब तेजी से टाइप करते, तो ध्यान केंद्रित होता। एंटर की दबाने पर कुछ भेजा जाता। इस तरह की शारीरिक भावना और काम की लय लंबे समय तक जुड़ी रही।

हालांकि, एआई युग के ऑफिस में, यह ध्वनि परिदृश्य बदल सकता है।

TechCrunch ने "कंप्यूटर से बात करने वाले लोगों" के बढ़ते भविष्य को उठाया है। इसका कारण है, एआई वॉयस इनपुट ऐप्स का प्रसार। Wispr Flow जैसे टूल का उपयोग करके, लोग कीबोर्ड पर टाइप करने के बजाय, जो सोच रहे हैं उसे धीरे-धीरे बोल सकते हैं, और ऐप उसे सुव्यवस्थित वाक्य या प्रॉम्प्ट में बदल देता है। इसके अलावा, Claude Code या Codex जैसे कोडिंग सहायता टूल के साथ संयोजन करके, डेवलपर्स कोड को एक-एक अक्षर लिखने के बजाय, "इस तरह की सुविधा लागू करें", "इस बग का कारण खोजें", "इस विनिर्देश के अनुसार संशोधन करें" जैसी आवाज़ में निर्देश दे सकते हैं।

अर्थात, भविष्य के ऑफिस में, लोग मीटिंग नहीं कर रहे हैं, फिर भी बात कर रहे हैं। फोन नहीं कर रहे हैं, फिर भी माइक्रोफोन की ओर बात कर रहे हैं। जो आवाज़ अकेले में बात करने जैसी दिखती है, वह वास्तव में एआई को दिए गए कार्य निर्देश हैं।

यह केवल इनपुट विधि का परिवर्तन नहीं है। यह काम करने की जगह के नियमों को हिला देने वाला परिवर्तन है।

TechCrunch के लेख में, Wall Street Journal के विशेषांक का हवाला देते हुए, सिलिकॉन वैली के आसपास वॉयस इनपुट टूल के उपयोग के बढ़ते हुए दृश्य को प्रस्तुत किया गया है। एक वेंचर कैपिटलिस्ट ने कहा कि जब वह स्टार्टअप के ऑफिस में जाते हैं, तो ऐसा लगता है जैसे वे एक उच्च-स्तरीय कॉल सेंटर में प्रवेश कर रहे हैं। Gusto के सह-संस्थापक Edward Kim ने भी कहा कि भविष्य के ऑफिस की आवाज़ बिक्री के फ्लोर जैसी हो सकती है।

यह "बिक्री फ्लोर" का रूपक काफी प्रतीकात्मक है।

बिक्री फ्लोर वह जगह है, जहाँ आवाज़ काम का केंद्र होती है। फोन कॉल करना, समझाना, मनाना, और प्रतिक्रिया सुनते हुए शब्दों को समायोजित करना। पारंपरिक इंजीनियरिंग, लेखन, और योजना कार्य इसके विपरीत, अपेक्षाकृत शांत कार्य माने जाते थे। लेकिन जब एआई के साथ सहयोग बढ़ेगा, तो प्रोग्रामर, संपादक, मार्केटर, और डिज़ाइनर भी बिक्री प्रतिनिधियों की तरह "बात करके काम को आगे बढ़ाने" की संभावना हो सकती है।

लोग आवाज़ से इनपुट क्यों देना चाहते हैं?

सबसे बड़ा कारण है कि यह विचार की मात्रा को सीधे बाहर निकालना आसान बनाता है। एआई को छोटे आदेश देने से अच्छे परिणाम नहीं मिलते। जनरेटिव एआई का सही उपयोग करने के लिए, पृष्ठभूमि, उद्देश्य, बाधाएं, पसंद, बचने वाली चीजें, अपेक्षित आउटपुट फॉर्मेट आदि को विस्तार से बताना आवश्यक है। लेकिन यह सब कीबोर्ड पर टाइप करना मुश्किल होता है। विशेष रूप से, सैकड़ों से हजारों शब्दों के प्रॉम्प्ट को बार-बार लिखने का काम, तेज़ टाइपिंग करने वालों के लिए भी बोझिल होता है।

वॉयस इनपुट के साथ, आप अपने दिमाग में मौजूद अस्पष्ट विचारों को एक बार में बाहर निकाल सकते हैं। थोड़ी गलती करने पर भी, एआई उसे सुधार देता है। बोलचाल की भाषा में बात करने पर भी, टूल उसे बिजनेस ईमेल, विनिर्देश, या चैट उत्तर के रूप में सुधार देता है। एआई का उपयोग करने के लिए इनपुट लागत घट जाती है।

सोशल मीडिया और डेवलपर समुदाय में भी, इस बिंदु की सराहना की जाती है। Reddit के कुछ पोस्ट में, Wispr Flow जैसे वॉयस इनपुट टूल के बारे में "एआई को लंबा संदर्भ देना आसान हो जाता है", "ईमेल और ड्राफ्ट बनाना तेज़ हो जाता है", "किसी भी ऐप में उपयोग करने योग्य सिस्टम-स्तरीय वॉयस इनपुट सुविधाजनक है" जैसी प्रतिक्रियाएं देखी जाती हैं। विशेष रूप से, vibe coding नामक एआई-सहायता प्राप्त विकास शैली में, छोटे कोड को सीधे लिखने के बजाय, एआई को लंबे समय तक इरादे बताना महत्वपूर्ण होता है, इसलिए आवाज़ के साथ इसका अच्छा मेल होता है।

हालांकि, प्रतिक्रियाएं केवल प्रशंसा तक सीमित नहीं हैं।

बल्कि, यह विषय दिलचस्प है क्योंकि तकनीकी रूप से यह सुविधाजनक है, लेकिन सामाजिक रूप से यह काफी असहज है।

TechCrunch के लेख में, एआई उद्यमी Mollie Amkraut Mueller का उदाहरण दिया गया है, जब वह रात में अपने पति के साथ काम कर रही थीं, तो कंप्यूटर से धीरे-धीरे बात करने की आदत ने उनके पति को चिढ़ा दिया। परिणामस्वरूप, दंपति ने अलग-अलग स्थानों पर काम करना शुरू कर दिया। यह घर की बात है, लेकिन ऑफिस में भी यही समस्या हो सकती है।

आपके बगल की सीट पर बैठा व्यक्ति लगातार धीरे-धीरे कुछ बोल रहा है। आपको लगता है कि वह फोन पर है, लेकिन वह किसी से बात नहीं कर रहा है। आप नहीं जानते कि वह आपसे बात कर रहा है या एआई से। आपको कुछ टुकड़ों में सुनाई देता है और आपकी एकाग्रता भंग होती है। गोपनीय जानकारी जैसी बातें आपके कान में पड़ती हैं। जो स्थान शांत कार्यक्षेत्र होना चाहिए था, वहां हमेशा धीमी आवाज़ की गूंज रहती है।

यह केवल एक साधारण शोर की समस्या नहीं है। मानव आवाज़ कीबोर्ड की आवाज़ से अधिक ध्यान आकर्षित करती है। क्योंकि इसमें शब्दों का अर्थ होता है। अर्थपूर्ण ध्वनि को मस्तिष्क स्वतः ही पकड़ लेता है। जैसे कि कैफे में आसपास की बातचीत सुनाई देने पर काम करना मुश्किल होता है, वैसे ही बगल की "एआई से फुसफुसाहट" आपके सोच से अधिक आपके आसपास की एकाग्रता को हटा सकती है।

सोशल मीडिया पर प्रतिक्रियाओं में भी यह चिंता दिखाई देती है।

Reddit पर, वॉयस इनपुट टूल के बारे में "ऐसा लगता है कि यह उन लोगों के लिए बनाया गया है जो अकेले शांत ऑफिस में हैं", "बच्चों या शोरगुल वाले वास्तविक वातावरण में यह अभी भी कठिन है" जैसी पोस्ट देखी जाती हैं। इसके अलावा, एक अन्य उपयोगकर्ता ने कहा कि वॉयस इनपुट स्वयं में प्रभावी है, लेकिन विराम चिह्न, व्याकरण, Microsoft Teams जैसे विशेष ऐप्स पर व्यवहार को लेकर असंतोष है। इसके अलावा, डेवलपर समुदाय में, वॉयस इनपुट सभी कोडिंग को प्रतिस्थापित करने के बजाय, विशेष कार्यों या लंबे विवरणों के लिए उपयुक्त है, यह एक संतुलित दृष्टिकोण है।

LinkedIn पर भी, वॉयस इनपुट समय बचा सकता है, लेकिन ऑफिस में लोग यह सोच सकते हैं कि वे आपसे बात कर रहे हैं, इसलिए इसे अलग कमरे में उपयोग करने की पोस्ट देखी जाती है। यह एक बहुत ही वास्तविक प्रतिक्रिया है। टूल की कार्यक्षमता बढ़ने पर भी, मानव दूरी और कार्यस्थल शिष्टाचार स्वतः ही अनुकूलित नहीं होते।

यहाँ सवाल उठता है, "एआई से बात करने का अधिकार" और "शांतिपूर्वक काम करने का अधिकार" के बीच संतुलन कैसे होगा।

ओपन ऑफिस पहले से ही ध्यान केंद्रित करने के लिए उपयुक्त नहीं माने गए हैं। दृष्टि, बातचीत, सूचनाएं, मीटिंग की आवाज़ें। अब इसमें एआई वॉयस इनपुट की नई आवाज़ जुड़ती है। यदि कंपनियाँ इस परिवर्तन को गंभीरता से अपनाती हैं, तो केवल "यह सुविधाजनक है, इसलिए इसका उपयोग करें" से काम नहीं चलेगा। ऑफिस के डिज़ाइन, सीटों की व्यवस्था, व्यक्तिगत बूथ, माइक्रोफोन के उपयोग के नियम, गोपनीय जानकारी का प्रबंधन, काम के दौरान ध्वनि शिष्टाचार तक सब कुछ पुनः विचार करने की आवश्यकता होगी।

उदाहरण के लिए, भविष्य के ऑफिस में "कॉल बूथ" के साथ "एआई इनपुट बूथ" की आवश्यकता हो सकती है। अभी भी ऑनलाइन मीटिंग के लिए व्यक्तिगत बूथ बनाने वाली कंपनियाँ बढ़ रही हैं, लेकिन यदि वॉयस एआई का प्रसार होता है, तो मीटिंग के अलावा सामान्य कार्यों के लिए भी बोलने की जगह की आवश्यकता होगी। या फिर, नॉइज़ कैंसलेशन माइक्रोफोन, बोन कंडक्शन माइक्रोफोन, दिशात्मक माइक्रोफोन, वियरेबल डिवाइस मानक उपकरण बन सकते हैं। कीबोर्ड या माउस की तरह, "स्वयं का माइक्रोफोन वातावरण" काम के उपकरण बन सकता है।

हालांकि, वॉयस इनपुट सभी के लिए उपयुक्त नहीं है।

पहली बात, कुछ लोग बोलते हुए सोचने में माहिर होते हैं, जबकि कुछ लिखते हुए सोचने में। जो लोग लेखन करते हैं, वे जानते हैं कि टाइपिंग केवल एक इनपुट कार्य नहीं है। स्क्रीन पर अक्षरों के प्रकट होने की प्रक्रिया स्वयं विचारों को व्यवस्थित करने में मदद करती है। लिखते हुए असंगति का पता चलता है, मिटाते हैं, पुनः व्यवस्थित करते हैं, और शब्दों को बदलते हैं। यह फीडबैक लूप आवाज़ में एक बार में बात करने के इनपुट से अलग होता है।

वास्तव में, सोशल मीडिया पर भी, वॉयस इनपुट में बोलने के बाद परिणाम देखने के कारण, अपने विचारों को वास्तविक समय में संशोधित करना कठिन होता है, यह एक महत्वपूर्ण मुद्दा है। वॉयस इनपुट तेज़ है, लेकिन तेज़ी हमेशा गुणवत्ता में नहीं बदलती। बल्कि, सोचने से पहले एआई को बड़ी मात्रा में शब्द फेंकने से, बाद में उन्हें व्यवस्थित करने में समय लग सकता है।

दूसरी बात, गोपनीयता और सुरक्षा की समस्या है।

कार्यस्थल में आवाज़ में बोलने का मतलब है कि आसपास के लोग सामग्री सुन सकते हैं। ग्राहक जानकारी, आंतरिक अप्रकाशित जानकारी, अनुबंध की शर्तें, मानव संसाधन जानकारी, कोड नाम, रणनीति दस्तावेज़। इन्हें एआई में इनपुट करते समय, कीबोर्ड से कम से कम स्क्रीन को देखे बिना नहीं समझा जा सकता है, लेकिन आवाज़ से पास में बैठे व्यक्ति के कान में जा सकती है। इसके अलावा, क्लाउड-आधारित वॉयस इनपुट का उपयोग करते समय, आवाज़ डेटा कहाँ संसाधित होता है, यह कंपनी की सुरक्षा नीति के साथ मेल खाता है या नहीं, यह भी एक समस्या हो सकती है।

तीसरी बात, एक्सेसिबिलिटी के मामले में बड़ी संभावनाएँ हैं। जो लोग हाथ या बांह में बोझ महसूस करते हैं, लंबे समय तक टाइपिंग करना मुश्किल होता है, या यात्रा के दौरान नोट्स लेना चाहते हैं, उनके लिए वॉयस इनपुट एक शक्तिशाली सहायक तकनीक हो सकती है। अर्थात, वॉयस इनपुट को केवल "नए गैजेट प्रेमियों के उत्पादकता हैक" के रूप में देखना पर्याप्त नहीं है। यह कार्य करने के विकल्पों को बढ़ाने वाली तकनीक भी है।

तो, क्या वॉयस इनपुट एआई वास्तव में ऑफिस का मुख्यधारा बन जाएगा?

वर्तमान में, यह अभी भी एक संक्रमणकालीन अवधि है। प्रदर्शन तेजी से बढ़ रहा है, लेकिन सामाजिक आदतें अभी तक नहीं पकड़ी हैं। स्मार्टफोन भी, जब पहली बार आया था, तो लोगों के सामने स्क्रीन देखने का कार्य असामान्य लगता था। वायरलेस ईयरफोन से अकेले में बात करने का दृश्य भी पहले अजीब लगता था। अब बहुत से लोग इसे स्वीकार कर चुके हैं। Wispr के संस्थापक का मानना है कि "यह अंततः सामान्य हो जाएगा" भी इसी विस्तार में है।

हालांकि, स्मार्टफोन या ईयरफोन और वॉयस इनपुट एआई में अंतर है। स्मार्टफोन ने मुख्य रूप से दृष्टि को छीन लिया, लेकिन वॉयस इनपुट ने स्थान को छीन लिया। ईयरफोन कॉल से पता चलता है कि व्यक्ति इंसान से बात कर रहा है, लेकिन एआई से फुसफुसाहट का उद्देश्य समझना मुश्किल होता है। यह स्पष्ट नहीं होता कि कोई किसी से बात कर रहा है, अकेले में बात कर रहा है, या गोपनीय जानकारी साझा कर रहा है। यह अस्पष्टता कार्यस्थल में असुविधा का कारण बन सकती है।

इस अर्थ में, भविष्य में "एआई वॉयस इनपुट शिष्टाचार" की आवश्यकता होगी।

उदाहरण के लिए, ऑफिस के अंदर सामान्य डेस्क पर लंबे समय तक वॉयस इनपुट नहीं करना। लंबे प्रॉम्प्ट या कोडिंग निर्देश विशेष बूथ में करना। आसपास के लोगों को सुनाई देने वाली आवाज़ में ग्राहक नाम या आंतरिक गोपनीयता की बात नहीं करना। माइक्रोफोन या हेडसेट का उपयोग करना, और जितना संभव हो उतनी धीमी आवाज़ में काम करने का वातावरण बनाना। टीम के अंदर, वॉयस इनपुट का उपयोग करने के लिए उपयुक्त और बचने योग्य स्थितियों को निर्धारित करना। इस तरह के नियम निकट भविष्य में कई कंपनियों में आवश्यक हो सकते हैं।

दिलचस्प बात यह है कि यह परिवर्तन "मानवता" को काम में वापस लाने जैसा दिखता है, लेकिन वास्तव में यह मानव बातचीत को कम कर सकता है।

लोग अपने पड़ोसी सहकर्मी से परामर्श करने के बजाय, एआई से धीरे-धीरे परामर्श करते हैं। व्हाइटबोर्ड के सामने चर्चा करने के बजाय, प्रत्येक व्यक्ति अपने स्क्रीन की ओर बात करता है। ऑफिस में आवाज़ें बढ़ती हैं, लेकिन यह जरूरी नहीं कि मानव संचार हो। बल्कि, प्रत्येक व्यक्ति अपने एआई सहायक के साथ बंद बातचीत कर रहा हो सकता है।

भीड़भाड़ वाला लेकिन अकेला ऑफिस।

यह वॉयस एआई युग का अजीब कार्यस्थल चित्रण है।

कंपनियों के लिए चुनौती इस तकनीक को प्रतिबंधित करना नहीं है। शायद, प्रतिबंध लगाने पर भी, जो फैलता है वह फैलता रहेगा। एआई टूल्स की तरह, जो सुविधाजनक होता है वह मैदान से फैलता है। महत्वपूर्ण यह है कि इसे कहाँ, कैसे, और किस उद्देश्य के लिए उपयोग किया जाए, इसका डिज़ाइन करना।

वॉयस इनपुट लेखन, कोडिंग, विचार उत्पन्न करने, ईमेल उत्तर देने, मीटिंग नोट्स बनाने, शोध नोट्स आदि जैसे कई कार्यों को तेज़ कर सकता है। विशेष रूप से जनरेटिव एआई को लंबा संदर्भ देने के कार्य में, कीबोर्ड की तुलना में आवाज़ अधिक स्वाभाविक होती है। लेकिन, यदि यह आसपास की एकाग्रता को हटा देता है, या जानकारी के लीक होने का जोखिम बढ़ाता है, तो उत्पादकता में वृद्धि के पीछे एक अन्य लागत उत्पन्न होती है।

कीबोर्ड के युग में, इनपुट व्यक्तिगत शरीर के अंदरूनी हिस्से के करीब का कार्य था। आवाज़ के युग में, इनपुट स्थान में फैलता है। इसलिए, व्यक्तिगत दक्षता और सामूहिक आराम को एक साथ सोचना आवश्यक