मुख्य सामग्री पर जाएं
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア लोगो
  • सभी लेख
  • 🗒️ रजिस्टर
  • 🔑 लॉगिन
    • 日本語
    • English
    • 中文
    • Español
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
cookie_banner_title

cookie_banner_message गोपनीयता नीति cookie_banner_and कुकी नीति cookie_banner_more_info

कुकी सेटिंग्स

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

कुछ महीनों का ऑप्टिकल डिज़ाइन "2 सेकंड" में? एआई × मेटासर्फेस का झटका

कुछ महीनों का ऑप्टिकल डिज़ाइन "2 सेकंड" में? एआई × मेटासर्फेस का झटका

2026年01月07日 11:52

"ऑप्टिकल डिज़ाइन 'कला' से 'प्रॉम्प्ट' की ओर"—LLM मेटासर्फेस डिज़ाइन को 'कई महीनों से → तुरंत' में बदलता है

ऑप्टिकल लेंस, VR/AR, होलोग्राफी, और यहां तक कि चिकित्सा और रक्षा अनुप्रयोगों तक। आधुनिक 'प्रकाश को नियंत्रित करने' की तकनीक हमारे जीवन और उद्योग के केंद्र में प्रवेश कर चुकी है, स्मार्टफोन कैमरों से लेकर औद्योगिक माप तक।


दूसरी ओर, इसके मूल में ऑप्टिकल घटकों का डिज़ाइन अभी भी भारी सिमुलेशन और विशेषज्ञ ज्ञान पर अत्यधिक निर्भर है, और "तेजी से परीक्षण नहीं कर पाने" की समस्या अक्सर बाधा बन जाती थी।


ऐसी स्थिति को बदलने वाली खबर 5 जनवरी 2026 को आई। पेंसिल्वेनिया स्टेट यूनिवर्सिटी (Penn State) की एक शोध टीम ने एक LLM (बड़े भाषा मॉडल) आधारित डिज़ाइन पद्धति प्रस्तुत की, जो मेटासर्फेस (metasurface) के डिज़ाइन को पारंपरिक 'कई सप्ताह से कई महीने' के पैमाने से 'सेकंड से मिलीसेकंड' तक कम कर सकती है। इसका उद्देश्य केवल गति बढ़ाना नहीं है।"नैनो ऑप्टिक्स के डिज़ाइन को अधिक लोगों के लिए 'इंटरैक्टिव' बनाना" है, जो डिज़ाइन संस्कृति में एक परिवर्तन है। Phys.org



मेटासर्फेस क्या है

मेटासर्फेस एक कृत्रिम संरचना है जोलहर दैर्ध्य से छोटे पैमाने (उप-लहर दैर्ध्य) के सूक्ष्म संरचनाओं (स्कैटरर्स) को सतह पर व्यवस्थित करती है, जिससे प्रकाश की आयाम, चरण, ध्रुवीकरण आदि को स्थानीय रूप से नियंत्रित किया जा सके। यदि इसे सही तरीके से डिज़ाइन किया जाए, तो यह पारंपरिक मोटे लेंस या बहु-घटक ऑप्टिकल सिस्टम द्वारा प्राप्त की जाने वाली कार्यक्षमताओं को पतली सतह पर प्रतिस्थापित या एकीकृत कर सकता है। मेटा लेंस, होलोग्राफिक इमेजर्स, और AR डिस्प्ले इसके विशिष्ट उदाहरण हैं। arXiv


हालांकि, यह "यदि इसे सही तरीके से डिज़ाइन किया जाए" चुनौतीपूर्ण है। सूक्ष्म आकृति में थोड़े से बदलाव से संचरण और परावर्तन स्पेक्ट्रम में बड़ा परिवर्तन हो सकता है, और डिज़ाइन स्पेस उच्च आयामी होता है। आदर्श प्रदर्शन तक पहुंचने के लिए खोज में बड़ी संख्या में संभावनाओं का परीक्षण करना पड़ता है।



पारंपरिक बाधा: फुल-वेव इलेक्ट्रोमैग्नेटिक फील्ड सिमुलेशन की भारीता

पारंपरिक रूप से, मेटासर्फेस के मूल्यांकन के लिए FDTD (फिनाइट डिफरेंस टाइम डोमेन मेथड) या FEM (फिनाइट एलिमेंट मेथड) जैसे "फुल-वेव" इलेक्ट्रोमैग्नेटिक सॉल्वर का अक्सर उपयोग किया जाता है। इनकी सटीकता उच्च होती है, लेकिन डिज़ाइन लूप को हर बार चलाने पर गणना भारी होती है। बड़े पैमाने के उपकरणों या बहु-कार्यात्मकता को लक्षित करने पर, दिन और सप्ताह के आधार पर समय लग सकता है। arXiv


इस "गणना की भारीता" समस्या के उत्तर के रूप में, हाल के वर्षों में डीप लर्निंग (DNN) का उपयोग करके सरोगेट (प्रतिनिधि) मॉडल का प्रचलन बढ़ा है। प्रशिक्षण के बाद, यह अनदेखे आकृतियों पर भी तेजी से प्रतिक्रिया की भविष्यवाणी कर सकता है। हालांकि, यहां भी एक और बाधा है।


**"नई उद्देश्य (नई ऑप्टिकल कार्यक्षमता) के लिए, प्रशिक्षण डेटा की तैयारी, नेटवर्क डिज़ाइन, और हाइपरपैरामीटर खोज की आवश्यकता होती है"** और अंततः मशीन लर्निंग की विशेषज्ञता की आवश्यकता होती है। arXiv



इस बार की नई पहल: LLM को "मेटासर्फेस के भविष्यवक्ता/डिज़ाइनर" के रूप में उपयोग करना

Penn State की टीम ने LLM को "पाठ उत्पन्न करने" के बजाय,मेटासर्फेस की आकृति → ऑप्टिकल प्रतिक्रिया (स्पेक्ट्रम) की भविष्यवाणी करने वाले मॉडल और इसके अलावा **लक्षित प्रतिक्रिया → आकृति उत्पन्न करने वाले विपरीत डिज़ाइन (इनवर्स डिज़ाइन)** इंजन के रूप में उपयोग करने की दृष्टिकोण प्रस्तुत की है। Phys.org


इसमें दो मुख्य बातें हैं।

  1. आकृति को "भाषा श्रृंखला" के रूप में व्यक्त करना
    शोध में, किसी भी आकृति के मेटासर्फेस को "नियंत्रण बिंदु (control points) की ग्रिड" के रूप में व्यक्त किया गया है, और समरूपता प्रदान करना → इंटरपोलेशन → द्विआधारीकरण → रूपात्मक प्रसंस्करण के माध्यम से मास्क को समायोजित किया जाता है। वहां से सिलिकॉन परत (उदाहरण: मोटाई 200nm) के रूप में बाहर निकाला जाता है, और ग्लास सब्सट्रेट पर संरचना के रूप में FDTD के साथ विश्लेषण किया जाता है, जिससे आकृति और स्पेक्ट्रम के जोड़ी डेटा तैयार होते हैं। arXiv

  2. LLM को "संख्याएं निकालने का काम" करने के लिए प्रशिक्षण डिजाइन
    LLM में, नियंत्रण बिंदुओं की ग्रिड को प्रॉम्प्ट के रूप में इनपुट किया जाता है, और आउटपुट के रूप में "1050 से 1600nm की सीमा में 31 बिंदुओं की संचरण दर" को संख्यात्मक श्रृंखला के रूप में लौटाने के लिए प्रशिक्षित किया जाता है। इसके अलावा, LoRA जैसे पैरामीटर-कुशल फाइन-ट्यूनिंग के साथ, LLM को वास्तविक गणना संसाधनों के साथ "उपयोगी भविष्यवक्ता" बनाया जाता है। arXiv


"सेकंड में प्रतिक्रिया" क्या बदलता है: डिज़ाइन लूप टूटता है (अच्छे अर्थ में)

पेपर के विवरण में, फाइन-ट्यून किए गए Llama-3.1-8B का उपयोग करके की गई भविष्यवाणी का उदाहरण दिया गया है, जो RTX 2080 Ti पर लगभग 2 सेकंड में लौटती है, और CPU क्लस्टर पर फुल-वेव विश्लेषण की तुलना में लगभग 60 गुना तेज थी। arXiv


Phys.org के लेख में कहा गया है कि "पारंपरिक रूप से समय और विशेषज्ञता की आवश्यकता होती है, और कभी-कभी 'कई महीने' लग सकते हैं" के क्षेत्र को LLM द्वारा 'सेकंड' में लाया जा सकता है। डेटा सेट के रूप में 45,000 से अधिक रैंडम जनरेटेड डिज़ाइन के साथ सत्यापन किया गया, यह भी उल्लेख किया गया है। Phys.org


यहां महत्वपूर्ण बात यह है कि गति से अधिक "डिज़ाइन की प्रक्रिया" बदलती है।


यदि डिज़ाइन धीमा होता है, तो लोग "साधारण आकृतियों (सिलेंडर, क्यूब आदि)" की ओर झुकते हैं और खोज की संख्या को कम करते हैं। इसके विपरीत, यदि डिज़ाइन तेज होता है, तो "कोई भी आकृति (फ्री-फॉर्म)" को बड़े पैमाने पर आजमाया जा सकता है। लेख में भी कहा गया है कि मानक आकृतियों से बंधे बिना उच्च स्वतंत्रता वाली तत्व आकृतियां प्रदर्शन को बढ़ा सकती हैं, जबकि पारंपरिक रूप से अनुकूलन व्यावहारिक नहीं था। Phys.org



विपरीत डिज़ाइन (इनवर्स डिज़ाइन): वांछित स्पेक्ट्रम से आकृति उत्पन्न करना

इस शोध का एक और महत्वपूर्ण हिस्सा विपरीत डिज़ाइन है।


लक्षित 31 बिंदुओं के संचरण स्पेक्ट्रम को इनपुट करने पर, LLM उस पर आधारित नियंत्रण बिंदु ग्रिड उत्पन्न करता है, जिससे आकृति के संभावित विकल्प प्राप्त होते हैं। पेपर में, विपरीत डिज़ाइन के मूल्यांकन के रूप में "टेस्ट सैंपल का 88% से अधिक एक निश्चित सीमा के नीचे MSE" प्राप्त किया गया, यह उल्लेख किया गया है। arXiv


जब यह व्यावहारिकता के करीब आता है, तो डिज़ाइन का प्रवेश द्वार तेजी से चौड़ा हो जाता है।


"इस तरंग दैर्ध्य पर इस प्रकार का संचरण गुण चाहिए" "इस उपयोग के लिए इस शर्त को पूरा करना है" जैसी आवश्यकताओं से, "आकृति का अनुमान" पहले बनाया जा सकता है, और अंत में उच्च सटीकता वाले सॉल्वर के साथ समायोजित किया जा सकता है। पेपर में भी, LLM को "तेज प्राथमिक मूल्यांकन" के लिए उपयोग करने और अंतिम चरण में भारी सॉल्वर या विशेष नेटवर्क का उपयोग करने की व्यावहारिकता का संकेत मिलता है। arXiv



हालांकि यह सर्वव्यापी नहीं है: LLM की "बातूनी आदत" बाधा बन सकती है

दिलचस्प बात यह है कि "हर LLM समान रूप से सफल नहीं होता" यह स्पष्ट रूप से कहा गया है। पेपर में, जब तर्क (reasoning) पर केंद्रित मॉडल को फाइन-ट्यून किया गया, तो यह निर्दिष्ट प्रारूप में संख्यात्मक श्रृंखला को लौटाने के बजाय "अतिरिक्त जानकारी की मांग करने वाला विवरण" उत्पन्न करता है। उदाहरण के रूप में पेश किया गया है। यानी, बातचीत में मजबूत मॉडल संख्या पुनरावृत्ति कार्यों में "मित्रवत रूप से भटक" सकते हैं। arXiv


यह LLM को इंजीनियरिंग डिज़ाइन में शामिल करने का एक वास्तविक ध्यान देने योग्य बिंदु है।


"आउटपुट के प्रकार को बनाए रखना", "चुपचाप संख्याएं निकालना", "अनावश्यक तर्क न जोड़ना"—ये नियंत्रण, जनरेटिव AI के सामान्य उपयोग से अधिक "कठोर इंजीनियरिंग" की मांग के करीब हैं।



औद्योगिक प्रभाव: पतले, हल्के, और स्मार्ट ऑप्टिकल सिस्टम की ओर

Phys.org में कहा गया है कि यह तेज़ अनुकूलन भविष्य में कैमरा लेंस, VR हेडसेट, होलोग्राफिक इमेजर्स जैसे उन्नत

← लेख सूची पर वापस जाएं

contact |  सेवा की शर्तें |  गोपनीयता नीति |  कुकी नीति |  कुकी सेटिंग्स

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア सभी अधिकार सुरक्षित।