कुछ महीनों का ऑप्टिकल डिज़ाइन "2 सेकंड" में? एआई × मेटासर्फेस का झटका

कुछ महीनों का ऑप्टिकल डिज़ाइन "2 सेकंड" में? एआई × मेटासर्फेस का झटका

"ऑप्टिकल डिज़ाइन 'कला' से 'प्रॉम्प्ट' की ओर"—LLM मेटासर्फेस डिज़ाइन को 'कई महीनों से → तुरंत' में बदलता है

ऑप्टिकल लेंस, VR/AR, होलोग्राफी, और यहां तक कि चिकित्सा और रक्षा अनुप्रयोगों तक। आधुनिक 'प्रकाश को नियंत्रित करने' की तकनीक हमारे जीवन और उद्योग के केंद्र में प्रवेश कर चुकी है, स्मार्टफोन कैमरों से लेकर औद्योगिक माप तक।


दूसरी ओर, इसके मूल में ऑप्टिकल घटकों का डिज़ाइन अभी भी भारी सिमुलेशन और विशेषज्ञ ज्ञान पर अत्यधिक निर्भर है, और "तेजी से परीक्षण नहीं कर पाने" की समस्या अक्सर बाधा बन जाती थी।


ऐसी स्थिति को बदलने वाली खबर 5 जनवरी 2026 को आई। पेंसिल्वेनिया स्टेट यूनिवर्सिटी (Penn State) की एक शोध टीम ने एक LLM (बड़े भाषा मॉडल) आधारित डिज़ाइन पद्धति प्रस्तुत की, जो मेटासर्फेस (metasurface) के डिज़ाइन को पारंपरिक 'कई सप्ताह से कई महीने' के पैमाने से 'सेकंड से मिलीसेकंड' तक कम कर सकती है। इसका उद्देश्य केवल गति बढ़ाना नहीं है।"नैनो ऑप्टिक्स के डिज़ाइन को अधिक लोगों के लिए 'इंटरैक्टिव' बनाना" है, जो डिज़ाइन संस्कृति में एक परिवर्तन है। Phys.org



मेटासर्फेस क्या है

मेटासर्फेस एक कृत्रिम संरचना है जोलहर दैर्ध्य से छोटे पैमाने (उप-लहर दैर्ध्य) के सूक्ष्म संरचनाओं (स्कैटरर्स) को सतह पर व्यवस्थित करती है, जिससे प्रकाश की आयाम, चरण, ध्रुवीकरण आदि को स्थानीय रूप से नियंत्रित किया जा सके। यदि इसे सही तरीके से डिज़ाइन किया जाए, तो यह पारंपरिक मोटे लेंस या बहु-घटक ऑप्टिकल सिस्टम द्वारा प्राप्त की जाने वाली कार्यक्षमताओं को पतली सतह पर प्रतिस्थापित या एकीकृत कर सकता है। मेटा लेंस, होलोग्राफिक इमेजर्स, और AR डिस्प्ले इसके विशिष्ट उदाहरण हैं। arXiv


हालांकि, यह "यदि इसे सही तरीके से डिज़ाइन किया जाए" चुनौतीपूर्ण है। सूक्ष्म आकृति में थोड़े से बदलाव से संचरण और परावर्तन स्पेक्ट्रम में बड़ा परिवर्तन हो सकता है, और डिज़ाइन स्पेस उच्च आयामी होता है। आदर्श प्रदर्शन तक पहुंचने के लिए खोज में बड़ी संख्या में संभावनाओं का परीक्षण करना पड़ता है।



पारंपरिक बाधा: फुल-वेव इलेक्ट्रोमैग्नेटिक फील्ड सिमुलेशन की भारीता

पारंपरिक रूप से, मेटासर्फेस के मूल्यांकन के लिए FDTD (फिनाइट डिफरेंस टाइम डोमेन मेथड) या FEM (फिनाइट एलिमेंट मेथड) जैसे "फुल-वेव" इलेक्ट्रोमैग्नेटिक सॉल्वर का अक्सर उपयोग किया जाता है। इनकी सटीकता उच्च होती है, लेकिन डिज़ाइन लूप को हर बार चलाने पर गणना भारी होती है। बड़े पैमाने के उपकरणों या बहु-कार्यात्मकता को लक्षित करने पर, दिन और सप्ताह के आधार पर समय लग सकता है। arXiv


इस "गणना की भारीता" समस्या के उत्तर के रूप में, हाल के वर्षों में डीप लर्निंग (DNN) का उपयोग करके सरोगेट (प्रतिनिधि) मॉडल का प्रचलन बढ़ा है। प्रशिक्षण के बाद, यह अनदेखे आकृतियों पर भी तेजी से प्रतिक्रिया की भविष्यवाणी कर सकता है। हालांकि, यहां भी एक और बाधा है।


**"नई उद्देश्य (नई ऑप्टिकल कार्यक्षमता) के लिए, प्रशिक्षण डेटा की तैयारी, नेटवर्क डिज़ाइन, और हाइपरपैरामीटर खोज की आवश्यकता होती है"** और अंततः मशीन लर्निंग की विशेषज्ञता की आवश्यकता होती है। arXiv



इस बार की नई पहल: LLM को "मेटासर्फेस के भविष्यवक्ता/डिज़ाइनर" के रूप में उपयोग करना

Penn State की टीम ने LLM को "पाठ उत्पन्न करने" के बजाय,मेटासर्फेस की आकृति → ऑप्टिकल प्रतिक्रिया (स्पेक्ट्रम) की भविष्यवाणी करने वाले मॉडल और इसके अलावा **लक्षित प्रतिक्रिया → आकृति उत्पन्न करने वाले विपरीत डिज़ाइन (इनवर्स डिज़ाइन)** इंजन के रूप में उपयोग करने की दृष्टिकोण प्रस्तुत की है। Phys.org


इसमें दो मुख्य बातें हैं।

  1. आकृति को "भाषा श्रृंखला" के रूप में व्यक्त करना
    शोध में, किसी भी आकृति के मेटासर्फेस को "नियंत्रण बिंदु (control points) की ग्रिड" के रूप में व्यक्त किया गया है, और समरूपता प्रदान करना → इंटरपोलेशन → द्विआधारीकरण → रूपात्मक प्रसंस्करण के माध्यम से मास्क को समायोजित किया जाता है। वहां से सिलिकॉन परत (उदाहरण: मोटाई 200nm) के रूप में बाहर निकाला जाता है, और ग्लास सब्सट्रेट पर संरचना के रूप में FDTD के साथ विश्लेषण किया जाता है, जिससे आकृति और स्पेक्ट्रम के जोड़ी डेटा तैयार होते हैं। arXiv

  2. LLM को "संख्याएं निकालने का काम" करने के लिए प्रशिक्षण डिजाइन
    LLM में, नियंत्रण बिंदुओं की ग्रिड को प्रॉम्प्ट के रूप में इनपुट किया जाता है, और आउटपुट के रूप में "1050 से 1600nm की सीमा में 31 बिंदुओं की संचरण दर" को संख्यात्मक श्रृंखला के रूप में लौटाने के लिए प्रशिक्षित किया जाता है। इसके अलावा, LoRA जैसे पैरामीटर-कुशल फाइन-ट्यूनिंग के साथ, LLM को वास्तविक गणना संसाधनों के साथ "उपयोगी भविष्यवक्ता" बनाया जाता है। arXiv


"सेकंड में प्रतिक्रिया" क्या बदलता है: डिज़ाइन लूप टूटता है (अच्छे अर्थ में)

पेपर के विवरण में, फाइन-ट्यून किए गए Llama-3.1-8B का उपयोग करके की गई भविष्यवाणी का उदाहरण दिया गया है, जो RTX 2080 Ti पर लगभग 2 सेकंड में लौटती है, और CPU क्लस्टर पर फुल-वेव विश्लेषण की तुलना में लगभग 60 गुना तेज थी। arXiv


Phys.org के लेख में कहा गया है कि "पारंपरिक रूप से समय और विशेषज्ञता की आवश्यकता होती है, और कभी-कभी 'कई महीने' लग सकते हैं" के क्षेत्र को LLM द्वारा 'सेकंड' में लाया जा सकता है। डेटा सेट के रूप में 45,000 से अधिक रैंडम जनरेटेड डिज़ाइन के साथ सत्यापन किया गया, यह भी उल्लेख किया गया है। Phys.org


यहां महत्वपूर्ण बात यह है कि गति से अधिक "डिज़ाइन की प्रक्रिया" बदलती है।


यदि डिज़ाइन धीमा होता है, तो लोग "साधारण आकृतियों (सिलेंडर, क्यूब आदि)" की ओर झुकते हैं और खोज की संख्या को कम करते हैं। इसके विपरीत, यदि डिज़ाइन तेज होता है, तो "कोई भी आकृति (फ्री-फॉर्म)" को बड़े पैमाने पर आजमाया जा सकता है। लेख में भी कहा गया है कि मानक आकृतियों से बंधे बिना उच्च स्वतंत्रता वाली तत्व आकृतियां प्रदर्शन को बढ़ा सकती हैं, जबकि पारंपरिक रूप से अनुकूलन व्यावहारिक नहीं था। Phys.org



विपरीत डिज़ाइन (इनवर्स डिज़ाइन): वांछित स्पेक्ट्रम से आकृति उत्पन्न करना

इस शोध का एक और महत्वपूर्ण हिस्सा विपरीत डिज़ाइन है।


लक्षित 31 बिंदुओं के संचरण स्पेक्ट्रम को इनपुट करने पर, LLM उस पर आधारित नियंत्रण बिंदु ग्रिड उत्पन्न करता है, जिससे आकृति के संभावित विकल्प प्राप्त होते हैं। पेपर में, विपरीत डिज़ाइन के मूल्यांकन के रूप में "टेस्ट सैंपल का 88% से अधिक एक निश्चित सीमा के नीचे MSE" प्राप्त किया गया, यह उल्लेख किया गया है। arXiv


जब यह व्यावहारिकता के करीब आता है, तो डिज़ाइन का प्रवेश द्वार तेजी से चौड़ा हो जाता है।


"इस तरंग दैर्ध्य पर इस प्रकार का संचरण गुण चाहिए" "इस उपयोग के लिए इस शर्त को पूरा करना है" जैसी आवश्यकताओं से, "आकृति का अनुमान" पहले बनाया जा सकता है, और अंत में उच्च सटीकता वाले सॉल्वर के साथ समायोजित किया जा सकता है। पेपर में भी, LLM को "तेज प्राथमिक मूल्यांकन" के लिए उपयोग करने और अंतिम चरण में भारी सॉल्वर या विशेष नेटवर्क का उपयोग करने की व्यावहारिकता का संकेत मिलता है। arXiv



हालांकि यह सर्वव्यापी नहीं है: LLM की "बातूनी आदत" बाधा बन सकती है

दिलचस्प बात यह है कि "हर LLM समान रूप से सफल नहीं होता" यह स्पष्ट रूप से कहा गया है। पेपर में, जब तर्क (reasoning) पर केंद्रित मॉडल को फाइन-ट्यून किया गया, तो यह निर्दिष्ट प्रारूप में संख्यात्मक श्रृंखला को लौटाने के बजाय "अतिरिक्त जानकारी की मांग करने वाला विवरण" उत्पन्न करता है। उदाहरण के रूप में पेश किया गया है। यानी, बातचीत में मजबूत मॉडल संख्या पुनरावृत्ति कार्यों में "मित्रवत रूप से भटक" सकते हैं। arXiv


यह LLM को इंजीनियरिंग डिज़ाइन में शामिल करने का एक वास्तविक ध्यान देने योग्य बिंदु है।


"आउटपुट के प्रकार को बनाए रखना", "चुपचाप संख्याएं निकालना", "अनावश्यक तर्क न जोड़ना"—ये नियंत्रण, जनरेटिव AI के सामान्य उपयोग से अधिक "कठोर इंजीनियरिंग" की मांग के करीब हैं।



औद्योगिक प्रभाव: पतले, हल्के, और स्मार्ट ऑप्टिकल सिस्टम की ओर

Phys.org में कहा गया है कि यह तेज़ अनुकूलन भविष्य में कैमरा लेंस, VR हेडसेट, होलोग्राफिक इमेजर्स जैसे उन्नत