फोटो के संदर्भ को न तोड़ने वाला एआई: एक शब्द में पोशाक परिवर्तन। Google का 'Nano-Banana' फोटो संपादन की परंपराओं को बदल रहा है।

फोटो के संदर्भ को न तोड़ने वाला एआई: एक शब्द में पोशाक परिवर्तन। Google का 'Nano-Banana' फोटो संपादन की परंपराओं को बदल रहा है।

"Nano-Banana" AI को फोटो एडिटिंग का अंतिम स्पर्श सौंपता है - Google का नया मॉडल रिटचिंग के तरीके को बदलता है

"फोटो में दिख रहे व्यक्ति, पालतू जानवर, या पृष्ठभूमि की रोशनी को 'जैसा है वैसा' रखते हुए, केवल आवश्यक बदलाव ही सटीक रूप से लागू होते हैं।" Google ने Gemini ऐप में एक नया इमेज जनरेशन और एडिटिंग मॉडल "Gemini 2.5 Flash Image" - जिसे "Nano-Banana" के नाम से जाना जाता है, को एकीकृत किया है। यह उपकरण 'प्राकृतिकता की निरंतरता' को लक्षित करता है। पारंपरिक जनरेटिव AI के लिए कठिन "उसी व्यक्ति के चेहरे, हेयरस्टाइल और पोशाक की संगति" या "फोटो खींचते समय रोशनी और परिप्रेक्ष्य की स्थिरता" पर ध्यान केंद्रित करते हुए, यह मॉडल केवल टेक्स्ट निर्देशों के माध्यम से तत्वों को जोड़ने, हटाने, दो छवियों को मिलाने, और चेहरे की दिशा को समायोजित करने जैसे जटिल संपादन को संभालता है।InfoMoney


इसका कार्यान्वयन Gemini ऐप पर निर्भर करता है। उपयोगकर्ता फोटो (Google Photos में सहेजी गई) को बुला सकते हैं और चैट में "इस शर्ट को पहनाओ", "साइनबोर्ड के टेक्स्ट को अलग फॉन्ट में", "अलग कोण से सामने की ओर" जैसी प्राकृतिक भाषा में निर्देश दे सकते हैं। मॉडल 'व्यक्ति या वस्तु की समानता' को बनाए रखते हुए, केवल लक्षित भाग को पुनः संयोजित करता है। इसके अलावा, संपादित स्थिर छवियों को Veo 3 के साथ जोड़कर वीडियो में बदलने का मार्ग भी तैयार किया गया है।InfoMoneyblog.googlexataka.com


क्या है 'नई' सटीकता?

आधिकारिक ब्लॉग इस मॉडल की विशेषता पर जोर देता है कि यह "कई छवियों का मिश्रण", "लक्षित क्षेत्रों की प्राकृतिक भाषा ट्रांसफॉर्मेशन", और "विश्व ज्ञान का उपयोग करके जनरेशन/एडिटिंग" को एक साथ संभाल सकता है। विशेष रूप से व्यक्ति और जानवरों के 'चेहरे की विशेषताएं' या छोटे वस्त्रों के पैटर्न को लगातार बनाए रखने की क्षमता, स्टोरीटेलिंग और उत्पाद फोटो के विविधता जनरेशन में प्रभावी होती है।Google Developers Blog


अमेरिकी Axios ने Nano-Banana को "नए जनरेशन के साथ-साथ, कई चरणों की सूक्ष्मता को प्राकृतिक रूप से संभालने की क्षमता" के रूप में वर्णित किया है, जो वेब/मोबाइल के Gemini में मुफ्त और भुगतान दोनों रूपों में व्यापक रूप से उपयोग किया जा सकता है। दूसरी ओर, संपादन की सटीकता में सुधार के साथ ही डीपफेक के प्रति चिंता भी बढ़ जाती है - इस चेतावनी को भी जोड़ा गया है।Axios


वास्तविक 'ऑपरेशन फील' क्या है? - सोशल मीडिया पर परीक्षण समीक्षा

 


InfoMoney के सारांश और स्थानीय उपयोगकर्ताओं के परीक्षण पोस्टों को देखने पर, छोटे निर्देशों के माध्यम से कपड़े बदलना, क्षति की मरम्मत, अन्य उत्पादों में प्रतिस्थापन, और कई संदर्भों से संगत संयोजन जैसी वास्तविक उपयोग में सीधे जुड़ने वाली 'मजबूती' स्पष्ट होती है। नीचे कुछ प्रमुख प्रतिक्रियाएँ दी गई हैं।

  • "इस शर्ट को पहनाओ" - केवल इतना कहने से ही प्राकृतिक रूप से व्यक्ति के कपड़े बदल जाते हैं (Pietro Schirano)InfoMoney

  • "छवि पुनर्स्थापन का नया SOTA" - पुरानी और खराब तस्वीरों की मरम्मत की सटीकता से चकित (Diego)InfoMoney

  • "जटिल पैटर्न के बावजूद उत्पाद प्रतिस्थापन होता है। औसतन 2-3 प्रयास पर्याप्त हैं" (DStudioproject)InfoMoney

  • "4 संदर्भों का उपयोग करने पर भी टूटता नहीं है। यह परिपूर्ण नहीं है, लेकिन सबसे अच्छा संपादन मॉडल है" (Halim Alrasihi)InfoMoney

  • "क्या यह Google Photos में भी आ गया है?" के रूप में चर्चित पोस्ट और इसे Photoshop किलर तक कहने वाली आवाजें भी हैं (Matthew Berman/arrakis_ai)। हालांकि 'अत्यधिक प्रचार' पर ठंडे नजरिए वाले समुदाय भी हैं, और Reddit पर मार्केटिंग तरीकों पर व्यंग्य और 'नर्फ' संदेह जैसी तापमान भिन्नताएं भी देखी जा सकती हैं।X (formerly Twitter)Reddit

क्या-क्या किया जा सकता है (वास्तविक उदाहरणों के आधार पर)

  • तत्वों का जोड़ना/हटाना: अनावश्यक वस्तुओं को हटाना, एक्सेसरीज़/कपड़े/प्रॉप्स का जोड़ना।InfoMoney

  • कई छवियों का संयोजन: व्यक्ति/उत्पाद/पृष्ठभूमि का प्रतिस्थापन या विभिन्न टेक का एकीकरण।InfoMoneyGoogle Developers Blog

  • चेहरे की दिशा/पोज़ का समायोजन: दृष्टि या चेहरे के कोण को प्राकृतिक रूप से सुधारना।InfoMoney

  • प्रकाश और परिप्रेक्ष्य का समायोजन: मूल फोटो की 'वातावरण' को बनाए रखते हुए संपादन।InfoMoney

  • वीडियो बनाने की प्रक्रिया: संपादन के बाद Veo 3 के साथ मोशन ग्राफिक्स में एकीकरण।InfoMoney

कहां और कैसे उपयोग करें?

वर्तमान में मुख्य मंच Gemini ऐप है। यह वेब/मोबाइल दोनों पर उपलब्ध है, और निर्देश केवल चैट में टाइप किए जाते हैं। फोटो का आयात Google Photos के साथ संयोजन में करना स्वाभाविक है, और Xataka ने "मुफ्त में 'अपनी फोटो' को Gemini में संपादित करने" की वास्तविक प्रक्रिया को समझाया है। शुल्क या उपयोग की सीमा खाता प्रकार के आधार पर भिन्न हो सकती है, लेकिन व्यापक रूप से उपलब्ध होने का तथ्य ही महत्वपूर्ण है।Axiosxataka.com


हालांकि, सोशल मीडिया पर "Premium+ या Pro के लिए असीमित" के रूप में पोस्ट भी प्रसारित हो रहे हैं, लेकिन यह आधिकारिक बयान नहीं है। योजना के अनुसार विस्तृत प्रतिबंधों की जानकारी के लिए Google के मार्गदर्शन को समय-समय पर जांचना चाहिए।InfoMoney


काम और शौक के लिए 'प्रभावी' उपयोग

  • ई-कॉमर्स और विज्ञापन निर्माण: स्टॉक फोटो के कपड़े/एक्सेसरीज़/रंग संयोजन का प्रतिस्थापन, पृष्ठभूमि का मौसमी अनुकूलन, ए/बी परीक्षण के लिए विविधता का विस्तार।

  • जनसंपर्क और डिज़ाइन: इवेंट की मुख्य छवि का उत्पादन, विषय और लोगो की संगति बनाए रखना।

  • फोटो संगठन: अनावश्यक वस्तुओं को हटाना, आधी आंखों का सुधार, पुरानी तस्वीरों की मरम्मत।

  • यूसीजी (उपयोगकर्ता जनित सामग्री): पसंदीदा गतिविधियाँ, कॉस्प्ले, पालतू फोटो की 'वर्ल्डव्यू' को एकीकृत करना।

सीमाएं और जोखिम: वास्तविकता की 'दोधारी तलवार'

जैसे-जैसे सटीकता बढ़ती है, नैतिकता और सुरक्षा के प्रश्न भी गहरे होते जाते हैं। Axios ने डीपफेक या गलत जानकारी के संभावित जोखिमों की ओर इशारा किया है, और उद्योग के समग्र मुद्दे के रूप में 'उपयोग के स्थान' की योजना बनाने का सुझाव दिया है।लेबलिंग (संयोजन/संपादन की स्पष्टता) और व्यक्ति की सहमति, द्वितीयक उपयोग के नियम, उपयोगकर्ता के लिए भी तैयार रहना चाहिए।Axios


सारांश: संपादन को 'शब्दों में व्यक्त करने' का युग

Nano-Banana का उद्देश्य 'संशोधन की उपस्थिति' को मिटाना नहीं है, बल्कि **"संदर्भ को नष्ट न करना"** है। पारंपरिक जनरेटिव AI की कमजोरी रही 'समानता का संरक्षण' और 'प्राकृतिकता की निरंतरता' को ध्यान में रखते हुए, पेशेवर और सामान्य उपयोगकर्ता