skip_to_content
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア 로고
  • 전체 기사
  • 🗒️ 회원가입
  • 🔑 로그인
    • 日本語
    • English
    • 中文
    • Español
    • Français
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message 개인정보처리방침 cookie_banner_and 쿠키 정책 cookie_banner_more_info

쿠키 설정

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

사진의 맥락을 해치지 않는 AI: 한마디로 의상 체인지. Google의 'Nano-Banana'가 사진 편집의 상식을 뒤엎다

사진의 맥락을 해치지 않는 AI: 한마디로 의상 체인지. Google의 'Nano-Banana'가 사진 편집의 상식을 뒤엎다

2025年08月28日 09:50

「Nano-Banana」는 "사진 편집의 마지막 한 방"을 AI에 맡긴다 - Google의 새로운 모델이 바꾸는 리터치 방식

"사진에 찍힌 사람도, 애완동물도, 배경의 빛도 '그대로' 두고, 원하는 변경만 딱 맞게 적용된다." Google이 Gemini 앱에 통합한 새로운 이미지 생성 및 편집 모델 "Gemini 2.5 Flash Image" - 통칭 "Nano-Banana"는 그러한 '자연스러움의 지속'을 목표로 한 도구이다. 기존의 생성 AI에서는 어려웠던 "동일 인물의 얼굴, 헤어스타일, 의상의 일관성"이나 "촬영 당시의 빛의 흐름과 원근 유지"에 특화되어, 텍스트 지시만으로 요소의 추가 및 삭제, 두 장의 합성, 얼굴 방향 조정과 같은 복잡한 편집을 수행한다는 것이다.InfoMoney


실행의 핵심은 Gemini 앱 측에 있다. 사용자는 사진(Google 포토에 저장된 것을 포함)을 불러와, 채팅으로 "이 셔츠를 입혀줘", "간판의 글자만 다른 폰트로", "다른 각도에서 정면으로" 등 자연어로 지시한다. 모델은 '인물이나 물체의 동일성'을 유지한 채, 대상 부분만을 재합성해준다. 게다가, 편집이 끝난 정지 이미지를 Veo 3와 연계하여 동영상화하는 경로까지 예상되어 있다.InfoMoneyblog.googlexataka.com


무엇이 '새로운' 정확성인가

공식 블로그는 이 모델이 "복수 이미지의 블렌드", "타겟 영역만의 자연어 변환", "'세계 지식'을 활용한 생성/편집"을 동시에 다룰 수 있음을 강조한다. 특히 인물 및 동물의 '얼굴 표정'이나 소품의 패턴까지 연속적으로 유지되는 점은 스토리텔링이나 상품 사진의 변형 생성에 효과적이다.Google Developers Blog


미국 Axios는 Nano-Banana를 "신규 생성뿐만 아니라, 다단계의 미세 조정을 자연스럽게 수행할 수 있는 점"이 특징이며, 웹/모바일의 Gemini에서 무료 및 유료를 불문하고 널리 사용할 수 있다고 보도했다. 한편, 편집 정확도의 향상은 딥페이크에 대한 우려도 동시에 높인다는 경고도 덧붙여져 있다.Axios


실제 '조작감'은? - SNS에서의 시범 리뷰

 


InfoMoney의 요약 및 현지 사용자의 검증 포스트를 보면, 짧은 지시로 의상 교체, 결손 복원, 다른 제품으로의 교체, 여러 참조에서의 일관된 합성 등 실제 운영에 직결되는 '견고함'이 두드러진다. 다음은 대표적인 반응이다.

  • "이 셔츠를 입혀줘 - 그것만으로 자연스럽다": 최소한의 프롬프트로 인물의 의상 교체 (Pietro Schirano)InfoMoney

  • "이미지 복원의 새로운 SOTA": 오래된/손상된 사진의 복원 정확도에 놀람 (Diego)InfoMoney

  • "복잡한 패턴에서도 제품 교체가 가능하다. 평균 2~3회의 시도로 충분" (DStudioproject)InfoMoney

  • "4개의 참조를 사용해도 무너지지 않는다. 완벽하지는 않지만 최고의 편집 모델" (Halim Alrasihi)InfoMoney

  • "Google 포토에도 왔나?"라는 화제의 포스트나, Photoshop 킬러라고까지 말하는 목소리도 (Matthew Berman/arrakis_ai). 하지만 '과도한 치켜세우기'에 냉담한 시선의 커뮤니티도 있으며, Reddit에서는 마케팅 방법에 대한 비꼼이나 '너프' 의혹 등 온도차도 보인다.X (formerly Twitter)Reddit


할 수 있는 것 목록 (실례 기반)

  • 요소의 추가/삭제: 불필요한 물건의 제거, 액세서리/의상/소품의 부여.InfoMoney

  • 복수 이미지의 합성: 인물/상품/배경의 교체나, 다른 테이크의 통합.InfoMoneyGoogle Developers Blog

  • 얼굴 방향 및 포즈 조정: 시선이나 얼굴 각도를 자연스럽게 보정.InfoMoney

  • 조명 및 원근의 일치: 원래 사진의 '분위기'를 유지한 채 편집.InfoMoney

  • 동영상화 파이프라인: 편집 후 Veo 3 연계로 모션 그래픽스화.InfoMoney


어디서 어떻게 사용할 수 있는가?

현재의 주요 무대는Gemini 앱이다. 웹/모바일 양쪽에서 제공되며, 지시는 채팅에 입력하기만 하면 된다. 사진의 불러오기는 Google 포토와 결합하는 것이 자연스러운 흐름이며, Xataka는 "무료로 '자신의 사진'을 Gemini에서 편집하는" 실제 조작을 설명하고 있다. 요금이나 횟수의 상한은 계정 종류에 따라 차이가 있을 수 있지만, 널리 개방된 것 자체가 포인트이다.Axiosxataka.com


한편, SNS에서는 "Premium+나 Pro라면 무제한"이라는 게시물도 돌고 있으나, 이는 공식 문구가 아니다. 플랜별 세부 제한은 Google의 안내를 수시로 확인하고 싶다.InfoMoney


업무와 취미, 각각의 '매력적인' 사용 방법

  • EC 및 광고 제작: 재고 사진의 의상/소품/색상 교체, 배경의 계절 어레인지, AB 테스트용 변형 전개.

  • 홍보 및 디자인: 이벤트의 키 비주얼 대량 생산, 피사체/로고의 일관성 유지.

  • 사진 정리: 불필요한 물체 제거, 반쯤 감긴 눈의 보정, 오래된 사진의 복원.

  • UCG(사용자 게시물): 팬 활동/코스프레/애완동물 사진의 '세계관' 통일.


한계와 위험: 진짜 같은 모습은 '양날의 검'

정확도가 높아질수록, 윤리 및 안전에 대한 질문은 더욱 깊어진다. Axios는 딥페이크나 잘못된 정보의 온상이 될 수 있는 위험을 지적하며, 업계 전체의 과제로서 '사용처'의 설계를 촉구하고 있다.라벨링(합성/편집의 명시)이나인물의 동의,2차 이용의 규칙은 사용자 측에서도 준비해 두고 싶다.Axios


요약: 편집을 '말로 표현하는' 시대에

Nano-Banana는 '가공된 느낌'을 없애는 것이 아니라 **"문맥을 깨지 않는"** 데 중점을 둔다. 기존의 생성 AI가 어려워했던 '동일성의 유지'와 '자연스러움의 지속'을 전제로, 전문가도 일반 사용자도 마무리의 한 방을 대화로 해결하는 - 그런 편집의 표준형을 갱신하고 있다.Google Developers Blogblog.google


참고 기사

##HTML_TAG_455
← 기사 목록으로 돌아가기

문의하기 |  이용약관 |  개인정보처리방침 |  쿠키 정책 |  쿠키 설정

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア All rights reserved.