跳转到主要内容
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア 标志
  • 全部文章
  • 🗒️ 注册
  • 🔑 登录
    • 日本語
    • English
    • Español
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message 隐私政策 cookie_banner_and Cookie政策 cookie_banner_more_info

Cookie设置

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

打破照片语境的AI:一句话换装。Google的『Nano-Banana』正在改写照片编辑的常识。

打破照片语境的AI:一句话换装。Google的『Nano-Banana』正在改写照片编辑的常识。

2025年08月28日 09:43

「Nano-Banana」是将“照片编辑的最后一步”交给AI——Google的新模型改变了修图的方法

“拍摄的人物、宠物、背景的光线都保持‘原样’,只有想要的更改准确地添加上去。”Google在Gemini应用中整合的新图像生成和编辑模型“Gemini 2.5 Flash Image”——昵称为“Nano-Banana”,是一种旨在保持“自然感”的工具。传统的生成AI难以实现的“同一人物的面部、发型、服装的一致性”以及“拍摄时光线的分布和透视的保持”是其专注的领域。只需通过文本指令,就可以完成元素的添加、删除、两张图片的合成、调整面部方向等复杂编辑。InfoMoney


实现的关键在于Gemini应用。用户可以调用照片(包括保存在Google Photos中的照片),通过聊天自然语言指令如“给他穿上这件衬衫”、“只更改招牌的字体”、“从不同角度正面拍摄”等进行指示。模型在保持“人物或物体的一致性”的同时,仅重新合成目标部分。此外,还设想了将编辑后的静态图像与Veo 3结合进行视频化的流程。InfoMoneyblog.googlexataka.com


什么是“新的”准确性

官方博客强调,这个模型能够同时处理“多张图片的混合”、“仅目标区域的自然语言转换”、“利用‘世界知识’进行生成/编辑”。特别是人物、动物的“面部表情”以及小物件的图案都能连续保持,这对故事叙述和商品照片的多样化生成非常有效。Google Developers Blog


美国Axios报道,Nano-Banana的特点在于不仅能进行新生成,还能自然地进行多层次的微调,并且在Web/移动的Gemini中广泛使用,无论是免费还是付费。同时,编辑精度的提高也引发了对深度伪造的担忧——这一警告也被附上。Axios


实际的“操作感”如何?——社交媒体上的试用评论

 


从InfoMoney的总结和当地用户的验证帖子来看,短指令即可实现服装替换、缺损恢复、替换为其他产品、从多个参考中一致合成等,实际运用中表现出“坚实”的一面。以下是代表性的反应。

  • “‘给他穿上这件衬衫’——仅此而已就很自然”:通过简短的提示更换人物的服装(Pietro Schirano)InfoMoney

  • “图像恢复的新SOTA”:对旧的、损坏的照片的修复精度令人惊讶(Diego)InfoMoney

  • “即使是复杂的图案也能成功替换产品。平均2〜3次尝试就足够”(DStudioproject)InfoMoney

  • “即使使用四个参考也不会崩溃。虽然不完美,但这是最好的编辑模型”(Halim Alrasihi)InfoMoney

  • “Google Photos也有了吗?”的热门帖子,以及甚至称其为Photoshop杀手的声音(Matthew Berman/arrakis_ai)。然而,也有对“过度吹捧”持冷静态度的社区,在Reddit上可以看到对营销手法的讽刺和“削弱”疑惑等温差。X (formerly Twitter)Reddit


功能列表(基于实例)

  • 元素的添加/删除:去除不需要的物品,添加配饰、服装、小道具。InfoMoney

  • 多张图片的合成:人物、商品、背景的替换或不同拍摄的整合。InfoMoneyGoogle Developers Blog

  • 面部方向和姿势的调整:自然地校正视线和面部角度。InfoMoney

  • 光线和透视的协调:在保持原照片“氛围感”的同时进行编辑。InfoMoney

  • 视频化流程:编辑后与Veo 3结合进行动态图形化。InfoMoney


在哪里和如何使用?

目前的主要战场是Gemini应用。在Web/移动端均可提供,只需在聊天中输入指令。照片的导入自然地与Google Photos结合,Xataka解释了“免费在Gemini中编辑‘自己的照片’”的实际操作。费用和次数的上限可能因账户类型而异,但广泛开放本身就是一个亮点。Axiosxataka.com


另外,社交媒体上流传着“Premium+或Pro可以无限制”的帖子,但这不是官方说法。关于不同计划的详细限制,请随时查看Google的指南。InfoMoney


工作和兴趣,各自的“切入”用途

  • 电子商务和广告制作:库存照片的服装/小物件/配色替换,背景的季节性调整,AB测试用的多样化展开。

  • 宣传和设计:活动的关键视觉量产,保持拍摄对象和标志的一致性。

  • 照片整理:去除拍摄入镜,修正半闭眼,恢复旧照片。

  • 用户生成内容(UCG):统一推崇活动、角色扮演、宠物照片的“世界观”。


限制和风险:真实性是“双刃剑”

精度越高,伦理和安全的问题就越突出。Axios指出,可能成为深度伪造或错误信息温床的风险,并敦促作为整个行业的课题来设计“使用场景”。标签化(合成和编辑的明示)和人物的同意、二次利用的规则是用户方面也需要准备的。Axios


总结:进入“用语言编辑”的时代

Nano-Banana并不是消除“加工感”,而是着重于**“不破坏语境”**。在传统生成AI难以实现的“同一性保持”和“自然感的持续”前提下,无论是专业人士还是普通用户,都可以通过对话完成最后的润色——正在更新这样的编辑标准形态。Google Developers Blogblog.google


参考文章

Google的“Nano-Banana”工具,承诺提供最佳的AI照片:详情请见此处
来源: https://www.infomoney.com.br/consumo/nano-banana-google-fotos-como-funciona/

Powered by Froala Editor

← 返回文章列表

联系我们 |  服务条款 |  隐私政策 |  Cookie政策 |  Cookie设置

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア All rights reserved.