打破照片语境的AI：一句话换装。Google的『Nano-Banana』正在改写照片编辑的常识。

2025年08月28日 09:43

「Nano-Banana」是将“照片编辑的最后一步”交给AI——Google的新模型改变了修图的方法

“拍摄的人物、宠物、背景的光线都保持‘原样’，只有想要的更改准确地添加上去。”Google在Gemini应用中整合的新图像生成和编辑模型“Gemini 2.5 Flash Image”——昵称为“Nano-Banana”，是一种旨在保持“自然感”的工具。传统的生成AI难以实现的“同一人物的面部、发型、服装的一致性”以及“拍摄时光线的分布和透视的保持”是其专注的领域。只需通过文本指令，就可以完成元素的添加、删除、两张图片的合成、调整面部方向等复杂编辑。InfoMoney

实现的关键在于Gemini应用。用户可以调用照片（包括保存在Google Photos中的照片），通过聊天自然语言指令如“给他穿上这件衬衫”、“只更改招牌的字体”、“从不同角度正面拍摄”等进行指示。模型在保持“人物或物体的一致性”的同时，仅重新合成目标部分。此外，还设想了将编辑后的静态图像与Veo 3结合进行视频化的流程。InfoMoneyblog.googlexataka.com

什么是“新的”准确性

官方博客强调，这个模型能够同时处理“多张图片的混合”、“仅目标区域的自然语言转换”、“利用‘世界知识’进行生成/编辑”。特别是人物、动物的“面部表情”以及小物件的图案都能连续保持，这对故事叙述和商品照片的多样化生成非常有效。Google Developers Blog

美国Axios报道，Nano-Banana的特点在于不仅能进行新生成，还能自然地进行多层次的微调，并且在Web/移动的Gemini中广泛使用，无论是免费还是付费。同时，编辑精度的提高也引发了对深度伪造的担忧——这一警告也被附上。Axios

实际的“操作感”如何？——社交媒体上的试用评论

从InfoMoney的总结和当地用户的验证帖子来看，短指令即可实现服装替换、缺损恢复、替换为其他产品、从多个参考中一致合成等，实际运用中表现出“坚实”的一面。以下是代表性的反应。

“‘给他穿上这件衬衫’——仅此而已就很自然”：通过简短的提示更换人物的服装（Pietro Schirano）InfoMoney
“图像恢复的新SOTA”：对旧的、损坏的照片的修复精度令人惊讶（Diego）InfoMoney
“即使是复杂的图案也能成功替换产品。平均2〜3次尝试就足够”（DStudioproject）InfoMoney
“即使使用四个参考也不会崩溃。虽然不完美，但这是最好的编辑模型”（Halim Alrasihi）InfoMoney
“Google Photos也有了吗？”的热门帖子，以及甚至称其为Photoshop杀手的声音（Matthew Berman／arrakis_ai）。然而，也有对“过度吹捧”持冷静态度的社区，在Reddit上可以看到对营销手法的讽刺和“削弱”疑惑等温差。X (formerly Twitter)Reddit

功能列表（基于实例）

元素的添加/删除：去除不需要的物品，添加配饰、服装、小道具。InfoMoney
多张图片的合成：人物、商品、背景的替换或不同拍摄的整合。InfoMoneyGoogle Developers Blog
面部方向和姿势的调整：自然地校正视线和面部角度。InfoMoney
光线和透视的协调：在保持原照片“氛围感”的同时进行编辑。InfoMoney
视频化流程：编辑后与Veo 3结合进行动态图形化。InfoMoney

在哪里和如何使用？

目前的主要战场是Gemini应用。在Web/移动端均可提供，只需在聊天中输入指令。照片的导入自然地与Google Photos结合，Xataka解释了“免费在Gemini中编辑‘自己的照片’”的实际操作。费用和次数的上限可能因账户类型而异，但广泛开放本身就是一个亮点。Axiosxataka.com

另外，社交媒体上流传着“Premium+或Pro可以无限制”的帖子，但这不是官方说法。关于不同计划的详细限制，请随时查看Google的指南。InfoMoney

工作和兴趣，各自的“切入”用途

电子商务和广告制作：库存照片的服装/小物件/配色替换，背景的季节性调整，AB测试用的多样化展开。
宣传和设计：活动的关键视觉量产，保持拍摄对象和标志的一致性。
照片整理：去除拍摄入镜，修正半闭眼，恢复旧照片。
用户生成内容（UCG）：统一推崇活动、角色扮演、宠物照片的“世界观”。

限制和风险：真实性是“双刃剑”

精度越高，伦理和安全的问题就越突出。Axios指出，可能成为深度伪造或错误信息温床的风险，并敦促作为整个行业的课题来设计“使用场景”。标签化（合成和编辑的明示）和人物的同意、二次利用的规则是用户方面也需要准备的。Axios

总结：进入“用语言编辑”的时代

Nano-Banana并不是消除“加工感”，而是着重于**“不破坏语境”**。在传统生成AI难以实现的“同一性保持”和“自然感的持续”前提下，无论是专业人士还是普通用户，都可以通过对话完成最后的润色——正在更新这样的编辑标准形态。Google Developers Blogblog.google

参考文章

Google的“Nano-Banana”工具，承诺提供最佳的AI照片：详情请见此处
来源: https://www.infomoney.com.br/consumo/nano-banana-google-fotos-como-funciona/

打破照片语境的AI：一句话换装。Google的『Nano-Banana』正在改写照片编辑的常识。

「Nano-Banana」是将“照片编辑的最后一步”交给AI——Google的新模型改变了修图的方法

什么是“新的”准确性

实际的“操作感”如何？——社交媒体上的试用评论

功能列表（基于实例）

在哪里和如何使用？

工作和兴趣，各自的“切入”用途

限制和风险：真实性是“双刃剑”

总结：进入“用语言编辑”的时代

滤镜之后是“演出” - Google Gemini AI的新照片趋势席卷全球：从复古纱丽到3D人偶

谷歌新功能“Ask Photos”再登场！“让照片也能对话”──谷歌描绘的下一代搜索的未来图景

Canva和Figma都成为敌人？Google Opal改变无代码战线的日子 - 轻松创建网页应用的可视化编程应用程序「Opal」

Google翻译进入“读空气”时代：通过Gemini实现“言いたいこと”能够被理解的翻译

百度在AI革命中革新搜索和视频生成！百度瞄准广告之后的金矿

cookie_banner_title

「Nano-Banana」是将“照片编辑的最后一步”交给AI——Google的新模型改变了修图的方法

什么是“新的”准确性

实际的“操作感”如何？——社交媒体上的试用评论

功能列表（基于实例）

在哪里和如何使用？

工作和兴趣，各自的“切入”用途

限制和风险：真实性是“双刃剑”

总结：进入“用语言编辑”的时代

滤镜之后是“演出” - Google Gemini AI的新照片趋势席卷全球：从复古纱丽到3D人偶

谷歌新功能“Ask Photos”再登场！“让照片也能对话”──谷歌描绘的下一代搜索的未来图景

Canva和Figma都成为敌人？Google Opal改变无代码战线的日子 - 轻松创建网页应用的可视化编程应用程序「Opal」

Google翻译进入“读空气”时代：通过Gemini实现“言いたいこと”能够被理解的翻译

百度在AI革命中革新搜索和视频生成！百度瞄准广告之后的金矿