跳转到主要内容
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア 标志
  • 全部文章
  • 🗒️ 注册
  • 🔑 登录
    • 日本語
    • English
    • Español
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message 隐私政策 cookie_banner_and Cookie政策 cookie_banner_more_info

Cookie设置

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

3D生成AI创造的“次世代创作”── SIGGRAPH 2025前沿报告

3D生成AI创造的“次世代创作”── SIGGRAPH 2025前沿报告

2025年06月17日 20:09
1. 序章──“画像→3D”的壁垒在2025年被突破

在文本和图像生成领域备受关注的生成AI(GenAI),从2024年开始正式渗透到3D领域。随着OpenAI的Shap-E和NVIDIA的Instant N-eRF的出现,“输入提示→数秒内生成3D网格”成为常态,制作流程的初期方案发生了巨大变化。到2025年,目前的单一对象生成已加速进化为“场景重构”、“动画生成”、“具有物理特性的服装生成”。github.comgaragefarm.net




2. SIGGRAPH 2025展示的三大突破

2-1 CAST:从一张照片到“可触摸的3D空间”

CAST(Component-Aligned Scene Reconstruction)能够从一张RGB图像中,推测隐藏面和深度,同时保持物体间的接触和重力关系,生成3D场景。研究团队

  • 物体识别:通过大型视觉Transformer同时检测数百个类别

  • 相机姿态估计:通过场景优化校正透视畸变

  • 几何一致性损失:使用NeRF衍生模型补全“不可见的背面”

    预计将应用于家具VR化、机器人模拟、电影预可视化等领域。digitalmedianet.com



2Anim:从分镜到3D动作

在电影和动画行业中广泛使用的分镜制作依然具有很强的模拟元素。Sketch2Anim通过扩散模型解析姿势序列和速度线,自动生成行走、跳跃等动作。可以以FBX格式立即导入Unity/Unreal,实现拍摄前的预可视化和虚拟形象发布会的即时预览。digitalmedianet.com



2-3 Dress-1-to-3:一张照片生成“带缝制图案”的服装

现有的虚拟试穿存在静态网格导致布料摆动不自然的问题。Dress-1-to-3通过扩散模型和物理优化(C-IPC)推测**布料参数(杨氏模量、弯曲刚度)**,实现与游戏用实时模拟一致的行为。预计将降低电子商务的退货率。digitalmedianet.com



3. 技术背景──扩散模型与NeRF的融合

扩散模型通过逆转噪声去除过程实现高质量生成,但在3D中多视点一致性是一个挑战。CAST引入视点一致性损失,Sketch2Anim引入时间轴一致性损失,Dress-1-to-3引入物理损失,以克服一致性问题。此外,NeRF系方法通过可微分渲染器实现图像→3D→渲染的一贯学习,将计算成本减少数十倍。garagefarm.net



4. 产业应用的扩展
行业具体用例预期效果
游戏/元宇宙用户生成场景的自动3D化缩短开发周期,激活UGC
电影/VFX外景照片→3D预可视化拍摄前成本削减
电商/时尚AR试穿,尺寸优化减少退货率
制造/建筑现有设备的点云→CAD化缩短设计前置时间
机器人实景→虚拟环境生成加速模拟学习




5. 对日本企业的影响
  • CG・动画:与赛璐珞文化融合,半自动化布局流程

  • 服装:ZOZO・优衣库通过虚拟试穿提升国内外销售

  • 制造:丰田・三菱重工快速构建数字孪生,提高生产线变更效率
    国内人才短缺是瓶颈,但通过生成AI可以实现从“操作员→监督员”型的工作方式转变。




6. 课题──著作权・伦理・环境负荷
  1. 著作权:现有3D资产混入导致的权利侵害风险

  2. 伦理:假冒产品或伪装试穿的滥用

  3. 环境负荷:大量GPU训练导致的CO₂排放
    需要法律整备和企业治理的双轮驱动。




7. 导入步骤和推荐工具
  1. PoC:使用Shap-E或LumaAI进行小规模验证

  2. 工作流整合:在Blender / Houdini中添加扩散插件

  3. CI/CD化:使用Git+云GPU自动执行生成脚本

  4. 制定指南:制定AI使用条款和质量检查流程
    日语UI的低代码工具也在增加,非工程师也能轻松尝试。




8. 未来展望──“世界模型”的发展

未来3D生成AI将内含物理、常识和任务计划,进化为World Model,成为机器人控制和XR学习环境的核心。有预测称,结合语言LLM和世界模型的“多模态AGI”将在2027年左右投入实用。businessinsider.com



9. 总结

3D生成AI将传统的3DCG制作概念从“从零开始创造”转变为“传达意图并生成”。CAST、Sketch2Anim、Dress-1-to-3的出现将“人人皆可3D”推向实用水平,并直接关系到日本企业竞争力的提升。现在正是小试牛刀、大展宏图的好时机。




参考文章列表

  • Digital Media Net「3D生成AI如何改变我们创建、设计和与数字内容互动的方式」digitalmedianet.com

  • GarageFarm「3D建模中的生成AI:变革创造力和工作流程」garagefarm.net

  • OpenAI GitHub「Shap-E: 生成条件3D隐式函数」github.com

  • Business Insider「顶级AI研究人员称语言限制… 世界模型」businessinsider.com


3D生成AI正在变革数字内容的创建、设计和互动方式
出处: https://digitalmedianet.com/3d-generative-ai-transforms-how-we-create-design-interact-with-digital-content/

← 返回文章列表

联系我们 |  服务条款 |  隐私政策 |  Cookie政策 |  Cookie设置

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア All rights reserved.