跳转到主要内容
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア 标志
  • 全部文章
  • 🗒️ 注册
  • 🔑 登录
    • 日本語
    • English
    • Español
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message 隐私政策 cookie_banner_and Cookie政策 cookie_banner_more_info

Cookie设置

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

萨姆·阿尔特曼谈论GPT-5的挑战和4o的复活:长凳是最强的,体验是不完整的?GPT-5发布会的“Chart Crime”和信任的成本

萨姆·阿尔特曼谈论GPT-5的挑战和4o的复活:长凳是最强的,体验是不完整的?GPT-5发布会的“Chart Crime”和信任的成本

2025年08月10日 11:46

1. 发生了什么?48小时时间线

8月7日(美国时间),OpenAI宣布推出新旗舰“GPT-5”。通过在后台切换快速响应系统和“思考”系统的实时路由器,转向“集成模型”。次日8日,首席执行官萨姆·阿尔特曼等人在Reddit上进行AMA,解释说:“第一天路由器出现重大故障(sev),有一段时间自动切换失效。这导致人们感到‘GPT-5变得愚蠢’。”他们承诺将Plus的速率上限翻倍,并增强显示哪个模型正在回答。此外,他们明确表示将考虑在Plus中继续提供“4o”,以回应强烈的用户需求。


2. GPT-5的目标——消除“模型选择的负担”

在官方声明中,OpenAI将GPT-5定义为“一体化系统”。通常情况下,路由器会自动判断使用轻量智能模型还是“思考”模型(GPT-5 Thinking/Pro)来解决难题。他们还提出了改进指令跟随和事实性,以及在代码、创作和健康领域的基准提升。换句话说,核心是让用户不必考虑“选择哪个模型”的用户体验。OpenAI


这一设计对大多数用户来说是受欢迎的。然而,对于那些习惯于根据“模型个性”进行区分的重度用户来说,这可能被视为选择权的缩减。这次事件正是这种差距的显现。


3. “还我4o”现象——基于社交媒体的感受

发布后不久,Reddit的r/ChatGPT等社区涌现出大量帖子,称“GPT-5的文本显得生硬”,“创作的风格下降”,“怀念4o的声音和对话感”。“Bring back 4o”和“#keep4o”等呼吁和签名网站也被分享。同时,也有不少反应认为“5更快更实用”,“代码更好”。8月9日至10日,关于“Plus的‘遗留显示’中4o已恢复/正在逐步推出”的报告帖子激增,许多人表示确实可以切换。TechRadarReddit


媒体也报道了“4o将回归”,显示出对用户声音的快速响应。然而,用户报告中也混杂着关于地区、计划和应用反映的时差。Tom's Guide


4. “图表犯罪”的痛点——可视化的信任

在发布会上,由于数值与柱状图高度不一致等错误,“图表犯罪(统计上严重的图表)”成为话题。阿尔特曼在X上承认这是“巨大的失误”,公司内部也进行了道歉。尽管官方博客上的图表是正确的,但现场展示的可视化错误对“以事实性为卖点的产品宣传”来说是痛苦的。《The Verge》等媒体对具体的不一致进行了验证,网络上的讽刺也随之加速。The Verge


这一事件留下了两个启示。首先,AI供应商的“数字叙述”直接关系到产品本身的信任。其次,即使模型很聪明,“人类的可视化和验证过程”是不同的,最终必须由人类来维护。


5. 即便如此,“内容”是否在进化

从开发者和研究人员的角度来看,GPT-5在指令跟随、代码生成的稳定性和长时间思考时的事实性方面有所提高。然而,评论者西蒙·威利森分享了一个“弱点的实例”:当他让模型自动排列表格时出现错误,最终通过Python重新排列解决。换句话说,它并非“万能”,但“如何避免失败和通过组合来补偿”成为实际操作中的重要知识。OpenAISimon Willison’s Weblog


6. OpenAI的“举措”及未来焦点

在AMA中,提出了Plus的速率上限翻倍、模型选择的透明化、4o的持续提供的考虑。虽然路由器故障作为“体验的首次冲击”影响很大,但如果切换算法得到改善,集成用户体验的优势将会显现。问题在于如何共存“偏好的多样性”和“集成的简便性”。遗留选择和“风格、个性细粒度定制”将成为关键。


7. 针对不同用户的实用提示

  • 个人创作者:如果重视故事和对话的“温度感”,暂时可以比较使用4o(如果可用)和5。明确地向GPT-5传达“这种文体”“情感更强”等风格指令。失败时,可以通过“生成表→用Python生成表后再排序”的工具联动来提供保障。RedditSimon Willison’s Weblog

  • 开发者:不要完全依赖路由器,重要步骤要“明确思考模式”,并以验证步骤(类型、测试、lint)为前提。可视化不要完全依赖自动生成,要双重检查单位、轴和比例。The Verge

  • 企业导入:初期要预设“体验的波动”,用SLO而非SLA进行监控。明确模型选择策略,设计用户“当前使用哪个模型”的显示和升级路径(长时间思考强制,人类验证)。


8. 结论——即使在集成时代,自由选择仍是武器

GPT-5明确提出了“让更多人更易使用”的方向。然而,AI体验同样依赖于“偏好”如同“性能”。这次事件不仅仅是关于故障或可视化错误的问题。“集成”和“个性”如何共存——这是AI普及不可避免的设计挑战,已被鲜明地暴露出来。


参考文章

萨姆·阿尔特曼谈“笨拙”的GPT-5推出、4o的回归以及“图表犯罪”
来源: https://techcrunch.com/2025/08/08/sam-altman-addresses-bumpy-gpt-5-rollout-bringing-4o-back-and-the-chart-crime/

Powered by Froala Editor

← 返回文章列表

联系我们 |  服务条款 |  隐私政策 |  Cookie政策 |  Cookie设置

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア All rights reserved.