萨姆·阿尔特曼谈论GPT-5的挑战和4o的复活：长凳是最强的，体验是不完整的？GPT-5发布会的“Chart Crime”和信任的成本

2025年08月10日 11:46

1. 发生了什么？48小时时间线

8月7日（美国时间），OpenAI宣布推出新旗舰“GPT-5”。通过在后台切换快速响应系统和“思考”系统的实时路由器，转向“集成模型”。次日8日，首席执行官萨姆·阿尔特曼等人在Reddit上进行AMA，解释说：“第一天路由器出现重大故障（sev），有一段时间自动切换失效。这导致人们感到‘GPT-5变得愚蠢’。”他们承诺将Plus的速率上限翻倍，并增强显示哪个模型正在回答。此外，他们明确表示将考虑在Plus中继续提供“4o”，以回应强烈的用户需求。

2. GPT-5的目标——消除“模型选择的负担”

在官方声明中，OpenAI将GPT-5定义为“一体化系统”。通常情况下，路由器会自动判断使用轻量智能模型还是“思考”模型（GPT-5 Thinking/Pro）来解决难题。他们还提出了改进指令跟随和事实性，以及在代码、创作和健康领域的基准提升。换句话说，核心是让用户不必考虑“选择哪个模型”的用户体验。OpenAI

这一设计对大多数用户来说是受欢迎的。然而，对于那些习惯于根据“模型个性”进行区分的重度用户来说，这可能被视为选择权的缩减。这次事件正是这种差距的显现。

3. “还我4o”现象——基于社交媒体的感受

发布后不久，Reddit的r/ChatGPT等社区涌现出大量帖子，称“GPT-5的文本显得生硬”，“创作的风格下降”，“怀念4o的声音和对话感”。“Bring back 4o”和“#keep4o”等呼吁和签名网站也被分享。同时，也有不少反应认为“5更快更实用”，“代码更好”。8月9日至10日，关于“Plus的‘遗留显示’中4o已恢复/正在逐步推出”的报告帖子激增，许多人表示确实可以切换。TechRadarReddit

媒体也报道了“4o将回归”，显示出对用户声音的快速响应。然而，用户报告中也混杂着关于地区、计划和应用反映的时差。Tom's Guide

4. “图表犯罪”的痛点——可视化的信任

在发布会上，由于数值与柱状图高度不一致等错误，“图表犯罪（统计上严重的图表）”成为话题。阿尔特曼在X上承认这是“巨大的失误”，公司内部也进行了道歉。尽管官方博客上的图表是正确的，但现场展示的可视化错误对“以事实性为卖点的产品宣传”来说是痛苦的。《The Verge》等媒体对具体的不一致进行了验证，网络上的讽刺也随之加速。The Verge

这一事件留下了两个启示。首先，AI供应商的“数字叙述”直接关系到产品本身的信任。其次，即使模型很聪明，“人类的可视化和验证过程”是不同的，最终必须由人类来维护。

5. 即便如此，“内容”是否在进化

从开发者和研究人员的角度来看，GPT-5在指令跟随、代码生成的稳定性和长时间思考时的事实性方面有所提高。然而，评论者西蒙·威利森分享了一个“弱点的实例”：当他让模型自动排列表格时出现错误，最终通过Python重新排列解决。换句话说，它并非“万能”，但“如何避免失败和通过组合来补偿”成为实际操作中的重要知识。OpenAISimon Willison’s Weblog

6. OpenAI的“举措”及未来焦点

在AMA中，提出了Plus的速率上限翻倍、模型选择的透明化、4o的持续提供的考虑。虽然路由器故障作为“体验的首次冲击”影响很大，但如果切换算法得到改善，集成用户体验的优势将会显现。问题在于如何共存“偏好的多样性”和“集成的简便性”。遗留选择和“风格、个性细粒度定制”将成为关键。

7. 针对不同用户的实用提示

个人创作者：如果重视故事和对话的“温度感”，暂时可以比较使用4o（如果可用）和5。明确地向GPT-5传达“这种文体”“情感更强”等风格指令。失败时，可以通过“生成表→用Python生成表后再排序”的工具联动来提供保障。RedditSimon Willison’s Weblog
开发者：不要完全依赖路由器，重要步骤要“明确思考模式”，并以验证步骤（类型、测试、lint）为前提。可视化不要完全依赖自动生成，要双重检查单位、轴和比例。The Verge
企业导入：初期要预设“体验的波动”，用SLO而非SLA进行监控。明确模型选择策略，设计用户“当前使用哪个模型”的显示和升级路径（长时间思考强制，人类验证）。

8. 结论——即使在集成时代，自由选择仍是武器

GPT-5明确提出了“让更多人更易使用”的方向。然而，AI体验同样依赖于“偏好”如同“性能”。这次事件不仅仅是关于故障或可视化错误的问题。“集成”和“个性”如何共存——这是AI普及不可避免的设计挑战，已被鲜明地暴露出来。

参考文章

萨姆·阿尔特曼谈“笨拙”的GPT-5推出、4o的回归以及“图表犯罪”
来源: https://techcrunch.com/2025/08/08/sam-altman-addresses-bumpy-gpt-5-rollout-bringing-4o-back-and-the-chart-crime/

萨姆·阿尔特曼谈论GPT-5的挑战和4o的复活：长凳是最强的，体验是不完整的？GPT-5发布会的“Chart Crime”和信任的成本

1. 发生了什么？48小时时间线

2. GPT-5的目标——消除“模型选择的负担”

3. “还我4o”现象——基于社交媒体的感受

4. “图表犯罪”的痛点——可视化的信任

5. 即便如此，“内容”是否在进化

6. OpenAI的“举措”及未来焦点

7. 针对不同用户的实用提示

8. 结论——即使在集成时代，自由选择仍是武器

AI革命！ChatGPT全面支持您的在线购物和演示准备

AI时代的陷阱：复制粘贴脑的诞生？长期使用ChatGPT记忆力下降55%

AI最终是否依赖广告：ChatGPT广告引入揭示“消费者AI的现实”

生成AI家庭教师的陷阱：错误检测率15%显示“学力下降”的现实

1GPU在1分钟内生成1秒音频。微软，内制AI的号角 ─ Copilot的“心脏”会自制化吗

cookie_banner_title

1. 发生了什么？48小时时间线

2. GPT-5的目标——消除“模型选择的负担”

3. “还我4o”现象——基于社交媒体的感受

4. “图表犯罪”的痛点——可视化的信任

5. 即便如此，“内容”是否在进化

6. OpenAI的“举措”及未来焦点

7. 针对不同用户的实用提示

8. 结论——即使在集成时代，自由选择仍是武器

AI革命！ChatGPT全面支持您的在线购物和演示准备

AI时代的陷阱：复制粘贴脑的诞生？长期使用ChatGPT记忆力下降55%

AI最终是否依赖广告：ChatGPT广告引入揭示“消费者AI的现实”

生成AI家庭教师的陷阱：错误检测率15%显示“学力下降”的现实

1GPU在1分钟内生成1秒音频。微软，内制AI的号角 ─ Copilot的“心脏”会自制化吗