跳转到主要内容
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア 标志
  • 全部文章
  • 🗒️ 注册
  • 🔑 登录
    • 日本語
    • English
    • Español
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message 隐私政策 cookie_banner_and Cookie政策 cookie_banner_more_info

Cookie设置

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

让30位天才在10分钟内沉默的AI真相:加利福尼亚震撼会议的全貌

让30位天才在10分钟内沉默的AI真相:加利福尼亚震撼会议的全貌

2025年07月13日 12:51

1. 引言

2025年5月17日至18日,在美国加州大学伯克利分校的一个角落,举办了一场极为秘密的数学峰会“FrontierMath Symposium”。受邀的有数论、几何、拓扑等领域的30位顶尖研究者。他们面临的对手不是人类,而是OpenAI最新的“推理”模型o4-mini。——仅仅48小时后,许多参与者一致认为“AI正在逐步进入数学天才的领域”。Live Science


2. o4-mini是什么

o4-mini 是一个轻量级的LLM,旨在实现传统GPT-4系不擅长的“深度推理”,并于4月发布。OpenAI与非营利组织Epoch AI合作,构建了一个由300道未公开题目组成的基准FrontierMath来衡量其性能。结果显示,在传统模型正确率低于2%的难题中,o4-mini解答了**20%**。Scientific American


3. 秘密会议的幕后

  • NDA和Signal
    所有参与的数学家都签署了NDA。为了防止问题被混入学习数据,通讯仅限于加密聊天工具Signal。Live Science

  • 悬赏金7,500美元
    提出“AI无法解决的问题”的出题者将获得奖金作为激励。Scientific American

  • 惊人的10分钟解答
    数论权威Ken Ono教授提出了一个“博士水平的未解问题”,但o4-mini在10分钟内就完成了解答。Ono教授苦笑着说,o4-mini已经掌握了“威慑性证明”。Live ScienceScientific American


4. 人类 VS AI:胜负的走向

在两天的激战中,人类完全让AI沉默的问题仅有10道。一位数学家Yang-Hui He评价说:“它已经不再是优秀的研究生,而是达到了合作者的水平。”Scientific American


5. 社交媒体上的赞与否

平台代表性声音概要
Reddit /r/AI“Epoch AI与OpenAI关系密切,感觉像是宣传。” – sandwichtank对企业利益的怀疑与谨慎论。Reddit
LinkedIn“AI不再是计算器,而是‘思考的同事’。” – 前政府工程师Keith King行业人士更感震撼。LinkedIn
X (旧Twitter)“#o4mini跨越了数学界的卢比孔河。” – Techmeme科技影响者的广泛传播。X (formerly Twitter)

 



支持者欢迎“AI研究效率的极大提升”,而怀疑者则担心“即使计算结果正确,但逻辑若有缺陷怎么办?”以及“验证成本的急剧增加”。


6. 数学研究将如何改变

  1. 角色分化 ― 数学家将专注于问题设定和创意的美学评价,AI则负责计算和生成证明。

  2. 教育课程的重新设计 ― 注重培养创造性和直觉的任务,常规计算交由AI处理。

  3. 证明的可靠性问题 ― “AI写的证明”需要人类能够检查的机制(机器可读格式和形式化证明)的重要性急剧上升。


7. 剩下的挑战

  • 从归纳到创造:o4-mini擅长“重构”现有文献,但能否真正产生新定理尚未验证。

  • 黑箱性:推理链可能是后期附加的(即所谓的“先猜出答案再写解释”现象)。Reddit

  • 评价的公正性:对Epoch AI与OpenAI的资金关系的质疑声不断。


8. 未来情景

时间AI的到达点人类数学家的主要工作
~2027自动解决大量Tier 4问题结果验证与问题设计
~2030挑战Tier 5(未知领域)审美眼光与研究伦理
2030年代“自我验证AI”崛起监督学术界整体的进化方向


9. 结语

“通用AI不会到来”这一传统论点,被数学前线的研究者在这个周末推翻。人类的“提出问题的能力”与AI的“编织解答的能力”是否会开始协奏?还是说,创造性的最后堡垒将被放弃?在伯克利的密室中响起的欢呼与尖叫,或许是对近未来智力生态系统的警报。



参考文章

AI在加州的秘密会议上击败了世界顶尖的30位数学家
来源: https://www.livescience.com/technology/artificial-intelligence/ai-outsmarted-30-of-the-worlds-top-mathematicians-at-secret-meeting-in-california

← 返回文章列表

联系我们 |  服务条款 |  隐私政策 |  Cookie政策 |  Cookie设置

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア All rights reserved.