人类 vs. AI ─ 数学奥林匹克中显现的“知识接战”与下一个前沿：Gemini与OpenAI所揭示的“数学极限”

2025年07月23日 12:06

1. 开幕——会场的惊呼「35分」

澳大利亚昆士兰州阳光海岸。海风吹拂的会议中心，聚集了来自112个国家的641名年轻数学家。第66届国际数学奥林匹克（IMO）在第一天和第二天各有3道题目，每天进行4.5小时的笔试。在这次比赛中，作为“非官方选手”，两台巨大的智能——Google DeepMind的“Gemini Deep Think”和OpenAI的未公开模型——被引入。

首日的快讯中传出“Gemini答对5题，得35分”这一数字，观众席一片惊呼，X（旧Twitter）的时间线上瞬间被“#AImath”“#GeminiGold”填满。Phys.org

2. 金牌达成，然而未能完全胜利

IMO的金牌线通常相当于前约10%。今年的门槛是35分，实际获得金牌的学生有67名，其中5名满分42分Reuters。Gemini和OpenAI都取得了35分，但未能突破满分的壁垒。“人类仍然保持领先。”AFP发布的文章标题具有象征意义Phys.org。

3. AI方的策略——“以自然语言解题”

引人注目的是，两家公司让自然语言直接书写证明。传统的AI数学研究主要是将问题翻译成Coq或Lean等形式语言，并通过证明搜索算法解决。这次既不是基于Llama的序列转换，也不是GPT‑4的“Chain‑of‑Thought”。Gemini在接受“不要过度扩展思考，深入挖掘”的指示后，在4.5小时内完成了任务Reuters。另一方面，OpenAI的研究者Noam Brown透露，他们“大幅度扩展了测试时间计算”，并表示“成本非常高”Reuters。

4. 社交媒体的狂热与怀疑

“1/N 终于实现了多年的AI挑战！”——OpenAI的Alexander Wei的帖子在4天内获得了3万个赞X (formerly Twitter)。
健康科学初创公司DINQ祝贺道：“🏅Congrats! OpenAI takes gold at IMO 2025!”X (formerly Twitter)。
Reddit /r/math 上有帖子嘲笑计算资源成本：“$2,000 per million tokens是个笑话吗？”Reddit。
菲尔兹奖得主特伦斯·陶在采访中警告说：“AI应该认识到实验室环境中允许重试和协作，与考试场所的‘模具’之间的差异”The Times of India。

5. “胜者”是谁？——对数学教育的影响

笔者在会场采访了一位韩国代表的女学生（17岁），她笑着说：“AI的答案易于阅读。但‘灵感’仍然属于人类。”指导教师则积极表示：“想在课堂上使用Gemini，让学生比较解法的多样性。”另一方面，日本代表团透露，他们将向国际委员会提议“评分标准的透明性和防止AI作弊的措施”。

在教育现场，已经出现了“是将作业全权交给AI，还是将其视为最佳家庭教师”的二元论。芬兰在比赛次日宣布了一项试点计划，将“LLM对话式证明解析”引入高中数学课程。

6. 研究前沿——挑战未解决问题

布朗大学的Jung教授大胆预测：“AI和数学家作为‘共同作者’在arXiv上发表论文的时代将在一年内到来”Reuters。实际上，Google已经新设了“Gemini-Research”团队，表示将着手研究黎曼猜想、代数几何和拓扑量子场论这三个主题。如果实现，AI将重新定义“定理证明的定式”，数学创造性的定义本身也将动摇。

7. 课题——计算资源、环境、公平性

OpenAI的估算耗电量约为1.3 MWh，相当于水冷数据中心约3小时的用电量。环境负荷自不必说，参与国之间的资源差距可能扩大。IMO委员会正在讨论“从明年起，将AI参与分为官方类别，并设定耗电上限”的方案。

此外，“如果人类在AI的答案上进行修改呢？”这种“混合作弊”的检测也尚未解决。据称，DeepMind正在开发带有全息签名的“自我证明令牌”。

8. 未来图景——协作还是竞争

总的来说，这次IMO向世界展示了**“人类以微弱优势获胜，但AI已经站在同一个舞台上”**。
社交媒体上的标签 #TeamHuman 和 #TeamAI 经常被讨论为对立结构。然而，现场的学生们已经开始接受AI作为“竞争和教学的对手”。

下届2026年IMO（计划在塞尔维亚举行）中，AI类别的创立/人类类别的分离变得更加现实。在那里，“35分”的壁垒是否会失去意义，还是会建立新的上限——数学的未来将在黑板的粉笔和硅的晶体管共同书写的空白中闪耀。

参考文章

人类在国际数学竞赛中击败AI，尽管AI获得了金牌级别的分数
来源：https://phys.org/news/2025-07-humans-ai-international-math-contest.html

← 返回文章列表

cookie_banner_title