跳转到主要内容
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア 标志
  • 全部文章
  • 🗒️ 注册
  • 🔑 登录
    • 日本語
    • English
    • Español
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message 隐私政策 cookie_banner_and Cookie政策 cookie_banner_more_info

Cookie设置

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

人类 vs. AI ─ 数学奥林匹克中显现的“知识接战”与下一个前沿:Gemini与OpenAI所揭示的“数学极限”

人类 vs. AI ─ 数学奥林匹克中显现的“知识接战”与下一个前沿:Gemini与OpenAI所揭示的“数学极限”

2025年07月23日 12:06

1. 开幕——会场的惊呼「35分」

澳大利亚昆士兰州阳光海岸。海风吹拂的会议中心,聚集了来自112个国家的641名年轻数学家。第66届国际数学奥林匹克(IMO)在第一天和第二天各有3道题目,每天进行4.5小时的笔试。在这次比赛中,作为“非官方选手”,两台巨大的智能——Google DeepMind的“Gemini Deep Think”和OpenAI的未公开模型——被引入。


首日的快讯中传出“Gemini答对5题,得35分”这一数字,观众席一片惊呼,X(旧Twitter)的时间线上瞬间被“#AImath”“#GeminiGold”填满。Phys.org


2. 金牌达成,然而未能完全胜利

IMO的金牌线通常相当于前约10%。今年的门槛是35分,实际获得金牌的学生有67名,其中5名满分42分Reuters。Gemini和OpenAI都取得了35分,但未能突破满分的壁垒。“人类仍然保持领先。”AFP发布的文章标题具有象征意义Phys.org。


3. AI方的策略——“以自然语言解题”

引人注目的是,两家公司让自然语言直接书写证明。传统的AI数学研究主要是将问题翻译成Coq或Lean等形式语言,并通过证明搜索算法解决。这次既不是基于Llama的序列转换,也不是GPT‑4的“Chain‑of‑Thought”。Gemini在接受“不要过度扩展思考,深入挖掘”的指示后,在4.5小时内完成了任务Reuters。另一方面,OpenAI的研究者Noam Brown透露,他们“大幅度扩展了测试时间计算”,并表示“成本非常高”Reuters。


4. 社交媒体的狂热与怀疑

 


  • “1/N 终于实现了多年的AI挑战!”——OpenAI的Alexander Wei的帖子在4天内获得了3万个赞X (formerly Twitter)。

  • 健康科学初创公司DINQ祝贺道:“🏅Congrats! OpenAI takes gold at IMO 2025!”X (formerly Twitter)。

  • Reddit /r/math 上有帖子嘲笑计算资源成本:“$2,000 per million tokens是个笑话吗?”Reddit。

  • 菲尔兹奖得主特伦斯·陶在采访中警告说:“AI应该认识到实验室环境中允许重试和协作,与考试场所的‘模具’之间的差异”The Times of India。


5. “胜者”是谁?——对数学教育的影响

笔者在会场采访了一位韩国代表的女学生(17岁),她笑着说:“AI的答案易于阅读。但‘灵感’仍然属于人类。”指导教师则积极表示:“想在课堂上使用Gemini,让学生比较解法的多样性。”另一方面,日本代表团透露,他们将向国际委员会提议“评分标准的透明性和防止AI作弊的措施”。


在教育现场,已经出现了“是将作业全权交给AI,还是将其视为最佳家庭教师”的二元论。芬兰在比赛次日宣布了一项试点计划,将“LLM对话式证明解析”引入高中数学课程。


6. 研究前沿——挑战未解决问题

布朗大学的Jung教授大胆预测:“AI和数学家作为‘共同作者’在arXiv上发表论文的时代将在一年内到来”Reuters。实际上,Google已经新设了“Gemini-Research”团队,表示将着手研究黎曼猜想、代数几何和拓扑量子场论这三个主题。如果实现,AI将重新定义“定理证明的定式”,数学创造性的定义本身也将动摇。


7. 课题——计算资源、环境、公平性

OpenAI的估算耗电量约为1.3 MWh,相当于水冷数据中心约3小时的用电量。环境负荷自不必说,参与国之间的资源差距可能扩大。IMO委员会正在讨论“从明年起,将AI参与分为官方类别,并设定耗电上限”的方案。


此外,“如果人类在AI的答案上进行修改呢?”这种“混合作弊”的检测也尚未解决。据称,DeepMind正在开发带有全息签名的“自我证明令牌”。


8. 未来图景——协作还是竞争

总的来说,这次IMO向世界展示了**“人类以微弱优势获胜,但AI已经站在同一个舞台上”**。
社交媒体上的标签 #TeamHuman 和 #TeamAI 经常被讨论为对立结构。然而,现场的学生们已经开始接受AI作为“竞争和教学的对手”。


下届2026年IMO(计划在塞尔维亚举行)中,AI类别的创立/人类类别的分离变得更加现实。在那里,“35分”的壁垒是否会失去意义,还是会建立新的上限——数学的未来将在黑板的粉笔和硅的晶体管共同书写的空白中闪耀。


参考文章

人类在国际数学竞赛中击败AI,尽管AI获得了金牌级别的分数
来源:https://phys.org/news/2025-07-humans-ai-international-math-contest.html

← 返回文章列表

联系我们 |  服务条款 |  隐私政策 |  Cookie政策 |  Cookie设置

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア All rights reserved.