skip_to_content
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア 로고
  • 전체 기사
  • 🗒️ 회원가입
  • 🔑 로그인
    • 日本語
    • English
    • 中文
    • Español
    • Français
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message 개인정보처리방침 cookie_banner_and 쿠키 정책 cookie_banner_more_info

쿠키 설정

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

인류 vs. AI ─ 수학 올림피아드에서 드러난 '지식의 접전'과 다음 프론티어: Gemini와 OpenAI가 제시한 '수학적 한계'

인류 vs. AI ─ 수학 올림피아드에서 드러난 '지식의 접전'과 다음 프론티어: Gemini와 OpenAI가 제시한 '수학적 한계'

2025年07月23日 12:09

1. 개막――장내가 술렁인 "35점"

호주 퀸즐랜드주 선샤인 코스트. 바닷바람이 불어오는 컨벤션 센터에, 112개국 641명의 젊은 수학자들이 집결했다. 66회째를 맞이한 국제수학올림피아드(IMO)는, 첫날에 3문제, 둘째 날에 3문제, 각각 4.5시간의 필기로 경쟁한다. 그곳에 "비공식 선수"로서, 2개의 거대한 두뇌――Google DeepMind의 "Gemini Deep Think"와 OpenAI의 미공개 모델――가 도입되었다.


첫날 속보로 "Gemini가 5문제 정답, 35점"이라는 숫자가 전해지자, 관객석은 술렁이고, X(구 Twitter)의 타임라인은 즉시 "#AImath", "#GeminiGold"로 가득 찼다.Phys.org


2. 금메달은 달성, 그러나 완전 승리는 아님

IMO의 금메달 라인은 예년 상위 약 10%에 해당한다. 올해는 35점이 임계치로, 실제로 금을 딴 학생은 67명, 그 중 5명이 만점 42점이었다Reuters. Gemini와 OpenAI는 모두 35점으로 어깨를 나란히 했지만, 만점의 벽에 막혔다. "인간이 아직 리드를 유지했다". AFP 배포 기사 제목이 상징적이다Phys.org.


3. AI 측의 전술――"자연어 그대로 풀기"

주목받은 것은, 양사가 자연어로 직접 증명을 작성하게 한 점이다. 기존의 AI 수학 연구는, 문제를 Coq나 Lean 등의 형식 언어로 번역하고, 증명 검색 알고리즘으로 푸는 것이 주류였다. 이번에는 Llama 기반의 시리즈 변환도 아니고, GPT‑4의 "Chain‑of‑Thought"도 아니다. Gemini는 **"생각을 너무 넓히지 않고, 깊게 파고들라"**는 지시 프롬프트를 받아, 4.5시간 내에 완결했다Reuters. 한편 OpenAI는 "테스트 타임 Compute를 대폭 스케일시켰다"고 연구자 Noam Brown 씨가 밝혔다. "매우 비쌌다"고도Reuters.


4. SNS의 열광과 회의

 


  • "1/N 드디어 오랜 AI 도전을 달성!"――OpenAI의 Alexander Wei 씨의 스레드는 4일 만에 3만 좋아요를 얻었다X (formerly Twitter).

  • 건강 과학계 스타트업 DINQ는 "🏅Congrats! OpenAI takes gold at IMO 2025!"라고 축하X (formerly Twitter).

  • Reddit /r/math에서는 "$2,000 per million tokens라니 농담이냐?"라며 계산 자원 비용을 조롱하는 스레드가 급증Reddit.

  • 필즈상 수상자 테렌스 타오 씨는 인터뷰에서 "AI는 리트라이와 협력이 허용되는 실험실 환경과, 시험장이라는 '틀'의 차이를 인식해야 한다"고 경고했다The Times of India.


5. "승자"는 누구인가?――수학 교육에의 영향

필자가 현장에서 취재한 한국 대표의 여학생(17)은 "AI의 답안은 읽기 쉽다. 하지만 '영감'은 아직 사람의 것"이라고 웃었다. 지도 교사는 "수업에서 Gemini를 사용해, 풀이의 변형을 비교시키고 싶다"고 긍정적이다. 한편, 일본 대표단은 "채점 기준의 투명성과 AI의 치트 방지책"을 국제 위원회에 제안한다고 밝혔다.


교육 현장에서는 이미 "AI에 숙제를 맡길 것인가, 아니면 최고의 가정교사로 볼 것인가"의 이분법이 일어나고 있다. 핀란드는 대회 다음 날 "고등학교 수학 커리큘럼에 LLM 대화식 증명 분석을 도입한다"는 파일럿 프로그램을 발표했다.


6. 연구 최전선――미해결 문제에의 도전

브라운 대학의 Jung 교수는 "AI와 수학자가 '공저자'로서 arXiv에 논문을 제출하는 시대는 1년 이내에 올 것"이라고 대담한 예측Reuters. 실제로, Google은 "Gemini-Research" 팀을 신설해, 리만 가설・대수 기하・위상적 양자장 이론의 3개 테마에 착수한다고 블로그에서 시사했다. 이것이 실현되면, AI가 "정리 증명의 정석"을 재정의하고, 수학적 창조성의 정의 자체가 흔들릴 것이다.


7. 과제――계산 자원・환경・공정성

OpenAI의 추정 소비 전력량은 약 1.3 MWh(추산)로, 수냉 데이터 센터 약 3시간 분에 해당한다. 환경 부담은 물론, 참가국 간의 자원 격차는 확대될 우려가 있다. IMO 위원회는 "내년 이후, AI 참가를 공식 카테고리로 분리하고, 소비 전력 상한을 설정한다"는 안을 협의 중이다.


또한, "AI의 답안에 인간이 가필했다면?"이라는 "하이브리드 부정"의 검출도 미해결이다. DeepMind는 홀로그램 서명 부착의 "자기 증명 토큰"을 개발 중이라고 한다.


8. 미래상――협력인가 경쟁인가

총괄하면, 이번 IMO는 **"인간이 근소한 차이로 승리했지만, AI는 이미 같은 링에 섰다"**는 것을 세계에 보여주었다.
SNS의 해시태그 #TeamHuman과 #TeamAI는, 종종 대립 구도로 논의된다. 하지만 현장의 학생들은 "경쟁하고, 가르쳐주는 라이벌"로서 AI를 받아들이기 시작하고 있다.


다음 2026년 IMO(세르비아 예정)에서는, AI 카테고리 창설/인간 카테고리 분리가 현실성을 띠게 된다. 그곳에서 다시 "35점"의 벽이 의미를 잃을 것인가, 아니면 새로운 천장이 세워질 것인가――수학의 미래는, 칠판의 분필과 실리콘의 트랜지스터가 함께 써내려가는 여백에서 빛을 발할 것이다.


참고 기사

인간이 국제 수학 콘테스트에서 AI를 물리치다, AI는 금메달급 점수를 획득했으나
출처: https://phys.org/news/2025-07-humans-ai-international-math-contest.html

← 기사 목록으로 돌아가기

문의하기 |  이용약관 |  개인정보처리방침 |  쿠키 정책 |  쿠키 설정

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア All rights reserved.