skip_to_content
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア 로고
  • 전체 기사
  • 🗒️ 회원가입
  • 🔑 로그인
    • 日本語
    • English
    • 中文
    • Español
    • Français
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message 개인정보처리방침 cookie_banner_and 쿠키 정책 cookie_banner_more_info

쿠키 설정

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

AI가 금메달을 획득한 날 ─ Gemini Deep Think와 수학의 미래도

AI가 금메달을 획득한 날 ─ Gemini Deep Think와 수학의 미래도

2025年07月24日 01:25

1. 배경――「AI vs. 수학 올림피아드」라는 무대

국제수학올림피아드(IMO)는 1959년 창설 이래, 인류 최고봉의 지적 격투기로 알려져 있다. 4.5시간 동안 6문제를 푸는 가혹한 경기로, 금메달에 도달하는 것은 상위 8%에 불과하다. DeepMind의 대형 언어 모델 「Gemini Deep Think(이하 GDT)」가 도전하여 35점(만점 42점)을 획득하고 공식적으로 금메달 인증을 받았다.36Kr


2. 무엇이 "공식"인가

작년까지의 AlphaProof/AlphaGeometry는 증명을 「Lean」 등의 형식 언어로 변환하여 채점을 받았지만, GDT는 문제를 그대로 영어로 읽고 자연어로 증명을 생성했다. 인간과 동일한 루브릭으로 심사위원이 채점했다는 점이 "공식 인증"의 근거이다.36Kr


3. Deep Think 모드와 병렬 추론

GDT에는 「Deep Think」라는 확장 추론 모드가 탑재되어, 다수의 사고 경로를 병렬 전개·통합함으로써 해답 정확도와 속도를 양립시킨다.

  • 병렬 추론:다양한 가설을 동시에 생성하고, 수렴 판단 알고리즘으로 취사선택

  • 강화 학습:과거의 IMO 해답 코퍼스로 자기 개선

  • 시간 관리:4.5시간의 제약 내에서 계산 자원을 동적으로 배분

그 결과, 5문제를 완답하고 35점에 도달했다.36Kr


4. 문제별 하이라이트

문제 영역인간 톱 해법의 전형GDT의 특징적 접근
해석 기하 (P1)점 집합의 분할 & 투사점 피복 문제를 시각화하고, **"양광선"** 개념으로 한 번에 분류
기하 (P2)윤곽 보조점과 각도 추적외심→접선→수심과 단계적으로 귀착
함수 부등식 (P3)최대값의 점근 해석Bonza 함수로 명명하여 케이스 분할, 상한 4=하한 4를 증명
정수 수열 (P4)불변량+배리법「짝수이면서 3의 배수」로 불변을 고정점화
조합 게임 (P5)대칭 전략·임계값λ<√2/1 과 λ>√2/1 을 분수령으로 필승 전략을 구축

(※P6은 도전하지 않음)


5. SNS가 보여주는 열광과 회의

 


  • Sundar Pichai(Google CEO)

    “From silver to gold in just a year – astonishing progress!”X (formerly Twitter)

  • Google DeepMind 공식

    “First AI to reach IMO gold‑medal standard, solving 5 / 6 problems.”X (formerly Twitter)

  • Hacker News / Reddit 에서는 「자연어로의 완전 증명은 충격」「P3가 예년보다 쉬웠던 것이 아닌가」라는 논의가 뜨겁다.techmeme.com

  • 일론 머스크 는 「Congrats」라고 짧게 답장하면서, 「인류의 일을 AI가 빼앗는 일정표가 또 앞당겨졌다」고 비꼬았다.The Times of India

한편, OpenAI는 자사의 GPT-Grok 계열 모델도 비공식적으로 금메달급이라고 주장하며, 채점 방법의 투명성을 둘러싸고 논쟁이 계속되고 있다.


6. 왜 의미가 있는가

  1. 추론의 일반화
    수학은 자연어 추론의 극치이며, 여기서의 도약은 법률·과학 연구·엔지니어링 설계 등 고정밀 추론 영역으로 파급된다.

  2. 도구로서의 AI
    이번 성과는 「인간 수학자의 보조선」이 될 가능성을 보여준다. 증명의 아이디어 발상, 오류 탐지, 훈련 문제 작성 등 응용처는 많다.

  3. 교육 격차의 축소
    IMO 수준의 문제 이해를 지원하는 무료/저비용 도구가 실현되면, 수학 교육의 지역 격차를 시정할 수 있다.


7. 남겨진 과제

  • 검증 비용:자연어 증명은 오류 수정이 어렵다. 형식화(Lean 등)와의 브리지가 필수적이다.

  • 데이터 유출 의혹:과거 문제나 해답 예의 과학습을 어떻게 회피할 것인가.

  • "작은 노트 반입" 논쟁:대규모 컨텍스트 투입이 공정성을 해친다는 비판도.


8. 향후 로드맵

DeepMind는 연구자 한정으로 GDT를 제공하고, 차기 Gemini Ultra에 추론 모듈을 통합한다고 발표.
OpenAI·Anthropic 등도 유사한 도전을 준비 중이며, "AI 수학 올림피아드"는 상설 경기로 될 것이라는 관측이 있다.



참고 기사

Google의 Gemini Deep Think AI가 공식 인증의 수학 올림피아드 금메달을 획득 - OSCHINA
출처: https://www.oschina.net/news/361739

← 기사 목록으로 돌아가기

문의하기 |  이용약관 |  개인정보처리방침 |  쿠키 정책 |  쿠키 설정

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア All rights reserved.