มนุษยชาติ vs. AI ─ การแข่งขันความรู้ที่เห็นได้จากโอลิมปิกคณิตศาสตร์และพรมแดนถัดไป: ขีดจำกัดทางคณิตศาสตร์ที่ Gemini และ OpenAI เผชิญหน้า

2025年07月23日 12:10

1. การเปิดฉาก—เสียงฮือฮาของ "35 คะแนน"

ซันไชน์โคสต์ รัฐควีนส์แลนด์ ประเทศออสเตรเลีย นักคณิตศาสตร์รุ่นเยาว์จำนวน 641 คนจาก 112 ประเทศได้มารวมตัวกันที่ศูนย์ประชุมที่ลมทะเลพัดผ่าน การแข่งขันคณิตศาสตร์โอลิมปิกระหว่างประเทศ (IMO) ครั้งที่ 66 ได้เริ่มขึ้น โดยมีการทดสอบข้อเขียน 3 ข้อในวันแรก และอีก 3 ข้อในวันที่สอง โดยแต่ละวันใช้เวลา 4.5 ชั่วโมง ในการแข่งขันนี้มีการนำ "ผู้เล่นที่ไม่เป็นทางการ" สองตัวเข้ามา คือ "Gemini Deep Think" ของ Google DeepMind และโมเดลที่ยังไม่เปิดเผยของ OpenAI

เมื่อมีการประกาศผลเบื้องต้นในวันแรกว่า "Gemini ได้ตอบถูก 5 ข้อ ได้ 35 คะแนน" เสียงฮือฮาก็เกิดขึ้นในที่นั่งผู้ชม และไทม์ไลน์ของ X (เดิมคือ Twitter) ก็เต็มไปด้วย "#AImath" และ "#GeminiGold"Phys.org

2. ได้เหรียญทองแต่ไม่ชนะอย่างสมบูรณ์

เกณฑ์เหรียญทองของ IMO มักจะอยู่ที่ประมาณ 10% แรกของผู้เข้าแข่งขัน ในปีนี้เกณฑ์คือ 35 คะแนน และมีนักเรียน 67 คนที่ได้รับเหรียญทอง โดย 5 คนในนั้นได้คะแนนเต็ม 42 คะแนนReuters ทั้ง Gemini และ OpenAI ได้คะแนน 35 คะแนนเท่ากัน แต่ไม่สามารถทำคะแนนเต็มได้ "มนุษย์ยังคงนำอยู่" เป็นหัวข้อข่าวที่ AFP เผยแพร่Phys.org.

3. กลยุทธ์ของ AI—"แก้ปัญหาในภาษาธรรมชาติ"

สิ่งที่น่าสนใจคือ ทั้งสองบริษัทให้ AI เขียนคำพิสูจน์โดยตรงใน ภาษาธรรมชาติ การวิจัยคณิตศาสตร์ของ AI แบบดั้งเดิมมักจะแปลปัญหาเป็นภาษารูปแบบ เช่น Coq หรือ Lean และใช้การค้นหาอัลกอริทึมในการแก้ปัญหา ครั้งนี้ไม่ใช่การแปลงลำดับแบบ Llama หรือ "Chain-of-Thought" ของ GPT-4 Gemini ได้รับคำสั่งให้ "ไม่ขยายความคิดมากเกินไป แต่ให้ขุดลึก" และสามารถทำเสร็จใน 4.5 ชั่วโมงReuters ในขณะที่ OpenAI ได้ "ขยาย Compute ในเวลาทดสอบอย่างมาก" ตามที่นักวิจัย Noam Brown กล่าว "มันมีค่าใช้จ่ายสูงมาก"Reuters.

4. ความตื่นเต้นและความสงสัยในโซเชียลมีเดีย

"1/N ในที่สุดก็สำเร็จความท้าทาย AI ที่ยาวนาน!"—กระทู้ของ Alexander Wei จาก OpenAI ได้รับ 30,000 ไลค์ใน 4 วันX (เดิมคือ Twitter).
DINQ สตาร์ทอัพด้านวิทยาศาสตร์สุขภาพกล่าวว่า "🏅ยินดีด้วย! OpenAI ได้เหรียญทองที่ IMO 2025!"X (เดิมคือ Twitter).
ใน Reddit /r/math มีการตั้งกระทู้เยาะเย้ยค่าใช้จ่ายทรัพยากรคำนวณว่า "$2,000 ต่อล้านโทเค็น นี่ล้อเล่นหรือ?"Reddit.
Terence Tao ผู้ได้รับรางวัล Fields กล่าวในสัมภาษณ์ว่า "AI ควรตระหนักถึงความแตกต่างระหว่างสภาพแวดล้อมในห้องทดลองที่อนุญาตให้ลองใหม่และร่วมมือกันได้ กับสนามสอบที่เป็น 'แม่พิมพ์'"The Times of India.

5. ใครคือ "ผู้ชนะ"?—ผลกระทบต่อการศึกษาคณิตศาสตร์

นักเรียนหญิงชาวเกาหลี (อายุ 17 ปี) ที่ผู้เขียนได้สัมภาษณ์ในสถานที่จัดงานกล่าวว่า "คำตอบของ AI อ่านง่าย แต่ 'ความคิดแวบ' ยังเป็นของมนุษย์" เธอหัวเราะ ครูที่ปรึกษากล่าวว่า "อยากใช้ Gemini ในการเรียนการสอนเพื่อเปรียบเทียบวิธีการแก้ปัญหาต่าง ๆ" ในขณะที่คณะผู้แทนญี่ปุ่นเปิดเผยว่าจะเสนอ "ความโปร่งใสของเกณฑ์การให้คะแนนและมาตรการป้องกันการโกงของ AI" ต่อคณะกรรมการระหว่างประเทศ

ในสถานศึกษาเกิดการถกเถียงกันว่า "จะโยนการบ้านให้ AI ทำ หรือจะมองว่าเป็นครูสอนพิเศษที่ดีที่สุด" ฟินแลนด์ได้ประกาศโครงการนำร่องที่จะนำ "การวิเคราะห์คำพิสูจน์แบบสนทนา LLM" เข้าสู่หลักสูตรคณิตศาสตร์ระดับมัธยมปลายในวันถัดจากการแข่งขัน

6. แนวหน้าการวิจัย—ความท้าทายต่อปัญหาที่ยังไม่แก้ไข

ศาสตราจารย์ Jung จากมหาวิทยาลัยบราวน์คาดการณ์ว่า "ยุคที่ AI และนักคณิตศาสตร์จะเป็น 'ผู้เขียนร่วม' ในการส่งบทความไปยัง arXiv จะมาถึงภายใน 1 ปี"Reuters. ในความเป็นจริง Google ได้ตั้งทีม "Gemini-Research" ขึ้นใหม่ และบอกใบ้ในบล็อกว่าจะเริ่มทำงานใน 3 หัวข้อคือ สมมติฐานรีมันน์, เรขาคณิตพีชคณิต, และทฤษฎีสนามควอนตัมเชิงทอพอโลยี หากสิ่งนี้เป็นจริง AI จะ "นิยามใหม่ของการพิสูจน์ทฤษฎี" และอาจสั่นคลอนนิยามของความคิดสร้างสรรค์ทางคณิตศาสตร์

7. ปัญหา—ทรัพยากรการคำนวณ สิ่งแวดล้อม และความเป็นธรรม

การประมาณการการใช้พลังงานของ OpenAI อยู่ที่ประมาณ 1.3 MWh (การประมาณ) ซึ่งเทียบเท่ากับศูนย์ข้อมูลระบายความร้อนด้วยน้ำประมาณ 3 ชั่วโมง ภาระต่อสิ่งแวดล้อมและช่องว่างทรัพยากรระหว่างประเทศที่เข้าร่วมมีแนวโน้มที่จะขยายตัว คณะกรรมการ IMO กำลังพิจารณา "แยก AI ออกเป็นหมวดหมู่อย่างเป็นทางการและกำหนดขีดจำกัดการใช้พลังงาน" ในปีต่อไป

นอกจากนี้ การตรวจจับ "การโกงแบบไฮบริด" ที่มนุษย์แก้ไขคำตอบของ AI ยังไม่ได้รับการแก้ไข DeepMind กำลังพัฒนา "โทเค็นการพิสูจน์ตัวเอง" ที่มีลายเซ็นโฮโลแกรม

8. ภาพอนาคต—ความร่วมมือหรือการแข่งขัน

สรุปแล้ว IMO ครั้งนี้ได้แสดงให้โลกเห็นว่า **"มนุษย์ชนะอย่างเฉียดฉิว แต่ AI ได้ยืนอยู่บนเวทีเดียวกันแล้ว"**
แฮชแท็ก #TeamHuman และ #TeamAI ในโซเชียลมีเดียมักถูกพูดถึงในลักษณะของความขัดแย้ง แต่ในสถานที่จริง นักเรียนเริ่มยอมรับ AI ในฐานะ "คู่แข่งที่แข่งขันและสอนกัน"

ในการแข่งขัน IMO ครั้งถัดไปในปี 2026 (ที่เซอร์เบีย) การสร้างหมวดหมู่ AI และการแยกหมวดหมู่มนุษย์อาจกลายเป็นความจริง ที่นั่นกำแพง "35 คะแนน" อาจไม่มีความหมายอีกต่อไป หรืออาจมีการสร้างเพดานใหม่ขึ้นมา—อนาคตของคณิตศาสตร์จะส่องแสงในพื้นที่ว่างที่ชอล์กบนกระดานดำและทรานซิสเตอร์ซิลิคอนเขียนร่วมกัน

บทความอ้างอิง

มนุษย์เอาชนะ AI ในการแข่งขันคณิตศาสตร์ระหว่างประเทศ แม้ว่า AI จะได้คะแนนระดับเหรียญทอง
ที่มา: https://phys.org/news/2025-07-humans-ai-international-math-contest.html

1. การเปิดฉาก—เสียงฮือฮาของ "35 คะแนน"

2. ได้เหรียญทองแต่ไม่ชนะอย่างสมบูรณ์

3. กลยุทธ์ของ AI—"แก้ปัญหาในภาษาธรรมชาติ"

4. ความตื่นเต้นและความสงสัยในโซเชียลมีเดีย

5. ใครคือ "ผู้ชนะ"?—ผลกระทบต่อการศึกษาคณิตศาสตร์

6. แนวหน้าการวิจัย—ความท้าทายต่อปัญหาที่ยังไม่แก้ไข

7. ปัญหา—ทรัพยากรการคำนวณ สิ่งแวดล้อม และความเป็นธรรม

8. ภาพอนาคต—ความร่วมมือหรือการแข่งขัน

OpenAI เอาชนะ Grok ของ Elon Musk! การแข่งขัน AI ระดับสูงสุดบน Kaggle: OpenAI o3 ชนะขาดลอย ทำไม Grok4 ถึงล้มเหลว

AI กับการพบกันของลัทธิขงจื๊อ: ขงจื๊อและซิลิคอน ― ฟื้นฟู "礼" ในยุค AI

AI依存ทำให้สูญเสียปัญญาหรือปลดปล่อยปัญญา ─ MIT เปิดเผยตัวตนของ "หนี้สินทางปัญญา"

cookie_banner_title

1. การเปิดฉาก—เสียงฮือฮาของ "35 คะแนน"

2. ได้เหรียญทองแต่ไม่ชนะอย่างสมบูรณ์

3. กลยุทธ์ของ AI—"แก้ปัญหาในภาษาธรรมชาติ"

4. ความตื่นเต้นและความสงสัยในโซเชียลมีเดีย

5. ใครคือ "ผู้ชนะ"?—ผลกระทบต่อการศึกษาคณิตศาสตร์

6. แนวหน้าการวิจัย—ความท้าทายต่อปัญหาที่ยังไม่แก้ไข

7. ปัญหา—ทรัพยากรการคำนวณ สิ่งแวดล้อม และความเป็นธรรม

8. ภาพอนาคต—ความร่วมมือหรือการแข่งขัน

OpenAI เอาชนะ Grok ของ Elon Musk! การแข่งขัน AI ระดับสูงสุดบน Kaggle: OpenAI o3 ชนะขาดลอย ทำไม Grok4 ถึงล้มเหลว

AI กับการพบกันของลัทธิขงจื๊อ: ขงจื๊อและซิลิคอน ― ฟื้นฟู "礼" ในยุค AI

AI依存ทำให้สูญเสียปัญญาหรือปลดปล่อยปัญญา ─ MIT เปิดเผยตัวตนของ "หนี้สินทางปัญญา"