Saltar al contenido principal
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Logo
  • Todos los artículos
  • 🗒️ Registrarse
  • 🔑 Iniciar sesión
    • 日本語
    • English
    • 中文
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message Política de privacidad cookie_banner_and Política de cookies cookie_banner_more_info

Configuración de cookies

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

El día en que la IA conquistó la medalla de oro: Gemini Deep Think y el futuro de las matemáticas

El día en que la IA conquistó la medalla de oro: Gemini Deep Think y el futuro de las matemáticas

2025年07月24日 01:22

1. Antecedentes: el escenario de "IA vs. Olimpiada de Matemáticas"

La Olimpiada Internacional de Matemáticas (IMO) es conocida como la competencia intelectual más prestigiosa de la humanidad desde su creación en 1959. Es una competencia rigurosa en la que se resuelven 6 problemas en 4.5 horas, y solo el 8% superior obtiene la medalla de oro. El modelo de lenguaje grande de DeepMind, "Gemini Deep Think" (GDT), participó y obtuvo 35 puntos (de un máximo de 42), recibiendo oficialmente la medalla de oro.36Kr


2. ¿Qué significa "oficial"?

Hasta el año pasado, AlphaProof/AlphaGeometry convertía las pruebas en lenguajes formales como "Lean" para ser evaluadas, pero GDT leyó los enunciados de los problemas directamente en inglés y generó pruebas en lenguaje natural. La base de la "certificación oficial" es que los jueces calificaron utilizando el mismo criterio que para los humanos.36Kr


3. Modo Deep Think y razonamiento paralelo

GDT está equipado con un modo de razonamiento extendido llamado "Deep Think", que permite desplegar y unificar múltiples caminos de pensamiento en paralelo para equilibrar la precisión y velocidad de las respuestas.

  • Razonamiento paralelo: Generación simultánea de diversas hipótesis y selección mediante un algoritmo de convergencia

  • Aprendizaje reforzado: Auto-mejora mediante un corpus de respuestas de la IMO

  • Gestión del tiempo: Distribución dinámica de recursos computacionales dentro de la restricción de 4.5 horas

Como resultado, resolvió completamente 5 problemas y alcanzó 35 puntos.36Kr


4. Destacados por problema

Áreas de problemasMétodo típico de los mejores humanosEnfoque característico de GDT
Geometría analítica (P1)División y proyección de conjuntos de puntosVisualización del problema de cobertura de puntos y clasificación rápida con el concepto de **"rayos de sol"**
Geometría (P2)Puntos auxiliares de contorno y seguimiento de ángulosIncentro→tangente→ortocentro, reducción paso a paso
Desigualdad funcional (P3)Análisis asintótico del valor máximoNombrado función Bonza, división de casos, demostración de que límite superior 4 = límite inferior 4
Secuencia de enteros (P4)Invariantes + reducción al absurdoFijación de invariante en "número par y múltiplo de 3"
Juego combinatorio (P5)Estrategia simétrica y valores críticosConstrucción de estrategia ganadora con λ<√2/1 y λ>√2/1 como divisores

(※P6 no fue intentado)


5. Entusiasmo y escepticismo en las redes sociales

 


  • Sundar Pichai (CEO de Google)

    “¡De plata a oro en solo un año – progreso asombroso!”X (anteriormente Twitter)

  • Google DeepMind oficial

    “Primera IA en alcanzar el estándar de medalla de oro de la IMO, resolviendo 5 de 6 problemas.”X (anteriormente Twitter)

  • Hacker News / Reddit discuten intensamente sobre "la prueba completa en lenguaje natural es impactante" y "¿fue P3 más fácil que en años anteriores?".techmeme.com

  • Elon Musk respondió brevemente "Felicidades" y añadió con ironía que "el calendario para que la IA reemplace el trabajo humano se ha adelantado nuevamente".The Times of India

Por otro lado, OpenAI también afirma que su modelo de la serie GPT-Grok ha alcanzado el nivel de medalla de oro de manera no oficial, y el debate sobre la transparencia de los métodos de calificación continúa.


6. ¿Por qué es significativo?

  1. Generalización del razonamiento
    Las matemáticas son la cúspide del razonamiento en lenguaje natural, y los avances en este campo pueden extenderse a áreas de razonamiento de alta precisión como el derecho, la investigación científica y el diseño de ingeniería.

  2. IA como herramienta
    Este logro sugiere el potencial de la IA como "línea auxiliar para matemáticos humanos". Hay muchas aplicaciones, como la generación de ideas para pruebas, la detección de errores y la creación de problemas de entrenamiento.

  3. Reducción de la brecha educativa
    Si se desarrollan herramientas gratuitas o de bajo costo que apoyen la comprensión de problemas al nivel de la IMO, podrían corregir las disparidades regionales en la educación matemática.


7. Desafíos pendientes

  • Costos de verificación: Las pruebas en lenguaje natural son difíciles de corregir. Es esencial un puente con la formalización (como Lean).

  • Sospechas de filtración de datos: Cómo evitar el sobreaprendizaje de problemas pasados y ejemplos de soluciones.

  • Controversia sobre "notas de bolsillo": Críticas de que la inclusión de un contexto masivo compromete la equidad.


8. Hoja de ruta futura

DeepMind anunció que proporcionará GDT solo a investigadores y que integrará el módulo de razonamiento en la próxima Gemini Ultra. OpenAI, Anthropic y otros también están preparando desafíos similares, y se observa que las "Olimpiadas de Matemáticas de IA" podrían convertirse en una competencia permanente.



Artículo de referencia

La IA Gemini Deep Think de Google obtiene la medalla de oro oficial en la Olimpiada de Matemáticas - OSCHINA
Fuente: https://www.oschina.net/news/361739

← Volver a la lista de artículos

Contacto |  Términos de servicio |  Política de privacidad |  Política de cookies |  Configuración de cookies

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Todos los derechos reservados.