Saltar al contenido principal
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Logo
  • Todos los artículos
  • 🗒️ Registrarse
  • 🔑 Iniciar sesión
    • 日本語
    • English
    • 中文
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message Política de privacidad cookie_banner_and Política de cookies cookie_banner_more_info

Configuración de cookies

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

¿ChatGPT-5 realmente decepciona? ── Una revisión completa de lo que el modelo anterior no podía hacer y en qué aspectos otras empresas aún lo superan

¿ChatGPT-5 realmente decepciona? ── Una revisión completa de lo que el modelo anterior no podía hacer y en qué aspectos otras empresas aún lo superan

2025年08月12日 23:14

1. Primero, aclaremos la verdadera naturaleza del argumento de "decepción"

  • Desde el momento de su anuncio, las opiniones se dividieron en las redes sociales y los medios. Se escucharon comentarios como "las expectativas de los usuarios eran demasiado altas" y "aunque la utilidad ha mejorado, no es una revolución". Axios señalainformes de errores en matemáticas y geografía, quejas sobre retrasos y la discrepancia con la afirmación de "nivel de doctorado". Axios

  • Este sentimiento se debe a que el cambio de OpenAI hacia la integración de modelos y el enfoque en la seguridad y la utilidad no coincidió con las expectativas de los receptores que esperaban un "salto" espectacular. OpenAI



2. Lo que GPT-5 puede hacer que los modelos anteriores no podían

2-1. Sistema integrado: optimización automática de la "cantidad de pensamiento" y la ruta

GPT-5 es unaintegración de un modelo de respuesta ligera, un modelo de razonamiento profundo (GPT-5 Thinking/Pro) y un enrutador en tiempo real.Dependiendo de las instrucciones del usuario y la dificultad de la tarea, se adapta desde respuestas rápidas hasta reflexiones profundas. Esto establece por defecto la experiencia de "trabajos rápidos se realizan rápidamente, problemas difíciles se piensan profundamente". OpenAI



2-2. Refuerzo significativo en codificación y tareas de agente

En el anuncio para desarrolladores, se mostró laverificación SWE-bench del 74.9% y lafuerza en largas cadenas de herramientas (incluyendo paralelas), además de nuevos parámetros comoverbosity y reasoning_effortque controlan la longitud de las respuestas y la cantidad de pensamiento, así como herramientas personalizadas que se pueden invocar en texto plano. La capacidad de "terminar el trabajo" en el ámbito práctico ha mejorado. OpenAI



2-3. Experiencia de chat: evolución de los preajustes de personalidad y voz

Fortune destacapreajustes de personalidad personalizables como cínico, robot, buen oyente y nerd, así comomejoras en la experiencia de voz.Ahora es más fácil ajustar el tono y cambiar el estilo de conversación según el uso. Fortune



2-4. Expansión en el ámbito práctico (uso empresarial)

OpenAI enfatiza la mejora en precisión, velocidad y razonamiento en las principales tareas deescribir, crear e investigar. Con el objetivo deautomatización y colaboración en los flujos de trabajo empresariales, promueve una **"nueva era laboral"**. OpenAI



3. ¿Por qué aún hay insatisfacción? ── La brecha en las reacciones iniciales

  • La expectativa de un salto dramático en contraste con la percepción de una **"gran actualización menor"**.

  • Confusión inicial e informes de fallos sobre el comportamiento del enrutador y la precisión en algunos aspectos.

  • Usuarios sensibles a las diferencias de "temperatura" y "empatía" comparadas con modelos anteriores (como el 4o).
    En gran medida, esto se debe a la fase de "adaptación y ajuste" inicial
    del lanzamiento, y OpenAI muestra disposición a seguir mejorando. Axios



4. Puntos donde otras empresasaúnson superiores (por uso)

4-1. Manejo del pensamiento profundo por el usuario: Anthropic Claude

  • Extended Thinking se puedeactivar/desactivar, y los desarrolladores pueden establecer un **"presupuesto de pensamiento". En tareas complejas, aumentar los tokens de pensamiento mejora la precisión de manera sistemática**. Se demostró su fortaleza en SWE-bench y TAU-bench, entre otros. Anthropic+1

  • Además, se están desarrollando actualizaciones de memoria que permitenbúsqueda y referencia transversal de diálogos pasados (prioridad para Max/Team/Enterprise). Esto es útil para retomar proyectos a largo plazo. The Verge

Cómo usarlo:

  • En situaciones como matemáticas, ciencias y revisión de diseño, donde se deseaaumentar intencionalmente el "tiempo de pensamiento" para mejorar la precisión.

  • Equipos que priorizan la seguridad y el cumplimiento de políticas.Anthropic



4-2. Investigación, integración y contexto extenso: Google Gemini

  • 2.0 Pro/Flash/Flash-Lite condiferenciación clara en velocidad, costo y capacidad.Contexto extenso de hasta 2M tokens,ejecución de búsqueda y código, yintegración de herramientas como base oficial. blog.google

  • Investigación profunda yCanvas (espacio de trabajo con generación y vista previa de código), y el fortalecimiento del "pensamiento" en **2.5 Pro (experimental)**.La oferta de AI Pro para educación en Japón y el fortalecimiento del ecosistema son características destacadas. Geminiblog.google

Cómo usarlo:

  • Operaciones de investigación, planificación y documentación aprovechando la integración con aplicaciones de Google (YouTube/Maps/Drive, etc.).

  • Análisis de grandes volúmenes de documentos ygestión de proyectos a largo plazo.



4-3. Auto-hospedaje y libertad de personalización: Meta Llama (sistemas abiertos)

  • Llama 3.1 (hasta 405B) es reportado como "el más prometedor en sistemas abiertos", y enLlama 3.2 se expandió lacompatibilidad con visión y optimización en el borde.Para empresas que desean "operar por sí mismas" debido a requisitos de costo o privacidad, es una opción atractiva. The VergeAI Meta+1

Cómo usarlo:

  • Operaciones en entornos on-premise o bajo regulaciones específicas, donde se priorizaajustes finos yoptimización de costos de inferencia.

  • Procesamiento en tiempo real en dispositivos móviles y en el borde.



5. Conclusión ── ¿"Decepción" o "evolución constante"?

  • GPT-5 mejora la "fluidez en el trabajo" a través de la operación integrada de inteligencia (cantidad de pensamiento y enrutamiento). Lacapacidaden codificación, agentes y seguimiento de instrucciones ha aumentado notablemente. OpenAI+1

  • Sin embargo, esperar un "salto dramático" puede resultar decepcionante.Si se desea controlar intuitivamente la profundidad del pensamiento, Claude es una opción; paraintegración con Google y profundidad en contexto extenso o investigación, Gemini es ideal; y paraoperaciones propias y optimización de costos, Llama sigue siendo una opción clara. Anthropic##HTML_TAG

← Volver a la lista de artículos

Contacto |  Términos de servicio |  Política de privacidad |  Política de cookies |  Configuración de cookies

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Todos los derechos reservados.