Saltar al contenido principal
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Logo
  • Todos los artículos
  • 🗒️ Registrarse
  • 🔑 Iniciar sesión
    • 日本語
    • English
    • 中文
    • Français
    • 한국어
    • Deutsch
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message Política de privacidad cookie_banner_and Política de cookies cookie_banner_more_info

Configuración de cookies

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

Sam Altman habla sobre los desafíos de GPT-5 y el regreso de 4o: ¿Es el banco el más fuerte, pero la experiencia está incompleta? El "Chart Crime" y el costo de la confianza en la presentación de GPT-5.

Sam Altman habla sobre los desafíos de GPT-5 y el regreso de 4o: ¿Es el banco el más fuerte, pero la experiencia está incompleta? El "Chart Crime" y el costo de la confianza en la presentación de GPT-5.

2025年08月10日 11:48

1. ¿Qué sucedió? Cronología de 48 horas

El 7 de agosto (hora de EE.UU.), OpenAI anunció su nuevo buque insignia "GPT-5". Con un enrutador en tiempo real que cambia entre un sistema de respuesta rápida y un sistema de "pensamiento", se dirigieron hacia un "modelo integrado". El día siguiente, el 8 de agosto, el CEO Sam Altman y otros realizaron un AMA en Reddit, explicando que "el primer día hubo un fallo grave (sev) en el enrutador, y hubo momentos en que el cambio automático no funcionaba. Por eso, se sintió como si 'GPT-5 se hubiera vuelto tonto'". Prometieron duplicar el límite de tasa de Plus y mejorar la visualización de qué modelo está respondiendo. Además, afirmaron que considerarían continuar ofreciendo el modelo 4o en Plus, en respuesta a fuertes demandas de los usuarios.


2. El objetivo de GPT-5: eliminar la "carga de elegir un modelo"

En el comunicado oficial, OpenAI definió GPT-5 como "un sistema integrado". Normalmente, el enrutador decide automáticamente entre un modelo inteligente y ligero o el modelo de "pensamiento" (GPT-5 Thinking/Pro) para problemas complejos. También se propusieron mejoras en el seguimiento de instrucciones, la factualidad, y en los ámbitos de código, creación y salud. En resumen, el núcleo es una experiencia de usuario que no requiere que el usuario piense "qué modelo elegir".OpenAI


Este diseño es bienvenido por la mayoría de los usuarios. Sin embargo, para los usuarios avanzados que diferenciaban entre las "personalidades del modelo", puede percibirse como una reducción de opciones. El reciente alboroto refleja precisamente esta brecha.


3. El fenómeno "Devuélvanos el 4o": una base de sentimiento en las redes sociales

Inmediatamente después del anuncio, en Reddit, en r/ChatGPT, se inundaron publicaciones diciendo "GPT-5 tiene un lenguaje rígido", "ha bajado el tono creativo", "extraño la voz y la sensación de conversación del 4o". Se vieron llamados como "Bring back 4o" y "#keep4o", así como sitios de peticiones compartidos. Por otro lado, también hubo respuestas diciendo que "5 es más rápido y práctico", "el código ha mejorado". Entre el 9 y 10 de agosto, se extendieron hilos de informes diciendo "el 4o ha vuelto en la 'visualización de legado' de Plus / aparentemente en despliegue gradual", y varias personas informaron que realmente podían cambiar.TechRadarReddit


Los medios también han informado que "el 4o está regresando", lo que indica una respuesta temprana a las voces de los usuarios. Sin embargo, los informes de los usuarios están mezclados debido a las diferencias de tiempo en la implementación según la región, el plan y la aplicación.Tom's Guide


4. El dolor de la "crimen de gráficos": la confianza en la visualización

En la conferencia de prensa, errores como la discrepancia entre los números y la altura de las barras hicieron que el "crimen de gráficos (gráficos estadísticamente incorrectos)" fuera un tema candente. Altman reconoció en X que fue "un gran error", y también hubo disculpas internas. Aunque los gráficos en el blog oficial eran correctos, el error de visualización en la presentación en vivo fue "doloroso para un producto que se vende por su factualidad". The Verge y otros medios verificaron las inconsistencias específicas, y el sarcasmo en la red se aceleró.The Verge


Este incidente deja dos sugerencias. Primero, la "narrativa de números" de los proveedores de IA está directamente relacionada con la confianza en el producto. Segundo, aunque el modelo sea inteligente, el "proceso de visualización y verificación humana" es diferente, y al final, los humanos deben protegerlo.


5. Aun así, ¿el "contenido" está evolucionando?

Desde la perspectiva de desarrolladores e investigadores, GPT-5 ha mejorado notablemente en el seguimiento de instrucciones, la estabilidad de la generación de código y la factualidad en tareas complejas. Sin embargo, el revisor Simon Willison compartió un "ejemplo de debilidad" donde, al dejar que el modelo alineara automáticamente una tabla, surgieron errores, y tuvo que rehacerlo en Python para resolverlo. En otras palabras, no es "omnipotente", pero el conocimiento sobre cómo evitar fallos y complementarlos con combinaciones es crucial para la operación práctica.OpenAISimon Willison’s Weblog


6. Las "estrategias" de OpenAI y los futuros focos

En el AMA, se indicó que se duplicaría el límite de tasa de Plus, se transparentaría la selección de modelos y se consideraría la continuación del 4o. Aunque el "primer golpe de experiencia" debido a la falla del enrutador al momento del lanzamiento fue significativo, si se mejora el algoritmo de cambio, deberían emerger los beneficios de la UX integrada. El desafío es cómo coexistir "la diversidad de preferencias" y "la simplicidad de la integración". La selección de legado y la "personalización granular de estilo y personalidad" serán clave.


7. Consejos prácticos según el tipo de usuario

  • Creadores individuales: Si valoras la "sensación de temperatura" en historias y conversaciones, por ahora, compara utilizando tanto el 4o (si está disponible) como el 5. En GPT-5, proporciona claramente el estilo, como "en este estilo" o "con más emoción". Si falla, utiliza herramientas como "genera una tabla→ordénala en Python" como respaldo.RedditSimon Willison’s Weblog

  • Desarrolladores: No confíes solo en el enrutador; en procesos críticos, especifica el "modo de pensamiento" y asume procesos de verificación (tipo, pruebas, lint). No delegues completamente la visualización a la generación automática; realiza una doble verificación de unidades, ejes y proporciones.The Verge

  • Implementación empresarial: Al principio, espera "fluctuaciones en la experiencia" y monitorea con SLO en lugar de SLA. Documenta la política de selección de modelos y diseña la visualización de "qué modelo está actualmente en uso" y las rutas de escalación para los usuarios (forzar pensamiento prolongado, verificación humana).


8. Conclusión: incluso en la era de la "integración", la libertad de elección es un arma

GPT-5 ha dejado clara su dirección de "hacerlo más fácil de usar para muchas personas". Sin embargo, la experiencia con IA depende tanto de las "preferencias" como del "rendimiento". El reciente alboroto no es solo una cuestión de fallos o errores de visualización. La cuestión de cómo equilibrar "integración" y "personalidad" se ha expuesto claramente como un desafío de diseño inevitable en la popularización de la IA.


Artículos de referencia

Sam Altman aborda el despliegue "torpe" de GPT-5, el regreso del 4o y el "crimen de gráficos"
Fuente: https://techcrunch.com/2025/08/08/sam-altman-addresses-bumpy-gpt-5-rollout-bringing-4o-back-and-the-chart-crime/

Powered by Froala Editor

← Volver a la lista de artículos

Contacto |  Términos de servicio |  Política de privacidad |  Política de cookies |  Configuración de cookies

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Todos los derechos reservados.