Zum Hauptinhalt springen
ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Logo
  • Alle Artikel
  • 🗒️ Registrieren
  • 🔑 Anmelden
    • 日本語
    • English
    • 中文
    • Español
    • Français
    • 한국어
    • ภาษาไทย
    • हिंदी
cookie_banner_title

cookie_banner_message Datenschutzrichtlinie cookie_banner_and Cookie-Richtlinie cookie_banner_more_info

Cookie-Einstellungen

cookie_settings_description

essential_cookies

essential_cookies_description

analytics_cookies

analytics_cookies_description

marketing_cookies

marketing_cookies_description

functional_cookies

functional_cookies_description

Enttäuscht ChatGPT-5 wirklich? – Ein umfassender Überblick über das, was das alte Modell nicht konnte und wo andere Unternehmen noch überlegen sind

Enttäuscht ChatGPT-5 wirklich? – Ein umfassender Überblick über das, was das alte Modell nicht konnte und wo andere Unternehmen noch überlegen sind

2025年08月12日 23:17

1. Zuerst die Klärung der "Enttäuschung"-Theorie

  • Unmittelbar nach der Veröffentlichung gab es in den sozialen Medien und den Medien gemischte Reaktionen. "Die Erwartungen der Nutzer waren zu hoch", "Die Praktikabilität wurde verbessert, aber es ist keine Revolution" waren einige der Meinungen. Axios hebt Berichte über mathematische und geografische Fehler, Unzufriedenheit mit Verzögerungen und die Diskrepanz zur Aussage auf "Ph.D.-Niveau" hervor. Axios

  • Diese Stimmung ist auch darauf zurückzuführen, dass die Neuausrichtung von OpenAI auf die Integration von Modellen und die Betonung von Sicherheit und Praktikabilität nicht mit den spektakulären "Sprüngen" übereinstimmte, die die Empfänger erwarteten. OpenAI



2. Was GPT-5 kann, was frühere Modelle nicht konnten

2-1. Integriertes System: Optimierung der "Denkmenge" und des Pfades automatisch

GPT-5 ist eine Integration aus einem leichten Antwortmodell, einem tiefen Schlussfolgerungsmodell (GPT-5 Thinking/Pro) und einem Echtzeit-Router. Je nach Anweisung des Nutzers und Schwierigkeitsgrad der Aufgabe, kann es zwischen schnellen Antworten und tiefem Nachdenken variieren. Dies macht die Erfahrung "schnelle Aufgaben schnell erledigen, schwierige Probleme tief durchdenken" zum Standard. OpenAI



2-2. Starke Verbesserung der Codierung und agentenartigen Aufgaben

Bei der Präsentation für Entwickler wurden SWE-bench Verified 74.9% und Stärke bei langen Werkzeugketten (einschließlich parallel) gezeigt, sowie Verbosity und Reasoning_effortals neue Parameter zur Steuerung der Antwortlänge und Denkintensität, sowie **"benutzerdefinierte Werkzeuge, die im Klartext aufgerufen werden können"** hinzugefügt. Die Fähigkeit, "die Arbeit zu beenden", hat sich in der Praxis verbessert. OpenAI



2-3. Chat-Erlebnis: Persönlichkeits-Presets und Sprachentwicklung

Fortune stellt anpassbare "Persönlichkeits"-Presets wie Zyniker (Cynic), Roboter (Robot), guter Zuhörer (Listener) und Nerd vor, sowie die Verbesserung des Spracherlebnisses. Die Feinabstimmung des Tons ist einfacher geworden, und es ist einfacher, den Gesprächsstil je nach Verwendungszweck zu wechseln. Fortune



2-4. Erweiterung des Geschäftsbereichs (Unternehmensnutzung)

OpenAI betont die Verbesserung der Genauigkeit, Geschwindigkeit und Schlussfolgerung in den Hauptaufgaben Schreiben, Erstellen, Recherchieren. Mit Blick auf Automatisierung und Zusammenarbeit in Unternehmens-Workflows propagiert es eine **"neue Ära der Arbeit"**. OpenAI



3. Warum gibt es dennoch Unzufriedenheit? ── Die Lücke in den ersten Reaktionen

  • Der Punkt, dass es wie ein **"großes Minor-Update"** erschien, im Vergleich zu den Erwartungen auf einen dramatischen Sprung.

  • Frühe Verwirrung und Berichte über Probleme bezüglich des Router-Verhaltens und der Genauigkeit in einigen Bereichen.

  • Benutzer, die empfindlich auf Unterschiede in **"Temperatur" und "Empathie"** im Vergleich zu alten Modellen (wie 4o) reagieren. Dies ist größtenteils auf die **"Gewöhnungs- und Anpassungsphase"** in der Anfangsphase der Markteinführung zurückzuführen, und OpenAI zeigt die Bereitschaft zur Verbesserung.
    Axios



4. Wo andere Unternehmen noch überlegen sind (nach Anwendungsfall)noch

4-1. Tiefes Denken vom Benutzer gesteuert: Anthropic Claude

  • Extended Thinking kann ein- und ausgeschaltet werden, und Entwickler können auch ein **"Denkbudget" festlegen. Bei komplexen Aufgaben verbessert sich die Genauigkeit regelmäßig, je mehr Denktokens verwendet werden**. Die Stärke wurde auch bei SWE-bench und TAU-bench gezeigt. Anthropic+1

  • Zusätzlich wird ein Memory-Update entwickelt, das die Durchsuchung und Referenzierung vergangener Dialoge ermöglicht (prioritär für Max/Team/Enterprise). Dies ist nützlich für die Wiederaufnahme langfristiger Projekte. The Verge

So verwenden:

  • In Situationen, in denen "Denkzeit" absichtlich erhöht wird, um die Genauigkeit zu verbessern, wie bei Mathematik, Wissenschaft und Design-Reviews.

  • Teams, die Wert auf Sicherheit und Richtlinientreue legen. Anthropic



4-2. Forschung, Integration, lange Kontexte: Google Gemini

  • 2.0 Pro/Flash/Flash-Lite mit klarer Unterscheidung von Geschwindigkeit, Kosten und Fähigkeiten. Lange Kontexte mit 2M Tokens, Suche und Code-Ausführung sowie Werkzeugintegration sind offiziell vorausgesetzt. blog.google

  • Deep Research und Canvas (Arbeitsbereich mit Code-Generierung und Vorschau), sowie die Verstärkung des "Denkens" in **2.5 Pro (Experiment)** werden ebenfalls entwickelt. Das Angebot von AI Pro für Bildung in Japan und die Stärkung des Ökosystems sind ebenfalls charakteristisch. Geminiblog.google

So verwenden:

  • Untersuchung, Planung und Dokumentation mit Google-App-Integration

    (YouTube/Maps/Drive usw.).
  • Analyse großer Dokumentenmengen und Langzeitprojektmanagement.



4-3. Selbst gehostet / Anpassungsfreiheit: Meta Llama (offen)

  • Llama 3.1 (maximal 405B) wird als "führend im offenen Bereich" berichtet, und in Llama 3.2 wird Vision-Unterstützung und Edge-Optimierung erweitert. Unternehmen, die "eigene Operationen" aufgrund von Kosten- oder Datenschutzanforderungen wünschen, werden angesprochen. The VergeAI Meta+1

So verwenden:

  • Betrieb unter On-Premise / spezifischen Vorschriften, mit Schwerpunkt auf feiner Abstimmung und Optimierung der Schlussfolgerungskosten.

  • Echtzeitverarbeitung auf mobilen Geräten und Edge.



5. Fazit ── "Enttäuschung" oder "stetige Weiterentwicklung"

  • GPT-5 verbessert die "Geschmeidigkeit der Arbeit" durch integrierte Intelligenzoperationen (Denkmenge, Routing). Die Grundfähigkeiten in Codierung, Agenten und Befolgen von Anweisungen haben sich tatsächlich verbessert. OpenAI+1

  • Allerdings kann man enttäuscht sein, wenn man "dramatische Sprünge" erwartet. Wenn Sie die Tiefe des Denkens intuitiv steuern möchten, dann Claude, für Google-Integration / lange Kontexte und Forschungstiefe dann Gemini, für eigene Operationen / kostengünstige Optim

← Zurück zur Artikelliste

Kontakt |  Nutzungsbedingungen |  Datenschutzrichtlinie |  Cookie-Richtlinie |  Cookie-Einstellungen

© Copyright ukiyo journal - 日本と世界をつなぐ新しいニュースメディア Alle Rechte vorbehalten.