OpenAI: GPT-5.5 verbessert Coding, Computer Nutzung und Forschung

OpenAI veröffentlicht GPT-5.5 als neues Frontier Modell für ChatGPT und Codex. Das Unternehmen bestätigt den Start in einem Beitrag vom 23. April 2026 und nennt Coding, Computer Nutzung, Wissensarbeit und wissenschaftliche Forschung als zentrale Einsatzbereiche. GPT-5.5 Thinking ist für Plus, Pro, Business und Enterprise in ChatGPT verfügbar. GPT-5.5 Pro startet für Pro, Business und Enterprise. In Codex steht GPT-5.5 für Plus, Pro, Business, Enterprise, Edu und Go bereit und nutzt dort ein Kontextfenster mit 400.000 Tokens. OpenAI kündigt außerdem API Zugriff mit einem Kontextfenster von 1 Million Tokens an.

OpenAI bringt GPT-5.5 in ChatGPT, Codex und bald in die API

OpenAI positioniert GPT-5.5 nicht als einfaches Chat Modell, sondern als AI Modell für lange Arbeitsabläufe. Der Fokus liegt auf Aufgaben mit Planung, Tool Nutzung, Code Änderungen, Recherche, Analyse und Dokumentenarbeit. Laut OpenAI versteht GPT-5.5 Aufgaben früher, benötigt weniger Anleitung und arbeitet zuverlässiger über mehrere Schritte hinweg. Diese Beschreibung passt zur stärkeren Ausrichtung auf Agentenfunktionen in Codex und ChatGPT.

GPT-5.5 Thinking ist in ChatGPT für Plus, Pro, Business und Enterprise verfügbar. OpenAI beschreibt diese Version als schnelleres Hilfsmittel für komplexe Aufgaben, professionelle Arbeit, Coding, Recherche und Informationsanalyse. GPT-5.5 Pro richtet sich an schwierigere Fragen und Aufgaben mit höherem Genauigkeitsbedarf. Diese Version bleibt Plus Nutzern verwehrt und steht nur Pro, Business und Enterprise zur Verfügung.

Codex erhält GPT-5.5 ebenfalls direkt zum Start. Dort nennt OpenAI Plus, Pro, Business, Enterprise, Edu und Go als verfügbare Pläne. Das Kontextfenster liegt in Codex bei 400.000 Tokens. Für Entwickler ist außerdem ein Fast Modus vorgesehen. Dieser Modus erzeugt Tokens laut OpenAI etwa 1,5 mal schneller und kostet etwa 2,5 mal so viel wie der Standardmodus.

Die API startet nicht sofort, aber OpenAI nennt bereits die Preise. GPT-5.5 soll in den Responses APIs und Chat Completions APIs 5 US Dollar pro 1 Million Input Tokens und 30 US Dollar pro 1 Million Output Tokens kosten. Cached Input liegt laut Preisseite bei 0,50 US Dollar pro 1 Million Tokens. Batch und Flex kosten die Hälfte des Standardpreises. Priority Processing kostet etwa das 2,5 fache des Standardpreises. GPT-5.5 Pro soll in der API 30 US Dollar pro 1 Million Input Tokens und 180 US Dollar pro 1 Million Output Tokens kosten.

OpenAI betont trotz höherer Preise eine bessere Token Effizienz gegenüber GPT-5.4. Das Unternehmen gibt an, dass GPT-5.5 in Codex für viele Nutzer bessere Ergebnisse mit weniger Tokens erreicht. OpenAI nennt außerdem eine ähnliche reale Latenz wie bei GPT-5.4. Die technische Grundlage dafür liegt laut Unternehmen auch in neuen Inferenzoptimierungen auf NVIDIA GB200 und GB300 NVL72 Systemen.

GPT-5.5 verbessert Coding, Computer Nutzung und Forschung

OpenAI legt den Schwerpunkt bei GPT-5.5 auf längere Arbeitsabläufe mit Code, Tools, Computer Nutzung und wissenschaftlicher Analyse. Die größten Fortschritte zeigt das Modell bei agentischem Coding, automatisierten Kommandozeilenaufgaben, Bioinformatik und komplexen Kundenservice Prozessen. Einige Benchmarks zeigen klare Zugewinne gegenüber GPT-5.4. In SWE Bench Pro liegt Claude Opus 4.7 aber weiter vor GPT-5.5.

Benchmark oder BereichGPT-5.5 ErgebnisEinordnung
Terminal Bench 2.082,7 %GPT-5.4 lag bei 75,1 %, der Test misst komplexe Kommandozeilen Workflows
Expert SWE73,1 %GPT-5.4 lag bei 68,5 %, der Test misst lange Coding Aufgaben mit hohem Planungsaufwand
SWE Bench Pro58,6 %Claude Opus 4.7 liegt mit 64,3 % höher
OSWorld Verified78,7 %GPT-5.4 lag bei 75,0 %, der Test misst reale Computer Nutzung
GDPval84,9 %Misst Wissensarbeit über 44 Berufe hinweg
Tau2 Bench Telecom98,0 %GPT-5.4 lag bei 92,8 %, der Test misst komplexe Telecom Service Workflows
GeneBench25,0 %, GPT-5.5 Pro 33,2 %GPT-5.4 lag bei 19,0 %, der Test misst Genetik und quantitative Biologie
BixBench80,5 %GPT-5.4 lag bei 74,0 %, der Test misst Bioinformatik Aufgaben
CyberGym81,8 %GPT-5.4 lag bei 79,0 %, Claude Opus 4.7 bei 73,1 %
Preparedness FrameworkHigh bei Bio und CyberOpenAI sieht hohe Fähigkeiten, aber keine kritische Einstufung

Die Tabelle zeigt, dass GPT-5.5 vor allem bei Aufgaben mit mehreren Schritten zulegt. Terminal Bench 2.0, Expert SWE und OSWorld Verified prüfen keine einfachen Chat Antworten. Diese Tests messen Planung, Tool Nutzung, Dateizugriff, Code Änderungen und Arbeit in realen Computerumgebungen. Genau dort positioniert OpenAI GPT-5.5 als stärkere Grundlage für Codex und agentische Workflows.

Im Forschungsbereich nennt OpenAI Fortschritte bei Genetik, quantitativer Biologie und Bioinformatik. GeneBench steigt von 19,0 Prozent bei GPT-5.4 auf 25,0 Prozent bei GPT-5.5. GPT-5.5 Pro erreicht 33,2 Prozent. BixBench steigt von 74,0 Prozent auf 80,5 Prozent. OpenAI verweist außerdem auf einen internen GPT-5.5 Lauf mit Custom Harness, der bei einem neuen Beweis zu Ramsey Zahlen half. Der Beweis wurde später in Lean geprüft.

Die höheren Fähigkeiten erhöhen auch die Sicherheitsanforderungen. OpenAI stuft GPT-5.5 im Preparedness Framework bei biologischen und chemischen Fähigkeiten sowie bei Cybersicherheit als High ein. Das Modell liegt damit eine Stufe unter Critical. OpenAI nennt strengere Cyber Klassifizierer, erweiterte externe Tests und das Programm Trusted Access for Cyber als zusätzliche Maßnahmen. Verifizierte Nutzer können dort erweiterten Zugang für defensive Sicherheitsarbeit beantragen.

Für Nutzer bedeutet GPT-5.5 vor allem mehr Leistung bei längeren Aufgaben. Codex soll größere Codebasen zuverlässiger bearbeiten. ChatGPT soll Recherche, Dokumente, Tabellen, Datenanalyse und wissenschaftliche Workflows besser unterstützen. Der kommende API Start entscheidet, wie schnell Entwickler GPT-5.5 in eigene Tools, interne Agenten und produktive Anwendungen integrieren können.