OpenAI beschreibt in einer neuen Studie zu Codex den schnellen Wandel von kurzen Chatbot-Interaktionen zu delegierten KI-Agenten, die längere Wissensarbeit selbstständig abarbeiten. Der am 25. Juni 2026 veröffentlichte Beitrag ordnet Codex nicht mehr nur als Coding-Hilfe ein. OpenAI beschreibt Codex als Beispiel für agentische Arbeit, bei der Nutzer Aufgaben über Minuten oder Stunden an ein System übergeben. Für Unternehmen, Entwicklerteams und Entscheider im Bereich KI ist das ein wichtiger Befund, weil sich damit nicht nur Tools ändern. Auch Arbeitsabläufe, Rollen und Kontrollpunkte verändern sich.
Der zentrale Unterschied liegt in der Arbeitseinheit. Ein Chatbot liefert meist eine Antwort auf einen Prompt. Ein Agent bekommt dagegen ein Ziel, nutzt Werkzeuge, prüft Dateien, führt Kommandos aus, verändert Artefakte und arbeitet iterativ weiter. OpenAI formuliert diesen Wechsel deutlich: Agentische KI verschiebt Wissensarbeit von einzelnen Interaktionen zu delegierten Aufgaben mit längerem Zeithorizont.
Codex begann als Werkzeug für Softwareentwicklung. Die aktuelle Studie beschreibt aber eine breitere Nutzung. OpenAI nennt Dokumententwürfe, Datenanalyse, Kommunikationskoordination und weitere Wissensarbeit außerhalb klassischer Programmierung. Genau darin liegt der Arbeitswelt-Winkel: Agenten bleiben nicht in Entwicklerteams stecken. Sie wandern in Research, Legal, Finance, Recruiting, Support, Produktarbeit und operative Teams.
OpenAI stützt diese Einordnung auf Nutzungsdaten aus drei Gruppen. Dazu gehören externe Nutzer mit privaten Konten, externe Organisationsnutzer und Mitarbeiter von OpenAI. Die Studie nutzt nach eigener Darstellung eine automatisierte und datenschutzschonende Auswertung. Forscher sollen dabei aggregierte und anonymisierte Muster analysieren, ohne einzelne Nachrichten selbst zu lesen. Das macht die Untersuchung interessant, aber nicht grenzenlos. OpenAI betont selbst, dass die interne Nutzung bei OpenAI nicht repräsentativ für durchschnittliche Unternehmen ist.
OpenAI misst den Wechsel von Chatbot-Antworten zu delegierter Arbeit
Die auffälligsten Zahlen betreffen die Länge der Aufgaben. Laut OpenAI machten im Mai 2026 80,6 Prozent der untersuchten Individualnutzer mindestens eine Codex-Anfrage, die auf mehr als 30 Minuten menschliche Arbeit geschätzt wurde. 70,2 Prozent überschritten mindestens einmal die Marke von einer Stunde. 25,6 Prozent stellten mindestens eine Anfrage, die laut Schätzung mehr als acht Stunden menschlicher Arbeit entsprach.
Diese Werte sagen nicht, dass Codex jede Aufgabe perfekt erledigt. Sie sagen aber, dass Nutzer Agenten immer größere Arbeitsblöcke zutrauen. OpenAI beschreibt besonders intensive Nutzer, die im 99. Perzentil mehr als 60 Stunden Codex-Agent-Turns pro Tag erzeugten. Das gelingt nur über Parallelisierung. Ein Mensch wartet dabei nicht auf eine einzelne Antwort. Er steuert mehrere Agentenläufe, prüft Zwischenergebnisse und verteilt Arbeit neu.
| OpenAI-Befund | Genannte Zahl | Einordnung für Wissensarbeit |
|---|---|---|
| Codex-Anfrage über 30 Minuten | 80,6 Prozent der untersuchten Individualnutzer bis Mai 2026 | Agenten werden für längere Arbeitsblöcke genutzt |
| Codex-Anfrage über 1 Stunde | 70,2 Prozent der untersuchten Individualnutzer bis Mai 2026 | Nutzer delegieren echte Arbeit statt nur Fragen |
| Codex-Anfrage über 8 Stunden | 25,6 Prozent der untersuchten Individualnutzer bis Mai 2026 | Langzeitaufgaben rücken in den Alltag |
| Codex-Anteil bei OpenAI-Output-Tokens | 99,8 Prozent der wöchentlichen Output-Tokens intern bei OpenAI | Codex ersetzt intern viele ChatGPT-Arbeitsinteraktionen |
| Nicht-Entwickler bei Organisationsnutzern | 189-faches Wachstum seit August 2025 | Agenten erreichen Fachbereiche außerhalb der Entwicklung |
Der Vergleich mit Chatbots ist deshalb mehr als Marketing. Bei klassischer Chatbot-Nutzung bleibt viel Arbeit beim Nutzer. Der Nutzer formuliert, kopiert, prüft, überträgt und setzt um. Bei Agenten verschiebt sich ein Teil dieser Umsetzung in das System. Das verändert die Rolle des Menschen. Aus dem Fragesteller wird eher ein Auftraggeber, Prüfer und Koordinator.
Für Entwickler ist dieser Wechsel naheliegend. Ein Agent kann Code lesen, Tests ausführen, Fehler suchen, Refactorings vorbereiten oder Pull Requests anlegen. Für andere Fachbereiche ist der Sprung größer. OpenAI nennt aber genau diese Verschiebung. Nicht-technische Mitarbeiter nutzen Codex für Automatisierung, Datentransformation, Tooling, Debugging und strukturierte Analyse. Die Grenze zwischen Facharbeit und technischer Ausführung wird dadurch durchlässiger.
Diese Entwicklung passt zu einer breiteren Debatte um Macht, Plattformen und Modellwahl. Der Artikel zu Microsoft-CEO warnt vor Macht großer KI-Anbieter ordnet den Plattformdruck auf Unternehmen ein. Bei Agenten verschärft sich diese Frage. Wer Arbeitsabläufe an ein Agentensystem bindet, bindet auch Berechtigungen, Datenzugriffe, Reviewprozesse und Toolketten an einen Anbieter.
Codex wandert aus Entwicklerteams in Legal, Finance und Recruiting
OpenAI berichtet, dass Codex intern inzwischen in allen Abteilungen das primäre KI-Werkzeug für Arbeit geworden ist. Engineering wechselte zuerst. Legal, Finance und Recruiting überschritten laut OpenAI um April 2026 die Schwelle zur Codex-Mehrheitsnutzung. Für den durchschnittlichen OpenAI-Mitarbeiter entfallen heute mehr als 85 Prozent der Output-Tokens auf Codex. Bei internen wöchentlichen Output-Tokens nennt OpenAI sogar 99,8 Prozent.
Besonders stark wuchs die Nutzung in Research. OpenAI nennt bis Juni 2026 eine mediane Nutzung, die 56-mal höher lag als im November 2025. Customer Support kam auf das 32-Fache. Engineering erreichte das 27-Fache. Legal wuchs langsamer, lag aber immer noch beim 13-Fachen des Novemberwerts. Diese Werte beschreiben nicht einfach mehr Chat. Sie beschreiben mehr KI-vermittelte Arbeit in Arbeitsabläufen.
Für Unternehmen im DACH-Raum ist genau dieser Punkt wichtig. Viele Firmen starten bei Chatbots mit Text, Zusammenfassung und Recherche. Agenten greifen tiefer ein. Sie brauchen Zugriff auf Repositories, Tickets, Dokumente, Datenbanken, lokale Dateien, Build-Systeme oder interne Tools. Damit steigen Produktivitätspotenzial und Risiko gleichzeitig.
Auch die Aufgabenmischung ändert sich. OpenAI beschreibt, dass Codex weiterhin stark in Engineering und Coding verankert ist. In Business-Funktionen entfielen laut OpenAI aber mehr als ein Viertel der Arbeit mit Codex auf Engineering oder Coding. Das ist der eigentliche Organisationsbruch. Fachabteilungen übernehmen technische Ausführung, die vorher oft auf Entwickler, Data Teams oder interne Toolspezialisten wartete.
| Bereich | Was sich mit Agenten ändert | Was Unternehmen prüfen sollten |
|---|---|---|
| Entwicklung | Mehr parallele Bugfixes, Tests und Codeänderungen | Code Review, Rechte und Testpflichten |
| Research und Data | Schnellere Datenaufbereitung und Prototypen | Datenzugriff, Reproduzierbarkeit und Quellenprüfung |
| Legal und Finance | Automatisierung von Auswertung, Dokumentenarbeit und Prüfpfaden | Vertraulichkeit, Freigaben und Haftung |
| Recruiting und Operations | Workflows, Vorlagen und interne Tools entstehen schneller | Governance für neue Tools und Schattenautomatisierung |
| Support | Analyse von Tickets, Makros und Wissensdatenbanken wird automatisierbarer | Qualitätssicherung, Eskalation und Kundendaten-Schutz |
Die Sicherheitsfrage wächst mit jedem Toolzugriff. Wenn Agenten Code ändern, Skripte ausführen oder Daten transformieren, reichen gute Prompts nicht aus. Unternehmen brauchen Rollenmodelle, Freigaben, Protokolle, Sandboxes, Audit-Logs und klare Stoppsignale. Der Beitrag zu AWS Continuum und AWS Context passt in diesen Rahmen, weil dort die Absicherung von KI-Agenten im Unternehmenskontext im Mittelpunkt steht.
Auch Multi-Agenten-Systeme rücken näher an produktive Arbeitsabläufe. Sakana AI Fugu greift denselben Trend aus einer anderen Richtung auf: Mehrere Modelle und Rollen werden orchestriert, statt nur ein einzelnes Chatfenster zu bedienen. Die OpenAI-Zahlen zu parallelen Codex-Agenten zeigen, dass diese Arbeitsweise nicht mehr nur ein Forschungsthema ist.
Unternehmen brauchen neue Regeln für Agentenarbeit
OpenAI präsentiert Codex als Hinweis auf die wirtschaftliche Kraft agentischer KI. Der Beitrag ist aber auch eine Warnung an Organisationen. Agenten entfalten ihren Nutzen nicht nur durch Modellqualität. Sie brauchen passende Arbeitsstrukturen. Ein Team muss entscheiden, welche Aufgaben delegierbar sind, welche Ergebnisse ein Mensch prüfen muss und welche Systeme ein Agent überhaupt berühren darf.
Die Methodik der Studie ist dafür wichtig. OpenAI schätzt Aufgabenhorizonte mit einem LLM-as-Judge-Verfahren. Die Schwellenwerte sollen als Richtungssignal gelten, nicht als exakte Zeiterfassung. Zudem bildet OpenAI eine besonders KI-nahe Organisation ab. Interne OpenAI-Mitarbeiter haben viel Erfahrung mit Modellen, geringe Nutzungshürden und starke organisatorische Unterstützung. Normale Unternehmen müssen mit anderen Reifegraden, Compliance-Anforderungen und Integrationskosten rechnen.
Für Entwicklerteams ist der nächste praktische Schritt oft ein Kontrollsystem rund um Agentenarbeit. Automatische Pull Requests, Tests, Dependency-Prüfungen und CI-Prozesse werden wichtiger. Der Ratgeber zu GitHub Dependabot liefert dafür einen angrenzenden Baustein, weil automatisierte Änderungen ohne Review- und Testkultur schnell neue Risiken erzeugen.
Lokale und browsernahe KI bleibt ein zweiter Strang. Gemini Nano in Chrome betrifft zwar nicht Codex, verdeutlicht aber den Trend zu KI direkt in Arbeitsumgebungen. Agenten werden nicht nur als separate App auftreten. Sie wandern in Browser, IDEs, Office-Tools, Ticketsysteme und Unternehmensplattformen.
- Delegation braucht klare Aufgabenklassen und definierte Grenzen.
- Toolzugriff sollte nach Rolle, Projekt und Risikostufe getrennt werden.
- Review muss Pflicht bleiben, wenn Agenten Code, Verträge, Finanzdaten oder Kundendaten verändern.
- Protokolle helfen bei Audits, Fehleranalyse und Haftungsfragen.
- Schulung sollte Fachbereiche einschließen, weil Nicht-Entwickler laut OpenAI besonders schnell wachsen.
Der Arbeitsmarkt-Kontext kommt hinzu. OpenAI schreibt, dass Agenten die Grenze dessen erweitern, was einzelne Mitarbeiter tun können. Das klingt nach Produktivität. Es bedeutet aber auch Reorganisation. Aufgaben verschieben sich. Fachkräfte müssen lernen, Agenten zu briefen, Ergebnisse zu überprüfen und Fehlerquellen zu erkennen. Führungskräfte müssen entscheiden, ob Agentenarbeit nur assistiert oder ganze Prozessketten ersetzt.
Genau deshalb sind KI-Entscheiderveranstaltungen für Unternehmen relevanter geworden. CONNECTED Berlin 2026 knüpft an diesen Bedarf an, weil Unternehmens-KI nicht nur Modellwahl meint. Es geht um Prozesse, Daten, Governance und Verantwortung. Die Personaldebatte bleibt ebenfalls eng verknüpft mit dem Agentenrennen. Der Wechsel von Noam Shazeer zu OpenAI steht für den harten Wettbewerb um Fachleute, die solche Systeme bauen und produktiv machen.
OpenAI liefert mit der Codex-Studie starke Hinweise auf einen schnellen Wechsel von Chatbot-Nutzung zu agentischer Wissensarbeit. Die Zahlen zeigen besonders bei OpenAI selbst und bei Organisationsnutzern eine deutliche Verschiebung zu längeren, parallelen und funktionsübergreifenden Aufgaben. Für Unternehmen zählt jetzt weniger die Frage, ob Mitarbeiter KI nutzen. Entscheidend wird, welche Arbeit sie an Agenten delegieren dürfen und wie diese Arbeit geprüft wird.