OpenAI-Studie: KI-Agenten verändern Wissensarbeit schneller als Chatbots

OpenAI beschreibt in einer neuen Studie zu Codex den schnellen Wandel von kurzen Chatbot-Interaktionen zu delegierten KI-Agenten, die längere Wissensarbeit selbstständig abarbeiten. Der am 25. Juni 2026 veröffentlichte Beitrag ordnet Codex nicht mehr nur als Coding-Hilfe ein. OpenAI beschreibt Codex als Beispiel für agentische Arbeit, bei der Nutzer Aufgaben über Minuten oder Stunden an ein System übergeben. Für Unternehmen, Entwicklerteams und Entscheider im Bereich KI ist das ein wichtiger Befund, weil sich damit nicht nur Tools ändern. Auch Arbeitsabläufe, Rollen und Kontrollpunkte verändern sich.

Der zentrale Unterschied liegt in der Arbeitseinheit. Ein Chatbot liefert meist eine Antwort auf einen Prompt. Ein Agent bekommt dagegen ein Ziel, nutzt Werkzeuge, prüft Dateien, führt Kommandos aus, verändert Artefakte und arbeitet iterativ weiter. OpenAI formuliert diesen Wechsel deutlich: Agentische KI verschiebt Wissensarbeit von einzelnen Interaktionen zu delegierten Aufgaben mit längerem Zeithorizont.

Codex begann als Werkzeug für Softwareentwicklung. Die aktuelle Studie beschreibt aber eine breitere Nutzung. OpenAI nennt Dokumententwürfe, Datenanalyse, Kommunikationskoordination und weitere Wissensarbeit außerhalb klassischer Programmierung. Genau darin liegt der Arbeitswelt-Winkel: Agenten bleiben nicht in Entwicklerteams stecken. Sie wandern in Research, Legal, Finance, Recruiting, Support, Produktarbeit und operative Teams.

OpenAI stützt diese Einordnung auf Nutzungsdaten aus drei Gruppen. Dazu gehören externe Nutzer mit privaten Konten, externe Organisationsnutzer und Mitarbeiter von OpenAI. Die Studie nutzt nach eigener Darstellung eine automatisierte und datenschutzschonende Auswertung. Forscher sollen dabei aggregierte und anonymisierte Muster analysieren, ohne einzelne Nachrichten selbst zu lesen. Das macht die Untersuchung interessant, aber nicht grenzenlos. OpenAI betont selbst, dass die interne Nutzung bei OpenAI nicht repräsentativ für durchschnittliche Unternehmen ist.

OpenAI misst den Wechsel von Chatbot-Antworten zu delegierter Arbeit

Die auffälligsten Zahlen betreffen die Länge der Aufgaben. Laut OpenAI machten im Mai 2026 80,6 Prozent der untersuchten Individualnutzer mindestens eine Codex-Anfrage, die auf mehr als 30 Minuten menschliche Arbeit geschätzt wurde. 70,2 Prozent überschritten mindestens einmal die Marke von einer Stunde. 25,6 Prozent stellten mindestens eine Anfrage, die laut Schätzung mehr als acht Stunden menschlicher Arbeit entsprach.

Diese Werte sagen nicht, dass Codex jede Aufgabe perfekt erledigt. Sie sagen aber, dass Nutzer Agenten immer größere Arbeitsblöcke zutrauen. OpenAI beschreibt besonders intensive Nutzer, die im 99. Perzentil mehr als 60 Stunden Codex-Agent-Turns pro Tag erzeugten. Das gelingt nur über Parallelisierung. Ein Mensch wartet dabei nicht auf eine einzelne Antwort. Er steuert mehrere Agentenläufe, prüft Zwischenergebnisse und verteilt Arbeit neu.

OpenAI-BefundGenannte ZahlEinordnung für Wissensarbeit
Codex-Anfrage über 30 Minuten80,6 Prozent der untersuchten Individualnutzer bis Mai 2026Agenten werden für längere Arbeitsblöcke genutzt
Codex-Anfrage über 1 Stunde70,2 Prozent der untersuchten Individualnutzer bis Mai 2026Nutzer delegieren echte Arbeit statt nur Fragen
Codex-Anfrage über 8 Stunden25,6 Prozent der untersuchten Individualnutzer bis Mai 2026Langzeitaufgaben rücken in den Alltag
Codex-Anteil bei OpenAI-Output-Tokens99,8 Prozent der wöchentlichen Output-Tokens intern bei OpenAICodex ersetzt intern viele ChatGPT-Arbeitsinteraktionen
Nicht-Entwickler bei Organisationsnutzern189-faches Wachstum seit August 2025Agenten erreichen Fachbereiche außerhalb der Entwicklung

Der Vergleich mit Chatbots ist deshalb mehr als Marketing. Bei klassischer Chatbot-Nutzung bleibt viel Arbeit beim Nutzer. Der Nutzer formuliert, kopiert, prüft, überträgt und setzt um. Bei Agenten verschiebt sich ein Teil dieser Umsetzung in das System. Das verändert die Rolle des Menschen. Aus dem Fragesteller wird eher ein Auftraggeber, Prüfer und Koordinator.

Für Entwickler ist dieser Wechsel naheliegend. Ein Agent kann Code lesen, Tests ausführen, Fehler suchen, Refactorings vorbereiten oder Pull Requests anlegen. Für andere Fachbereiche ist der Sprung größer. OpenAI nennt aber genau diese Verschiebung. Nicht-technische Mitarbeiter nutzen Codex für Automatisierung, Datentransformation, Tooling, Debugging und strukturierte Analyse. Die Grenze zwischen Facharbeit und technischer Ausführung wird dadurch durchlässiger.

Diese Entwicklung passt zu einer breiteren Debatte um Macht, Plattformen und Modellwahl. Der Artikel zu Microsoft-CEO warnt vor Macht großer KI-Anbieter ordnet den Plattformdruck auf Unternehmen ein. Bei Agenten verschärft sich diese Frage. Wer Arbeitsabläufe an ein Agentensystem bindet, bindet auch Berechtigungen, Datenzugriffe, Reviewprozesse und Toolketten an einen Anbieter.

OpenAI berichtet, dass Codex intern inzwischen in allen Abteilungen das primäre KI-Werkzeug für Arbeit geworden ist. Engineering wechselte zuerst. Legal, Finance und Recruiting überschritten laut OpenAI um April 2026 die Schwelle zur Codex-Mehrheitsnutzung. Für den durchschnittlichen OpenAI-Mitarbeiter entfallen heute mehr als 85 Prozent der Output-Tokens auf Codex. Bei internen wöchentlichen Output-Tokens nennt OpenAI sogar 99,8 Prozent.

Besonders stark wuchs die Nutzung in Research. OpenAI nennt bis Juni 2026 eine mediane Nutzung, die 56-mal höher lag als im November 2025. Customer Support kam auf das 32-Fache. Engineering erreichte das 27-Fache. Legal wuchs langsamer, lag aber immer noch beim 13-Fachen des Novemberwerts. Diese Werte beschreiben nicht einfach mehr Chat. Sie beschreiben mehr KI-vermittelte Arbeit in Arbeitsabläufen.

Für Unternehmen im DACH-Raum ist genau dieser Punkt wichtig. Viele Firmen starten bei Chatbots mit Text, Zusammenfassung und Recherche. Agenten greifen tiefer ein. Sie brauchen Zugriff auf Repositories, Tickets, Dokumente, Datenbanken, lokale Dateien, Build-Systeme oder interne Tools. Damit steigen Produktivitätspotenzial und Risiko gleichzeitig.

Auch die Aufgabenmischung ändert sich. OpenAI beschreibt, dass Codex weiterhin stark in Engineering und Coding verankert ist. In Business-Funktionen entfielen laut OpenAI aber mehr als ein Viertel der Arbeit mit Codex auf Engineering oder Coding. Das ist der eigentliche Organisationsbruch. Fachabteilungen übernehmen technische Ausführung, die vorher oft auf Entwickler, Data Teams oder interne Toolspezialisten wartete.

BereichWas sich mit Agenten ändertWas Unternehmen prüfen sollten
EntwicklungMehr parallele Bugfixes, Tests und CodeänderungenCode Review, Rechte und Testpflichten
Research und DataSchnellere Datenaufbereitung und PrototypenDatenzugriff, Reproduzierbarkeit und Quellenprüfung
Legal und FinanceAutomatisierung von Auswertung, Dokumentenarbeit und PrüfpfadenVertraulichkeit, Freigaben und Haftung
Recruiting und OperationsWorkflows, Vorlagen und interne Tools entstehen schnellerGovernance für neue Tools und Schattenautomatisierung
SupportAnalyse von Tickets, Makros und Wissensdatenbanken wird automatisierbarerQualitätssicherung, Eskalation und Kundendaten-Schutz

Die Sicherheitsfrage wächst mit jedem Toolzugriff. Wenn Agenten Code ändern, Skripte ausführen oder Daten transformieren, reichen gute Prompts nicht aus. Unternehmen brauchen Rollenmodelle, Freigaben, Protokolle, Sandboxes, Audit-Logs und klare Stoppsignale. Der Beitrag zu AWS Continuum und AWS Context passt in diesen Rahmen, weil dort die Absicherung von KI-Agenten im Unternehmenskontext im Mittelpunkt steht.

Auch Multi-Agenten-Systeme rücken näher an produktive Arbeitsabläufe. Sakana AI Fugu greift denselben Trend aus einer anderen Richtung auf: Mehrere Modelle und Rollen werden orchestriert, statt nur ein einzelnes Chatfenster zu bedienen. Die OpenAI-Zahlen zu parallelen Codex-Agenten zeigen, dass diese Arbeitsweise nicht mehr nur ein Forschungsthema ist.

Unternehmen brauchen neue Regeln für Agentenarbeit

OpenAI präsentiert Codex als Hinweis auf die wirtschaftliche Kraft agentischer KI. Der Beitrag ist aber auch eine Warnung an Organisationen. Agenten entfalten ihren Nutzen nicht nur durch Modellqualität. Sie brauchen passende Arbeitsstrukturen. Ein Team muss entscheiden, welche Aufgaben delegierbar sind, welche Ergebnisse ein Mensch prüfen muss und welche Systeme ein Agent überhaupt berühren darf.

Die Methodik der Studie ist dafür wichtig. OpenAI schätzt Aufgabenhorizonte mit einem LLM-as-Judge-Verfahren. Die Schwellenwerte sollen als Richtungssignal gelten, nicht als exakte Zeiterfassung. Zudem bildet OpenAI eine besonders KI-nahe Organisation ab. Interne OpenAI-Mitarbeiter haben viel Erfahrung mit Modellen, geringe Nutzungshürden und starke organisatorische Unterstützung. Normale Unternehmen müssen mit anderen Reifegraden, Compliance-Anforderungen und Integrationskosten rechnen.

Für Entwicklerteams ist der nächste praktische Schritt oft ein Kontrollsystem rund um Agentenarbeit. Automatische Pull Requests, Tests, Dependency-Prüfungen und CI-Prozesse werden wichtiger. Der Ratgeber zu GitHub Dependabot liefert dafür einen angrenzenden Baustein, weil automatisierte Änderungen ohne Review- und Testkultur schnell neue Risiken erzeugen.

Lokale und browsernahe KI bleibt ein zweiter Strang. Gemini Nano in Chrome betrifft zwar nicht Codex, verdeutlicht aber den Trend zu KI direkt in Arbeitsumgebungen. Agenten werden nicht nur als separate App auftreten. Sie wandern in Browser, IDEs, Office-Tools, Ticketsysteme und Unternehmensplattformen.

  • Delegation braucht klare Aufgabenklassen und definierte Grenzen.
  • Toolzugriff sollte nach Rolle, Projekt und Risikostufe getrennt werden.
  • Review muss Pflicht bleiben, wenn Agenten Code, Verträge, Finanzdaten oder Kundendaten verändern.
  • Protokolle helfen bei Audits, Fehleranalyse und Haftungsfragen.
  • Schulung sollte Fachbereiche einschließen, weil Nicht-Entwickler laut OpenAI besonders schnell wachsen.

Der Arbeitsmarkt-Kontext kommt hinzu. OpenAI schreibt, dass Agenten die Grenze dessen erweitern, was einzelne Mitarbeiter tun können. Das klingt nach Produktivität. Es bedeutet aber auch Reorganisation. Aufgaben verschieben sich. Fachkräfte müssen lernen, Agenten zu briefen, Ergebnisse zu überprüfen und Fehlerquellen zu erkennen. Führungskräfte müssen entscheiden, ob Agentenarbeit nur assistiert oder ganze Prozessketten ersetzt.

Genau deshalb sind KI-Entscheiderveranstaltungen für Unternehmen relevanter geworden. CONNECTED Berlin 2026 knüpft an diesen Bedarf an, weil Unternehmens-KI nicht nur Modellwahl meint. Es geht um Prozesse, Daten, Governance und Verantwortung. Die Personaldebatte bleibt ebenfalls eng verknüpft mit dem Agentenrennen. Der Wechsel von Noam Shazeer zu OpenAI steht für den harten Wettbewerb um Fachleute, die solche Systeme bauen und produktiv machen.

OpenAI liefert mit der Codex-Studie starke Hinweise auf einen schnellen Wechsel von Chatbot-Nutzung zu agentischer Wissensarbeit. Die Zahlen zeigen besonders bei OpenAI selbst und bei Organisationsnutzern eine deutliche Verschiebung zu längeren, parallelen und funktionsübergreifenden Aufgaben. Für Unternehmen zählt jetzt weniger die Frage, ob Mitarbeiter KI nutzen. Entscheidend wird, welche Arbeit sie an Agenten delegieren dürfen und wie diese Arbeit geprüft wird.