Sakana AI startet Fugu: Ein KI-Modell, das andere KI-Modelle orchestriert

Sakana AI hat mit Fugu ein neues KI-System vorgestellt, das sich nach außen wie ein einzelnes Modell verhält, intern aber mehrere Sprachmodelle und Agenten koordiniert. Entwickler senden ihre Anfrage an einen Endpunkt. Fugu entscheidet dann, ob eine direkte Antwort reicht oder ob spezialisierte Modelle Aufgaben übernehmen, Ergebnisse prüfen und zu einer finalen Antwort zusammenführen. Der Zugriff erfolgt über eine OpenAI-kompatible API.

Damit setzt Sakana AI einen anderen Schwerpunkt als viele Anbieter im Bereich KI. Fugu ist nicht einfach das nächste einzelne Frontier-Modell. Das System soll vorhandene Modelle orchestrieren, Aufgaben aufteilen und je nach Bedarf andere Agenten einbinden. Für Unternehmen und Entwickler ist das relevant, weil Modellabhängigkeit, Exportkontrollen, Datenschutzvorgaben und Vendor-Lock-in inzwischen zu realen Planungsfaktoren werden.

Sakana AI bietet Fugu und Fugu Ultra über eine API an

Zum Start gibt es zwei Varianten: Fugu und Fugu Ultra. Fugu ist laut Sakana AI auf ein Gleichgewicht aus Leistung und niedriger Latenz ausgelegt. Es soll sich für alltägliches Coding, Code-Reviews, Chatbots und interaktive Dienste eignen. Entwickler können Fugu in bestehende OpenAI-kompatible Workflows einbinden, ohne die eigene Integration grundlegend umzubauen.

Fugu Ultra ist die leistungsstärkere Variante. Sie koordiniert laut Sakana AI einen tieferen Pool spezialisierter Agenten und ist für schwierige, mehrstufige Aufgaben gedacht. Genannt werden KI-Forschung, Reproduktion wissenschaftlicher Arbeiten, Cybersicherheitsanalysen sowie Patent- und Literaturrecherchen. Der Preis dafür ist voraussichtlich höhere Latenz, weil mehr interne Arbeitsschritte koordiniert werden.

Technisch wichtig ist die Rollenverteilung. Sakana AI beschreibt Fugu selbst als ein Modell, das gelernt hat, andere Modelle zu koordinieren. Es entscheidet, wann es delegiert, welche Agenten eingebunden werden, wie diese miteinander kommunizieren und wie Teilergebnisse verifiziert werden. Die Idee baut auf den Forschungsarbeiten TRINITY und Conductor auf, die gelernte Modell- und Agenten-Orchestrierung untersuchen.

PunktFuguFugu Ultra
ZielBalance aus Leistung und Latenzmaximale Antwortqualität
APIOpenAI-kompatibelOpenAI-kompatibel
Agentenpooldynamisch orchestrierttieferer fixer Agentenpool
Kontrolleeinzelne Agenten können laut Sakana AI ausgeschlossen werdenAgentenpool laut Sakana AI nicht frei anpassbar
Typische NutzungCoding, Code-Review, Chatbots und AlltagsaufgabenForschung, Cybersecurity, Patente und komplexe Analysen
Benchmark-Fokusstarke Werte bei Coding und Reasoning laut Anbieter73,7 Prozent SWE Bench Pro und 93,2 Prozent LiveCodeBench laut Anbieter

Fugu soll Modellabhängigkeit und Exportkontrollen abfedern

Sakana AI positioniert Fugu ausdrücklich als Antwort auf eine neue Schwachstelle im KI-Markt. Wenn Unternehmen ihre kritischen Workflows an ein einzelnes Modell oder einen einzelnen Anbieter binden, kann ein Ausfall, eine Preiserhöhung, eine Zugriffsbeschränkung oder eine Exportkontrolle ganze Prozesse treffen. Fugu soll dieses Risiko reduzieren, weil der Agentenpool austauschbar ist und neue Modelle in die Orchestrierung aufgenommen werden können.

Das ist besonders für Entwicklerteams interessant, die bereits mit OpenAI-kompatiblen Schnittstellen arbeiten. Eine Anwendung müsste nicht für jeden Modellwechsel neu geschrieben werden. Stattdessen kann sie weiter einen Modellnamen ansprechen, während Fugu intern die passende Kombination auswählt. Sakana AI schreibt zudem, dass Fugu nach öffentlichen Modellstarts innerhalb von etwa zwei Wochen trainiert und evaluiert werden soll, bevor aktualisierte Varianten ausgerollt werden.

Auch der Standort spielt in der Positionierung eine Rolle. Sakana AI betont Hosting in Tokio. Für internationale Unternehmen kann das ein Argument sein, wenn sie Zugriff auf starke KI-Leistung suchen, aber nicht vollständig von US-Anbietern, bestimmten Exportregeln oder einzelnen Modell-APIs abhängig sein wollen. Für europäische Unternehmen bleiben trotzdem Datenschutz, Vertragsbedingungen, Datenflüsse und regionale Compliance zu prüfen.

Die Benchmarks klingen stark. Sakana AI nennt für Fugu Ultra 73,7 Prozent in SWE Bench Pro, 93,2 Prozent in LiveCodeBench, 90,8 Prozent in LiveCodeBench Pro und 82,1 Prozent in TerminalBench 2.1. Diese Werte stellen Fugu Ultra in die Nähe führender Modelle. Sie stammen aber vom Anbieter und hängen vom verwendeten Scaffold, den erlaubten Tools, der Modellkombination und dem Benchmark-Setup ab.

Gerade deshalb sollte Fugu nicht nur über Tabellenwerte bewertet werden. Die Diskussion um Claude Fable 5 und andere Benchmark-Vergleiche zeigt, wie stark Ergebnisse von Testumgebung und Aufgabenprofil abhängen. Für Unternehmen zählt am Ende, ob Fugu in eigenen Codebasen, internen Dokumenten, Sicherheitsanalysen oder Kundenworkflows zuverlässiger arbeitet als ein einzelnes Modell.

Der Ansatz bleibt trotzdem bemerkenswert. Sakana AI verkauft Fugu nicht als weiteres geschlossenes Modell mit einem festen Wissensstand, sondern als koordinierende Schicht über mehreren Modellen. Wenn das im Alltag funktioniert, könnte der Wettbewerb im KI-Markt weniger über ein einziges bestes Modell laufen und stärker über Orchestrierung, Modellmix, Compliance und Kostensteuerung. Entscheidend werden nun Latenz, Preis, Transparenz des Agentenpools und reproduzierbare Ergebnisse in realen Entwicklerprojekten.