Google hat Gemini 3.5 Live Translate veröffentlicht. Das neue Audiomodell übersetzt gesprochene Sprache nahezu in Echtzeit und startet in mehreren Google-Produkten. Google nennt mehr als 70 unterstützte Sprachen, automatische Spracherkennung und eine kontinuierliche Übersetzung, die nur wenige Sekunden hinter dem Sprecher bleiben soll. Der Rollout beginnt über die Gemini Live API, Google AI Studio, Google Meet und die Google-Translate-App. Die Meldung ist ein starkes Google-Thema, da Gemini damit nicht nur Text verarbeitet, sondern direkte Sprachkommunikation zwischen Menschen verändern soll. Echtzeitübersetzung rückt aus Spezialgeräten und isolierten Apps stärker in Alltagsprodukte wie Google Translate, Videokonferenzen und Entwicklerplattformen.
Google startet Gemini 3.5 Live Translate in Translate, Meet und API
Gemini 3.5 Live Translate unterscheidet sich von älteren Übersetzungssystemen durch den Ablauf. Klassische Systeme warten oft, bis ein Sprecher fertig ist. Erst danach beginnt die Übersetzung. Google beschreibt das neue Modell als kontinuierliches System. Es verarbeitet Sprache während des Sprechens und erzeugt parallel übersetzte Sprache.
Das Modell erkennt die Eingabesprache automatisch. Nutzer oder Entwickler müssen die Sprache nicht immer manuell auswählen. Google nennt außerdem Robustheit in lauten und unvorhersehbaren Umgebungen. Das ist wichtig für Flughäfen, Straßen, Klassenzimmer, Meetings, Reisen, Führungen und Kundengespräche.
Für normale Nutzer läuft Gemini 3.5 Live Translate über die Google Translate-App auf Android und iOS. Nutzer verbinden Kopfhörer, öffnen Google Translate und starten Live Translate. Die Übersetzung soll Tonfall, Betonung und Sprechtempo besser erhalten. Auf Android startet zusätzlich ein neuer Hörmodus. Nutzer können das Smartphone ans Ohr halten und die Übersetzung über die Hörmuschel hören.
| Bereich | Google-Angabe | Bedeutung |
|---|---|---|
| Gemini 3.5 Live Translate | Neues Audiomodell für Speech-to-Speech-Übersetzung | Sprache wird direkt in Sprache übertragen |
| Sprachen | Mehr als 70 Sprachen | Breiter Einsatz für Reisen, Meetings und Lernen |
| Übersetzungsmodus | Kontinuierlich statt nur nach Sprecherende | Gespräch soll natürlicher wirken |
| Google Translate | Rollout global auf Android und iOS | Nutzer brauchen keine Spezialhardware |
| Android-Hörmodus | Übersetzung direkt über die Hörmuschel | Praktisch ohne Kopfhörer |
| Entwickler | Public Preview über Gemini Live API und Google AI Studio | Entwickler können eigene Live-Übersetzungs-Apps bauen |
| Unternehmen | Private Preview in Google Meet für ausgewählte Workspace-Kunden | Videokonferenzen werden mehrsprachiger |
| Wasserzeichen | SynthID für erzeugte Audiodaten | KI-Audio bleibt technisch markierbar |
Für Entwickler öffnet Google das Modell über die Gemini Live API und Google AI Studio in einer öffentlichen Vorschau. Google nennt LiveKit, Agora, Fishjam, Pipecat und Vision Agents als Plattformen, die Entwickler beim Aufbau von Echtzeit-Sprachübersetzungen unterstützen sollen. Anwendungen reichen von mehrsprachigen Calls über Unterricht bis zu Live-Übertragungen.
Google nennt außerdem Grab als frühen Testpartner. Grab testet Gemini 3.5 Live Translate für nahezu Echtzeit-Kommunikation zwischen Fahrern und Reisenden bei Abholungen. Laut Google laufen über Grab mehr als 10 Millionen Sprachaufrufe pro Monat. Genau solche Situationen zeigen den praktischen Nutzen einer Übersetzung, die nicht erst nach langen Pausen reagiert.
Google Meet bekommt mehr Sprachen und mehr Sprachkombinationen
Google Meet soll Gemini 3.5 Live Translate ebenfalls erhalten. Google startet die neue Übersetzung zunächst als private Vorschau für ausgewählte Business-Kunden von Google Workspace. Ein breiterer Rollout soll später im Jahr folgen.
Der Sprung in Google Meet ist groß. Google spricht von mehr als 70 Sprachen statt bisher fünf Sprachen. Zusätzlich sollen Gespräche über mehr als 2.000 Sprachkombinationen möglich werden. Die Übersetzung soll nicht mehr nur von und nach Englisch funktionieren, sondern direkter zwischen vielen Sprachpaaren arbeiten.
Für Unternehmen ist das relevant, da Meetings oft mehrsprachig sind. Vertrieb, Support, Schulung, Recruiting, internationale Teams und Kundenkommunikation können von besserer Echtzeitübersetzung profitieren. Gleichzeitig bleiben Datenschutz, Aufzeichnung, Workspace-Verwaltung und Freigaben wichtige Punkte. Übersetzte Sprache entsteht aus Live-Audio und sollte in Unternehmen wie andere sensible Meetingdaten behandelt werden.
| Nutzungsszenario | Möglicher Einsatz | Offene Grenze |
|---|---|---|
| Reisen | Gespräche im Ausland schneller verstehen | Latenz bleibt bei wenigen Sekunden |
| Stadtführungen | Übersetzung direkt über Kopfhörer oder Hörmuschel | Hintergrundlärm kann Qualität beeinflussen |
| Unterricht | Mehrsprachige Inhalte live verfolgen | Fachbegriffe brauchen Kontext |
| Business-Meetings | Teams sprechen mit weniger Sprachbarriere | Unternehmensregeln bleiben wichtig |
| Kundensupport | Support kann Sprache des Kunden schneller bedienen | Datenschutz und Einwilligung prüfen |
| Entwickler-Apps | Eigene Live-Übersetzungsprodukte über API | API-Kosten und Qualität testen |
| Medien und Broadcasts | Simultanübersetzung für Streams und Veranstaltungen | Rechte, Moderation und Fehlerkorrektur bleiben relevant |
| Private Gespräche | Kurze Alltagsgespräche ohne Dolmetscher-App-Wechsel | Nicht jede Nuance wird perfekt übertragen |
Google betont zusätzlich Sicherheit und Nachvollziehbarkeit. Alle von den Modellen erzeugten Audiodaten werden laut Google mit SynthID versehen. Das Wasserzeichen ist für Menschen nicht hörbar, soll aber helfen, KI-generierte Audiospuren später als solche zu erkennen. Google verweist für Details auf die Modellkarte.
Der Schritt passt in Googles breitere Gemini-Strategie. Gemini soll nicht nur Antworten schreiben, sondern Sprache, Live-Interaktion, Multimodalität und Entwicklerplattformen verbinden. Echtzeitübersetzung ist dafür ein starkes Alltagsbeispiel, da der Nutzen sofort verständlich ist: Menschen sprechen in ihrer Sprache und hören eine übersetzte Version fast ohne Wartezeit.
Für Nutzer in Deutschland bleibt der konkrete Funktionsumfang wichtig. Google nennt einen globalen Rollout in Google Translate auf Android und iOS. Einzelne Funktionen wie der neue Android-Hörmodus können trotzdem gestaffelt erscheinen. In Google Meet beginnt der Einsatz zunächst nur für ausgewählte Workspace-Kunden. Gemini 3.5 Live Translate ist damit gestartet, aber noch nicht überall in derselben Form verfügbar.