Google startet Gemini 3.5 Live Translate für Echtzeit-Übersetzungen

Google hat Gemini 3.5 Live Translate veröffentlicht. Das neue Audiomodell übersetzt gesprochene Sprache nahezu in Echtzeit und startet in mehreren Google-Produkten. Google nennt mehr als 70 unterstützte Sprachen, automatische Spracherkennung und eine kontinuierliche Übersetzung, die nur wenige Sekunden hinter dem Sprecher bleiben soll. Der Rollout beginnt über die Gemini Live API, Google AI Studio, Google Meet und die Google-Translate-App. Die Meldung ist ein starkes Google-Thema, da Gemini damit nicht nur Text verarbeitet, sondern direkte Sprachkommunikation zwischen Menschen verändern soll. Echtzeitübersetzung rückt aus Spezialgeräten und isolierten Apps stärker in Alltagsprodukte wie Google Translate, Videokonferenzen und Entwicklerplattformen.

Google startet Gemini 3.5 Live Translate in Translate, Meet und API

Gemini 3.5 Live Translate unterscheidet sich von älteren Übersetzungssystemen durch den Ablauf. Klassische Systeme warten oft, bis ein Sprecher fertig ist. Erst danach beginnt die Übersetzung. Google beschreibt das neue Modell als kontinuierliches System. Es verarbeitet Sprache während des Sprechens und erzeugt parallel übersetzte Sprache.

Das Modell erkennt die Eingabesprache automatisch. Nutzer oder Entwickler müssen die Sprache nicht immer manuell auswählen. Google nennt außerdem Robustheit in lauten und unvorhersehbaren Umgebungen. Das ist wichtig für Flughäfen, Straßen, Klassenzimmer, Meetings, Reisen, Führungen und Kundengespräche.

Für normale Nutzer läuft Gemini 3.5 Live Translate über die Google Translate-App auf Android und iOS. Nutzer verbinden Kopfhörer, öffnen Google Translate und starten Live Translate. Die Übersetzung soll Tonfall, Betonung und Sprechtempo besser erhalten. Auf Android startet zusätzlich ein neuer Hörmodus. Nutzer können das Smartphone ans Ohr halten und die Übersetzung über die Hörmuschel hören.

BereichGoogle-AngabeBedeutung
Gemini 3.5 Live TranslateNeues Audiomodell für Speech-to-Speech-ÜbersetzungSprache wird direkt in Sprache übertragen
SprachenMehr als 70 SprachenBreiter Einsatz für Reisen, Meetings und Lernen
ÜbersetzungsmodusKontinuierlich statt nur nach SprecherendeGespräch soll natürlicher wirken
Google TranslateRollout global auf Android und iOSNutzer brauchen keine Spezialhardware
Android-HörmodusÜbersetzung direkt über die HörmuschelPraktisch ohne Kopfhörer
EntwicklerPublic Preview über Gemini Live API und Google AI StudioEntwickler können eigene Live-Übersetzungs-Apps bauen
UnternehmenPrivate Preview in Google Meet für ausgewählte Workspace-KundenVideokonferenzen werden mehrsprachiger
WasserzeichenSynthID für erzeugte AudiodatenKI-Audio bleibt technisch markierbar

Für Entwickler öffnet Google das Modell über die Gemini Live API und Google AI Studio in einer öffentlichen Vorschau. Google nennt LiveKit, Agora, Fishjam, Pipecat und Vision Agents als Plattformen, die Entwickler beim Aufbau von Echtzeit-Sprachübersetzungen unterstützen sollen. Anwendungen reichen von mehrsprachigen Calls über Unterricht bis zu Live-Übertragungen.

Google nennt außerdem Grab als frühen Testpartner. Grab testet Gemini 3.5 Live Translate für nahezu Echtzeit-Kommunikation zwischen Fahrern und Reisenden bei Abholungen. Laut Google laufen über Grab mehr als 10 Millionen Sprachaufrufe pro Monat. Genau solche Situationen zeigen den praktischen Nutzen einer Übersetzung, die nicht erst nach langen Pausen reagiert.

Google Meet bekommt mehr Sprachen und mehr Sprachkombinationen

Google Meet soll Gemini 3.5 Live Translate ebenfalls erhalten. Google startet die neue Übersetzung zunächst als private Vorschau für ausgewählte Business-Kunden von Google Workspace. Ein breiterer Rollout soll später im Jahr folgen.

Der Sprung in Google Meet ist groß. Google spricht von mehr als 70 Sprachen statt bisher fünf Sprachen. Zusätzlich sollen Gespräche über mehr als 2.000 Sprachkombinationen möglich werden. Die Übersetzung soll nicht mehr nur von und nach Englisch funktionieren, sondern direkter zwischen vielen Sprachpaaren arbeiten.

Für Unternehmen ist das relevant, da Meetings oft mehrsprachig sind. Vertrieb, Support, Schulung, Recruiting, internationale Teams und Kundenkommunikation können von besserer Echtzeitübersetzung profitieren. Gleichzeitig bleiben Datenschutz, Aufzeichnung, Workspace-Verwaltung und Freigaben wichtige Punkte. Übersetzte Sprache entsteht aus Live-Audio und sollte in Unternehmen wie andere sensible Meetingdaten behandelt werden.

NutzungsszenarioMöglicher EinsatzOffene Grenze
ReisenGespräche im Ausland schneller verstehenLatenz bleibt bei wenigen Sekunden
StadtführungenÜbersetzung direkt über Kopfhörer oder HörmuschelHintergrundlärm kann Qualität beeinflussen
UnterrichtMehrsprachige Inhalte live verfolgenFachbegriffe brauchen Kontext
Business-MeetingsTeams sprechen mit weniger SprachbarriereUnternehmensregeln bleiben wichtig
KundensupportSupport kann Sprache des Kunden schneller bedienenDatenschutz und Einwilligung prüfen
Entwickler-AppsEigene Live-Übersetzungsprodukte über APIAPI-Kosten und Qualität testen
Medien und BroadcastsSimultanübersetzung für Streams und VeranstaltungenRechte, Moderation und Fehlerkorrektur bleiben relevant
Private GesprächeKurze Alltagsgespräche ohne Dolmetscher-App-WechselNicht jede Nuance wird perfekt übertragen

Google betont zusätzlich Sicherheit und Nachvollziehbarkeit. Alle von den Modellen erzeugten Audiodaten werden laut Google mit SynthID versehen. Das Wasserzeichen ist für Menschen nicht hörbar, soll aber helfen, KI-generierte Audiospuren später als solche zu erkennen. Google verweist für Details auf die Modellkarte.

Der Schritt passt in Googles breitere Gemini-Strategie. Gemini soll nicht nur Antworten schreiben, sondern Sprache, Live-Interaktion, Multimodalität und Entwicklerplattformen verbinden. Echtzeitübersetzung ist dafür ein starkes Alltagsbeispiel, da der Nutzen sofort verständlich ist: Menschen sprechen in ihrer Sprache und hören eine übersetzte Version fast ohne Wartezeit.

Für Nutzer in Deutschland bleibt der konkrete Funktionsumfang wichtig. Google nennt einen globalen Rollout in Google Translate auf Android und iOS. Einzelne Funktionen wie der neue Android-Hörmodus können trotzdem gestaffelt erscheinen. In Google Meet beginnt der Einsatz zunächst nur für ausgewählte Workspace-Kunden. Gemini 3.5 Live Translate ist damit gestartet, aber noch nicht überall in derselben Form verfügbar.