Gemini 3.5 Live Translate: Google bringt Echtzeit-Sprachübersetzung

Google hat Gemini 3.5 Live Translate veröffentlicht. Das neue Audiomodell übersetzt gesprochene Sprache nahezu in Echtzeit und startet in mehreren Google-Produkten. Google nennt mehr als 70 unterstützte Sprachen, automatische Spracherkennung und eine kontinuierliche Übersetzung, die nur wenige Sekunden hinter dem Sprecher bleiben soll. Der Rollout beginnt über die Gemini Live API, Google AI Studio, Google Meet und die Google-Translate-App. Die Meldung ist ein starkes Google-Thema, da Gemini damit nicht nur Text verarbeitet, sondern direkte Sprachkommunikation zwischen Menschen verändern soll. Echtzeitübersetzung rückt aus Spezialgeräten und isolierten Apps stärker in Alltagsprodukte wie Google Translate, Videokonferenzen und Entwicklerplattformen.

Google startet Gemini 3.5 Live Translate in Translate, Meet und API

Gemini 3.5 Live Translate unterscheidet sich von älteren Übersetzungssystemen durch den Ablauf. Klassische Systeme warten oft, bis ein Sprecher fertig ist. Erst danach beginnt die Übersetzung. Google beschreibt das neue Modell als kontinuierliches System. Es verarbeitet Sprache während des Sprechens und erzeugt parallel übersetzte Sprache.

Das Modell erkennt die Eingabesprache automatisch. Nutzer oder Entwickler müssen die Sprache nicht immer manuell auswählen. Google nennt außerdem Robustheit in lauten und unvorhersehbaren Umgebungen. Das ist wichtig für Flughäfen, Straßen, Klassenzimmer, Meetings, Reisen, Führungen und Kundengespräche.

Für normale Nutzer läuft Gemini 3.5 Live Translate über die Google Translate-App auf Android und iOS. Nutzer verbinden Kopfhörer, öffnen Google Translate und starten Live Translate. Die Übersetzung soll Tonfall, Betonung und Sprechtempo besser erhalten. Auf Android startet zusätzlich ein neuer Hörmodus. Nutzer können das Smartphone ans Ohr halten und die Übersetzung über die Hörmuschel hören.

Bereich	Google-Angabe	Bedeutung
Gemini 3.5 Live Translate	Neues Audiomodell für Speech-to-Speech-Übersetzung	Sprache wird direkt in Sprache übertragen
Sprachen	Mehr als 70 Sprachen	Breiter Einsatz für Reisen, Meetings und Lernen
Übersetzungsmodus	Kontinuierlich statt nur nach Sprecherende	Gespräch soll natürlicher wirken
Google Translate	Rollout global auf Android und iOS	Nutzer brauchen keine Spezialhardware
Android-Hörmodus	Übersetzung direkt über die Hörmuschel	Praktisch ohne Kopfhörer
Entwickler	Public Preview über Gemini Live API und Google AI Studio	Entwickler können eigene Live-Übersetzungs-Apps bauen
Unternehmen	Private Preview in Google Meet für ausgewählte Workspace-Kunden	Videokonferenzen werden mehrsprachiger
Wasserzeichen	SynthID für erzeugte Audiodaten	KI-Audio bleibt technisch markierbar

Für Entwickler öffnet Google das Modell über die Gemini Live API und Google AI Studio in einer öffentlichen Vorschau. Google nennt LiveKit, Agora, Fishjam, Pipecat und Vision Agents als Plattformen, die Entwickler beim Aufbau von Echtzeit-Sprachübersetzungen unterstützen sollen. Anwendungen reichen von mehrsprachigen Calls über Unterricht bis zu Live-Übertragungen.

Google nennt außerdem Grab als frühen Testpartner. Grab testet Gemini 3.5 Live Translate für nahezu Echtzeit-Kommunikation zwischen Fahrern und Reisenden bei Abholungen. Laut Google laufen über Grab mehr als 10 Millionen Sprachaufrufe pro Monat. Genau solche Situationen zeigen den praktischen Nutzen einer Übersetzung, die nicht erst nach langen Pausen reagiert.

Google Meet bekommt mehr Sprachen und mehr Sprachkombinationen

Google Meet soll Gemini 3.5 Live Translate ebenfalls erhalten. Google startet die neue Übersetzung zunächst als private Vorschau für ausgewählte Business-Kunden von Google Workspace. Ein breiterer Rollout soll später im Jahr folgen.

Der Sprung in Google Meet ist groß. Google spricht von mehr als 70 Sprachen statt bisher fünf Sprachen. Zusätzlich sollen Gespräche über mehr als 2.000 Sprachkombinationen möglich werden. Die Übersetzung soll nicht mehr nur von und nach Englisch funktionieren, sondern direkter zwischen vielen Sprachpaaren arbeiten.

Für Unternehmen ist das relevant, da Meetings oft mehrsprachig sind. Vertrieb, Support, Schulung, Recruiting, internationale Teams und Kundenkommunikation können von besserer Echtzeitübersetzung profitieren. Gleichzeitig bleiben Datenschutz, Aufzeichnung, Workspace-Verwaltung und Freigaben wichtige Punkte. Übersetzte Sprache entsteht aus Live-Audio und sollte in Unternehmen wie andere sensible Meetingdaten behandelt werden.

Nutzungsszenario	Möglicher Einsatz	Offene Grenze
Reisen	Gespräche im Ausland schneller verstehen	Latenz bleibt bei wenigen Sekunden
Stadtführungen	Übersetzung direkt über Kopfhörer oder Hörmuschel	Hintergrundlärm kann Qualität beeinflussen
Unterricht	Mehrsprachige Inhalte live verfolgen	Fachbegriffe brauchen Kontext
Business-Meetings	Teams sprechen mit weniger Sprachbarriere	Unternehmensregeln bleiben wichtig
Kundensupport	Support kann Sprache des Kunden schneller bedienen	Datenschutz und Einwilligung prüfen
Entwickler-Apps	Eigene Live-Übersetzungsprodukte über API	API-Kosten und Qualität testen
Medien und Broadcasts	Simultanübersetzung für Streams und Veranstaltungen	Rechte, Moderation und Fehlerkorrektur bleiben relevant
Private Gespräche	Kurze Alltagsgespräche ohne Dolmetscher-App-Wechsel	Nicht jede Nuance wird perfekt übertragen

Google betont zusätzlich Sicherheit und Nachvollziehbarkeit. Alle von den Modellen erzeugten Audiodaten werden laut Google mit SynthID versehen. Das Wasserzeichen ist für Menschen nicht hörbar, soll aber helfen, KI-generierte Audiospuren später als solche zu erkennen. Google verweist für Details auf die Modellkarte.

Der Schritt passt in Googles breitere Gemini-Strategie. Gemini soll nicht nur Antworten schreiben, sondern Sprache, Live-Interaktion, Multimodalität und Entwicklerplattformen verbinden. Echtzeitübersetzung ist dafür ein starkes Alltagsbeispiel, da der Nutzen sofort verständlich ist: Menschen sprechen in ihrer Sprache und hören eine übersetzte Version fast ohne Wartezeit.

Für Nutzer in Deutschland bleibt der konkrete Funktionsumfang wichtig. Google nennt einen globalen Rollout in Google Translate auf Android und iOS. Einzelne Funktionen wie der neue Android-Hörmodus können trotzdem gestaffelt erscheinen. In Google Meet beginnt der Einsatz zunächst nur für ausgewählte Workspace-Kunden. Gemini 3.5 Live Translate ist damit gestartet, aber noch nicht überall in derselben Form verfügbar.

Google startet Gemini 3.5 Live Translate für Echtzeit-Übersetzungen

Google startet Gemini 3.5 Live Translate in Translate, Meet und API

Google Meet bekommt mehr Sprachen und mehr Sprachkombinationen