Neues Google-Projekt Mit eigener Stimme fremde Sprachen sprechen

dj

20.5.2019

Die Babylonische Sprachverwirrung könnte bald ein Ende finden.
Die Babylonische Sprachverwirrung könnte bald ein Ende finden.
iStock

Wer schon immer mal Spanisch, Chinesisch oder Bengalisch sprechen wollte, hat Glück: Google hat ein System entwickelt, das gesprochene Sprache direkt übersetzen und die Stimme dabei erhalten kann.

Mit dem Translatotron von Google könnte man bald in der eigenen Stimme unzählige Sprache sprechen. Das mit künstlicher Intelligenz befasste Google-Team hat ein Konzept vorgelegt, wie das funktionieren könnte.

Echtzeitübersetzung ist nicht mehr komplett neu. Bereits jetzt gibt Angebote, auch von Google, die das gesprochene Wort auffangen und dann per Sprachausgabe in der Zielprache wiedergeben können. Das Besondere an Translatotron ist jedoch, dass die Übersetzung in der Stimme der Original-Sprecher erklingt.

Spektogramme werden übersetzt

Translatotron übersetzt gesprochene Sprache direkt, ohne sie zuvor in Textform zu konvertieren, wie bei derzeitiger Übersetzungssoftware eigentlich üblich. Stattdessen achtet es auf das Spektrogramm der gesprochenen Worte und erstellt daraus eine Spektogramm der Zielsprache.

Von der Übersetzungsgenauigkeit reicht das noch nicht ganze an konventionelle Übersetzungssoftware heran, wie Google selbst einräumt. Die Methode erlaubt es Translatotron aber, das Übersetzte mit der Stimme des Original-Sprechers wiederzugeben. Damit die noch realistischer klingt, sollen auch Verzögerungslaute wie beispielsweise «ähm» erhalten bleiben. Diese Strategie hat Google auch schon bei der Duplex-Funktion des Google Assistant gezeigt.

Wenn Translatotron in einem fertigen Produkt erscheinen wird, ist noch unklar. Google selbst sieht die Technologie wohl noch relativ am Anfang und hofft auf weitere Verbesserungen. Dazu hat es auch ein Forschungspapier veröffentlicht und zahlreiche Hörbeispiele des Translatotron online gestellt.

Bilder des Tages

Zurück zur Startseite