ForschungsprojektSiri, Alexa und Co. sollen endlich Schweizerdeutsch lernen
SDA
25.5.2021 - 09:20
Ein Projekt von Schweizer Hochschulen sammelt und digitalisiert Deutschschweizer Dialekte. Das Ziel ist, eine Grundlage zu schaffen, um etwa Chatbots und Sprachassistenzen Mundart beizubringen.
25.05.2021, 09:20
25.05.2021, 10:04
SDA
Mit Siri und Alexa sprechen, wie einem der Schnabel gewachsen ist: Das ist bei Schweizer Mundart kaum möglich, weil die Software die Dialekte häufig nicht versteht. Denn es fehlen die notwendigen, grossen Mengen an Trainingsdaten, also Audioaufnahmen und dazugehörige Transkripte.
Ein Team der Zürcher Hochschule für Angewandte Wissenschaften (ZHAW) und der Fachhochschule Nordwestschweiz (FHNW) ruft daher nun zu einer Datensammlung von Schweizer Dialekten in der gesamten Deutschschweiz auf, wie die ZHAW am Dienstag mitteilte. «Mindestens 2000 Stunden Aufnahmen von schweizerdeutschen Dialekten sollen zusammenkommen, damit wir eine gute Datenbasis haben», liess sich der ZHAW-Forscher Mark Cieliebak zitieren.
Algorithmus lernt Schweizerdeutsch
Dazu entwickelten die Forschenden eine Webapplikation, bei der Freiwillige hochdeutsche Sätze in ihre Mundart übersetzen können. Diese Audioaufnahmen fliessen in eine Datenbank und lassen sich von anderen überprüfen.
Basierend auf künstlicher Intelligenz soll einem Algorithmus anhand des Sammelsuriums anschliessend beigebracht werden, schweizerdeutsche Sprache zu verstehen und automatisch in hochdeutschen Text umzuwandeln, wie Manfred Vogel von der FHNW erläuterte.
Ebenfalls lanciert das Team einen «Kampf der Kantone»: Ab Ende Mai soll tagesaktuell verfolgt werden, wie viele Aufnahmen pro Kanton vorhanden sind, auf einer Landkarte stellen die Forschenden die Rangliste basierend auf dem Verhältnis zur deutschsprachigen Einwohnerschaft in der App dar. Aus dem Gewinner-Kanton sollen schlussendlich drei Personen mit einem Preis geehrt werden. Zusätzlich gibt es auch eine Belohnung für die meisten Aufnahmen sowie die beste Qualität.
Für grosse Technologiefirmen wie Google, Apple oder Amazon ist der Schweizer Markt zu klein und deshalb nicht attraktiv, um eine Lösung zu entwickeln, die Mundart versteht. Sobald sich gesprochene Sprache aber verschriftlichen lässt, wird es beispielsweise möglich, mit Sprachassistenten auf Schweizerdeutsch zu sprechen, Untertitel bei Filmen automatisch zu erstellen oder Sitzungsprotokolle und Interviews zu transkribieren. Um die Datensammlung zur Entwicklung von Computerprogrammen zu nutzen, soll sie für Forschungszwecke zugänglich gemacht werden.
Die Schweizer Dialektsammlung wird von der Swiss Association for Natural Language Processing (SwissNLP) geleitet. Das Media Technology Centre der ETH und Universität Zürich ist als Technologiepartner am Projekt beteiligt, finanzielle Unterstützung kommt vom Schweizer Nationalfonds (SNF) und der AXA Versicherung. Tamedia und 20 Minuten stellen die Textdaten als Basis für die Sprachaufnahmen zur Verfügung.