Die Sprachen, die sich nicht automatisch übersetzen lassen

In einer sich immer weiter globalisierenden Welt, die sich jeden Tag schneller dreht, gibt es wenig Zweifel, dass sich automatische Übersetzung behaupten wird. Trotz des Gekichers über maschinelle Übersetzungen sind Sprachapps basiert auf neuronalen Netzwerken (vernetzte Computersysteme, die die menschliche Denkweise nachahmen) dennoch unschlagbar in Sachen Geschwindigkeit (sofort) und Kosten (kostenlos).

Keine Anzahl von Algorithmen kann jedoch bisher das menschliche Gehirn ersetzen, und noch viel weniger das Feingefühl für Kontext und Redewendungen (es regnet Bindfäden) der professionellen Übersetzer.

Schnell, kostenlos und fehlerhaft―aber reifend

Dank des Einflusses von internationalen Organisationen (wie die Vereinten Nationen) und mehrsprachigen Institutionen (wie das Europäische Parlament), haben massive Datenbanken enorme Mengen paralleler Daten für über fünfzig Jahre aufgebaut. Es geschah jedoch erst im zweiten Jahrzehnt des 21. Jahrhunderts―mit der Ankunft der tiefen neuronalen Netzwerke (DNNs)―als diese von Menschen übersetzte Dokumentation eine bessere praktische Anwendung finden konnte.

Unter Verwendung dieser linguistischen Schatztruhen haben eine Reihe von größeren Technologieakteuren kostenlose Übersetzungsplattformen entwickelt, darunter:

  • Google Translate: (133 Sprachen) Täglich eingesetzt von über 500 Millionen Benutzern, mit den Sprachen Englisch, Spanisch, Arabisch, Russisch, Portugiesisch und Indonesisch als die am häufigsten verwendeten, während Bengalisch, haitianisches Kreol und Tadschikisch eher im Hintergrund stehen;
  • Bing Translator von Microsoft: (103 Sprachen) Ein Clouddienst, der Teil von Microsoft Cognitive Services ist, integriert über mehrere Produkte, darunter Bing, MS Office, Edge, Skype und Windows, sowie Apple- und Android-Geräte;
  • DeepL: (28 Sprachen) Diese Engine expandiert gerade von seiner europäischen Basis, um Sprachen aus aller Welt einzubeziehen; sie ist auf einem gigantischen Korpus von von Menschen übersetzten Sätzen, Redewendungen und Ausschnitten basiert, die im Linguee-Onlinewörterbuch enthalten sind.

Erweiterung des Fokus

Diese anfängliche Abhängigkeit von diesen digitalen Goldminen an parallelen Daten erklärt wahrscheinlich, warum die automatische Übersetzung aktuell europäische Sprachen wie Finnisch (fünf Millionen Sprecher) einbezieht, jedoch 48 Millionen Äthiopier ignoriert werden, die Oromo sprechen. Sonstige Muttersprachen, die immer noch im technologischen Limbus schweben, sind Bhojpuri (51 Millionen), Fula (24 Millionen), Sylheti (11 Millionen) und Kirundi (9 Millionen).

Diese Situation ändert sich jedoch mit immer mehr ergänzten Übersetzungssprachen, sodass der Umfang der Maschinenübersetzung immer mehr erweitert wird. Wie Carl Rubino, ein Programmmanager von IARPA (das US Intelligence Services Research Center), betont: „Viele der Herausforderungen, vor denen wir heutzutage stehen, wie wirtschaftliche und politische Instabilität, die Covid-19-Pandemie und der Klimawechsel, gehen über unseren Planeten hinaus―und sind daher von Natur aus mehrsprachig.”

Leben retten durch Sprachen

Da diese Herausforderungen häufig vor allem benachteiligte Gemeinschaften betreffen, die am schlechtesten ausgerüstet sind, um damit zurechtzukommen, werden sofortige aber genaue Kommunikationen schnell zu einer Sache auf Leben und Tod. Während die Leistung von menschlichen Übersetzern durch physische Beschränkungen bedingt ist, können Computer rund um die Uhr, sieben Tage die Woche mit übermenschlichen Geschwindigkeiten arbeiten. Sie können Non-Stop-Ströme von Analysen, Berichten und Richtlinien produzieren, die grammatikalisch fehlerhaft sein können, aber für enge Zeitfenster geeignet sind.

Dies ist der echte Wert der Erweiterung des Umfangs der automatischen Übersetzung. Durch die Erleichterung der sofortigen Kommunikation über Sprach- und kulturelle Barrieren hinaus, wenn Leben und Lebensgrundlagen auf dem Spiel stehen, werfen diese gesichtslosen Algorithmen Rettungsleinen zu Low-Tech-Gemeinschaften, die mit ungünstigen Bedingungen ums Überleben kämpfen.

Sprachen mit wenigen Ressourcen

Wenn auch von Millionen Menschen gesprochen, bieten einige Sprachen nur wenige (und oft einsprachige) schriftliche Ressourcen, trotz ihrer reichen mündlichen Traditionen. Für tiefe neuronale Netzwerke waren diese Sprachen mit wenigen Ressourcen―so wie sie in der Branche bekannt sind―schwer in Angriff zu nehmen. In der Zwischenzeit bemühen sich die Sprecher dieser Sprachen darum, Beiträge und Blogs hochzuladen, die das Überleben ihrer Gesellschaften sicherstellen werden, trotz ihres traditionellen Mangels an Aufzeichnungen und Büchern.

Historisch gesehen waren mehrsprachige Quellen unter einigen dieser Kulturen oft auf kleinen Datensätzen beschränkt, die aus der religiösen Literatur stammen, insbesondere heilige Bücher, die weitgehend übersetzt wurden, wie der Koran und die Bibel. In moderneren Zeiten bauen Ausdruck, audiovisuelle Medien und soziale Netzwerke solide Bestände von einsprachigen Daten auf, die analysiert und von tiefen neuronalen Netzwerken übersetzt werden können.

Soziale Netzwerke bauen Schutznetze für Gemeinschaften auf

Moderne Modelle von neuronalen Netzwerken können nun mit gesprochenen und schriftlichen einsprachigen Quellen vortrainiert werden. Die Theorie ist, dass neuronale Modelle bestimmte Funktionen und Strukturen der menschlichen Sprache gelernt haben, die durch Parameter errichtet wurden, die nun bei Übersetzungsaufgaben angewendet werden.

Mit Nutzern, die weltweit Inhalt posten, der sich häufig über kulturelle Grenzen hinweg wiederholt, und in ihrer Muttersprache, können neuronale Modelle jetzt Texte für Nutzer zusammenfassen. Um dies zu tun, scheinen diese Apps nur sehr wenig zweisprachiges Training von parallelen Daten zu benötigen, wobei ein paar Hunderttausend Wörter (vielleicht ein halbes Dutzend Bücher) ausreichen.

Kernpunkt: Mit über 7.000 gesprochenen Sprachen weltweit (aber nur etwa 4.000 von ihnen geschrieben) gibt es für virtuelle Übersetzungsapps noch enorme Bereiche zur Expansion. Vom Gesundheitswesen bis hin zur Landwirtschaft ist die Überbrückung von linguistischen und kulturellen Lücken durch automatische Übersetzung eindeutig der Weg zu einer besseren Zukunft für die Menschheit―aber immer mit einer helfenden Hand von professionellen Übersetzern, die nicht nur sachkundig in mehr als einer Sprache sind, sondern auch in mehr als einer Kultur.

Bild von Yatheesh Gowda von Pixabay