Kann künstliche Intelligenz verlorene Sprachen entziffern?

Gefeiert wegen ihrer Weisheit und Legende haben alte Zivilisationen und ihre vergessenen Sprachen schon immer Historiker, Archäologen und Sprachwissenschaftler fasziniert. Heutzutage haben diese Forscher ein neues Instrument in ihren professionellen Werkzeugkästen: Künstliche Intelligenz, eine Technologie, die die Geheimnisse von Gesellschaften lüften könnten, die vor Jahrtausenden verschwunden sind.

Hieroglyphen und der Stein von Rosette

Von der sumerischen Keilschrift bis zu vorrömischen etruskischen Inschriften haben sowohl Akademiker als auch Amateure für Jahrhunderte über diese Reliquien nachgegrübelt. Einer von ihnen war Jean-Francois Champollion (1790-1832), ein junger Franzose, der eines der bekanntesten alten Schriftsystemen entziffert hat: Ägyptische Hieroglyphen. Hierzu hat er den berühmten Stein von Rosette verwendet. Diese Granodiorit-Stele wurde mit Fragmenten des selben Texts in drei Schriften graviert —32 Zeilen demotische Schrift, 14 Zeile Hieroglyphen und 54 Zeilen Griechisch.

Sumerische Keilschrift und andere alte Rätsel

Ein weiteres verblüffendes Beispiel ist Ugaritisch. Von französischen Archäologen im Jahr 1929 auf einer Reihe an Tontafeln entdeckt, die in den 1920ern auf dem Ruinenhügel von Ugarit gefunden wurden, war es in einem konsonantischen Alphabet der sumerischen Keilschrift beschrieben. Diese ausgestorbene nordwestsemitische Sprache wurde von hebräischen Gelehrten verwendet, um biblische hebräische Texte zu analysieren und Ähnlichkeiten zwischen dem alten Israel und Juda und deren Nachbarkulturen aufzuzeigen.

Auch an anderen Orten in der Welt gibt es jede Menge mysteriöse Texte, die noch immer entschlüsselt werden müssen, wie das Voynich-Manuskript (Europa), der Cascajal-Stein (Zentralamerika) und Rongorongo (Rapa Nui/Osterinsel).

Mysterien des Bronzezeitalters

Vielleicht das bekannteste Beispiel der Neuzeit ist Linearschrift B, ursprünglich in kretischen Ruinen gefunden, die auf das Bronzezeitalter zurückdatiert. Auch wenn man meistens den britischen Architekten Michael Ventris dafür würdigt, die Linearschrift B—jetzt als die früheste Form von griechischer Orthografie anerkannt und entwickelt ungefähr 1400 vor Christus—entziffert zu haben, wurden seine Bemühungen von der Altphilologin Alice Kober untermauert. Sie hat eine primitive analoge „Datenbank“ bei sich zu Hause in New York zusammengestellt und über 180.000 Zettel in Zigarettenschachteln aufbewahrt. Tragischerweise starb sie zwei Jahre bevor dieser mysteriöse Code von Ventris im Jahr 1952 geknackt wurde.

Zwischen ihnen dauerte es über sechs Jahrzehnte mühsame Arbeit, um die Linearschrift B zu verstehen, bei der es sich um einen Ableger der Linearschrift A Silbenschrift handelte, die von der mysteriösen minoischen Zivilisation verwendet wurde und möglicherweise nicht mit den indoeuropäischen Sprachen verwandt ist. Technologie beschleunigt jedoch die Entschlüsselung dieser alten Sprachen, nur ein Jahrhundert nach den Ausgrabungen in Knossos durch den britischen Archäologen Sir Arthur Evans (1851–1941).

Mysterium des Industals

In den 1870ern wurden aus einer Ruinenstädte in Punjab Ziegelsteine geborgen und als Ballast verwendet, um beinahe hundert Meilen Eisenbahnschiene zwischen den Städten Multan und Lahore zu untermauern. Der Armeeingenieur und archäologischer Gutachter Alexander Cunningham hatte jedoch ein paar Scherben alter Keramik sowie eine kleine Steintafel von etwa 1,5 Quadratzoll gefunden, die mit sechs unbekannten Zeichen und einem einhörnigen Stier oder Nashorn (oder vielleicht sogar einem Einhorn) graviert waren.

Seitdem wurden weitere 4.000 Reliquien ausgegraben, die meisten in der Nähe des Indus-Flusses in Pakistan, mit anderen in Indien und sogar im Irak. Mit bis zu 700 einzigartigen Symbolen scheint es wahrscheinlich, dass sie als Stempel zur Besteuerung und Handelskontrolle dienten und möglicherweise von rechts nach links gelesen wurden. Niemand weiß jedoch, was diese prävedischen Zeichen bedeuten, trotz den über Hundert im letzten Jahrhundert veröffentlichten Versuchen. Dieser Vorgang gewinnt jedoch an neuer Dynamik Dank der modernen Technologie der KI.

Grenzen des tiefen Lernens

Experten wie die Indus-Schrift-Forscherin Bahata Ansumali Mukhopadhyay sind sich den Grenzen der leistungsstärksten Rechner sehr bewusst. Sie glaubt, dass viele kognitive Aspekte nicht in praktische Rahmenwerke codiert werden können, da die aktuellen KI-Iterationen nicht in der Lage sind, mit Informationen zu arbeiten, die nicht so quantifizierbar sind, dass sie von Rechnern verstanden werden.

Selbst tiefes Lernen—aktuell die dominante KI-Technik—ist nur eine Form der Mustererkennung, wobei sich das Arbeitsergebnis parallel zu der Menge an in das System eingespeisten Informationen verbessert. Dieser Daten-nach-Wagenladung-Ansatz stockt jedoch bei Sprachen mit wenigen Ressourcen wie die alten Sprachen, welche oft unvollständig, angeschlagen und durch die Zeit erodiert sind. Gelehrte (und Rechner) können nicht herausfinden, ob ein Kratzer ein Symbol mit einer neuen Bedeutung ist oder einfach nur ein zufälliger Schaden.

Was liegt vor uns?

Selbst Liebhaber des maschinellen Lernens—wie MIT-Wissenschaftler Jiaming Luo—erwarten keine sofortigen Übersetzungen von verlorenen Sprachen, die automatisch durch irgendeine „Archäo-Trans“-App ausgespuckt werden können. Bestenfalls geht er davon aus, dass diese Sprachfragmente im Vergleich zu gegenwärtigen Sprachen in den umgebenden Regionen analysiert werden können, um Fragmente von sprachlichen Verbindungen zu suchen.

Er hat das Gefühl, dass ein hybrider Ansatz am wahrscheinlichsten positive Ergebnisse liefern wird. Zuerst könnte die rohe Gewalt von massiven Computern verwendet werden, um Artefakte zu untersuchen und mögliche Beziehungen zu bekannten Sprachen ausfindig zu machen. Dies könnte Jahrzehnte an Arbeitsaufwand ersparen, den die damaligen Orthographisten benötigten, sodass die heutigen Experten sich mit subtileren Aspekten befassen können, wobei Inspiration blinde Vertrauensvorschüsse gewähren kann.

Kernpunkt: Alphabete und Symbole sind einzigartige Abbilder der Zivilisationen, die sie früher einmal verwendet haben. Tausende Jahre später ist es ziemlich eindeutig, dass sogar die ausgeklügeltsten Maschinen immer noch nicht das menschliche Gehirn ersetzen, insbesondere was die Übersetzung von Gedanken und Konzepten betrifft, die jede Gesellschaft einzigartig machen.

Bild von Peace,love,happiness von Pixabay