L’intelligenza artificiale è in grado di decifrare le lingue andate perdute?

Celebrate in tradizioni e leggende, le civiltà antiche e le loro lingue ormai dimenticate affascinano da tempo immemore gli storici, gli archeologi e i linguisti. Al giorno d’oggi questi ricercatori dispongono di un nuovo strumento: l’Intelligenza artificiale, una tecnologia che può aiutare a svelare i segreti di società scomparse da millenni.

I geroglifici e la Stele di Rosetta

Dalla scrittura cuneiforme dei Sumeri alle iscrizioni etrusche di epoca pre-romana, per secoli accademici e appassionati hanno condotto osservazioni nel tentativo di decifrare le lingue antiche. Fra di essi spicca Jean-Francois Champollion (1790-1832), un giovane studioso francese che ha decifrato uno dei sistemi di scrittura antichi più famosi: i geroglifici egizi. Per farlo ha utilizzato la celebre Stele di Rosetta. Su questa stele di granodiorite vennero incise parti dello stesso testo in tre lingue: 32 righe in demotico, 14 righe di geroglifici e 54 righe in greco.

La scrittura cuneiforme e altri enigmi dell’antichità

Un altro esempio affascinante è la lingua ugaritica. Scoperta dagli archeologi francesi nel 1929 su una serie di tavolette di argilla ritrovate negli anni Venti presso la collina di Ugarit, è scritta in un alfabeto cuneiforme consonantico. Questa lingua semitica nord-occidentale estinta veniva utilizzata dagli studiosi ebraici che analizzavano i testi in ebraico classico, svelando somiglianze fra l’antico Israele e la Giudea e le culture limitrofe.

Ovunque nel mondo si trovano numerosi testi misteriosi ancora da decifrare, come il Manoscritto Voynich (Europa), la Pietra di Cascajal (America centrale) e il Rongorongo (Isola di Pasqua).

Misteri dell’Età del Bronzo

Forse l’esempio più conosciuto in epoca moderna è la Lineare B, inizialmente ritrovata fra rovine cretesi risalenti all’Età del Bronzo. Anche se la decifrazione della Lineare B (attualmente considerata la forma più precoce di ortografia greca, sviluppata intorno al 1400 A.C.) viene generalmente attribuita all’architetto Michael Ventris, le sue scoperte vennero supportate dalla studiosa classicista Alice Kober che, nella propria abitazione di New York, creò quello che si potrebbe definire un predecessore analogico di database archiviando circa 180.000 strisce di carta nelle scatole delle sigarette. Purtroppo Alice Kober morì due anni prima che questo misterioso sistema di scrittura venisse decifrato da Ventris nel 1952.

Sommando i loro sforzi, ci sono voluti oltre sessant’anni di impegno scrupoloso per comprendere la Lineare B, che costituisce una branca del sillabario Lineare A utilizzato dalla misteriosa civiltà minoica e forse non correlato alle lingue indoeuropee. Tuttavia, la tecnologia sta velocizzando la decifrazione di queste lingue antiche, a un solo secolo di distanza dagli scavi di Cnosso effettuati dall’archeologo britannico Sir Arthur Evans (1851–1941).

Il mistero della valle dell’Indo

Nel corso degli anni Settanta del XIX secolo i mattoni recuperati da una città in rovina nel Punjab vennero utilizzati come rinforzo per quasi cento miglia di binari ferroviari tra le città di Multan e Lahore. Tuttavia, l’ingegnere militare e geometra archeologico Alexander Cunningham ritrovò alcuni frammenti di antiche ceramiche e una minuscola tavoletta di pietra di circa 1,5 pollici quadrati con incisi sei caratteri sconosciuti e un toro o rinoceronte con un corno solo (ma potrebbe trattarsi anche di un unicorno).

Da allora sono state portate alla luce qualcosa come altre 4.000 reperti storici, la maggior parte dei quali lungo il fiume Indo in Pakistan, altri in India e perfino in Iraq. Con oltre 700 simboli unici, sembra probabile che venissero utilizzati come sigilli di tassazione e controllo commerciale, forse letti da destra a sinistra. Tuttavia, nessuno sa cosa significhino questi simboli di epoca pre-vedica, nonostante gli oltre cento tentativi di traduzione pubblicati nel secolo scorso; attualmente però si è verificato un nuovo slancio guidato dalla tecnologia all’avanguardia basata sull’intelligenza artificiale.

I limiti dell’apprendimento automatico

Gli esperti come Bahata Ansumali Mukhopadhyay, ricercatrice di testi indù, sono ben consapevoli dei limiti dei computer, anche di quelli più potenti. Questa studiosa ritiene che molti aspetti cognitivi non possano essere codificati in strutture comode, poiché le attuali iterazioni dell’IA non sono in grado di far fronte a informazioni non quantificabili in modi comprensibili al computer.

Perfino il deep learning, che attualmente costituisce la tecnica di IA più largamente diffusa, si basa esclusivamente sul riconoscimento di pattern e i suoi output migliorano di pari passo con la quantità di informazioni inserite nel sistema. Tuttavia, questo approccio basato sul carico di lavoro vacilla per le tematiche a basso contenuto di risorse, come le lingue antiche, che spesso risultano incomplete, frammentate ed erose dal tempo. Gli studiosi (e i computer) non hanno modo di sapere se un graffio conferisce un nuovo significato a un certo simbolo o se si tratta solo di un danno accidentale.

Quali sono le prospettive?

Perfino gli esperti di machine learning, come lo scienziato del MIT Jiaming Luo, non si aspettano che qualche app di traduzione archeologica sforni automaticamente traduzioni istantanee delle lingue perdute. Nella migliore delle ipotesi, Luo prevede di analizzare questi frammenti linguistici confrontandoli con le lingue contemporanee delle regioni circostanti in cerca di frammenti di collegamenti linguistici.

Lui ritiene che un approccio ibrido abbia le maggiori probabilità di portare a risultati utili. Inizialmente si potrebbe sfruttare la potenza dei computer più imponenti per esaminare gli artefatti e trovare possibili relazioni con linguaggi conosciuti. Ciò potrebbe consentire di risparmiarsi i decenni di sforzi che in passato erano necessari agli studiosi, consentendo agli esperti odierni di concentrarsi sugli aspetti più delicati, seguendo l’ispirazione a procedere oltre.

Morale: Alfabeti e simboli sono un riflesso unico delle civiltà che li utilizzano. Migliaia di anni dopo è piuttosto evidente che anche le macchine più sofisticate non sono in grado di eguagliare il cervello umano, in particolare nella traduzione dei pensieri e concetti che rendono unica ogni società.

Immagine di Peace, love, happiness di Pixabay