BLOG IN ANDERE TALEN

Blog de traducción
Blog di traduzione
Blog de traduction
Übersetzungsblog
Blog de tradução
Vertaal Blog
翻訳ブログ
 Блог на тему перевода
翻译博客
 مدونة الترجمة
번역 블로그

Home » Blog » Talen » Kan kunstmatige intelligentie uitgestorven talen ontcijferen?

Kan kunstmatige intelligentie uitgestorven talen ontcijferen?

september 28, 2022
Rafael Dos Santos
Tags: AI, deep learning, dode talen, machine leren, machine vertaling, oude talen, uitgestorven talen, verdwenen talen

De oude beschavingen en hun vergeten talen, welke gevierd werden in overlevering en legende, hebben historici, archeologen en taalkundigen lang gefascineerd. Vandaag hebben deze onderzoekers een nieuw instrument in hun professionele gereedschapskist: Kunstmatige intelligentie, een technologie die de geheimen kan ontrafelen van samenlevingen die millennia geleden verdwenen zijn.

Hiërogliefen en de Steen van Rosetta

Van Sumerisch spijkerschrift tot pre-Romeinse Etruskische inscripties, zowel academici als amateurs hebben zich eeuwenlang over deze overblijfselen gebogen. Onder hen was Jean-Francois Champollion (1790-1832), een jonge Fransman die een van de bekendste oude schrijfsystemen ontcijferde: Egyptische hiërogliefen. Daarvoor gebruikte hij de beroemde Steen van Rosetta. Op deze zuil van granodioriet stonden fragmenten van dezelfde tekst in drie schriften: 32 regels Demotisch, 14 regels hiërogliefen en 54 regels Grieks.

Spijkerschrift en andere oude geheimen

Een ander intrigerend voorbeeld is het Ugaritisch. Het werd in 1929 door Franse archeologen ontdekt op een reeks kleitabletten die in de jaren twintig in de Tell van Ugarit werden gevonden en is geschreven in een spijkerschrift alfabet van medeklinkers. Deze uitgestorven Noordwest-Semitische taal werd gebruikt door Hebreeuwse geleerden die Bijbels-Hebreeuwse teksten analyseerden en zo overeenkomsten ontdekten tussen het oude Israël en Juda en hun naburige culturen.

Elders in de wereld zijn er nog veel mysterieuze teksten die ontcijferd moeten worden, zoals het Voynich Manuscript (Europa), het Cascajal Block (Midden-Amerika) en Rongorongo (Rapa Nui/Paaseiland).

Mysteries uit de Bronstijd

Het bekendste voorbeeld in de moderne tijd is wellicht Lineair B, dat aanvankelijk werd gevonden bij Kretenzische ruïnes uit de Bronstijd. Hoewel aan de Britse architect Michael Ventris meestal de ontcijfering van het lineair B wordt toegeschreven – nu erkend als de vroegste vorm van Griekse orthografie en ontwikkeld rond 1400 v.C. – werden zijn inspanningen ondersteund door de classicus Alice Kober. Zij stelde in haar huis in New York een primitieve analoge “database” samen, waarin ongeveer 180.000 papiertjes in sigarettendoosjes werden opgeborgen. Tragisch genoeg stierf ze twee jaar voordat deze mysterieuze code door Ventris in 1952 werd gekraakt.

Samen kostte het meer dan zes decennia van nauwgezette inspanningen om Lineair B te begrijpen, dat een uitloper is van het Lineair A syllabarium, gebruikt door de mysterieuze Minoïsche beschaving en mogelijk niet verwant aan de Indo-Europese talen. De technologie versnelt echter de ontcijfering van deze oude talen, slechts een eeuw na de opgravingen van Knossos door de Britse archeoloog Sir Arthur Evans (1851-1941).

Indus Vallei Mysterie

In de jaren 1870 werden bakstenen, geborgen uit een verwoeste stad in Punjab, gebruikt als ballast voor een bijna honderd mijl lange spoorlijn tussen de steden Multan en Lahore. Maar legeringenieur en archeologisch onderzoeker Alexander Cunningham vond een paar scherven oud aardewerk en een vierkante kleine stenen tablet van ongeveer 4 cm een zijde, met daarop zes onbekende tekens en een stier met één hoorn of neushoorn (of misschien zelfs een éénhoorn).

Sindsdien zijn zo’n 4000 andere relikwieën opgegraven, de meeste langs de Indus rivier in Pakistan en weer andere in India en zelfs Irak. Ze bevatten tot 700 unieke symbolen en werden waarschijnlijk gebruikt als zegels voor belastingen en handelscontrole en werden mogelijk van rechts naar links gelezen. Niemand weet echter wat deze pre-Vedische tekens betekenen, ondanks meer dan honderd pogingen die in de afgelopen eeuw zijn gepubliceerd, maar er is een nieuw momentum die wordt aangestuurd door de geavanceerde technologie van AI.

Beperkingen van Deep Learning

Deskundigen zoals Indus script onderzoeker Bahata Ansumali Mukhopadhyay zijn zich terdege bewust van de beperkingen van zelfs de krachtigste computers. Zij gelooft dat veel cognitieve aspecten niet kunnen worden gecodeerd in handige kaders, omdat de huidige AI iteraties niet kunnen omgaan met informatie die niet kwantificeerbaar is op een manier die computers begrijpen.

Zelfs Deep Learning – momenteel de dominante AI-techniek – is slechts een kwestie van patroonherkenning, waarbij de output verbetert naarmate het systeem meer informatie ingevoerd krijgt. Deze aanpak van volstoppen met data faalt echter bij onderwerpen met weinig hulpbronnen, zoals oude talen, die vaak onvolledig zijn, beschadigd en uitgehold door de tand des tijd. Geleerden (en computers) kunnen niet weten of een kras een symbool een nieuwe betekenis geeft, of dat het gewoon een toevallige beschadiging is.

Wat ligt er in het verschiet?

Zelfs liefhebbers van machinaal leren, zoals MIT-wetenschapper Jiaming Lu, verwachten niet dat onmiddellijke vertalingen van verloren talen automatisch worden gemaakt door een of andere “archeo-trans” app. In het beste geval overweegt hij deze taalfragmenten te analyseren aan de hand van hedendaagse talen in hun omliggende streken, op zoek naar fragmenten van taalkundige verbanden.

Hij meent dat een hybride aanpak de meeste kans op positieve resultaten biedt. Aanvankelijk kon de brute kracht van enorme computers worden gebruikt om artefacten te onderzoeken en mogelijke verbanden met bekende talen op te sommen. Dit zou de decennialange inspanning van vroegere orthografen kunnen opslaan, waardoor de deskundigen van vandaag de subtielere aspecten kunnen overnemen, met inspiratie die aanzet tot blind vertrouwen.

Uitgangspunten: Alfabetten en symbolen zijn unieke weerspiegelingen van de beschavingen die ze ooit gebruikten. Duizenden jaren later is het overduidelijk dat zelfs de meest geavanceerde machines nog steeds niet kunnen tippen aan het menselijk brein, vooral voor het vertalen van de gedachten en concepten die elke samenleving uniek maken.

Afbeelding van Vrede, Liefde, Geluk door Pixabay