Oude Kleitabletten en AI Vertaling

Wanneer je teksten van de ene taal naar de andere vertaalt is het van groot belang dat je op zorgvuldige wijze zinnen construeert die de boodschap van de bronteksten kunnen overbrengen. Het gaat derhalve niet om oppervlakkige woord-voor-woord vertalingen van de brontaal in de doeltaal. Vanwege de nuance binnen het stuk als geheel is een zekere mate van flexibiliteit van groter belang dan de geïsoleerde betekenis van de aparte bestanddelen die het geheel vormen.

Automatische vertaling is de afgelopen jaren continu in dit proces ontwikkeld en dat heeft de voorbije jaren aanzienlijke verbeteringen opgeleverd. Om de kracht van kunstmatige intelligentie binnen van de verwerking van natuurlijke talen verder te onderbouwen hebben onderzoekers recent een AI vertaalmachine ingesteld om vertalingen van 5000 jaar oude Akkadische kleitabletten te leveren.

De Uitdaging van Dode Talen

Dit is vooral indrukwekkend omdat de uitdagingen die met vertalen gepaard gaan alleen groter worden wanneer de brontaal al duizenden jaren uitgestorven is. Dat geldt voor het Akkadisch, een vroeg-Semitische taal zonder dochtertalen. Deze talen zijn zeer waardevol om te bestuderen, al was het alleen maar om inzicht te krijgen in het leven, de politiek en levensovertuigingen binnen oude beschavingen. Een poging daartoe biedt inzicht in onze eigen plek binnen de wereldgeschiedenis.

Voorzichtige ramingen schrijven honderdduizenden teksten die door archeologen zijn ontdekt aan het Akkadisch toe. Vele zijn inmiddels gedigitaliseerd. Niettemin kan slechts een handvol onderzoekers de teksten ook maar enigszins begrijpen. Voor zover zij de teksten wel konden begrijpen was dat slechts fragmentarisch, aangezien veel context door het verstrijken van de tijd verloren is gegaan, ondanks dat het op klei geschreven is. Klei bewaart tekst door de eeuwen heen veel beter dat ander materiaal zoals papyrus.

Het is precies het fragmentarische begrip die de moeilijkheidsgraad van de vertaling zo verhoogt, iets dat verergerd wordt door het gebrek aan experts in deze talen. Helaas werken zowel tijd als mankracht die voor het vertalen van dergelijke documenten noodzakelijk zijn pogingen daartoe tegen.

AI Vertalers

Om dit probleem kleiner te maken heeft een team van archeologen en computerwetenschappers een AI vertaalmachine ontwikkeld die vanuit het Akkadisch kan vertalen. Het werkt onmiddellijk volgens eenneuraal machinevertaling (NMT) model dat specifiek voor deze taal is ontworpen.

Akkadisch staat ook wel te boek als een ‘polyvalente’ taal, waarin de betekenis van de symbolen afhankelijk is van de functie binnen de zin. Hierdoor hebben vertalers te maken met een zogeheten tweestapsproces In de eerste plaats moeten zij de brontekst doornemen en herschrijven terwijl ze fonetische overeenkomsten met de doeltaal, ook wel transliteratie geheten, gebruiken. Dat houdt in dat ze de worden reconstrueren door een letter uit het Latijnse alfabet te gebruiken die het woord in de brontaal zoveel mogelijk benadert. Een algemeen bekend voorbeeld van een dergelijk proces is het Arabische woord voor God, الله, dat met ‘ Allah’ vertaald wordt. Wanneer dit eenmaal gedaan is, vertalen ze de nieuwe tekst in de doeltaal.

Om die reden is NMT zodanig ontwikkeld dat het zowel spijkerschrift als de transliteratie daarvan kan verwerken. Bij het gebruik van een algoritme dat is ontworpen om machinaal vertaalde teksten te evalueren, scoorde het model respectievelijk 37,47 en 36,52. Dit proces staat bekend als de bilingual evaluation understudy 4( BLEU4). Elk van beide scores bevonden zich binnen de bandbreedte die op een kwalitatief hoogwaardige vertaling geldt.

NMT schiet op een aantal functionaliteiten tekort. Het kan langere zinnen niet heel goed verwerken, en raakt de context snel kwijt wanneer het met de meer ”literaire genres” te verwerken krijgt, tegenover genres die meer ‘ standaardtaal’ bevatten, zoals vonnissen en dossiers. Buiten deze tekortkomingen is het zeer accuraat in het herkennen van specifieke genres, wat een tijdsbesparende functionaliteit is.

In enkele gevallen produceerde het model resultaten die overduidelijk geen verband hielden met de ingevoerde tekst. De onderzoeken bestempelden deze resultaten als ” hallucinaties” van AI.

Een Gezamenlijke Inspanning

Wat is nu de rol van de vertalers? De technologie fungeert grotendeels als een nuttig hulpmiddel, dat aanstuurt op een snelle en accurate vertaling. Het merendeel van het werk komt nog steeds voor rekening van een menselijke vertaler: zelfs als een vertaling de kwaliteitsdrempel haalt, moet deze beoordeeld, geredigeerd en zelfs herzien worden. Deze processen kunnen, voorlopig althans, het best door mensen worden uitgevoerd.

Tegenwoordig is het NMT model toegankelijk via een online notebook, en de broncode is beschikbaar gesteld op GitHub onder de projectnaam ”Akkademia.” Deze technologie is voor iedereen beschikbaar. Het vertalen van de oude wereld wordt aanzienlijk eenvoudiger en meer toegankelijk door op een manier te werken, waarbij onderzoekers dergelijke NMT modellen gebruiken.

Wanneer het echter de moderne wereldwijd gesproken talen betreft, zal de vertaalservice van Trusted Translations,dat professionele vertalers en taalkundigen van over de hele wereld in dienst heeft, alles doen om in uw behoefte aan professionele vertalingen te voorzien.

Foto door Bilge Şeyma Kütükoğlu op pexels.com