Tablettes anciennes et traduction IA

Traduire entre deux langues implique de construire avec soin des phrases qui transmettent au mieux le sens du texte source. Il ne s’agit pas de traduire mot à mot. Il y a un certain degré de flexibilité, car il s’agit de saisir les nuances de la pièce dans son ensemble, plutôt que d’identifier la signification des parties constituantes.

C’est un processus dans lequel la traduction automatique a été continuellement perfectionnée, montrant des améliorations progressives au fil des ans. Dans une démonstration de la puissance de l’intelligence artificielle pour traiter les langues naturelles, des chercheurs ont récemment entraîné une IA pour effectuer des traductions approximatives de tablettes akkadiennes vieilles de 5 000 ans.

Le défi des langues mortes

C’est particulièrement impressionnant, car les défis de la traduction se multiplient lorsqu’il s’agit de traduire une langue disparue depuis des millénaires. C’est le cas de la langue des Akkadiens, une langue sémitique sans langues filles (langues dérivées ou descendantes). Ces langues valent la peine d’être étudiées, même lorsque le but est uniquement de mieux comprendre la vie, la politique et les croyances des sociétés anciennes. Une entreprise qui illumine notre propre place historique dans le monde.

Des estimations prudentes reconnaissent l’akkadien dans des centaines de milliers de textes découverts par des archéologues. Beaucoup ont déjà été numérisés. Cependant, seule une poignée d’érudits peuvent déchiffrer une partie de ces textes. Leur compréhension de ces textes est fragmentée. Une grande partie du contexte est perdue à cause des effets dégradants du temps, bien que les tablettes soient faites d’argile, qui se conserve mieux à travers les siècles que d’autres matériaux, comme le papyrus.

C’est ce nature fragmentaire qui ajoute à la complexité de la traduction, aggravée par le manque général d’experts dans ces langues. Malheureusement, le temps et la main-d’œuvre nécessaires vont à l’encontre de l’effort de traduction de ces documents.

Traducteurs IA

Pour aider à alléger ces difficultés, une équipe d’archéologues et d’informaticiens ont développé une IA pour traduire l’akkadien. Elle fonctionne instantanément, grâce à un modèle de traduction automatique neuronale (NMT) conçu pour traiter cette langue.

L’akkadien est ce que l’on appelle une langue polyvalente, c’est-à-dire que le sens des symboles varie selon leur fonction syntactique. Par conséquent, les traducteurs doivent adopter un processus en deux étapes. Premièrement, ils prennent le texte source et le réécrivent dans le système phonétique de la langue cible. Ce processus est connu sous le nom de translittération. Autrement dit, ils reconstruisent les mots en utilisant les lettres de l’alphabet latin qui correspondent le mieux aux phonèmes de la langue source. Un exemple courant de ce processus est le mot arabe الله, qui est écrit en lettres latines comme « Allah ». Une fois cela fait, ils traduisent le nouveau texte dans la langue cible.

Dans cet esprit, la NMT a été entraîné pour traiter à la fois le cunéiforme et sa translittération. En utilisant un algorithme conçu pour évaluer les textes traduits automatiquement, connu sous le nom de Bilingual Evaluation Understudy 4 (BLEU4), le modèle a obtenu un score de 37,47 et 36,52, respectivement. Chacun, dans les tolérances acceptables pour une traduction de haute qualité.

La NMT manque d’un certain nombre de fonctions. Elle a du mal à traiter de longues phrases et se perd plus facilement lors du traitement du langage littéraire ou soutenu que lors du traitement de textes formels ou protocolaires, tels que les décrets et les registres. Mis à part les défauts, la NMT est capable de reconnaître avec précision des genres spécifiques, ce qui permet de gagner du temps.

Dans certains cas, le modèle a inventé des résultats qui n’avaient apparemment rien à voir avec le texte source. Les chercheurs appellent ce phénomène les hallucinations de l’IA.

Un effort collaboratif

Qu’arrive-t-il alors aux traducteurs ? La technologie sert principalement à faciliter une traduction rapide et précise. Mais la majeure partie du travail est toujours effectuée par un traducteur humain : même si la traduction franchit le seuil des traductions acceptables, elle doit être revue, éditée et même refaite. Ces travaux, pour l’instant, sont mieux faits par un humain.

Actuellement, le modèle NMT est accessible via Internet et le code source est disponible sur GitHub, sous le nom de projet Akkademia. Cette technologie est accessible à tous. En travaillant de cette manière, avec des chercheurs utilisant de tels modèles NMT, la traduction du monde antique devient beaucoup plus facile et plus accessible.

Pourtant, lorsqu’il s’agit de langues modernes avec des millions de locuteurs, des services tels que ceux offerts par Trusted Translations, qui emploie des traducteurs et des linguistes professionnels du monde entier, contribueront grandement à répondre et à dépasser vos besoins de traduction professionnelle.

Photo de Bilge Şeyma Kütükoğlu chez pexels.com