La traduction automatique hallucine-t-elle des moutons électriques ?

Les robots ne rêvent peut-être pas, mais ils ont bien des hallucinations. L’intelligence artificielle étant au centre de l’attention des médias ces derniers temps, la tendance de la technologie basée sur les algorithmes à « halluciner » est devenue une préoccupation majeure concernant l’utilisation de l’IA, et c’est également le cas dans le domaine de la traduction automatique.

Dans cet article, nous examinerons ce que sont les hallucinations de traduction automatique, pourquoi elles se produisent et comment éviter que ce sérieux problème n’affecte vos projets de traduction potentiels.

Qu’est-ce qu’une hallucination de traduction automatique ?

La traduction automatique utilise des logiciels informatiques – généralement des solutions d’intelligence artificielle ou d’apprentissage automatique – pour traduire un texte d’une langue à une autre, en opposition à la traduction humaine. Si la traduction automatique permet de gagner du temps et de l’argent, ces machines peuvent malheureusement aussi produire des hallucinations : des traductions qui n’ont rien à voir avec l’original (et qui sont souvent étranges).

Par exemple, une expérience de traduction automatique a révélé que le modèle utilisé hallucinait des histoires totalement inventées. La phrase originale était une déclaration sur une grève en cours en Colombie ; après être passée par Google Translate en Marathi et avoir été retraduite en anglais par le traducteur automatique, la phrase s’est transformée en une déclaration totalment à côté de la plaque sur des enfants américains servant au sein des Témoins de Jéhovah. Comme le montre cet exemple, les hallucinations sont particulièrement fréquentes lors de la traduction de l’anglais vers des langues moins répandues, pour lesquelles le traducteur automatique ne dispose pas d’autant de données fiables.

Pourquoi les hallucinations se produisent-elles ?

Certaines hallucinations de traduction automatique neuronale (NMT) sont causées par une « perturbation de la source », c’est-à-dire un élément inattendu dans la source qui altère par conséquent le résultat. La source peut comporter une faute de frappe, un style étrange, un mot inhabituel ou un mot qui n’est tout simplement pas pris en compte dans le modèle.

D’autres hallucinations proviennent de problèmes sous-jacents liés aux données utilisées pour entraîner le modèle. Les chercheurs ont découvert, par exemple, que certains modèles ont des problèmes de surmémorisation des phrases, c’est-à-dire des phrases tellement mémorisées par la machine qu’elle veut les répéter exactement de la même manière à chaque fois, sans tenir compte du contexte ou de l’expression idiomatique. Une quantité élevée de « bruit » dans le corpus de données d’entraînement – trop de paires erronées ou mal alignées entre les phrases source et cible – peut également entraîner des hallucinations.

Et lorsqu’il s’agit de modèles basés sur le LLM comme ChatGPT, l’image est tout aussi troublante. Outre les traductions hors cible et les erreurs de traduction, les données d’entraînement peuvent également contenir des éléments toxiques qui se glissent dans le résultat de la traduction.

Comment éviter les hallucinations de traduction

Comme vous pouvez l’imaginer, les hallucinations de traduction automatique peuvent avoir des conséquences désastreuses pour une entreprise, pouvant entamer la confiance des utilisateurs et poser de graves problèmes de sécurité. Bien qu’il existe des moyens d’affiner les machines elles-mêmes, le seul moyen éprouvé de remédier aux hallucinations est de faire appel à un traducteur humain, un vrai traducteur professionnel.

Le recours à la traduction humaine ne signifie pas que vous ne pouvez pas utiliser la traduction automatique comme première étape d’un projet important. Au contraire, vous pouvez engager un traducteur humain pour nettoyer le « premier jet » de la traduction automatique dans le cadre d’un processus connu sous le nom de post-édition. Non seulement les post-éditeurs reverront et corrigeront vos traductions automatiques, en les peaufinant, mais leurs retraductions peuvent également être incorporées dans la mémoire de la machine, améliorant ainsi son « entraînement » pour les projets futurs.

Pour obtenir les meilleurs résultats, vous devez faire appel à des linguistes professionnels spécialement formés à la post-édition de traductions automatiques, comme nos experts post-éditeurs chez Trusted Translations, qui suivent un processus rigoureux pour garantir la qualité de chaque traduction.

Image par Enrique de Pixabay