TMX : mémoire de traduction en format XML

Dans une précédente publication, j’ai expliqué que le format XML est à présent un standard en ce qui concerne l’échange d’informations. Il existe par ailleurs des formats XML spécifiques qui sont eux aussi devenus relativement communs dans le domaine de la traduction. Deux d’entre eux sont : TMX (pour échanger des mémoires de traduction) et XLIFF (un format qui participe du processus de traduction lui-même). Je m’attarderai ici sur le format TMX.

Un fichier TMX est, de même que tous les fichiers XML, un fichier de texte plat avec des tag (tags) bien intégrées. Cependant, dans ce cas précis, les tag ont une structure de nom spéciale qui facilite l’identification de fragments particulier de données.

Le contenu principal du fichier est une série d’tag « tu », chacune ayant des tag « tuv », lesquelles contiennent les segments dans une langue donnée.

<tu>
<tuv xml:lang=”EN-GB”>
<seg>General provisions</seg>
</tuv>
<tuv xml:lang=”ES-ES”>
<seg>Dispositions générales</seg>
</tuv>
</tu>

Ce fragment montre le segment « General provisions » et son équivalent en français. Le segment lui-même est contenu dans une étiquette « seg » avec l’attribut xml:lang qualifiant la langue appropriée.

Une des raisons pour lesquelles nous considérons que ce format convient parfaitement vient de l’entraînement de moteur de traduction automatique. L’entrainement de moteur de traduction requière des textes bilingues de haute qualité. Celle-ci se mesure selon deux axes, la linguistique et la technique. La capacité des traducteurs humains apporte la qualité linguistique. La qualité technique est assurée par le fait que les segments proviennent de mémoires de traduction offrant des coïncidences parfaites entre la langue source et la langue cible.

Tous les outils de traduction assistée (CAT Tools) que je connais supportent le format TMX. Indépendamment de l’outil de traduction assistée utilisé, depuis qu’il est assez simple d’exporter ces mémoires au format TMX nous pouvons faire un bon usage du contenu de traduction accumulé au fil du temps.

Si vous souhaitez que votre entreprise s’essaie aux bénéfices de la traduction avec cette technologie, contactez-nous pour un devis gratuit.

Étiquettes : traduction automatique, TM, XML, outils de traduction assistée

Version originale en anglais : https://www.trustedtranslations.com/tmx-translation-memories-in-xml-format-2012-03-17.html

Version en espagnol : https://www.trustedtranslations.com/tmx-memorias-de-traduccion-en-formato-xml-2012-03-22.html