Los glosarios en la traducción automática

En el ámbito de la traducción automática usamos el término “glosario” de manera diferente a la tradicional, es decir, una lista de términos con explicación, ordenados alfabéticamente. Para nosotros es una asociación de frases en diferentes idiomas. Se usa para traducir ciertas combinaciones de palabras de una forma en particular. Por lo general, los idiomas son dos, y hay una dirección implícita entre ellos, pero el mecanismo es lo suficientemente sencillo como para funcionar bien no sólo en la dirección inversa, sino también con más de dos idiomas. La diferencia entre idioma de origen y meta es un poco artificial en este contexto, pero la mantendremos por simplicidad en lo que sigue a continuación.

Además, para lo que quiero demostrar, el idioma meta no es importante, entonces para ejemplificar los puntos incluidos, usaré el siguiente ejemplo: “presione la tecla de inicio” -> “X Y Z“, significa que estas cuatro palabras en particular en inglés deben traducirse por “X Y Z”, y representan no necesariamente palabras, sino también ideogramas o cualquier otra anotación que se utilice en el idioma meta.

Veamos lo que sucede cuando queremos traducir una oración como “Cuando esté preparado para comenzar, presione la tecla de inicio y espere que se encienda la luz azul”.

Ahora podemos proceder de dos maneras:

Hacer el reemplazo en el idioma de origen antes de mandar el documento a traducir. La oración que enviamos al motor es “Cuando esté preparado para comenzar, presione X Y Z y espere que se encienda la luz azul”. Las palabras y símbolos extraños son lo suficientemente distintos del español para no confundir al motor. Aun así, podemos ver que hay problemas posibles que opacan esta solución. Cualquier entrenamiento del motor basado en fragmentos como “presione la tecla de inicio y espere” se perdería.
Averigüe cómo el motor traduciría “presione la tecla de inicio” por su cuenta y realice el reemplazo en el documento meta una vez que se haya traducido. Por ejemplo, la oración se traduce por “A B C”. Entonces “A B C” será un fragmento de la traducción de la oración completa. En este caso es directo reemplazarla por el contenido indicado en el glosario. Sin embargo, es posible, incluso probable, que cuando este fragmento se traduzca como parte de una oración más larga el contenido extra cambie la traducción y “A B C” no aparezca (con el contenido extra puede traducirse, por ejemplo, “A B C D”).

Entonces vemos que una tarea aparentemente sencilla como usar un glosario se vuelve problemática en el contexto de la traducción automática.

En mi opinión, la mejor manera de solucionar este problema es realizar la opción número dos, y luego marcar los casos en que el idioma meta no contiene el fragmento correspondiente.

Este es uno de los desafíos que debemos enfrentar para llegar a una solución en este nuevo campo de la traducción automática. Póngase en contacto con nosotros para recibir una cotización gratis si le interesa usar esta nueva tecnología.

 

Traducción del original de Pablo A.