¿La traducción automática alucina ovejas eléctricas?

Puede que los robots no sueñen, pero sí alucinan. Últimamente, con la inteligencia artificial en el centro de la atención de los medios, la tendencia de los algoritmos a alucinar se ha convertido en una preocupación grave con respecto al uso de las IA, y el campo de la traducción automática no es una excepción.

En esta publicación, examinaremos qué son las alucinaciones de la traducción automática, por qué ocurren y cómo evitar que este serio problema afecte a tus proyectos de traducción.

¿Qué son las alucinaciones de la traducción automática?

La traducción automática utiliza el software (normalmente inteligencia artificial o el aprendizaje automático) para traducir textos de un idioma a otro, a diferencia de la traducción humana. Si bien la traducción automática puede ayudar a ahorrar tiempo y dinero, desafortunadamente, estas máquinas también pueden producir alucinaciones: traducciones que no tienen ninguna relación con el texto y que a menudo son extrañas.

Por ejemplo, un experimento con traducción automática descubrió que el modelo utilizado alucinaba historias completamente nuevas. La frase original era una declaración sobre una huelga en Colombia; después de pasar por Google Translate al marati y luego ser traducida nuevamente al inglés mediante el traductor automático, la oración se convirtió en una declaración tremendamente equivocada sobre niños estadounidenses que servían a los testigos de Jehová. Como ilustra este ejemplo, las alucinaciones pueden ocurrir especialmente a menudo cuando se traduce del inglés a idiomas menos utilizados, sobre los cuales la máquina puede no tener tantos datos confiables.

¿Por qué ocurren las alucinaciones?

Algunas alucinaciones de traducción automática neuronal (NMT) son causadas por una «perturbación de la fuente» o un elemento inesperado en ella que, en consecuencia, contamina el resultado. El texto fuente puede tener un error tipográfico, un estilo peculiar, una palabra inusual o una palabra que simplemente no se tiene en cuenta en el modelo.

Otras alucinaciones surgen de problemas subyacentes con los datos utilizados para entrenar al modelo. Los investigadores han descubierto, por ejemplo, que algunos modelos tienen problemas con la memorización excesiva de frases, es decir, frases que la máquina memoriza tanto que quiere repetirlas exactamente de la misma manera cada vez, sin reconocer el contexto o la expresión idiomática. Una gran cantidad de «ruido» en el conjunto de datos de entrenamiento (demasiados pares erróneos o desalineados entre las oraciones fuente y meta) también puede provocar alucinaciones.

Y, cuando se trata de modelos basados en LLM, como ChatGPT, el panorama es igualmente preocupante. Además de las traducciones erróneas y las fallas o los errores en la traducción, los datos de entrenamiento también pueden contener material tóxico que se cuela en la traducción.

Cómo evitar las alucinaciones de la traducción

Como puedes imaginar, las alucinaciones de la traducción automática pueden ser desastrosas para una empresa, erosionando la confianza del usuario y causando graves problemas de seguridad. Si bien hay formas de ajustar las propias máquinas, la única forma probada y verdadera de corregir las alucinaciones más allá de toda duda es con el toque humano: un traductor humano real y profesional.

Utilizar la traducción humana no significa que no se pueda utilizar la traducción automática como primer paso en un proyecto importante. En su lugar, puedes contratar a un traductor humano para que limpie el “borrador” de la traducción automática en un proceso conocido como posedición. Los poseditores no sólo revisarán y corregirán tus traducciones automáticas, puliéndolas a un alto nivel, sino que sus retraducciones también podrán incorporarse a la memoria de la propia máquina, mejorando su entrenamiento para proyectos futuros.

Para obtener los mejores resultados, debes buscar lingüistas profesionales capacitados específicamente en posedición de traducción automática, como los poseditores expertos de Trusted Translations, quienes siguen un proceso riguroso para garantizar la calidad de cada traducción.

Imagen de Enrique en Pixabay