¿Cómo calcular las palabras de documentos complejos?

calculatorHace algunos días presentamos una primera introducción a la cuestión del recuento de palabras para proyectos de traducción. Hoy veremos algunos detalles importantes que resultarán de interés para comprender en mayor profundidad este proceso fundamental para la industria. Para ello nos valdremos de ejemplos prácticos, de casos de cotizaciones corrientes que podemos encontrarnos cualquier día en nuestro trabajo.

Un caso muy habitual es el de los documentos personales que necesitan de una traducción certificada. ¿Cuántas palabras tiene un certificado de nacimiento que recibimos escaneado? ¿Cuántas un extracto académico que detalla las calificaciones de una persona a lo largo de sus estudios? Dificil saberlo a priori, porque este tipo de documentos nunca viene en un formato editable, es decir, en el archivo propio del programa informático con el que fueron creados. En general sucede que se trata de escaneos de las versiones impresas. La mejor manera de calcular las palabras de este tipo de documentos (que suelen guardarse con la extensión .pdf o .jpg) es procesarlos con un software de reconocimiento de textos (OCR). Esto nos permitirá abrir la conversión del documento en Word, por ejemplo, y tratarla más o menos como si de un archivo .doc original se tratase. Por supuesto, estos programas de reconocimiento óptico no son infalibles, así que tendremos que afinar el cálculo en función de ese margen de error.

Otra situación cotidiana es la de cotizar archivos generados con alguna versión de Adobe InDesign. Estos suelen tener alguna finalidad comercial o de difusión profesional, y se prestan al uso de herramientas de traducción asistida, pero el proceso que tenemos que seguir para cotizarlos no es inmediato. Lo primero será convertir ese archivo .indd en algún otro formato susceptible de ser editado con CAT tools, como el .idml o el .inx. Luego, sí, podremos hacer un recuento con la herramienta que vayamos a utilizar en la traducción y, por último, sumar aquellas palabras que, por estar dentro de imágenes o gráficos no editables, no hayan sido capturadas en el proceso anterior. Esto nos permitirá determinar si existe un número elevado de repeticiones en el documento, o si, por contar con una memoria de traducción previa, nos encontramos por ejemplo ante la actualización parcial de una traducción ya completada.

En la próxima entrada comentaremos algún caso de cotización más complejo que los hasta aquí expuestos. Mientras tanto, no dude en ponerse en contacto con nuestro equipo de ventas para solicitar un presupuesto sin cargo, o utilice la sección de comentarios de esta entrada para expresar posibles dudas sobre el proceso de cotización.