Google Traduction s’étend avec 24 langues supplémentaires

« Les langues sont profondément liées aux vies, aux cultures, aux groupes ethniques et aux organisations politiques ».

Roberto Zariquiey, Linguiste

Université pontificale catholique du Pérou

Ces 24 langues récemment arrivées comptent plus de 300 millions de locuteurs dans des dizaines de pays à travers le monde, portant le nombre total de langues inclues dans Google Traduction (Google Translate) à 133. Elles sont parlées principalement en Afrique, au sud de l’Asie et en Amérique du Sud et représentent le plus grand contingent de langues depuis de l’addition de 16 nouvelles langues en 2010. Cinq autres langues ont été également ajoutées à la plateforme en 2020.

Cette plateforme innovante, soutenue par un modèle de traduction automatique que Google a nommé zero-resource, zero-shot, peut apprendre à traduire dans d’autres langues sans jamais voir d’échantillons écrits.

C’est une grande avancée pour les langues de tradition orale, notamment dans les domaines des soins médicaux et de l’éducation. Dans les zones rurales, les professionnels de la santé et les enseignants formés dans des institutions conventionnelles ont souvent du mal à communiquer avec la population locale en parlant uniquement en langues indigènes.

Comment fonctionne-t-il Google Traduction ?

En termes simples, Google Traduction fonctionne grâce à l’entraînement. Près d’une centaine de langues riches en données alimentent un grand moteur d’intelligence artificielle (le cerveau de la plateforme) qui applique ces connaissances à des dizaines d’autres langues. Ensuite, le moteur commence à trouver les significations possibles des mots et des phrases en fonction de sa connaissance d’autres langues.

Cependant, Google lui-même admet que ce résultat est loin d’être parfait, surtout en ce qui concerne les langues minoritaires. Selon le chercheur Isaac Caswell, de Google Traduction, la traduction automatique est idéale pour transmettre des idées rapidement et au moindre coût, même si une grande partie de la subtilité d’une langue (et parfois une grande partie du sens des mots) est perdue dans le processus.

Pourquoi ces 24 langues sont-elles importantes ?

Missionnaires, médecins et marketeurs n’hésitent pas à communiquer avec le public dans leur propre langue. Cependant, certains facteurs culturels présentent des obstacles. Google Traduction inclut depuis longtemps des langues européennes minoritaires (islandais, frison, corse et maltais) qui comptent moins d’un million de locuteurs chacune, mais a laissé de côté des langues d’Afrique de l’Est (par exemple, l’oromo, le tigrigna) qui ont des millions de locuteurs.

Ce dernier groupe de langues est un bon début pour inverser cette situation et aider des millions de personnes dont les langues maternelles ne sont pas bien représentées dans la technologie actuelle. Conçues comme un marchepied pour des communautés qui visent se mettre à jour dans le monde moderne, ces derniers ajouts se concentrent en trois groupes selon le continent d’origine.

  • Afrique : bambara, éwé, krio, lingala, luganda, meitei, oromo, kurde sorani, tigrigna, sotho du Transvaal, tsonga et twi
  • Sud d’Asie : assamais, sanskrit, bhojpuri, divehi, dogri, ilocano, konkani, maïthili et mizo
  • Amérique du Sud : aymara, guarani et quechua

La taille de ces communautés linguistiques varie entre 300 000 locuteurs de divehi aux Maldives, 50 millions de locuteurs de bhojpuri au Népal, aux Fidji et dans le nord de l’Inde, et 45 millions de locuteurs de lingala en Afrique centrale.

Simplifier les communications pour renforcer les communautés

Le géant américain de la technologie considère ces ajouts comme bien plus qu’un évènement marquant du développement technologique et est déterminé à briser les barrières linguistiques qui séparent les peuples. La dernière plate-forme de traduction I/O de Google innove en forgeant des liens avec des communautés linguistiques énormes mais mal desservies, comme les dix millions de locuteurs de quechua en Amérique du Sud.

L’usage officiel du quechua, qui était la lingua franca du vaste Empire inca, dont le territoire s’étendait de ce qui est aujourd’hui le centre du Chili au sud de la Colombie, a décliné après l’expansion de la conquête espagnole à travers le Nouveau Monde. Cependant, le quechua, ainsi que l’aymara, est encore langue officielle au Pérou et en Bolivie.

Traduction automatique : Le premier pas dans ton voyage communicationnel

Pour ses nombreux utilisateurs, la traduction automatique offre deux avantages imbattables par rapport à ses homologues humains : elle est instantanée et gratuite.

Cependant, la qualité de la traduction automatique à l’état brut est encore loin d’être entièrement acceptable. C’est pourquoi de nombreux clients choisissent une méthode hybride pour répondre à leurs besoins de traduction qui permet d’économiser du temps et de l’argent : la post-édition de la traduction automatique (MTPE).

Cette méthode offre le meilleur des deux mondes : les éditeurs MTPE expérimentés peuvent post-éditer un texte, c’est-à-dire améliorer la qualité de la traduction automatique et la rapprocher du niveau des traductions humaines, en deux fois moins de temps qu’il faudrait à un traducteur pour le traduire.

Comment choisir entre la traduction humaine et la MTPE ?

Dans le domaine de la traduction, il n’y a pas de solution universelle. Chaque document est unique et sa traduction peut prendre plus ou moins de temps. Cela doit être déterminé au cas par cas. La solution la plus efficace c’est d’obtenir un devis auprès les experts de Trusted Translations qui s’adapte à ton budget et à tes délais.

Photo de Jess Baily sur Unsplash