La traduzione automatica ha allucinazioni sulle pecore elettriche?

I robot potranno anche non sognare, ma hanno le allucinazioni. Poiché ultimamente l’intelligenza artificiale è spesso al centro dell’attenzione dei media, la tendenza della tecnologia basata su algoritmi ad avere “allucinazioni” relative ai materiali è diventata una preoccupazione primaria per quanto riguarda l’utilizzo dell’IA e ciò vale anche per il campo della traduzione automatica.

In questo post esaminiamo cosa sono le allucinazioni della traduzione automatica, perché si verificano e come evitare che questo grave problema influenzi i vostri progetti di traduzione.

Cosa sono le allucinazioni nella traduzione automatica?

A differenza della traduzione umana, la traduzione automatica utilizza software informatici, solitamente soluzioni di intelligenza artificiale o di apprendimento automatico, per tradurre testo da una lingua a un’altra. Sebbene la traduzione automatica possa aiutare a risparmiare tempo e denaro, sfortunatamente le macchine possono anche produrre allucinazioni, ovvero risultati della traduzione completamente indipendenti dall’input originale (e spesso bizzarri).

Ad esempio, un esperimento con la traduzione automatica ha scoperto che il modello utilizzava storie completamente inventate. La frase originale riguardava uno sciopero in corso in Colombia; dopo essere stata tradotta in marathi da Google Translate e poi tradotta nuovamente in inglese dal traduttore automatico, la frase è diventata un’affermazione assolutamente slegata dal significato originario, sui bambini americani che prestano servizio nei Testimoni di Geova. Come illustra questo esempio, le allucinazioni possono verificarsi soprattutto quando si traduce dall’inglese a lingue meno comunemente utilizzate, sulle quali la macchina può non disporre di dati affidabili.

Perché si verificano allucinazioni nella traduzione automatica?

Alcune allucinazioni della traduzione automatica neurale (NMT) sono causate da una “perturbazione dell’input” o da un elemento inaspettato dell’input che di conseguenza contamina l’output. Ad esempio, l’input potrebbe avere uno stile bizzarro, contenere un errore di battitura, una parola insolita o semplicemente una parola non inclusa nel modello.

Altre allucinazioni derivano da problemi di fondo con i dati utilizzati per addestrare il modello. I ricercatori hanno scoperto, ad esempio, che alcuni modelli hanno problemi con la memorizzazione eccessiva di frasi, ovvero frasi che vengono memorizzate così tanto dalla macchina che questa vuole ripeterle esattamente nello stesso modo ogni volta, senza tenere conto del contesto o riconoscerne l’utilizzo idiomatico. Anche un’elevata quantità di “rumore” nel corpo dei dati di addestramento – troppe coppie errate o disallineate tra frasi di origine e di destinazione – può provocare allucinazioni.

E quando si tratta di modelli basati su LLM come ChatGPT, il quadro è altrettanto preoccupante. Oltre alle traduzioni slegate dal significato originale e agli errori di traduzione, i dati usati per l’addestramento possono anche contenere materiale errato che si insinua nell’output della traduzione.

Come evitare le allucinazioni nella traduzione automatica

Come è facile immaginare, le allucinazioni nella traduzione automatica possono essere disastrose per un’azienda, minando la fiducia degli utenti e causando gravi problemi di sicurezza. Sebbene esistano modi per tentare di mettere a punto i software, l’unico modo comprovato e certo per evitare le allucinazioni senza ombra di dubbio è il tocco umano: l’intervento di un traduttore umano professionista.

Ricorrere alla traduzione umana non significa non poter usare la traduzione automatica come primo passo in un progetto di ampia portata. È invece possibile assumere un traduttore umano per ripulire la “prima bozza” della traduzione automatica con un procedimento noto come post-editing. Non solo i post-editor rivedranno e correggeranno le traduzioni automatiche, perfezionandole secondo standard elevati, ma le loro ritraduzioni potranno anche essere incorporate nella memoria del software, migliorandone l’addestramento per progetti futuri.

Per ottenere i migliori risultati, dovreste rivolgervi a linguisti professionisti appositamente formati nel post-editing della traduzione automatica, come gli esperti post-editor di Trusted Translations, che si attengono a un processo rigoroso per garantire la qualità di ogni traduzione.

Immagine di Enrique da Pixabay