Algemene (basislijn) oplossingen voor neurale machinevertaling

Trusted Translations heeft een technologieproces ontwikkeld dat baseline machine translation (MT)-engines van AI-leiders zoals Google, Microsoft, Amazon, DeepL en anderen integreert met translation memory (TM)-servers en post-editing-services om vertalingen in grote volumes te produceren van de hoogste kwaliteit in de branche.

Home » Diensten » Machinevertaling » Algemene Aut Systemen

Gestroomlijnd proces

Op basis van het verzoek en de specificaties van onze klant integreren wij een basis MT-oplossing met ons kwaliteitscontroleproces om zeer betrouwbare en nauwkeurige vertalingen te produceren. Dit bedrijfseigen proces heeft bewezen de doorlooptijden aanzienlijk te verbeteren en de kosten te verlagen terwijl de vertaalkwaliteit op een zeer hoog niveau blijft.

Machinevertalingsengines voor het algemene domein

Een General Domain Machine Translation Engine (ook wel “GMTE” genoemd) verwijst naar een softwareprogramma dat tekst van en naar een bepaalde taal kan vertalen met weinig of geen menselijke tussenkomst. Hoewel elk van deze baseline-engines anders is gebouwd, zijn de meeste ontworpen om algemene inhoud te vertalen zonder gespecialiseerde terminologie – vandaar de naam General Domain Machine Translation-oplossingen. De meest populaire zijn Google Translate, Systran, Microsoft Translator, Microsoft Hub en Amazon.

Voor een algemeen begrip van relatief eenvoudige inhoud kunnen baseline-engines prima werk leveren. Tot op heden hebben aangepaste motoren echter nog steeds een concurrentievoordeel. Dat wil zeggen, de vertalingen die alleen door GMTE’s worden geproduceerd, zijn niet betrouwbaar genoeg voor professioneel gebruik, omdat fouten zelfs bij eenvoudige documenten onvermijdelijk zijn.

Toch kan GMTE een nuttig onderdeel zijn van een vertaalproces, afhankelijk van de doelstellingen van de klant en de aard van het project. Bij Trusted Translations, hebben we geleerd hoe we GMTE’s kunnen benutten en integreren op basis van de behoeften en doelen van onze klanten. Als we geloven dat een bepaald project een goede kandidaat is om GMTE’s in het proces te integreren, bespreken we de optie met onze klant en ontwerpen we een oplossing die de voordelen van GMTE’s, geheugenservers en menselijke vertalingen combineert.

Vertaalgeheugenservers en algemeen domein MT

Het gebruik van een Translation Memory Server (“TMS”) bij het gebruik van een GMTE is een manier om de algehele kwaliteit van de vertaaluitvoer te verbeteren, aangezien het gebruik maakt van verouderde, door mensen vertaalde segmenten als onderdeel van de uitvoer. Het gebruik van dergelijke oude inhoud helpt de kwaliteit te waarborgen, wat tot uiting komt in een betere naleving van klantspecifieke stijlrichtlijnen, en helpt zelfs met terminologie in gevallen waarin woordenlijsten geen sterke troef zijn. Een mogelijke configuratie van het werkproces voor de voorbereiding van content zou zijn dat elk contentsegment eerst wordt vertaald door middel van een TMS. Als er bij deze eerste stap geen identiek of vergelijkbaar segment (volledige of fuzzy match) wordt gevonden, wordt de inhoud door de General Machine Translation Engine gehaald.

Met de meeste TMS’en kunt u deze twee stappen momenteel tegelijkertijd uitvoeren. Ten slotte kan de tweetalige inhoud die is gegenereerd uit een vertaalgeheugen of uit een pure machinevertaling ook worden bewerkt door een deskundige post-editor; dat wil zeggen, een taalkundige die speciaal is opgeleid om met die MT-uitvoer te werken. Verder worden eventuele menselijke nabewerkingen teruggekoppeld naar het TMS, waardoor de kwaliteit van de volgende vertaling wordt verbeterd.

Menselijke nabewerking van machinevertalingen in het algemene domein

Het gebruik van GMTE kan de snelheid van de output aanzienlijk verhogen in vergelijking met een vertaalproces waarbij alleen menselijke linguïsten betrokken zijn. Met voldoende rekenkracht zou u in slechts een paar dagen honderden miljoenen woorden kunnen vertalen. Ongeacht het recente debat over de vraag of er pariteit is bereikt tussen MT- en HT-productie, is er in het algemeen enige reden tot bezorgdheid over de kwaliteit van de uiteindelijke output. Een oplossing is om een menselijke nabewerkingsstap toe te voegen, en eventueel extra beoordelingsstappen, als onderdeel van het werkproces. Het integreren van een menselijk nabewerkingsproces verkort weliswaar de doorlooptijd, maar levert op zijn beurt een veel hoger kwaliteitsniveau op en kan ook helpen bij het opsporen van probleemgebieden bij het gebruik van GMTE’s.

Wist je dat?
De eerste voorstellen voor computergestuurde automatische vertaling verschenen in 1949.
Wist je dat?
De meest populaire GMTE, Google Translate, ondersteunt meer dan 130 wereldtalen.
Wist je dat?
Trusted Translations biedt deskundige post-editors om alle uitvoer van machinevertalingen te beoordelen.
Wist je dat?
Algemene machinevertaling kan een nuttige eerste stap zijn om kosten en doorlooptijden te verminderen.
Wist je dat?
Wist je dat?

Algemene domein MT-engines, geheugenservers en
Menselijk nabewerkingsproces

Aangezien oplossingen voor machinevertaling zich nog in de ontwikkelings- en verbeteringsfase bevinden, benadert Trusted Translations elk project als een uniek geval. Op basis van onze ervaring hebben we echter verschillende werkprocessen ontwikkeld en getest die automatische vertalingen succesvol integreren. Het volgende is een algemeen werkproces die GMTE integreert met een vertaalgeheugen en menselijke nabewerkingsoplossing.

Zoals hierboven geïllustreerd, zou de inhoud alle stappen van het proces doorlopen via een API of andere soorten integraties. Elk inhoudssegment gaat door het TMS en de General Domain Machine Translation Engine om de nabewerkingsomgeving te bereiken. Met andere woorden, de resultaten van elk segment dat uit onze Translation Memory Server en/of General Machine Translation Engine komt, worden online nabewerkt door een van onze professionele nabewerkers in onze cloudgebaseerde nabewerkingsomgeving. Het proces kan gelijktijdig voor meerdere talen worden uitgevoerd. Het proces stroomt vrijwel onmiddellijk naar de nabewerkingsomgeving. Retro-feedback die het resultaat is van de menselijke nabewerkingstaak genereert automatische updates voor het TMS.

Algemeen domein MT vs. Aangepaste MT

Het gebruik van een General Domain Machine Translation Engine in combinatie met Translation Memory Servers verlaagt de kosten aanzienlijk door gebruik te maken van menselijke nabewerking in plaats van menselijke vertaling (helemaal opnieuw) en revisie. Doorlooptijden verbeteren drastisch. De nadelen van deze optie zijn dat de kwaliteit niet zo hoog zal zijn en dat de automatische vertaalcomputer niet het dynamische vermogen heeft om te leren en zichzelf te verbeteren zoals een aangepaste automatische vertaalcomputer dat wel kan.