翻訳テクノロジー101:CATツール、機械翻訳、ポストエディット

CATツールとは何ですか?ポストエディットとはどういう意味ですか?言語業界、翻訳業界では、さまざまな専門用語が使われています。このブログでは、これらの重要な要素とは何か、どのように使われるのか、また、翻訳プロジェクトに携わる際に知っておくべきことを解説します。

CATツール

コンピュータ支援翻訳(CAT)ツールは、人間の翻訳者の翻訳プロジェクトをソフトウェアで支援し、補助するものです。CATツールは、言語翻訳に関わるさまざまな作業をコンピュータ処理で自動化することで、翻訳者の作業効率を向上できます。

CATツールはどのような仕組みになっていますか?コンピュータ支援翻訳では、通常、翻訳メモリ(TM)と呼ばれる、過去に翻訳されたテキストを保存するデータベースが使用されます。CATツールを使って、これらのテキストを保存し、検索し、新しいコンテンツと比較することで、翻訳者は過去の翻訳を再利用できる箇所と新しい翻訳が必要な箇所を特定できます。CATツールは、デスクトップ型とクラウド型があります。

その他、用語管理ツール、スペルチェッカーや文法チェッカー、電子辞書など、コンピュータを利用した翻訳補助ツールもあります。

CATツールは、特に長期にわたるプロジェクトや高度に専門的なプロジェクトにおいて、翻訳者の時間短縮、生産性と正確性の向上、一貫した言い回しの確保に貢献します。お客様の視点に立てば、CATツールの活用は、費用対効果の向上、納期の短縮、管理の容易さにつながります。たとえば、編集者が同じウェブコンテンツを異なる言語で公開し、管理することが容易になります。

ここでは、代表的なCATツールの事例を紹介します:

  • Memsource(クラウドベース)
  • SDL Trados Studio (デスクトップベース)
  • Smartcat(クラウドベース)
  • memoQ(デスクトップベース)

機械翻訳

 では、CATツールは機械翻訳と同じものですか?これはよくある誤解です。実際は、機械翻訳(MT)は、コンピュータのプログラムを使って、人間の関与なし で、ある言語から別の言語へ自動的にテキストを翻訳するものです。

機械翻訳とは、大まかに言うと、機械学習や人工知能を利用して、テキスト入力を受け、そのテキストをデータベースと比較し、そのテキストをターゲット言語で出力することです。具体的には、MTは3種類の翻訳アプローチを取ることができます:

  • ルールベース:機械は、言語規則、文法基準、辞書を使用して、テキストを解析し、翻訳します。
  • 統計的:機械は、アルゴリズムを使って膨大な翻訳データセットを探索し、統計的に最も可能性の高い翻訳を探します。
  • ニューラル:機械の人工知能とニューラルネットワークが翻訳しながら「学習」し、最適な言葉の並びを予測し、生成していきます。

最近の機械翻訳エンジンの多くは、これらのアプローチを1つ以上組み合わせています。現在の主要なMTエンジンはすべてニューラル翻訳を採用しており、Google Translate、Bing Translate、Amazon Translateなどのビッグテックの製品や、DeepL、SYSTRANなどの有名企業もあります。Trusted Translationsでは、翻訳プロジェクトを慎重に評価し、ケースバイケースで最適なエンジンを決定しています。

翻訳者が最初の出力(第一稿など)に機械翻訳を使用する場合には、いくつかの状況が考えられます。例えば、ほぼ瞬時に結果を出す必要があるライブイベントや、字幕制作などのスピードアップ、非常に大きなプロジェクトに着手する時などがあります。しかし、機械翻訳を単体のサービスとして利用することはありません。機械翻訳は、コスト削減、スピードアップ、世界の多様な言語へのアクセスなどの可能性などを考えると魅力的です。しかし、品質と正確性を確保するためには、常に人間が編集することが理想です。

ポストエディット

ポストエディットとは、機械翻訳が生成された後に、人間の翻訳者が最終的に使用可能な翻訳を作成することを目的として編集することです。翻訳者は、CATツールを使って機械翻訳と原文を比較し、品質を評価することになります。機械翻訳を修正するか、そのままにするか、一から翻訳し直すか、のいずれかの選択肢があります。

Trusted Translations のような翻訳会社は、さまざまなレベルのポストエディットによって、クライアントのニーズに合わせたサービスを提供できます。

  • 簡単で、高速なポストエディット:編集者は、重要な修正(露骨な意味上の誤り、文法上の誤り、スペルミスなど)と基本的な明瞭さに焦点を当てた最小限の編集を行います。ポストエディットはコストとスピードを優先させるもので、すでに機械翻訳がきちんとできている場合に使用することもできます。
  • 完全なポストエディットまたは公開準備のためのポストエディット:ポストエディットでは、文体の細部、一貫性、トーンなどを徹底的に洗練し、完全な人力翻訳プロジェクトに匹敵するレベルのテキストを作成します。このレベルは時間がかかりますが、最高品質の仕上がりになります。

機械翻訳(MT)を使用する翻訳プロセスでは、どのレベルであってもポストエディットは絶対に必要なステップです。機械翻訳では、不明瞭な表現、不正確な用語、一貫性のない用語、不自然に聞こえる出力が多くあります。特に理解するのにトーン、感情、文脈が重要な場合は、実際の翻訳者が確認する必要があります。翻訳を依頼する顧客は、長期的に非常にコストがかかり、評判を下げ、時間を奪う可能性がある機械が生成するエラーを出さない、一貫した品質の翻訳を保証できる、信頼できる人間のポストエディターに依頼する必要があります。

写真:Miguel Á. Padriñán、pexels.com