번역 테크놀로지의 모든 것: CAT 툴, 기계 번역 및 포스트 에디팅(Post-Editing)

CAT 툴이란 무엇인가요? 포스트 에디팅(post-editing)이란 무엇을 의미하나요? 언어와 번역 산업 전반에 걸쳐 다양한 기술 용어들이 사용되고 있습니다. 이 블로그에서는 어떤 주요 용어들이 있고, 어떻게 사용되며 번역 프로젝트에 참여함에 있어 알아야 할 것은 무엇인지 알기 쉽게 설명해 드리겠습니다.

CAT 툴

CAT(computer-assisted translation) 툴은 번역 프로젝트에 참여한 번역가가 번역을 하는 데 도움을 주기 위한 소프트웨어입니다. CAT 툴은 컴퓨터 프로세싱을 통해 언어 번역에 관련된 여러 작업을 자동화함으로써 번역가가 더 효율적으로 작업할 수 있게 합니다.

CAT 툴은 어떻게 작동하나요? CAT 툴은 주로 앞서 번역한 원문과 번역문 쌍을 저장한 번역 메모리(TM) 또는 데이터베이스를 활용합니다. 번역가는 CAT 툴을 사용하여 이러한 번역 쌍을 저장하고, 검색하며, 새로운 원문과 비교하여 이전 번역을 재사용할 수 있는 부분과 새로 번역할 부분을 구분할 수 있습니다. CAT 툴은 데스크톱 기반과 클라우드 기반으로 나뉩니다.

그 밖에 많은 CAT 툴이 용어 관리, 맞춤법 및 문법 검사기, 전자 사전 등과 같은 다양한 기능을 가지고 있습니다.

CAT 툴은 번역가가 더 짧은 시간 안에 더 많은 양을 더 정확하게 번역할 수 있도록 도와 줍니다. 뿐만 아니라 장기 프로젝트 또는 고도의 기술적 프로젝트에서 번역 일관성을 유지하는 데 도움을 줍니다. 고객 입장에서 CAT 툴을 사용하면 비용을 절약하고 번역 기간을 단축할 수 있으며 관리가 더 쉬워집니다. 예를 들어 편집자가 더 쉽게 동일한 웹사이트 내용을 여러 언어로 게시하고 관리할 수 있게 됩니다.

주로 사용되는 CAT 툴에는 다음과 같은 것들이 있습니다.

  • Memsource(클라우드 기반)
  • SDL Trados Studio(데스크톱 기반)
  • Smartcat(클라우드 기반)
  • memoQ(데스크톱 기반)

기계 번역

 그렇다면 CAT 툴과 기계 번역은 같은 것일까요? 많은 사람들이 이 둘이 같은 것으로 오해하고 있습니다. 말 그대로 기계 번역은 컴퓨터 프로그램을 사용하여 인간의 개입 없이 텍스트를 한 언어에서 다른 언어로 자동으로 번역합니다.

통상적으로 기계 번역은 머신러닝(machine learning)과 인공지능을 활용하여 텍스트를 입력하고, 그 입력된 텍스트를 데이터베이스에서 비교하여 동일한 의미의 대상 언어로 출력합니다. 좀 더 세분화 해서 설명 드리자면 기계 번역 방식에는 크게 세 가지가 있습니다.

  • 규칙 기반: 기계가 언어의 규칙, 문법 및 어휘 등을 사용하여 텍스트를 분석하고 번역합니다.
  • 통계 기반: 기계가 방대한 인간 번역 테이터셋을 검색할 수 있는 알고리즘을 사용하여 통계적으로 원문 텍스트와 가장 유사한 번역문을 찾아 냅니다.
  • 신경망 기반: 기계의 인공 지능과 신경망이 번역과 “학습”을 거듭하면서 원문에 가장 적합한 번역문을 도출합니다.

가장 최근의 기계 번역 엔진은 위 방식 중 한 개 또는 그 이상을 혼합하여 사용하고 있습니다. Google 번역, Bing 번역 및 Amazon Translate과 같은 거대 IT 기업의 기계 번역뿐만 아니라 업계에서 큰 인기를 얻고 있는 DeepL과 SYSTRAN 등과 같은 최신 MT 엔진 모두 신경망 번역을 사용하고 있습니다. Trusted Translations에서는 각 프로젝트 별로 가장 적합한 엔진이 무엇인지 신중하게 고려하여 결정하고 있습니다.

번역가는 실시간으로 즉시 번역이 필요한 상황, 자막 작업과 같이 빠른 프로세스를 요하는 상황, 또는 초대형 프로젝트 시작과 같은 상황에서 1차 번역(초벌 번역)을 작업하는 데 기계 번역을 사용하기도 합니다. 하지만 기계 번역만으로 번역 서비스를 제공할 수 없습니다. 아무리 고객이 더 적은 비용으로 더 빨리 더 많은 언어의 번역을 원한다 하더라도 품질과 정확도 향상을 위해 기계 번역된 내용을 사람이 검토해야 합니다.

포스트 에디팅(Post-Editing)

포스트 에디팅 과정에서는 사람이 기계 번역된 내용을 검토하여 수정함으로써 사용 가능한 최종 번역을 완성합니다. 번역가는 CAT 툴을 사용하여 기계 번역을 원문과 비교하여 그 품질을 확인합니다. 그리고 나서 품질에 따라 기계 번역을 일부 수정하거나, 그대로 사용하거나, 아예 다시 번역합니다.

Trusted Translations는 고객의 요구에 따라 포스트 에디팅 수준을 다음과 같이 나누고 있습니다.

  • 낮은 수준의 빠른 포스트 에디팅: 검토자가 되도록 번역을 수정하지 않고 심각한 오류(예: 명확한 의미 오류, 문법 오류, 맞춤법 오류)만 수정하고 기본적인 명확성만 확보합니다. 기계 번역의 품질만 괜찮다면 비용 절감과 빠른 번역을 원하는 고객에게 적합합니다.
  • 전체 또는 바로 게시 가능한 높은 수준의 포스트 에디팅: 기계 번역을 마치 완전히 사람이 번역한 것과 같은 수준의 품질로 만들고자 한다면 전체 포스트 에디팅을 통해 기계 번역의 많은 부분을 수정하고 세부적인 스타일을 다듬고 일관성과 번역 톤을 검토해야 합니다. 이러한 수준의 작업은 긴 시간이 걸립니다. 하지만 그럼에도 불구하고 고품질 번역을 원하는 고객에게 적합합니다.

그 수준과 상관 없이 포스트 에디팅은 기계 번역을 사용하는 프로젝트에서 꼭 필요한 작업입니다. 기계 번역을 사용하면 종종 투박한 구문, 부적절하거나 일관성이 없는 용어, 그리고 어색한 번역이 나옵니다. 따라서 사람이 반드시 이러한 부분들을 찾아 수정해야 합니다. 특히 번역의 톤, 감정, 그리고 문맥이 번역을 이해하는 데 중요할 경우 더욱 그렇습니다. 번역 고객은 기계 번역에 있는 오류를 모두 수정하여 번역 품질을 일관되게 유지할 수 있는 포스트 에디터를 고용해야 합니다. 기계 번역 이후 포스트 에디팅 과정을 거쳤음에도 오류가 남아 있다면 결국 비용을 낭비하게 되고, 기분도 상하게 되며, 시간도 허비하는 결과를 가져오기 때문입니다.

사진: Miguel Á. Padriñán(pexels.com)