Основы технологии перевода: CAT-инструменты, машинный перевод и постредактирование

Что такое CAT-инструмент? Что означает постредактирование? Существует множество различных технических терминов, используемых в языковой и переводческой отрасли. В этой статье мы приведем их краткий обзор и расскажем, что представляют собой эти ключевые элементы, как они используются и что следует знать при работе над переводческим проектом.

CAT-инструменты

Инструменты автоматизированного перевода (сomputer-assisted translation, CAT) используют программное обеспечение для помощи или содействия переводчикам при работе над переводческими проектами. Используя компьютерную обработку для автоматизации ряда задач, связанных с языковым переводом, CAT-инструменты помогают переводчикам работать более эффективно.

Как работают CAT-инструменты? При автоматизированном переводе часто используются памяти переводов (TМ), или базы данных, в которых хранятся ранее переведенные фрагменты соответствующего текста (текстов). Использование CAT-инструмента для хранения, извлечения и сравнения этих единиц текста с новым содержанием позволяет переводчику определить, где можно повторно использовать предыдущие переводы, а где требуется новый перевод. CAT-инструмент может быть настольной программой или облачным сервисом.

К другим компьютерным инструментам, служащим помощниками при переводе, относятся менеджеры-лексикографы, средства проверки орфографии и грамматики, электронные словари и многое другое.

CAT-инструменты помогают переводчикам экономить время, повышать производительность труда и точность, а также обеспечивать единообразие формулировок, особенно в долгосрочных или технически сложных проектах. С точки зрения заказчика использование инструментов CAT означает повышение экономической эффективности, сокращение времени исполнения заказа и упрощение управления – например, редакторам становится легче заниматься публикацией и поддержкой одного и того же веб-контента на разных языках.

Вот несколько примеров ведущих CAT-инструментов:

  • Memsource (облачный сервис)
  • SDL Trados Studio (настольная программа)
  • Smartcat (облачный сервис)
  • memoQ (настольная программа)

Машинный перевод

 Так что, получается, что CAT-инструменты – то же самое, что машинный перевод? Это широко распространенное заблуждение. По сути дела, машинный перевод (machine translation, МТ) использует компьютерную программу для автоматического перевода текста с одного языка на другой без участия человека.

В широком смысле при машинном переводе используется машинное обучение и искусственный интеллект для получения входного текста, сравнения этого текста с базой данных и создания на выходе текста на языке перевода. Если говорить более конкретно, МТ может использовать три вида подхода к переводу:

  • На основе правил: Машина использует правила языка, грамматические нормы и лексику для разбора и перевода текста.
  • Статистический: Машина использует алгоритмы для изучения обширнейшей базы данных переводов, сделанных силами человека, в поисках наиболее статистически вероятного перевода данного текста.
  • Нейронный: Искусственный интеллект и нейронные сети машины «учатся» в процессе перевода, предсказывая и генерируя наилучшую последовательность слов.

В большинстве современных систем машинного перевода используется один из этих подходов или их сочетание. К ведущим современным системам MT, в которых используется нейронный перевод, относятся такие крупные технологические продукты как Google Translate, Bing Translate и Amazon Translate, а также такие хорошо зарекомендовавшие себя сервисы как DeepL и SYSTRAN. Компания Trusted Translations тщательно оценивает каждый переводческий проект, чтобы определить, какая система лучше всего подходит для работы в каждом конкретном случае.

Переводчик может использовать машинный перевод для получения первоначального варианта (например, первого черновика) в некоторых ситуациях – например, на живом мероприятии, где требуется практически мгновенный результат; для ускорения некоторых процессов, таких как субтитрирование; или для начала работы над очень большими проектами. Однако машинный перевод не должен применяться как самостоятельная процедура. Хотя заказчиков перевода может привлекать возможность снижения затрат, увеличения скорости и доступа к разнообразным языкам мира, в идеале машинные переводы всегда должны редактироваться людьми, чтобы обеспечить их качество и точность.

Постредактирование

В процессе постредактирования живые люди-переводчики редактируют машинные переводы после их создания, чтобы получились пригодные для использования окончательные переводы. При этом переводчики используют CAT-инструменты для сравнения машинного перевода с исходным текстом и оценки его качества. Затем они либо вносят правки в машинный перевод, либо оставляют его как есть, либо переводят все заново с нуля.

Различные уровни постредактирования позволяют таким переводческим компаниям, как Trusted Translations, адаптировать услуги к потребностям клиента:

  • Легкое и быстрое постредактирование: Редактор вносит минимальные правки, уделяя внимание критическим моментам (таким как вопиющие смысловые, грамматические и орфографические ошибки) и элементарной точности. В данном случае приоритет отдается стоимости работы и скорости; такой вид постредактирования также может применяться в том случае, когда полученный машинный перевод уже приличного качества.
  • Полное постредактирование или постредактирование с целью получить готовый к публикации текст: При полном постредактировании текст доводится до уровня проекта, полностью переведенного живым человеком, при этом вносятся обширные правки, чтобы отшлифовать стилистические детали, единообразие и тональность повествования. Работа на этом уровне постредактирования занимает больше времени, но зато дает самые качественные результаты.

Независимо от выбранного уровня, постредактирование является абсолютно необходимым этапом в процессе перевода с использованием машинного перевода (МТ). Машинный перевод часто выдает неуклюжие фразы, использует неправильную или непоследовательную терминологию, и на выходе получаются неестественно звучащие результаты; все это должно быть проверено настоящими переводчиками, особенно если тон, эмоции и контекст имеют решающее значение для понимания. Заказчики переводов должны привлекать к работе авторитетных постредакторов, которые гарантируют неизменное качество перевода, без машинных ошибок, которые в конечном итоге могут оказаться чрезвычайно дорогостоящими, досадными или отнимающими время.

Фото: Miguel Á. Padriñán, pexels.com