Общие (базовые) решения для нейронного машинного перевода

Компания Trusted Translations разработала технологический процесс, который интегрирует базовые механизмы машинного перевода (MT) от таких лидеров в данной области как Google, Microsoft, Amazon, DeepL и других, с серверами памяти переводов (TM) и службами постредактирования для создания больших объемов переводов самого высокого в отрасли качества.

Home » Услуги » Машинный перевод » Распространенные системы машинного перевода

Оптимизированный процесс

Основываясь на запросе и спецификациях клиента, наша компания интегрирует базовое решение машинного перевода с нашим процессом контроля качества для получения высоконадежных и точных переводов. Доказано, что этот запатентованный процесс значительно сокращает время выполнения проекта и снижает затраты при сохранении самого высокого уровня качества перевода.

Системы машинного перевода общетематического характера

Системы машинного перевода общетематического характера (иногда обозначаемые аббревиатурой «GMTE») — это программы, которые могут переводить текст с/на определенный язык с минимальным вмешательством человека или вообще без такового. Хотя каждая из этих базовых систем выстроена по-своему, большинство из них предназначены для перевода контента общего назначения без использования специальной терминологии. Отсюда и название: системы машинного перевода общетематического характера. Наиболее популярными из них являются Google Translate, Systran, Microsoft Translator, Microsoft Hub и Amazon.

Для общего понимания отметим, что в случае относительно базового контента такие системы способны выдавать достойный результат. Однако на сегодняшний день индивидуально настраиваемые системы по-прежнему имеют конкурентное преимущество. Другими словами, переводы, выполненные с помощью только GMTE, недостаточно надежны для профессионального использования, поскольку даже в случае простых документов ошибки неизбежны.

При этом GMTE может быть полезной частью процесса перевода в зависимости от целей заказчика и характера проекта. Компания Trusted Translations научилась использовать GMTE и интегрировать ее в соответствии с потребностями и целями заказчиков. Если мы считаем, что определенный проект является подходящим кандидатом для включения GMTE в процесс, мы обсуждаем этот вариант с клиентом и разрабатываем решение, которое сочетает в себе все преимущества GMTE, серверов памяти и перевода, выполненного человеком (HT), и проверки.

Серверы памяти переводов и распространенные системы MT

Использование сервера памяти переводов («TMS») при использовании GMTE — это один из способов улучшить общее качество результата перевода, поскольку он использует уже имеющиеся сегменты, переведенные человеком, как часть готового текста. Использование такого имеющегося контента помогает обеспечить качество, что выражается в том, что результат лучше соответствует рекомендациям по стилю для конкретного клиента, а также это помогает с терминологией в тех случаях, когда глоссарии не дают значительного преимущества. Одна из возможных конфигураций рабочего процесса для подготовки контента состоит из того, что перевод каждого сегмента контента осуществляется в первую очередь с помощью TMS. Если идентичный или похожий сегмент (полное или нечеткое совпадение) не найден на этом первом шаге, контент пропускают через распространенную систему машинного перевода.

В настоящее время большинство TMS позволяют выполнять эти два шага одновременно. Наконец, двуязычный контент, созданный либо на основе памяти переводов, либо на основе чисто машинного перевода, также может быть отредактирован опытным постредактором — лингвистом, специально обученным для работы с результатами машинного перевода. В дальнейшем все сегменты, полученные в процессе постредактирования, передаются обратно в TMS, что повышает качество следующих переводов.

Постредактирование человеком машинных переводов, полученных из распространенных систем МТ

Использование GMTE может значительно увеличить скорость вывода по сравнению с процессом перевода, в котором участвуют только люди-лингвисты. При наличии достаточной вычислительной мощности можно было бы перевести сотни миллионов слов всего за пару дней. Несмотря на недавние дебаты о том, достигнут ли паритет между результатами MT и HT, в целом имеются некоторые причины для беспокойства по поводу качества конечного результата. Одним из решений является добавление этапа постредактирования силами человека и, возможно, дополнительных шагов проверки как части рабочего процесса. Интеграция процесса постредактирования человеком увеличивает время работы, но, в свою очередь, это обеспечивает гораздо более высокий уровень качества, а также помогает выявить проблемные области при использовании GMTE.

Знаете ли вы, что...?
Первые предложения в области компьютерного машинного перевода появились в 1949 году.
Знаете ли вы, что...?
Самая популярная система GMTE — Google Translate — поддерживает более 130 языков мира.
Знаете ли вы, что...?
Компания Trusted Translations предоставляет опытных постредакторов для проверки всех результатов машинного перевода.
Знаете ли вы, что...?
Общий машинный перевод может быть полезным первым шагом на пути к сокращению затрат и времени выполнения заказа.
Знаете ли вы, что...?
Знаете ли вы, что...?

Распространенные системы MT, серверы памяти и
рабочий процесс постредактирования силами человека

Учитывая, что решения для машинного перевода все еще находятся на стадии разработки и усовершенствования, Trusted Translations подходит к каждому проекту как к уникальному. Однако, основываясь на нашем опыте, мы разработали и протестировали несколько рабочих процессов, в которые успешно интегрируется машинный перевод. Ниже приведен общий рабочий процесс, который интегрирует GMTE с памятью переводов и постредактированием силами человека.

Как показано выше, контент проходит через все этапы процесса с помощью API или других видов интеграции. Каждый сегмент контента проходит через сервера памяти переводов (TMS) и распространенные системы машинного перевода, чтобы попасть в среду постредактирования. Другими словами, результаты каждого сегмента, поступающие с нашего сервера памяти переводов и (или) из распространенной системы машинного перевода, проходят постредактирование онлайн силами нашего профессионального постредактора в облачной среде постредактирования. Процесс может выполняться одновременно для нескольких языков. Процесс переносится в среду постредактирования почти мгновенно. Ретроспективная обратная связь, возникающая в результате задачи постредактирования силами человека, создает автоматические обновления для TMS.

Системы MT общетематического характера в сравнении с настраиваемыми МТ

Использование системы машинного перевода общетематического характера в сочетании с серверами памяти переводов значительно снижает затраты за счет использования постредактирования силами человека вместо перевода силами человека (с нуля) и проверки. Сроки выполнения проекта значительно сокращаются. Недостатки этого варианта заключаются в том, что качество будет не таким высоким, а системе машинного перевода будет не хватать динамической способности к обучению и самосовершенствованию, как это может делать настраиваемая система машинного перевода.