Древние таблички и перевод с помощью ИИ

Перевод с одного языка на другой — это умение тщательно строить предложения, которые наилучшим образом передают смысл исходного текста. Вот почему речь не идет об элементарном дословном переключении между целевым и исходным языками. Здесь требуется определенная четко выверенная гибкость, поскольку речь идет о нюансах переводимого текста в целом, а не об отдельных значениях его составных частей.

Это процесс, которому постоянно обучают машинный перевод, постепенно совершенствуя его на протяжении многих лет. В качестве еще одной демонстрации возможностей искусственного интеллекта в работе с естественными языками исследователи недавно обучили ИИ делать примерный перевод 5000-летних аккадских табличек.

Проблема «мертвых» языков

Это особенно сильно впечатляет, поскольку трудности, связанные с переводом, только увеличиваются, когда речь идет о языке оригинала, вымершем уже тысячи лет назад. Так обстоит дело с аккадским языком — ранним семитским языком, не имеющим родственных языков. Такие языки стоит изучать хотя бы потому, что они дают возможность получить представление о жизни, политике и верованиях древних обществ. Эти усилия проливают свет на наше собственное историческое место в мире.

По самым скромным оценкам аккадскому языку приписываются сотни тысяч текстов, обнаруженных археологами. Многие из них уже оцифрованы. Но тем не менее лишь немногие ученые способны хоть как-то осмыслить эти тексты. И даже то, что они могут понять, представляет собой лишь обрывки информации, потому что большая часть контекста потеряна из-за разрушающего воздействия времени, несмотря на то, что эти надписи были сделаны на глине, которая сохраняется гораздо лучше на протяжении веков, чем папирус.

Именно такая фрагментарность делает перевод сложным, а еще это усугубляется общим отсутствием специалистов по таким языкам. К сожалению, перевод этих документов сопряжен с большими затратами как времени, так и трудовых ресурсов.

Переводчики с искусственным интеллектом

Чтобы облегчить решение этой сложнейшей задачи, группа археологов и компьютерщиков разработала ИИ для перевода аккадского языка. Он работает мгновенно в соответствии с моделью нейромашинного перевода (NMT), разработанной специально для данного языка.

Аккадский язык является так называемым «поливалентным» языком, т. е. значение его символов меняется в зависимости от их функции в предложении. В результате переводчикам приходится иметь дело с так называемым двухэтапным процессом. Сначала они берут оригинальный текст и переписывают его с использованием схожих по звучанию фонетических средств целевого языка — это называется транслитерацией. То есть, они восстанавливают слова, используя ту букву латинского алфавита, которая наиболее точно соответствует слову в языке оригинала. Типичным примером такого процесса служит арабское слово, обозначающее Бога, الله, которое переводится как «Аллах». После этого они переводят получившийся текст на целевой язык.

С учетом этого NMT был обучен работе как с клинописью, так и с ее транслитерацией. Когда результаты работы этой модели оценили с помощью алгоритма BLEU4 (bilingual evaluation understudy 4), предназначенного для оценки качества машинного перевода, она получила соответственно 37,47 и 36,52 балла. Обе эти оценки находятся в пределах допустимого диапазона для качественного перевода.

Но есть целый ряд задач, с которыми NMT не справляется. Он плохо переводит длинные предложения и легко теряется, когда ему предлагают более «литературные жанры», в отличие от жанров более «шаблонных», таких как указы и протоколы. Если абстрагироваться от недостатков, то следует отметить, что NMT очень точно распознает конкретные жанры, что является еще одной функцией, позволяющей сэкономить время.

В некоторых случаях эта модель выдавала результаты, которые как бы вообще не имели отношения к восполненному тексту. Исследователи назвали это «галлюцинациями» со стороны ИИ.

Совместные усилия

Что же остается переводчикам? В большинстве случаев данная технология служит полезным подспорьем, обеспечивая быстрый и точный перевод. Но основная часть усилий все равно ложится на плечи «живого» переводчика: даже если результат вписался в допустимый диапазон качественного перевода, его приходится пересматривать, редактировать и даже переделывать. Эти процессы пока лучше всего выполняет человек.

В настоящее время доступ к модели NMT осуществляется через онлайн-блокнот, а исходный код размещен на GitHub под названием проекта «Akkademia». Эта технология доступна каждому. Таким образом, благодаря тому, что ученые используют подобные NMT-модели, перевод текстов древнего мира становится значительно проще и доступнее.

Однако если речь идет о современных, широко распространенных языках, то услуги, предлагаемые компанией Trusted Translations, в которой работают профессиональные переводчики и лингвисты со всего мира, в значительной степени удовлетворят и превзойдут ваши потребности в профессиональном переводе.

Фото: Bilge Şeyma Kütükoğlu, pexels.com