Кому нужны CAT-инструменты и как с ними работать

от автора

На первый вопрос очень легко ответить. Еще вчера для зарубежных тендеров и поставок без переводчиков было не обойтись. На больших предприятиях создавали целые отделы, где работали в поте лица десятки лингвистов. Сегодня вместо отдела достаточно 1-2 специалистов, которые умеют пользоваться CAT-инструментами для переводчиков. Как же работают компании, которые ведут десятки, а порой и сотни проектов перевода на несколько языков?

Спасибо CAT-программам для переводчиков (Сomputer-Аssisted Тranslation). Изначально подобное ПО переводчики использовали на своем компьютере и обменивались собранными в них базами данных по почте. Сейчас развитые CAT-tools для переводчика находятся в облаке, чтобы над проектом могла работать одновременно целая команда. Да и доступ с любого компьютера с подключением к интернет, конечно, занимает не последнее место в списке преимуществ.

CAT-инструменты (CAT-tools) – что это такое

CAT-программы для переводчиков – программное обеспечение, предназначенное для перевода, редактирования, хранения многоязычного контента. С его помощью можно частично автоматизировать переводы часто повторяющих текстов. Крупные предприятия нередко внедряют CAT-инструменты для переводчиков, чтобы сократить время на перевод и облегчить труд лингвистов.

Машина, «кот» или ИИ?

CAT-программа не просто сравнивает и анализирует переводы с двух разных языков. Черновой вариант перевода, или подстрочник, можно получить и без CAT-tools для переводчика. Как говорится, гугл-перевод вам в помощь.

Машинный перевод и плох, и хорош одновременно. Хорош он, в основном, скоростью. Результат машинного перевода нередко используют как базовый текст для дальнейшего редактирования. В целом, такой машинный перевод позволяет ускорить работу переводчика. Однако адаптировать текст с учётом специфики отрасли, профессиональной терминологии, даже сленга может только переводчик-человек. С CAT-системами для переводчиков это намного удобнее.

Примером машинного перевода можно считать когда-то очень популярную программу Promt. Она устанавливалась на компьютер как приложение и не требовала выхода в интернет. С ее помощью быстрый «подстрочник» можно было получить в любое время. Но Promt не обладает, как и другие системы машинного перевода, преимуществами более сложных систем, то есть CAT-программ.

Самые существенные из них:

  1. работа с общей базой данных, которая обеспечивает прямой доступ к памяти переводов, терминологическим данным и данным проекта;

  2. управление проектами, где вы можете определить цели, сроки и критерии качества для ваших проектов, отслеживать ход выполнения проектов и использовать отчеты для контроля и выставления счетов;

  3. редактор переводов, который удобно структурирован, вставляет термины из памяти переводов и терминологическую базу данных, а также подгружает данные для перевода независимо от формата исходного файла;

  4. управление терминологией, что включает терминологию проекта вместе с их определениями, информацией об использовании, синонимами и словами, которые не следует употреблять, и все это прямо в редакторе переводов;

  5. работа с клиентами – особенно удобная вещь, здесь самые развитые CAT-системы дают возможность подключить клиентов, которые могут загружать файлы для перевода со своего компьютера прямо в текущие проекты;

  6. машинный перевод, как правило, работает практически во всех CAT-системах. В некоторых за счет интеграции с готовыми системами автоперевода, например, DeepL, в других – с помощью собственных больших языковых моделей (LLM).  Сочетание искусственного интеллекта с уже имеющейся базов переводов повышает качество и ускоряет выполнение перевода.

Впрочем, с развитием технологий чисто машинный перевод практически исчез. В настоящее время переводческие программы всё шире используют ИИ. Автоматический перевод с использованием искусственного интеллекта, в отличие от машинного (подстрочного), получается более естественным. В качестве образца искусственный интеллект использует заранее заложенный в него словарь и готовые фрагменты переведенных текстов.

К примеру, Google Translate использует нейронные сети и обученные модели, чтобы учесть контекст и особенности целевого языка. DeepL Translator также использует нейронные сети, благодаря чему на выходе получается логичный и связный текст.

Участие человека в автоматическом переводе с использованием ИИ сводится к минимуму. Достаточно внести исходный текст, нажать кнопку и ждать результата. Однако, в художественных текстах в зависимости от контекста одни и те же слова, фразы, могут переводиться по-разному и иметь разный смысл. Так что без человека сделать литературный перевод пока сложно. Скорее всего, никакой искусственный интеллект не сможет сделать из «Пиноккио» сказку про Буратино, а из романов Дюма тех мушкетеров, которых мы все так любим.

В свою очередь CAT-программы для переводчиков тоже способны обучаться. И чем больше текстов вы переводите с помощью CAT-программы, тем больший словарный запас она приобретает. CAT-системы для переводчиков получают информацию о правильности перевода именно от переводчика-человека.

Принцип работы CAT-программы

Первый этап: переводчик загружает требуемый контент в программу. CAT-tools для переводчика извлекает из него текст, пригодный для перевода. Если в исходном контенте присутствуют изображения, они отображаться не будут.

Второй этап: программа делит весь текстовый контент на части – так называемые сегменты. Сегментами могут стать как отдельные слова, так и фразы. Иногда – целые абзацы.

Третий этап: переводчик вписывает перевод каждого сегмента на целевой язык в специальные поля снизу или справа от исходника. Программа «запоминает» перевод и таким образом накапливает «базу данных». Она называется память перевода (TM – translation memory).

Память перевода — Translation Memory (TM)

В дальнейшем, если в тексте встречается ранее переведенное слово, фраза или иной сегмент, программа автоматически вставляет сохранённый перевод в нужное место. Либо предлагает человеку варианты из памяти перевода. Более того, в любое время переводчик может отредактировать или заменить ранее переведённый текст. Память перевода также автоматически обновится. В системе также есть возможность редактирования и форматирования готового текста.

Таким образом, чем больший объём и количество текстов проходит через CAT-tools для переводчика, тем обширнее у неё память, которую можно использовать в долгосрочной перспективе.

Например, после обработки текста, неважно, технического или художественного, перевод сохранился в TM. Причем перевод в двух вариантах – на исходном языке и целевом. Через какое-то время нужно перевести похожий текст, где встречаются аналогичные разы, абзацы. Переводчику не придется переводить принятые обороты заново, с этим прекрасно справится память переводов. Но при этом нужно понимать, что речь идет о памяти переводов для конкретной темы или контекста.

Часто не нужно вручную искать уже переведенные сегменты в старых текстах, чтобы использовать их в новых переводах. ТМ сделает это самостоятельно.

Сейчас все больше CAT-инструментов для переводчиков работают онлайн. Это даёт возможность работать над проектом целой команде переводчиков и редакторов. Память перевода также сохраняется в облаке, и пользоваться ею может любой член команды. В том числе пополнять и редактировать.

Глоссарий

Глоссарий или терминологическая база данных – это список профессиональных терминов, определений, накопленных в конкретной CAT-программе. Сюда также входят и инструкции по использованию и применению терминов. Глоссарий составляют сами переводчики с учётом той профессиональной сферы, в которой ведется перевод.

Так как глоссарий в CAT-системах для переводчиков тоже расположен в облаке, использовать и пополнять его могут все, кто работает над проектом. Подобные глоссарии помогают придерживаться единой стилистики и единообразия использования терминов в переводах различных текстов.

Кроме того, при помощи глоссария и единых инструкций легко сохранить стиль переводов. Ведь переводы могут потребоваться не на один язык, а на множество. Для разных стран со своей культурой и пониманием рынка. И для каждого иностранного рынка нужна своя локализация. То есть придется адаптировать тексты для разных культур.

Чтобы ваш продукт сохранил собственную значимость на международной арене, важно не просто перевести, а донести его ценность до потребителя. И сделать это просто механическим переводом не получается. Надо знать культурные особенности и обычаи народа.

Ярким примером может служить Китай с его непростым языком и разнообразием написания иероглифов. Много лет назад компания «Кока Кола» совершила ошибку локализации. Компания просто выставила свой продукт на китайский рынок, не меняя названия. Но не учла, что на одном из диалектов Поднебесной «кока-кола» переводилось как «кобыла, набитая воском». Потребители отказывались покупать напиток «со вкусом кобылы». Изучив особенности языка и перебрав сотни других названий, производители выбрали другое: «коку коле». Теперь для китайцев название напитка звучит как «счастье во рту». И это, разумеется, совсем другое дело.

Еще «ляп локализации» когда-то допустила компания Ford, выпустившая в Бразилии новинку: модель авто Pinto. Дословно на испанский это слово переводится как «цыпленок». Но производители не знали, что на местном сленге слово «Pinto» звучит крайне оскорбительно для мужчин. Машину пришлось срочно переименовывать. Автомобиль получил название Corcel, что означает «жеребец». Под таким именем модель сразу стала привлекательной.

Все эти нюансы недоступны системам автоматизации переводов. В таких вопросах работу опытного переводчика не заменять CAT-системы. Но они могут помочь в другом.

Преимущества CAT-программ

Благодаря самым популярным «кошачьим» системам скорость перевода повышается в разы. Переводчики отмечают, что экономят больше половины времени, которое тратили, чтобы скопировать и вставить части уже сделанных переводов. CAT-инструменты для переводчиков делают механическую рутино самостоятельно там, где необходимо. Человеку остается только проверить готовые переводы или адаптировать их к контексту. И чем больше уже переведённых текстов, тем больше база накопленных данных и тем меньше участие человека. Более того, CAT-инструмент отредактирует и отформатирует перевод в соответствии с сохранённым образцом.

— Повышается согласованность работы в команде. Переводчики, даже находясь в разных местах, используют единую базу данных, единый словарь и сохраняют общий стиль без постоянных контактов между собой.

— Почти все CAT-программы могут распознавать текст из pdf, jpg, tiff файлов из других программ.

— Большинство CAT-систем для переводчиков могут использоваться в облаке, что позволяет работать в команде. Однако есть и такие программы, которые устанавливаются на персональном компьютере и используются одним человеком. Этот вариант может быть удобен в небольших проектах для малого и среднего бизнеса.

— CAT-программы позволяют сделать локализацию больших проектов с малыми затратами. Ведь с ними можно быстро перевести тексты, сайт, документацию вашего проекта на несколько языков, подключив к проектам несколько удаленных переводчиков.

Минусы CAT-программ

Да, при всём удобстве CAT-программ, в них есть и неудобства. При работе с проектами перевода в CAT‑системах могут возникнуть ошибки, от незначительных до критичных. И дело не в автоматическом переводе. Существует особый тип ошибок, который на самом деле должен был быть полностью исключен, если поставщик языковых услуг работает по требованиям стандарта ISO 17 100.

Дело в том, что в памяти системы может содержаться два разных перевода. Например, в одном проекте английское слово «patient» было переведено в контексте человеческой медицины («пациент»), а в другом — в контексте ветеринарной медицины («животное»). Поэтому САТ‑система может предложить фрагмент из памяти переводов разной тематики (человеческая и ветеринарная медицина). При этом переводчик часто не обращает на это внимания, т.к. видит, что фрагмент на 100% совпадает с памятью.

Такие ошибки должны быть обнаружены как минимум на этапе доработки, то есть при двуязычном редактировании. Однако, даже серьезные переводческие агентства, даже имеющие сертификат ISO, часто пренебрегают его стандартами. Поэтому использование CAT‑инструментов в процессе перевода не исключает человеческих ошибок.

Ценовая сетка CAT-систем

Стоимость перевода в разных CAT-системах рассчитывается по ценовой сетке CAT за каждое слово. Это значит, что стоимость взвешивается в зависимости от соответствия ТМ, то есть от того, полностью ли сегмент уже был переведен (100 % совпадений), частично (нечеткие совпадения) или вообще не соответствует (так называемые «новые слова»). Стоимость 100 % совпадений обычно составляет около 10 % от стоимости полного слова, поскольку даже 100 % совпадения придется проверить на предмет контекста, может потребоваться редактирование.

На практике многие компании не платят переводчикам за 100 % совпадения. Такая экономия оправдана, т.к. позволяет избежать расходов на пересмотр. Иногда нехватка времени не позволяет переводчикам полностью проверить эти сегменты. Поэтому в результате использования CAT-инструментов может возникнуть ряд предложений ТМ, которые являются правильными, но неуместными в конкретных контекстах. Ошибки возникают в результате принятия этих предложений без их проверки или соответствующей адаптации. Так что здесь есть определенный минус.

Платить или не платить? Вот в чем вопрос

Как у многих пользовательских сервисов, у «котов» существуют бесплатные CAT-программы и платные версии. Какую выбрать – зависит от поставленных целей и задач.

Бесплатная CAT-программа для перевода, как правило, обладает меньшим функционалом. И, как правило, ее нужно скачивать и устанавливать на персональный компьютер. То есть нет возможности работать в команде и сохранять ТМ и глоссарий в облаке.  

Вот примеры CAT-программ, предоставляющих, наряду с платными, свободные для скачивания версии.

OmegaT https://omegat.org/

Эта программа заявлена как абсолютно бесплатная: её можно скачать на компьютер с любой операционной системой. Единственное условие: ОС должна соответствовать некоторым техническим критериям, указанным на сайте программы. Кроме того, если программа вам понравится, в качестве благодарности вы можете пожертвовать любую сумму. Но это не обязательное требование.

CafeTran Espresso https://www.cafetran.com/get-cafetran/

Этот сервис также заявлен как бесплатный. Хотя предлагается приобрести и платную лицензию. Разница в том, что в free-версия программы ограничена. Память перевода – не более 1000 единиц, глоссарий – не более 500 терминов. Хотите больше – будьте добры купить лицензию.

Впрочем, условно-бесплатными можно назвать и другие CAT-сервисы. Вот некоторые из них:

SDL Trados Studio https://www.sdltrados.com/

Это одна из популярнейших CAT-систем для переводчиков. Полностью «свободной» версии не имеет. Но чтобы не покупать в прямом смысле «кота в мешке», Trados предлагает попробовать поработать бесплатно в течение месяца. Понравится – оформите покупку позже.  Повысьте производительность за счет использования Большой языковой модели (LLM) с помощью Trados Copilot — помощника ИИ. Сочетание искусственного интеллекта с имеющимися лингвистическими ресурсами повышает качество перевода и ускоряет его выполнение.

MemoQ https://www.memoq.com/

 Эта CAT-система предлагает различные – в том числе по стоимости – варианты: для переводческих компаний, фрилансеров, студентов. Программа поддерживает наиболее употребительные форматы файлов и более 100 иностранных языков.

Wordfast https://www.wordfast.com/

До 2022 гога этот CAT-сервис был полностью бесплатным. Сейчас бесплатными остались только пробные версии. Wordfast – это набор CAT-инструментов: Wordfast Classic, Wordfast Pro и Wordfast Anywhere. Каждый из них выполняет свою функцию. Например, с Wordfast Anywhere переводчики могут работать над проектами в любом месте, где есть доступ в интернет. Переводчику достаточно войти в свой личный кабинет – и он получает доступ ко всем своим сохраненным данным.

Wordfast Classic устанавливается на ПК и позволяет работать офлайн, что также может быть удобно как фрилансерам, так и студентам. Wordfast Pro – это корпоративная версия для установки на любую операционную систему. Эта версия позволяет переводить тексты сразу на несколько целевых языков, поддерживает любые форматы файлов. Есть и другие «плюшки» – но только в полностью платной версии.

Across Translator Edition

Конечно, это платная система. Но есть и бесплатная CAT-программа для перевода от Across, правда, сильно урезанная в части возможностей. Платная подписка на год стоит довольно дорого, больше 110 евро в месяц, поэтому ее приобретают в основном, на компанию. Большой плюс – это условно-бесплатная версия, так сказать, на пробу.

Для того, чтобы разобраться в возможностях, можно зарегистрироваться и скачать. Учтите, что для установки система требует не меньше 20 Гб места на жестком диске. Для работы нужно создать проект, в котором вести перевод. Другая особенность — сложный интерфейс, который не похож на другие Cat-программы. Большое количество мелких значков подойдет только специалистом с острым зрением.

Из минусов – есть сложности с импортом памяти переводов из Trados или MemoQ. Их надо сначала преобразовать в какой-то общий формат, чтобы затем использовать в Across.

Слабовата система OCR, встроенная в Across, которая не тянет оцифровку отсканированных PDF-файлов. Также есть небольшая путаница со шрифтами, если у вас не будет нужного шрифта на компьютере, документ выйдет уродливым.

Смарткат https://Smartcat.com

Это проект российской ABBYY Language Solutions, который был внутренней системой и стал отдельно развиваться только после 2016 г. Самое большое преимущество системы – это бесплатная CAT-программа для переводчиков. Платить нужно только за автоматический перевод, или процент от проекта, если вы оплачиваете в Смарткате работу фрилансеров.

Smartcat как и другие CAT-системы включает такие возможности, как память переводов, терминологические базы, машинный перевод от сторонних провайдеров, работу над проектами и даже биржу фриланса.

Смарткат в расчетах между бюро и переводчиком действует как гарант оплаты. Рассчитываться за работу переводческая компания может прямо в системе, если оплатит депозит. Сначала работодатель перечисляет деньги на платформу, чтобы иметь возможность привлечь переводчика к проекту. После того, как переводчик закончил работу, бюро проверяет его работу и принимает. В этом случае Smartcat переведет оплату на личный счет переводчика, с которого затем их можно вывести на банковскую карту.

В Smartcat, в отличие от зарубежных аналогов, никаких ограничений по объему перевода. Один проект позволяет загружать десятки документов. В редакторе все работает очень быстро. Теперь работать онлайн в Смарткате можно при любом интернете. Например, можно быстро подтвердить сегмент, даже если связь очень плохая, на это не требуется большой скорости интернета. Еще из удобств можно назвать функции сохранения истории. В редакторе отражаются абсолютно все изменения сегментов перевода, так что можно их отменить или повторить отдельно каждый. Есть автоматический контроль качества. Работа с глоссарием не только сохраняет общую терминологию на проекте, но и разграничивает доступ к его редактуре. Это сделано для того, чтобы младшие переводчики не создавали путаницу в терминах.

Единственное, что может утомить переводчика, это сохранение форматирования перевода 1-в-1 с оригиналом. В Смарткате это реализовано с помощью мета-тегов. Подтвердить фрагмент не получится, пока переводчик не вставит в него все теги из исходного фрагмента. Но в целом Смарткат довольно удобная «кошка», которая постоянно развивается.

Это лишь несколько примеров CAT-программ, доступных на рынке. Каждая из них имеет свои особенности и возможности, мы постарались подчеркнуть основные из них, чтобы облегчить ваш выбор.

Выводы

CAT-программы при правильном использовании могут сделать доступными международные проекты для малого бизнеса. Особенно это касается проектов в машиностроении, разработке ПО, медицине, торговле и строительстве.

CAT-программы для переводчиков прекрасно проявили себя в переводах для нефтегазовых компаний, горнодобывающих компаний. С помощью CAT-инструментов, например, наша компания Translationrussian.ru готовит:

  • руководства по эксплуатации и техническому обслуживанию;

  • описание оборудование и руководства пользователя;

  • объемную проектную и инженерную документацию;

  • а также ведет проекты перевода объемной технической документации, которая не приемлет разночтений в терминологии.

В целом, как и любой инструмент, CAT-системы для переводчиков нужно использовать с умом. Тогда можно добиться значительной экономии времени, средств и сил.


ссылка на оригинал статьи https://habr.com/ru/articles/854074/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *