Померяемся языками, чей длиннее?

от автора

Всем привет!

Мы занимаемся локализацией программного обеспечения и игр на 30+ языков и часто видим, как разработчики сталкиваются с одной и той же проблемой: в разных языках для передачи одной и той же информации требуется разное количество знаков. В итоге, в интерфейсе пользователя некоторые надписи “не влазят” и их приходится сокращать, либо изменять размеры контролов.

Известно, что, к примеру, немецкий язык “длиннее” английского, а китайский — “короче”. Однако вряд ли у кого-то получится сходу точно сказать на сколько один язык более “знакоёмкий”, чем другой.

Нам стало интересно, мы собрали статистику и получили вот такую табличку с коэффициентами для примерно двадцати языковых пар — под катом.


Язык оригинала Язык перевода На сколько текст на языке перевода больше или меньше (-) оригинала
Английский Французский 17.48%
Английский Испанский 16.33%
Английский Итальянский 15.19%
Английский Немецкий 14.29%
Английский Нидерландский 12.13%
Английский Португальский (Португалия) 12.01%
Английский Португальский (Бразилия) 11.48%
Английский Польский 8.54%
Английский Русский 8.35%
Английский Чешский 3.57%
Английский Арабский -6.67%
Английский Японский -65.79%
Английский Корейский -78.69%
Английский Китайский (Упрощенный) -162.96%
Английский Китайский (Традиционный) -176.25%
Русский Английский 1.37%
Русский Итальянский 11.10%
Русский Испанский 12.10%
Русский Немецкий 12.48%
Русский Французский 13.84%
Итальянский Русский 3.45%

Как считали?

Расчет произведен на основании данных сервиса живого онлайн перевода Nitro (это как Google Translate, только перевод выполняется живыми переводчиками-носителями языка). По мере работы сервиса там накапливаются так называемые параллельные тексты (оригинал на одном языке — перевод на другом).

И вот мы взяли последние 1000 заказов в Nitro по каждому из направлений перевода, для каждого заказа нашли отношение количества знаков в тексте перевода к количеству знаков в тексте оригинала, отсортировали получившиеся значения и выбрали серединное значение (медиану). Таким образом мы получили наиболее вероятное отношение.

Выводы

Примечательно, что при переводе с английского на русский, длина текста вырастает на 8.35%, а при переводе в обратном направлении… снова вырастает, но всего на 1.37%. Это может говорить о том, что переводчики используют больше слов, чтобы не потерять и передать смысл текста правильно в ущерб лаконичности. Мы же были уверены, что получим симметрию т.е. меньше английского текста при переводе с русского — оказывается в реальной жизни это не так.

Мы так же были много лет уверены, что немецкий текст вырастает на 30% при переводе с английского (эта цифра кочует из презентации в презентацию о локализации программного обеспечения разных докладчиков и так же встречается в документации для разработчиков Microsoft), но это не так — рост всего 14.29%.

Суперкороткий (более чем в 2.5 раза!) китайский текст заставляет хорошенько задуматься над тем, как будут выглядеть наши приложения и вылизанные до пикселя игры для iOS будучи переведенными на это язык.

Надеемся, эта информация пригодится не только для удовлетворения любопытства “так какой же язык самый лаконичный?”, но и для решения практических задач, например, для определения максимальных размеров полей и контролов при подготовке к локализации приложения, игры или сайта.

Обещаем не забывать об этой инициативе и обновлять, уточнять статистику, добавлять новые направления перевода на радость разработчикам и менеджерам по локализации.

Кстати, службу профессионального перевода на иностранные языки Nitro, по данным которой построена статистика, можно попробовать бесплатно. Для этого напишите нам на nitro@alconost.com пару строк о себе, и мы пришлем вам купон на пополнение счета.

ссылка на оригинал статьи http://habrahabr.ru/company/alconost/blog/197146/


Комментарии

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *