Home
Angel Station
Продолжение следует
Языки наизнанку 
26th-Dec-2008 12:35 am

Есть две программы, которые мне нельзя запускать: Adobe Photoshop и Microsoft Visual Studio. Если я их запускаю в свободное от работы время, то застреваю в них надолго. Видимо, в детстве не нарисовался и в конструктор не наигрался… В общем, VS мне попала под хвост вот по какому поводу: есть вещи, которые в локализации считаются само собой разумеющимися, которые принимаются на веру и все такое… Например, что немецкий - “длинный” язык, то есть, что при переводе с английского на немецкий текст существенно удлиняется – по сравнению с остальными. Я, собственно, тоже принимал-принимал, а тут выходные… Дай, думаю, покручу переводы, статистику пособираю.

Взял базу переводов, около 100 тысяч фраз и компьютерных терминов, написал програмку, которая выцепляет и анализирует пары “английский оригинал – перевод” для шести языков: французский, итальянский, немецкий, испанский, русский, португальский (бразильский). Азиатские языки мучать не стал: они в общем случае короче (в смысле количества символов).

О некоторых результатах напишу завтра, когда дообрабатываю: меня интересуют 12 параметров для каждого языка, я с ними еще вожусь. Если хотите, можете попробовать угадать три из них:

  • У какого из вышеперечисленных языков встретился перевод с максимальным удлинением? Пример: “ Cannot Find Help File” на итальянский переводится как “Impossibile trovare il file della Guida”, удлинение 81%. А “User” на русский переводится как “Пользователь”, удлинение – 200%. И так далее. У какого языка встретится самый большой процент?
  • У какого из вышеперечисленных языков самое большое “среднее” удлинение текста по всей выборке? Все языки действительно “в среднем” длинее английского, какой “самый удлиняющийся”?
  • У какого из языков получилось наибольшее количество переводов, где длина оригинала больше длины перевода? Ну, типа “Connection Attributes” на одну букву длинее чем “Атрибуты соединения”… В каком языке чаще всего встречаются такие “короткие” переводы?

Кидайте предположения в приват, завтра сверитесь :)

Comments 
26th-Dec-2008 10:44 am (UTC)
имхо тайский зачастую короче английского получается) про китайский молчу. а самый удлинняющийся наверно немецкий.. или испанский)
27th-Dec-2008 06:38 am (UTC)
:)
26th-Dec-2008 10:57 am (UTC)
та ну так не честно :) на английском - это все почти уже жаргон, потому и коротко а переводить пытаются литературно
27th-Dec-2008 06:37 am (UTC)
Вот я и пытаюсь выяснить, насколько нечестно :) Один из выводов: за использование акронимов девелоперам надо бить по рукам :)
26th-Dec-2008 11:17 am (UTC)
Гадать не буду, у меня наболевший вопрос. Русский Windows до сих пор встречает пользователя имбецильным приветствием "Приветствие"? )
27th-Dec-2008 06:36 am (UTC)
Честно говоря, не знаю :) "Приветствие" - это которое перый экран после установки и входа в виндовс?
26th-Dec-2008 11:30 am (UTC)
Во-первых, удлинение зависит от качества перевода (и соответственно отношения к этому качеству со стороны потребителей/локализаторов). Для длинных текстов хороший перевод с английского на русский всегда короче плохого (просто потому, что переводчик лучше владеет средствами родного языка).
Во-вторых, самые большие удлинения скорее всего будут на коротких словах. Потом, локализация - не вполне перевод; слово Yes может быть переведено "Подтвердить" или "Согласен". Вот, кстати, кандидат на короткий перевод: "Yes" на русский, испанский, итальянский - сокращение в 1.5 раза.
Интересно было бы посмотреть статистику коэффициентов удлинения/сокращения в зависимости от длины исходного сегмента - и асимптотику.
Ставки:
1. Немецкий
2. Бразильский португальский (наудачу, поставил бы на русский, но неинтересно)
3. Итальянский

27th-Dec-2008 06:34 am (UTC)
> Интересно было бы посмотреть статистику коэффициентов удлинения/сокращения в зависимости от длины исходного сегмента - и асимптотику.

Это - очень правильное замечание. Я этим займусь завтра :)
26th-Dec-2008 01:48 pm (UTC)
"У какого из вышеперечисленных языков самое большое “среднее” удлинение текста по всей выборке? Все языки действительно “в среднем” длинее английского, какой “самый удлиняющийся”? "

Думаю у русского.
26th-Dec-2008 03:09 pm (UTC)
1. Немецкий
2. Русский
3. Немецкий
26th-Dec-2008 03:40 pm (UTC)
1. Русский
2. Немецкий
3. Португальский
This page was loaded Jul 14th 2009, 3:07 pm GMT.