Разделение памяти переводов |
Здравствуйте, гость ( Вход | Регистрация )
Разделение памяти переводов |
Kagami |
15.1.2010, 23:51
Сообщение
#1
|
Старейший участник Группа: Участник Сообщений: 601 Регистрация: 2.2.2009 Пользователь №: 523 Спасибо сказали: 101 раз(а) Репутация: 9 |
Недавно я заинтересовался вопросом - "А сколько у нас в ПП сегментов, перевод которых совпадает с оригиналом (совпадающие сегменты)?". Быстро набросал программку и получил следующий результат: из 100000 сегментов совпадающих 75000. Если просто выкинуть их из ПП (например, с помощью TMXCleaner), то потом все равно придется их вводить. Но можно сделать по-другому:
1. При следующем объединении выделить все совпадающие в отдельный файл (я ради интереса написал QTMXSplitter). 2. Переводчикам взять файл только с несовпадающими сегментами. 3. Переводить файлы как обычно. 4. При объединении объединить файлы переводчиков в один, извлечь из него совпадающие сегменты и объединить их с файлом, полученным в п. 1. "+": Меньше размер ПП, меньше трафика, быстрее анализ в омеге. "-": Больше работы объединяющему, некоторые сегменты придется помечать как переведенные заново. Кто что думает по этому поводу? |
|
|
Litkevich Yuriy |
2.5.2010, 17:41
Сообщение
#2
|
разработчик РЭА Группа: Сомодератор Сообщений: 9669 Регистрация: 9.1.2008 Из: Тюмень Пользователь №: 64 Спасибо сказали: 807 раз(а) Репутация: 94 |
мне больше подуше вариант классический. Т.е. разность это разность (но в случае с ПП, конечно, нужно чтобы это была полноценная память переводов, а не то, что делает unix'овая программа diff, т.е. без спец информации). А patch просто интуитивно понятный ключ.
Если есть интересные мысли по поводу специнформации, то мне, как пользователю, было бы удобнее разрешать её появление в tmx-файле только при дополнительном ключе. А по умолчанию, чтобы просто чистая ПП была. П.С. к стати говоря проект твой весьма впечатляющий, хоть и маленький и не приметный на первый взгляд. Я думаю, надо тебе место в подфоруме проекты выделить. И сделать там два раздельчика русскоязычный и англоязычный. Пюс написать команде OmegaT, чтобы они добавили твой проект в свой раздел Third-party software. Многим инструмент понадобится. Тем более, что работает он шутсрее явовских |
|
|
Текстовая версия | Сейчас: 14.11.2024, 6:10 |