Разделение памяти переводов |
Здравствуйте, гость ( Вход | Регистрация )
Разделение памяти переводов |
Kagami |
15.1.2010, 23:51
Сообщение
#1
|
Старейший участник Группа: Участник Сообщений: 601 Регистрация: 2.2.2009 Пользователь №: 523 Спасибо сказали: 101 раз(а) Репутация: 9 |
Недавно я заинтересовался вопросом - "А сколько у нас в ПП сегментов, перевод которых совпадает с оригиналом (совпадающие сегменты)?". Быстро набросал программку и получил следующий результат: из 100000 сегментов совпадающих 75000. Если просто выкинуть их из ПП (например, с помощью TMXCleaner), то потом все равно придется их вводить. Но можно сделать по-другому:
1. При следующем объединении выделить все совпадающие в отдельный файл (я ради интереса написал QTMXSplitter). 2. Переводчикам взять файл только с несовпадающими сегментами. 3. Переводить файлы как обычно. 4. При объединении объединить файлы переводчиков в один, извлечь из него совпадающие сегменты и объединить их с файлом, полученным в п. 1. "+": Меньше размер ПП, меньше трафика, быстрее анализ в омеге. "-": Больше работы объединяющему, некоторые сегменты придется помечать как переведенные заново. Кто что думает по этому поводу? |
|
|
Kagami |
16.1.2010, 11:40
Сообщение
#2
|
Старейший участник Группа: Участник Сообщений: 601 Регистрация: 2.2.2009 Пользователь №: 523 Спасибо сказали: 101 раз(а) Репутация: 9 |
Для меня более важна скорость анализа в Омеге, чем объем пересылаемого файла.
P.S. А программу для diff'а TMX еще никто не писал? |
|
|
Текстовая версия | Сейчас: 23.11.2024, 3:51 |