Разделение памяти переводов |
Здравствуйте, гость ( Вход | Регистрация )
Разделение памяти переводов |
Kagami |
15.1.2010, 23:51
Сообщение
#1
|
Старейший участник Группа: Участник Сообщений: 601 Регистрация: 2.2.2009 Пользователь №: 523 Спасибо сказали: 101 раз(а) Репутация: 9 |
Недавно я заинтересовался вопросом - "А сколько у нас в ПП сегментов, перевод которых совпадает с оригиналом (совпадающие сегменты)?". Быстро набросал программку и получил следующий результат: из 100000 сегментов совпадающих 75000. Если просто выкинуть их из ПП (например, с помощью TMXCleaner), то потом все равно придется их вводить. Но можно сделать по-другому:
1. При следующем объединении выделить все совпадающие в отдельный файл (я ради интереса написал QTMXSplitter). 2. Переводчикам взять файл только с несовпадающими сегментами. 3. Переводить файлы как обычно. 4. При объединении объединить файлы переводчиков в один, извлечь из него совпадающие сегменты и объединить их с файлом, полученным в п. 1. "+": Меньше размер ПП, меньше трафика, быстрее анализ в омеге. "-": Больше работы объединяющему, некоторые сегменты придется помечать как переведенные заново. Кто что думает по этому поводу? |
|
|
Kagami |
16.1.2010, 15:52
Сообщение
#2
|
Старейший участник Группа: Участник Сообщений: 601 Регистрация: 2.2.2009 Пользователь №: 523 Спасибо сказали: 101 раз(а) Репутация: 9 |
Я написал программу для сравнивания двух файлов омеги.
Она создает новый файл омеги содержащий только сегменты, которых нет в первом файле, и сегменты, значение которых было изменено. Сейчас подчищу код и попробую зарегиться на гиториусе |
|
|
Текстовая версия | Сейчас: 26.11.2024, 18:09 |