Разделение памяти переводов |
Здравствуйте, гость ( Вход | Регистрация )
Разделение памяти переводов |
Kagami |
15.1.2010, 23:51
Сообщение
#1
|
Старейший участник Группа: Участник Сообщений: 601 Регистрация: 2.2.2009 Пользователь №: 523 Спасибо сказали: 101 раз(а) Репутация: 9 |
Недавно я заинтересовался вопросом - "А сколько у нас в ПП сегментов, перевод которых совпадает с оригиналом (совпадающие сегменты)?". Быстро набросал программку и получил следующий результат: из 100000 сегментов совпадающих 75000. Если просто выкинуть их из ПП (например, с помощью TMXCleaner), то потом все равно придется их вводить. Но можно сделать по-другому:
1. При следующем объединении выделить все совпадающие в отдельный файл (я ради интереса написал QTMXSplitter). 2. Переводчикам взять файл только с несовпадающими сегментами. 3. Переводить файлы как обычно. 4. При объединении объединить файлы переводчиков в один, извлечь из него совпадающие сегменты и объединить их с файлом, полученным в п. 1. "+": Меньше размер ПП, меньше трафика, быстрее анализ в омеге. "-": Больше работы объединяющему, некоторые сегменты придется помечать как переведенные заново. Кто что думает по этому поводу? |
|
|
Kagami |
2.5.2010, 16:30
Сообщение
#2
|
Старейший участник Группа: Участник Сообщений: 601 Регистрация: 2.2.2009 Пользователь №: 523 Спасибо сказали: 101 раз(а) Репутация: 9 |
Хехе, я как раз думал сегодня в эту сторону. Решил сделать так. При диффе сохранять в разностную ПП информацию является ли сегмент новым, а если нет, то исходный вариант? с помощью тегов <prop> и <note> (тогда можно будет diff поглядеть и откорректировать прямо в файлике). И добавить ключик --force [n] для режима --merge чтобы он выбирал указанный вариант - 1 или 2 (по умолчанию 2) - без запроса пользователя. Но если хочешь, могу и --patch сделать. Думаю вечером появится в гиториусе
|
|
|
Текстовая версия | Сейчас: 22.11.2024, 22:58 |