Разделение памяти переводов |
Здравствуйте, гость ( Вход | Регистрация )
Разделение памяти переводов |
Kagami |
15.1.2010, 23:51
Сообщение
#1
|
Старейший участник Группа: Участник Сообщений: 601 Регистрация: 2.2.2009 Пользователь №: 523 Спасибо сказали: 101 раз(а) Репутация: 9 |
Недавно я заинтересовался вопросом - "А сколько у нас в ПП сегментов, перевод которых совпадает с оригиналом (совпадающие сегменты)?". Быстро набросал программку и получил следующий результат: из 100000 сегментов совпадающих 75000. Если просто выкинуть их из ПП (например, с помощью TMXCleaner), то потом все равно придется их вводить. Но можно сделать по-другому:
1. При следующем объединении выделить все совпадающие в отдельный файл (я ради интереса написал QTMXSplitter). 2. Переводчикам взять файл только с несовпадающими сегментами. 3. Переводить файлы как обычно. 4. При объединении объединить файлы переводчиков в один, извлечь из него совпадающие сегменты и объединить их с файлом, полученным в п. 1. "+": Меньше размер ПП, меньше трафика, быстрее анализ в омеге. "-": Больше работы объединяющему, некоторые сегменты придется помечать как переведенные заново. Кто что думает по этому поводу? |
|
|
Litkevich Yuriy |
16.1.2010, 10:09
Сообщение
#2
|
разработчик РЭА Группа: Сомодератор Сообщений: 9669 Регистрация: 9.1.2008 Из: Тюмень Пользователь №: 64 Спасибо сказали: 807 раз(а) Репутация: 94 |
Я думаю, что лучше из ПП переводчика вычленять новые сегменты, т.е. отдельная программа. И эту разностную ПП отправлять.
|
|
|
Kagami |
16.1.2010, 11:40
Сообщение
#3
|
Старейший участник Группа: Участник Сообщений: 601 Регистрация: 2.2.2009 Пользователь №: 523 Спасибо сказали: 101 раз(а) Репутация: 9 |
Для меня более важна скорость анализа в Омеге, чем объем пересылаемого файла.
P.S. А программу для diff'а TMX еще никто не писал? |
|
|
Litkevich Yuriy |
16.1.2010, 12:51
Сообщение
#4
|
разработчик РЭА Группа: Сомодератор Сообщений: 9669 Регистрация: 9.1.2008 Из: Тюмень Пользователь №: 64 Спасибо сказали: 807 раз(а) Репутация: 94 |
|
|
|
Kagami |
16.1.2010, 15:52
Сообщение
#5
|
Старейший участник Группа: Участник Сообщений: 601 Регистрация: 2.2.2009 Пользователь №: 523 Спасибо сказали: 101 раз(а) Репутация: 9 |
Я написал программу для сравнивания двух файлов омеги.
Она создает новый файл омеги содержащий только сегменты, которых нет в первом файле, и сегменты, значение которых было изменено. Сейчас подчищу код и попробую зарегиться на гиториусе |
|
|
Kagami |
16.1.2010, 17:53
Сообщение
#6
|
Старейший участник Группа: Участник Сообщений: 601 Регистрация: 2.2.2009 Пользователь №: 523 Спасибо сказали: 101 раз(а) Репутация: 9 |
На гиториусе зарегился, но он у меня ключи не принимает... Так что пока выкладываю тут.
Прикрепленные файлы
|
|
|
Kagami |
16.1.2010, 21:57
Сообщение
#7
|
Старейший участник Группа: Участник Сообщений: 601 Регистрация: 2.2.2009 Пользователь №: 523 Спасибо сказали: 101 раз(а) Репутация: 9 |
Вот новая версия. Чуть пофиксил баги, доработал API для указания исходного языка и языка перевода. Будет пару часиков свободного времени и креативное настроение, напишу еще класс TMXMerger
P.S. Что-то гиториус у меня так ключи не принимает. Похоже какой-то глюк
Прикрепленные файлы
|
|
|
Kagami |
17.1.2010, 19:08
Сообщение
#8
|
Старейший участник Группа: Участник Сообщений: 601 Регистрация: 2.2.2009 Пользователь №: 523 Спасибо сказали: 101 раз(а) Репутация: 9 |
Теперь исходники переехали на сюда - http://gitorious.org/qtmxtools
|
|
|
Kagami |
24.1.2010, 18:08
Сообщение
#9
|
Старейший участник Группа: Участник Сообщений: 601 Регистрация: 2.2.2009 Пользователь №: 523 Спасибо сказали: 101 раз(а) Репутация: 9 |
Добавил возможность объединения ПП из двух файлов. При этом программа берет сегменты которые есть только в одном файле, а для сегментов которые есть в обоих файлах и у которых различается перевод выводит оригинал, оба варианта и спрашивает какой оставить.
|
|
|
Litkevich Yuriy |
23.2.2010, 10:39
Сообщение
#10
|
разработчик РЭА Группа: Сомодератор Сообщений: 9669 Регистрация: 9.1.2008 Из: Тюмень Пользователь №: 64 Спасибо сказали: 807 раз(а) Репутация: 94 |
Kagami, я тут собрался документацию обновить, и решил собрать общую ПП (Novak куда-то пропал) и обнаружил странную вещь, Твоя программа дала разницу только для моей ПП, делал так:
(имя исполняемого фала я изменил)Здесь comon.tmx - общая ПП с прошлого раза. Может я не правильно делал? |
|
|
Текстовая версия | Сейчас: 22.11.2024, 22:24 |