crossplatform.ru

Здравствуйте, гость ( Вход | Регистрация )

23 страниц V   1 2 3 > »   
Ответить в данную темуНачать новую тему
> CAT и TM, (Системы автоматизированного перевода) и (Память переводов)
Litkevich Yuriy
  опции профиля:
сообщение 24.4.2008, 9:06
Сообщение #1


разработчик РЭА
*******

Группа: Сомодератор
Сообщений: 9669
Регистрация: 9.1.2008
Из: Тюмень
Пользователь №: 64

Спасибо сказали: 807 раз(а)




Репутация:   94  


Я тут начал юзать OmegaT, система для переводчиков, вобщем эта система делит входной текст на фрагменты называемые сегментами, и запоминает то как вы переведете сегмент, далее при 100% совпадении переводит их сама по всему проекту, т.е. по всем файлам. Нечеткие переводы просто предлагает как шаблон, вообщем переводить очень быстро можно.

Плюсы
* Понимает html и позволяет сгеренировать результат в том же формате.
* Автоматизируется процесс адаптации переводов.


Из недостатков
* Надо переводить с нуля, т.е. указывается исходный язык, и когда в файле есть слово "Сигналы" оно будет числится в английском, но это похоже можно обойти.
* Нельзя наполнить память переводов таким способом: указать не переведенный файл и его переведенный вариант.
* написано на Java - тормозит периодически.
* При попытке подсунуть ей все наши файлы документации - сделала ножки к верху, виртуалки не хватило.
Т.е. мы на себя взяли больше чем профессиональные переводчики :lol:

-----------------------------------------------------------------------------------------------

== Установка и настройка ==
2) Подготовка
  • Скачайте OmegaT и установите ее.
  • Чтобы не начинать все с нуля, предлагаю свои наработки, а именно готовый проект с памятью переводов (далее ПП).
    Скачайте архив omegat_project.zip и распакуйте архив куда-нибудь (путь класический без пробелов и кирилицы).
    Замечание: Для демонстрации работы в архив добавлен непереведенный файл qlistview.html (от версии 4.1.0 на английском и в кодировке UTF-8 )
  • Скачайте файл глоссария, который сделал alex977

2) Настройка OmegaT
Запустите ОмегуТ, в меню "Настройки" выберите "Файловые фильтры"
  • снимите флажек с "XHTML-файлы"
  • выберите пункт "HTML- и XHTML-файлы" и перейдите в его настройки
  • настройте как на рисунке:
    Прикрепленный файл  Omega_settings.png ( 6,42 килобайт ) Кол-во скачиваний: 56


3) Настройка проекта
  • в меню "Проект" выберите "Открыть", выберите каталог проекта "qt" (тот что из архива), после анализа вам будет предложено импортировать исходные файлы.
  • В качестве демонстрации работы, выберите указаный выше файл, OmegaT поместит его копию в подкаталог source, а затем проанализирует его (разобьет на сегменты). Т.к. проект уже содержит память переводов, то осуществит перевод имеющихся в ПП сегментов.
  • файл глоссария положите в подкаталог glossary.
  • Затем вы можете получить переведенный вариант файла, для этого в меню "Проект" выберите "Создать переведенные документы".
  • Ищите результат в подкаталоге target, ну а чтобы сохранить проект в соответствующем меню выберите "Сохранить"

Для добавления других файлов в проект в меню "Проект" выберите "Файлы проекта..."
Для у даления, просто удалите соответствующий файл из подкаталога source, и если необходимо из каталога target.

Не рекомендую добавлять в проект много фалов, лучше добавляйте новый по мере того как закончите с одним.

По редактированию сегментов:
  • Всякий раз когда вы нажимете "Ввод" перевод записывается в ПП (файлы *.tmx)
  • Неизменяйте внутренние тэги OmegaT, т.е. если сегмент выглядит так:
    <s1><s2>[<a3>QtGui</a3> module]</s2></s1>
    то перевдено должно быть так:
    <s1><s2>[Модуль <a3>QtGui</a3>]</s2></s1>
    т.к. по ним она востанавливает форматирование
  • то что вы не переводили в текстовом редакторе, здесь нужно помещать в ПП как есть, т.е. на соответствующем сегменте нажать "Ввод", например сегмент:
    #include <QListView>
    нужно перевести как есть, тогда OmegaT будет считать его переведенным.


Если что-то не понятно, спрашивайте здесь.
Прикрепленные файлы
Прикрепленный файл  omegat_project.zip ( 79,8 килобайт ) Кол-во скачиваний: 19
 
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
ViGOur
  опции профиля:
сообщение 24.4.2008, 9:13
Сообщение #2


Мастер
******

Группа: Модератор
Сообщений: 3296
Регистрация: 9.10.2007
Из: Москва
Пользователь №: 4

Спасибо сказали: 231 раз(а)




Репутация:   40  


Ссылку дай, взглянуть на него хоть. :)
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
Litkevich Yuriy
  опции профиля:
сообщение 24.4.2008, 9:39
Сообщение #3


разработчик РЭА
*******

Группа: Сомодератор
Сообщений: 9669
Регистрация: 9.1.2008
Из: Тюмень
Пользователь №: 64

Спасибо сказали: 807 раз(а)




Репутация:   94  


вот OmegaT
вообще координатор openSUSE RTT его обхаял, он две какие-то другие пытает.
дело в том что память переводов в ней простой текстовый файл и его проблемотично сделать общим, т.е. каждому прийдется самому обучать систему.

я запускаю так, в bat'нике:
java -Xmx250M -jar OmegaT.jar %*
где 250 емпирически подобраный размер памяти( в МиБ)

Вообще помучавшись с некоторыми инструментами, начал фантазировать на тему своей программы, наибольшую, для меня проблему представляет процесс сегментирования, т.е. грамотного выделения фраз, например из того же html.
Есть такой текст:
Цитата
<td width="1">  </td><td class="postheader" valign="center"><a href="index.html"><font color="#004faf">Home</font></a> · <a href="classes.html"><font color="#004faf">All Classes</font></a> · <a href="mainclasses.html"><font color="#004faf">Main Classes</font></a> · <a href="groups.html"><font color="#004faf">Grouped Classes</font></a> · <a href="modules.html"><font color="#004faf">Modules</font></a> · <a href="functions.html"><font color="#004faf">Functions</font></a></td>

А вот ка он отображается в OmegaT:
Цитата
<a0><f1>Home</f1></a0> <a2><f3>AllClasses</f3></a2> <a4><f5>MainClasses</f5></a4> <a6><f7>GroupedClasses</f7></a6> <a8><f9>Modules</f9></a8> <a10><f11>Functions</f11></a10>


т.е. ни каких href="classes.html" и т.д. переводчику не показывается, он не может испортить, она помечает своими тэгами все, тоже касается ссылок в нутри предложения, она понимает что это целая фраза, например:
Цитата
If the widget's layout direction is <a0>Qt::RightToLeft</a0> (instead of <a1>Qt::LeftToRight</a1>, the default), Qt::AlignLeft refers to the <i2>right</i2> edge and Qt::AlignRight to the <i3>left</i3> edge.

и переводчик видит все предложение, и в память переводов уйдет все предложение.
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
Litkevich Yuriy
  опции профиля:
сообщение 15.5.2008, 14:44
Сообщение #4


разработчик РЭА
*******

Группа: Сомодератор
Сообщений: 9669
Регистрация: 9.1.2008
Из: Тюмень
Пользователь №: 64

Спасибо сказали: 807 раз(а)




Репутация:   94  


в общем, OmegaT портит часть тегов html'ных, оригинал:
<a name="development"></a>
<td width="30%">Copyright © 2007 <a href="trolltech.html">Trolltech</a></td>

результат работы OmegaT:
<a name="development"/>
<td width="30%">Copyright  2007 <a href="trolltech.html">Trolltech</a></td>


Наверно нестоит ее пользовать <_<
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
ViGOur
  опции профиля:
сообщение 15.5.2008, 15:18
Сообщение #5


Мастер
******

Группа: Модератор
Сообщений: 3296
Регистрация: 9.10.2007
Из: Москва
Пользователь №: 4

Спасибо сказали: 231 раз(а)




Репутация:   40  


Я вижу, только что:
1. приведено <a name="development"/> (ничего криминального)
2. затерт © (криминал)
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
Litkevich Yuriy
  опции профиля:
сообщение 15.5.2008, 15:25
Сообщение #6


разработчик РЭА
*******

Группа: Сомодератор
Сообщений: 9669
Регистрация: 9.1.2008
Из: Тюмень
Пользователь №: 64

Спасибо сказали: 807 раз(а)




Репутация:   94  


еще он делает такую штуку, могу малость наврать:
было:
<br />

стало:
<br/>

т.е. прибил пробел, а в некоторых тегах, вроде в одиночных, и покакому-то стандарту пробел должен быть.
Толком не понял почему, но при просмотре в браузере шрифт меньше, чем у оригинала, хотя сравнивал файлы вроде относительно шрифта ничего не поменялось.
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
nick shaforostoff
  опции профиля:
сообщение 18.5.2008, 0:45
Сообщение #7


Студент
*

Группа: Новичок
Сообщений: 50
Регистрация: 6.12.2007
Из: киев
Пользователь №: 35

Спасибо сказали: 0 раз(а)




Репутация:   0  


на заметку: я автор альтернативной проги под KDE4. пока что она только .po-файлы может. через пару месяцев сделаю чтобы ею можно было переводить файлы любых форматов (будет конвертация в формат XLIFF и обратно)

http://techbase.kde.org/Projects/Summer_of...Projects/KAider
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
Litkevich Yuriy
  опции профиля:
сообщение 18.5.2008, 1:31
Сообщение #8


разработчик РЭА
*******

Группа: Сомодератор
Сообщений: 9669
Регистрация: 9.1.2008
Из: Тюмень
Пользователь №: 64

Спасибо сказали: 807 раз(а)




Репутация:   94  


nick, у меня такие вопросы:
-1-
как это работает, если предположить, что он уже поддерживает html, переводчик тэги видит или только текст?
Надо чтоб ПП не засарялась мусором вроде тэгов, чтоб только с текстом работать.
-2-
Как осуществляется работа с ПП? Это однопользовательская система или многопользовательская? Есть ли инструмент для обслуживания ПП (например, ее правка/подчистка).
-3-
Ты привязываешь ее к KDE? или там чистое QT приложение?
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
nick shaforostoff
  опции профиля:
сообщение 18.5.2008, 22:33
Сообщение #9


Студент
*

Группа: Новичок
Сообщений: 50
Регистрация: 6.12.2007
Из: киев
Пользователь №: 35

Спасибо сказали: 0 раз(а)




Репутация:   0  


1 формат XLIFF предусматривает такую штуку - в окне просто будет квадратик-заменитель, похоже как здесь: http://www.heartsome.net/EN/screen_hsxlf9.html
2 функцию синхронизации (в т.ч. переноса изменений из модифицированного перевода) я уже реализовал и постоянно ею пользуюсь когда мне присылают обновленные переводы для KDE. очень удобная штука. кроме того ф. синхронизации позволяет работать над несколькими ветками одновременно (редактируется trunk, и все изменения на фоне записываются в branch, если оригинал такой же)
3
привязываю. уж больно много всяких вкусностей в KDE. ну да, неудобство - надо пользовать kde installer, но это то же самое, что ставить джаву для омегит. версию для винды я периодически тестирую - она такая же работоспособная, как и линуксовая.

над программой продолжу работу сразу после сессии
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение
Litkevich Yuriy
  опции профиля:
сообщение 18.5.2008, 22:40
Сообщение #10


разработчик РЭА
*******

Группа: Сомодератор
Сообщений: 9669
Регистрация: 9.1.2008
Из: Тюмень
Пользователь №: 64

Спасибо сказали: 807 раз(а)




Репутация:   94  


Цитата(nick shaforostoff @ 19.5.2008, 2:33) *
версию для винды я периодически тестирую - она такая же работоспособная, как и линуксовая

можно тут по подробнее, если у меня есть Qt 4(см. мою подпись), что еще понадобится чтобы собрать твою программу?
нет ли готовых бинарей под виндовоз?
Перейти в начало страницы
 
Быстрая цитата+Цитировать сообщение

23 страниц V   1 2 3 > » 
Быстрый ответОтветить в данную темуНачать новую тему
Теги
Нет тегов для показа


3 чел. читают эту тему (гостей: 3, скрытых пользователей: 0)
Пользователей: 0




RSS Текстовая версия Сейчас: 22.11.2024, 7:55