Как работает переводчик-фрилансер

Когда десять лет назад я поступил на факультет переводов, нас учили как переводить: что такое теория перевода, как передавать смысл, как сохранять форму… Но никто не говорил, как именно переводить. Ну вот говорит мне заказчик, “нужно перевести документ с китайского на русский”, а дальше что? Открыть в Word’е и писать поверх оригинала? Или лучше открыть документ слева и справ, и переписывать, стараясь копировать форматирование? Или загнать в Google Translate, а потом редактировать?

Давайте расскажу, как я работаю. Если вы ещё только учитесь на письменного переводчика, или вам приходится переводить время от времени, вы обязательно узнаете что-нибудь полезное.

Disclaimer

Я не истина в последней инстанции, многие работают по-другому. Если что-то я делаю не так — приглашаю в комментарии!

Что у нас на входе?

Письменный переводчик сталкивается с текстом в совершенно разных форматах. Это может быть договор в формате *.doc, с форматированием и сносками.

Это может быть расписание строительных работ в табличке Excel.

Это могут быть письма в Outlook.

Это может быть string-файл локали приложения в каком-нибудь *.xml.

И что со всем этим делать? Как переводить? В чём держать словарик часто употребляемых слов?

Технологии

Computer Assisted Translation

Computer Assisted Translation (CAT) — принцип работы с письменными переводами, который обязателен в 21-м веке. Нельзя быть конкурентоспособным переводчиком, игнорируя современные технологии. Существует множество standalone-программ и онлайн-приложений, относящихся к CAT, например Trados, MemoQ, Tolma.ch и OmegaT.

Принцип простой: текст разбивается на сегменты, которые переводятся один за другим. Каждый сегмент и его перевод автоматически сохраняется в ТМ (translation memory, базу данных переводов) без привязки к конкретному документу.

Программа анализирует каждый новый сегмент и ищет похожие в ТМ. При полном совпадении программа может автоматически подставить перевод, при частичном — показать переводчику совпадения и различия.

CAT отслеживает терминологию, помогая сохранить единый перевод терминов в множестве документов (название деталей, имена персонажей, и т.п.).

Чем больше вы работаете с CAT, тем больше накапливается в памяти перевода, тем легче вам переводить каждый новый документ.

Machine Translation

Использовать машинный перевод для помощи переводчику — тренд последних нескольких лет. Это не означает переводить с помощью Google Translate, а лишь отображать машинный перевод по каждому сегменту в процессе работы. Это увеличивает скорость перевода на 100-200% без снижения качества перевода. Правда, это сработает только в том случае, когда переводчик знает язык. Редактировать машинный перевод с незнакомого языка категорически нельзя, можете существенно исказить смысл.

Софт

Эти программы пригодятся в работе переводчика. Буду подробнее останавливаться на каждой из программ по мере необходимости.

  • OmegaT
    Относится к программам CAT — помощникам переводчика, незаменимый инструмент.
  • GoldenDict
    Онлайн-словари хорошо, а офлайн ещё лучше. Для меня это Golden Dict. Это как ABBYY Lingvo, только бесплатно.
  • LibreOffice
    Много лет использую Libre Office как основной офисный пакет, но всегда держу под рукой Microsoft Office на случай неграмотного форматирования от заказчика.
  • F.lux
    Чтобы глазки не болели, и спалось хорошо.
  • Okapi
    Набор незаменимо полезных программ для работы с памятью перевода и для проверки орфографии.
  • ApSIC Xbench
    Автоматизированная проверка переводов. Версия 2.9 уже не поддерживается, зато совершенно бесплатная.
  • Notepad++
    Мощный текстовый редактор, пригодится для случаев, когда нужно что-то техническое поправить ручками.

Организация

Для начала упорядочим свою работу. Не храните файлы на рабочем столе или в Моих документах. Пусть у вас будет отдельная папка Работа, и только для работы. Внутри можете организовывать как вам удобно. У меня следующим уровнем идут компании, с которыми я работал.

Я большой фанат автоматизации перевода. Чем больше переводишь, тем больше копится в Translation Memory, тем легче переводить в дальнейшем. Поэтому любые переводы я стараюсь делать через OmegaT. Перестроиться на полную работу через CAT не так уж и сложно. Достаточно сохранить исходный файл в нужную папку, а затем открыть OmegaT. Иногда файл нужно подготовить, но сделать это совсем не сложно.

Подготовка файлов для OmegaT

Базовый принцип — оставить в файле только тот контент, который требуется перевести, и убрать лишнее. Форматирование при этом можно сохранить.

Например, в таблице Excel заказчик может оставить колонки ID, ChineseRussian, Comments. Очевидно, что под ними в конечном итоге должен быть нужный контент, но сами названия переводить не обязательно. Создайте копию файла и удалите содержимое из лишних колонок и строк, но не удаляйте сами строки, чтобы не нарушать структуру файла — будет проще собрать всё вместе в дальнейшем.

В текстовом документе Word лишними могут быть комментарии заказчика, подстрочник-пояснение на языке перевода, и прочее.

Иногда документ Word служит просто хранилищем для разрозненных кусков текста, которые заказчик любезно структурировал в одном файле.

Некоторые технические файлы, вроде strings.xml из приложений для Android, помимо текста содержит названия переменных, выглядит это примерно так:

Однако, удалять названия переменных не нужно: OmegaT и многие другие CAT-программы знакомы со структурой таких файлов и сами скроют от ваших глаз технический текст.

Если вы постоянно переводите корреспонденцию, просто копируйте текст письма в текстовый файл или Word.

Summary: форматирование сохраняйте, текст не для перевода — удаляйте. Всегда храните оригинальные файлы от заказчика.

Проекты

Будем считать, что вы уже установили OmegaT и подключили машинный перевод.

В OmegaT у каждого проекта есть только одна рабочая TM, в которую сохраняется вновь переводимый текст. Поэтому разумно создавать отдельные проекты не только по языковой принадлежности, но и по тематике перевода. Например, у меня есть проект General_ZH-RU для текстов общей тематики и каких-то случайных заказов, Games_ZH-RU для около-игровых текстов.

Кроме того, при работе над большими проектами конкретного заказчика имеет смысл создать отдельный проект именно для него, чтобы сохранять уникальную терминологию именно для этого продукта. Например, для перевода игры Luvinia с китайского на русский у меня есть проект Luvinia_ZH-RU. При этом память перевода из одного проекта можно добавить в другой в качестве вспомогательной: начали работать над переводом новой игры — создайте ей отдельный проект, и подключите памяти из других игровых проектов.

Глоссарий

Вести глоссарий проекта очень важно. Глоссарий — не словарь, это перевод слова в контексте конкретно проекта. Добавлять слова в глоссарий в OmegaT совсем не сложно, вот здесь я привожу наглядный пример.

В глоссарий следует заносить специфические для проекта термины. Например, в играх на платформе Playstation джойстик нужно называть исключительно “контроллером”, а для Xbox — “геймпадом”. Это требования гайдлайнов Microsoft и Sony, перепутать их нельзя ни в коем случае.

В художественных текстах в глоссарий следует добавлять имена персонажей, особенно если их перевод напрямую не вытекает из оригинала. К примеру, человека по фамилии 灰 [hui] можно перевести как Хой или Хуэй, а если это персонаж игры (и китайским происхождением можно пренебречь), то и вообще Грэй.

Когда имя встречается раз в три тысячи символов, можно забыть, как именно вы его обозвали, и встречался ли он вообще. Глоссарий и CAT подскажут правильный вариант ещё до того, как вы об этом подумаете.

Переводим! — разбираем конкретный кейс

Заказчик дал нам вот такой файлик в Word. Объясню по порядку, что мы с ним будем делать.

Определим контент

Мы переводим с китайского на русский. В файле есть много китайского и немного английского. Очевидно, что не всё из этого будет видно конечному пользователю.

Из контекста понятно, что не нужно переводить:

  • 催付场景:在买家创建订单半小时后,仍没有支付的情况下,卖家可以主动发起的一个催付款的通知消息。用于沟通服务未支付的原因。[ситуация: ….]
    Это описание ситуации, для которой нужен текст
  • 催付消息模板:[шаблон напоминания об оплате]
    Это просто обозначает, где начинается “шаблон”, который нужно первести
  • 中文 [китайский]
    Это означает, что дальше оригинальный текст на китайском
  • 标题 [заголовок]
    Означает, что дальше идёт заголовок

…и аналогичные предложения. А так же английский, с которого мы не переводим.

Создадим копию с контентом

Теперь сохраним выдержку в отдельный файл без лишнего мусора. Самым очевидным решением будет сохранить текст в такой же формат, как и исходный — Word, очистив его от мусора. Получится примерно так:

Такой файл уже готов к работе через OmegaT или другую программу.

Но здесь кроются подводные камни. Поставьте себя на место заказчика:

  1. Сможет ли он без знания языка сопоставить исходный текст и перевод?
  2. Есть ли room for error — возможность допустить глупую ошибку? Например, выделить не тот фрагмент, или вместе с текстом захватить сопроводительную информацию
  3. Понятная ли структура у файла?

Для подобных документов Word не подходит, текст для перевода перемешан с сопроводительным текстом. Вы можете облегчить работу себе и заказчику. Чем понятнее структура, тем меньше вопросов он будет вам задавать.

А решение простое: перенесите нужный текст в Excel:

Это делается простым Ctrl+C -> Ctrl+V.

Какой бы формат вы ни выбрали, сохраните получившийся файл в папку \source\ вашего проекта OmegaT.

Сколько брать?!

Теперь у нас есть файл только с тем, что следует перевести. И уже можно прикинуть, сколько заказчик должен заплатить за перевод.

В письменном переводе единица измерения — слово. Для языков вроде китайского, где определить слово в нашем понимании не так просто, единицей будет один символ.

Но это не всё. Добросовестный переводчик, работая с большим проектом, может сделать скидку, тарифицируя повторяющиеся сегменты и нечёткие совпадения (fuzzy matches) дешевле, ведь на них затрачивается намного меньше усилий. Просить меньше денег может показаться контринтуитивно, но сделав скидку и объяснив заказчику причину, вы значительно поднимите свою репутацию в его глазах, и создадите образ честного подрядчика. Хотя можете и схалтурить, дело за вами.

Внимание: делайте скидку за повторы только внутри конкретного проекта. Брать дешевле за совпадения с другими вашими ТМ не рекомендуется 🙂

Word может посчитать количество символов, но не подскажет, сколько там повторов, а CAT вроде OmegaT подскажет.

Сначала посмотрим общую статистику. Запустите OmegaT, нажмите Tools -> Statistics
Обратите внимание на цифры в Characters total и Characters unique. Разница между двумя этими цифрами — символы в предложении, которое повторяется в этом документе и переведётся автоматически, т.е. практически не потребует от вас усилий.

А ещё можно посмотреть подробности для похожих сегментов, где совпадение не 100%. Для этого нажмите Tools -> Match statistics per file

Так сколько просить-то?!

Если вы только начинаете переводить, и не знаете, сколько просить денег за символ/страницу, то посмотрите цены на ваше направление в разных переводческих агентствах. Просите столько же или больше на 50%. Если заказчик откажется, торгуйтесь. В любом случае, на первых заказах вы заработаете опыта больше, чем денег.

Переводим

Запускаем OmegaT, открываем проект с файлом, начинаем перевод.

В процессе перевода добавляйте в глоссарий слова, у которых может быть разный перевод, но вы хотели бы придерживаться одного. Например, если боитесь запутаться в переводе слова 订单 (заказ, бланк заказа, покупка) — добавьте его в глоссарий. В следующий раз, когда слово встретится в тексте, система сама подскажет перевод, и даже поможет его вписать:

Проверяем

Перед тем, как вернуть файл, проверьте, что в тексте нет глупых ошибок: используйте встроенный Language Tools. Для этого нажмите Tools -> Check issues…

Смотрите, целых три ошибки. Две опечатки — ничего необычного, это можно было заметить с помощью spellchecker’а даже в Word’е. А вот отсутствие перевода одного предложения простой текстовый редактор вам бы не подсказал.

Дважды кликните на ошибку в окне Issues, чтобы перейти к сегменту с ней.

Создаём готовый файл

Когда с переводом закончено, нажимаем Project -> Create translated documentsВ папке \target\ проекта появится готовый файл. Он будет иметь точно такую же структуру, как и оригинальный файл, только текст будет заменён на перевод.

Вот как выглядят оригинальный и переведённый файлы Word:

Такой вариант оптимален, если вы, например, переводите договор или книгу, и вам нужна идентичная копия документа на другом языке. Но если клиент будет в дальнейшем как-то использовать ваш текст, то ему придётся туго: как он сможет соотнести ваш перевод с оригиналом, не вчитываясь в каждую строку?

В этом случае поможет использование Excel:

Как видно, каждой строчке на китайском соответствует строка на русском под тем же номером. Теперь достаточно совместить оба столбца в одном файле. Скопируйте столбец в другой файл, и подпишите его. Заказчик точно не ошибётся:

Файл готов, возвращайте заказчику.

Вместо заключения

Тонкостей в работе переводчика целая куча. Я постоянно сижу на форуме 大БКРС, где регулярно задаются одни и те же вопросы от начинающих переводчиков. Вот и написал подобие статьи, чтобы кидать ссылку, а не повторять одно и то же. Я бы сам был рад прочитать такую статью в начале своей карьеры, чтобы совершать меньше ошибок.

Задавайте вопросы! С удовольствием напишу по ним продолжение.

blog.wtigga.com – Заметки белого тигра

6 комментариев

  • Антон

    Отличная статья, спасибо! Как вы думаете, почему до сих пор не создана едина база глоссария для переводов? Хотябы и за деньги? Или существует подобное?

    • WTiggA

      Универсальный единый глоссарий – это словарь 🙂 Потому что отличие глоссария от словаря в привязке к конкретному проекту.
      Памяти перевода иногда выкладывают в общий доступ, например у Mozilla раньше были TMX в открытом доступе. Но работать с миллионами слабо-релевантных строк будет и медленно, и не очень эффективно.
      В онлайн-платформах вроде crowdin зачастую предлагают доступ к “общим” TM (за деньги) на определённую тематику. Но проверять всё равно нужно будет за посторонними.

  • Моисеев Сергей

    Обалденная статья! Спасибо, Владимир Жданов! Огромное спасибо! Я вроде как не начинающий переводчик (плотно занимаюсь “переводами на продажу” с 2012 г, а китайский начал изучать в 8 лет). Но, сейчас век современных технологий, и эту технологию надо выстраивать и осваивать. А такие статьи только в помощь. Работал только в Мемсёрсе, но его предоставляет фирма. А так, зная опыт работы в САТ, знаю, что это намного ускоряет работу. Одним словом → 赞! Надо только потом еще хорошо перечитать и поэкспериментировать. А то сейчас, после дневного перевода голова не очень хорошо работает. Еще раз огромное спасибо и мое почтение)))

  • Юлия Андросова

    Прекрасная статья! Я в свое время плотно пользовалась Trados, хотя и OmegaT осваивала. Жаль, тогда не было таких подробных статей и лайфхаков)

Добавить комментарий

Ваш e-mail не будет опубликован. Обязательные поля помечены *