Автоматизированный перевод

Вступление

За последние 10-15 лет характер работы переводчика  и требования к нему существенно  изменились. В первую очередь изменения  коснулись перевода научно-технической, официальной и деловой документации. Сегодня уже недостаточно просто перевести текст, пользуясь компьютером как пишущей машинкой. Заказчик ожидает о переводчика, что оформление готового документа будет соответствовать внешнему виду оригинала настолько точно, насколько это возможно, при этом удовлетворять принятым в данной стране стандартам. От переводчика требуется также умение эффективно использовать  ранее выполненные заказы на ту же тему, а работодатель, в свою очередь, рассчитывает на заметную экономию времени и средств при переводе повторяющихся или похожих фрагментах текста. Эти жесткие, зачастую противоречивые условия можно соблюсти лишь в том случае, если переводчик не только в совершенстве владеет родным и иностранным языком и глубоко изучил выбранную им предметную область, но и уверенно ориентируется в современных компьютерных технологиях.

Ключевой для  переводчика технической документации в данных условиях является технология TRANSLATION MEMORY (TM). Системам машинного перевода уделено мало места, так как возможности  их ограничены и это не позволяет  рекомендовать их для применения в процессе профессиональной работы над текстом.

В последнее  время устойчиво возрастает объем  переводов, связанных с информационными  технологиями, причем переводческим  и компьютерным компаниям приходится иметь дело не только с подготовкой  документации, но и с локализацией программного обеспечения, т.е. с переводом ресурсов, содержащихся в exe- и dll- файлах. И с последующим тестированием ПО.

Что же такое  машинный перевод и системы автоматизированного  перевода, чем они отличаются и  как могут помочь переводчику в его работе.

 

1.1 Машинный перевод.

Машинный перевод (MT англ. Machine Translation) — процесс перевода текстов (письменных, а в идеале и устных) с одного естественного языка на другой полностью специальной компьютерной программой. Так же называется направление научных исследований, связанных с построением подобных систем.

Мысль использовать ЭВМ для перевода была высказана  в 1947 году в США, сразу после появления  первых ЭВМ. Первая публичная демонстрация машинного перевода (так называемый Джорджтаунский эксперимент) состоялась в 1954 году. Несмотря на примитивность той системы (словарь в 250 слов, грамматика из 6 правил, перевод нескольких простых фраз), этот эксперимент получил широкий резонанс: начались исследования в Англии, Болгарии, ГДР, Италии, Китае, Франции, ФРГ, Японии и других странах; в том же 1954 году и в СССР.

К середине 1960-х  в США для практического использования  были предоставлены две системы  русско-английского перевода:

  • MARK (в Департаменте иностранной техники ВВС США);
  • GAT (разработка Джорджтаунского университета, использовалась в Национальной лаборатории атомной энергии в Окридже и в центре Евратома в г. Испра, Италия).

Однако созданная  для оценки подобных систем комиссия ALPAC пришла к выводу, что в силу низкого качества машинно переведённых текстов эта деятельность в условиях США нерентабельна. Хотя комиссия рекомендовала продолжать и углублять теоретические разработки, в целом её выводы привели к росту пессимизма, снижению финансирования, часто к полному прекращению работ по этой тематике.

Тем не менее, в  ряде стран исследования продолжались, чему способствовал постоянный прогресс вычислительной техники. Особенно существенным фактором стало появление мини- и  персональных компьютеров, а с ними всё более сложных словарных, поисковых и т. п. систем, ориентированных на работу с естественноязыковыми данными. Росла и необходимость в переводе как таковом ввиду роста международных связей. Все это привело к новому подъёму этой области, наступившему примерно с середины 1970-х. В 1980-е наступило время широкого практического использования переводческих систем, сложился рынок коммерческих разработок по этой теме.

Впрочем, мечты, с которыми человечество полвека  назад взялось за задачу машинного  перевода, в значительной мере остаются мечтами: высококачественный перевод текстов широкой тематики по-прежнему недостижим. Однако несомненным является ускорение работы переводчика при использовании систем машинного перевода: по оценкам конца 1980-х, до пяти раз.

В настоящее  время существует множество коммерческих проектов машинного перевода. Одним из пионеров в области машинного перевода была компания Systran. В России большой вклад в развитие машинного перевода внесла группа под руководством проф. Р. Г. Пиотровского (Российский государственный педагогический университет имени А. И. Герцена, Санкт-Петербург).

 

Статистический  машинный перевод

Статистический  машинный перевод — это разновидность  машинного перевода текста, основанная на сравнении больших объёмов  языковых пар. Языковые пары — тексты, содержащие предложения на одном языке и соответствующие им предложения на втором, могут быть как вариантами написания двух предложений человеком — носителем двух языков, так и набором предложений и их переводов, выполненных человеком. Таким образом статистический машинный перевод обладает свойством «самообучения». Чем больше в распоряжении имеется языковых пар и чем точнее они соответствуют друг другу, тем лучше результат статистического машинного перевода. Под понятием «статистического машинного перевода» подразумевается общий подход к решению проблемы перевода, который основан на поиске наиболее вероятного перевода предложения с использованием данных, полученных из двуязычной совокупности текстов. В качестве примера двуязычной совокупности текстов можно назвать парламентские отчеты, которые представляют собой протоколы дебатов в парламенте. Двуязычные парламентские отчеты издаются в Канаде, Гонконге и других странах; официальные документы Европейского экономического сообщества издаются на 11 языках; а Организация объединенных наций публикует документы на нескольких языках. Как оказалось, эти материалы представляют собой бесценные ресурсы для статистического машинного перевода.

Формы организации  взаимодействия ЭВМ и человека при  машинном переводе:

  • С постредактированием: исходный текст перерабатывается машиной, а человек-редактор исправляет результат;
  • С предредактированием: человек приспосабливает текст к обработке машиной (устраняет возможные неоднозначные прочтения, упрощает и размечает текст), после чего начинается программная обработка;
  • С интерредактированием: человек вмешивается в работу системы перевода, разрешая трудные случаи;
  • Смешанные системы (например, одновременно с пред- и постредактированием).

 

Качество перевода с использованием машинных средств.

Качество перевода зависит от тематики и стиля исходного текста, а также грамматической, синтаксической и лексической родственности языков, между которыми производится перевод. Машинный перевод художественных текстов практически всегда оказывается неудовлетворительного качества. Тем не менее для технических документов при наличии специализированных машинных словарей и некоторой настройке системы на особенности того или иного типа текстов возможно получение перевода приемлемого качества, который нуждается лишь в небольшой редакторской корректировке.[источник не указан 128 дней] Чем более формализован стиль исходного документа, тем большего качества перевода можно ожидать. Самых лучших результатов при использовании машинного перевода можно достичь для текстов, написанных в техническом (различные описания и руководства) и официально-деловом стиле.

Применение машинного  перевода без настройки на тематику (или с намеренно неверной настройкой) служит предметом многочисленных бытующих в Интернете шуток. Из старых и  наиболее популярных примеров наиболее известен текст перевода документации к драйверу мыши, известный как «Гуртовщики Мыши», заявленный как «перевод компьютерной документации программой Poliglossum на основе медицинского, коммерческого и юридического словарей». Из кратких — фраза «Our cat gave birth to three kittens — two whites and one black», которую онлайн-переводчик «ПРОМТ» (версия 7.0, 2007) превращал в «Наш кот родил трёх котят — двух белых и одного афроамериканца».[5] Если «афроамериканца» ещё можно было сделать «чёрным», написав «black kitten», то «коту» так и не получалось сменить пол: например, female cat переводился как «самка кот».

Чаще всего  подобные шутки связаны с тем, что программа не распознаёт контекст фразы и переводит термины  дословно, к тому же не отличая собственных имён от обычных слов. Тот же переводчик ПРОМТ превращает «Лев Толстой» в «Lion Thick» («толстый лев»), «bra-ket notation» в «примечание Кети лифчика», «Lie algebra» — в «алгебру Лжи», «eccentricity vector» — в «вектор оригинальности», «Shawnee Smith» в «индеец племени шони Смит» и т. п. Переводчик Google, наоборот, слово «rice» часто принимал за фамилию госсекретаря США. Также одним из показательных примеров использования машинного перевода без редактуры является данный веб-сайт: http://querywords.ru/english/Finder%27s+Fee

 

1.2 Автоматизированный перевод http://ikit.edu.sfu-kras.ru/files/12/ch01s01s01.pdf

Вместо «машинный» иногда употребляеся слово «автоматический», что не влияет на смысл. Однако термин «автоматизированный» перевод имеет совсем другое значение — при нём программа просто помогает человеку переводить тексты.

Автоматизированный  перевод (АП или САТ англ. Computer-Aided Translation) — перевод текстов на компьютере с использованием компьютерных технологий. От машинного перевода (МП) он отличается тем, что весь процесс перевода осуществляется человеком, компьютер лишь помогает ему произвести готовый текст либо за меньшее время, либо с лучшим качеством.

Автоматизированный  перевод предполагает такие формы  взаимодействия:

• Частично автоматизированный перевод: например, использование переводчиком-человеком компьютерных словарей.

• Системы с разделением труда: компьютер обучен переводить только фразы жёстко заданной структуры (но делает это так, чтобы исправлять за ним не требовалось), а всё не уложившееся в схему отдает человеку.

Идея АП появилась  с момента появления компьютеров: переводчики всегда выступали против стандартной в те годы концепции МП, на которую было направлено большинство исследований в области компьютерной лингвистики, но поддерживали использование компьютеров для помощи переводчикам. В 1960-е годы Европейское объединение угля и стали (предшественник современного Евросоюза) стало создавать терминологические базы данных под общим названием Eurodicautom. В Советском Союзе для создания баз такого рода был создан ВИНИТИ.

В современной  форме идея АП была развита в статье Мартина Кея 1980 года, который выдвинул следующий тезис: "By taking over what is mechanical and routine, it (computer) frees human beings for what is essentially human" («Компьютер берет на себя рутинные операции и освобождает человека для операций, требующих человеческого мышления»).

В настоящее время наиболее распространенными способами использования компьютеров при письменном переводе является работа со словарями и глоссариями, памятью переводов (англ. Translation Memory, TM), содержащей примеры ранее переведенных текстов, а также использование так называемых корпусов, больших коллекций текстов на одном или нескольких языках, что дает сжатое описание того, как слова и выражения реально используются в языке в целом или в конкретной предметной области.

Для локализации  программного обеспечения часто применяются специализированные средства, например, Passolo, которые позволяют переводить меню и сообщения в программных ресурсах и непосредственно в откомпилированных программах, а также тестировать корректность локализации. Для перевода аудиовизуальных материалов (главным образом фильмов) также используются специализированные средства, например, Swift, которые объединяют в себе некоторые аспекты памяти переводов, но дополнительно обеспечивают возможность появления субтитров по времени, их форматирования на экране, следования видеостандартам и т.п.

При синхронном переводе использование средств  автоматизированного перевода по необходимости  ограничено. Одним из примеров является использование словарей, загружаемых  на КПК. Другим примеров может служить полуавтоматическое извлечение списков терминов при подготовке к синхронному переводу в узкой предметной области.

В узких предметных областях при большом количестве исходных текстов и устоявшейся  терминологии переводчики могут  использовать и машинный перевод, который может обеспечить хорошее качество перевода терминологии и устойчивых выражений в узкой области. Переводчик в этом случае осуществляет пост-редактирование полученного текста. Более половины текстов внутри Еврокомиссии (главным образом юридические тесты и текущая корреспонденция) переводится с использованием МП.

Автоматизированный  перевод — это широкое и  понятие, охватывающее широкий спектр простых и сложных инструментов. Они могут включать:

  • Программы для проверки правописания, которые могут быть встроены в текстовые редакторы или дополнительные программы;
  • Программы для проверки грамматики, которые также встраиваются в текстовые редакторы или дополнительные программы;
  • Программы для управления терминологией, которые позволяют переводчикам управлять своей собственной терминологической базой в электронной форме. Это может быть и простая таблица, созданная в текстовом редакторе, и электронная таблица, и база данных, созданная в программе FileMaker. Для более трудоемких (и более дорогих) решений существует специальное программное обеспечение, например, LogiTerm, MultiTerm, Termex, TermStar и т. п.
  • Словари на компакт-дисках, одноязычные или многоязычные;
  • Терминологические базы данных, хранимые на компакт-дисках или подключаемые по Интернету, например The Open Terminology Forum или TERMIUM;
  • Программы для полнотекстового поиска (или индексаторы), которые позволяют пользователю обращаться с запросами к ранее переведенным текстам или разного рода справочным документам. В индустрии переводов известны такие индексаторы, как Naturel, ISYS Search Software и dtSearch;
  • Программы конкорданса, которые позволяют находить примеры слов или выражений в употребляемом контексте в одноязычном, двуязычном или многоязычном корпусе, как например, битекст или память переводов, например Transit NXT;
  • Битекст, одно из нововведений последнего времени, это результат слияния исходного текста и его перевода, который впоследствии может быть проанализирован при помощи программ для полнотекстового поиска или конкорданса;
  • Программное обеспечение для управления проектами, которое позволяет лингвистам структурировать сложные переводческие проекты, передавать выполнение различных задач разным сотрудникам и наблюдать за процессом выполнения этих задач;
  • Программы управления памятью переводов (TMM), состоящие из базы данных сегментов текста на исходном языке и их переводов на один или более целевых языков, например Transit NXT;
  • Почти полностью автоматические системы, напоминающие машинный перевод, но позволяющие пользователю вносить определенные изменения в сомнительных случаях. Иногда такие программы называют машинным переводом с участием человека.

 

Память переводов

Па́мять перево́дов (ПП, англ. translation memory, TM иногда называемая «Накопитель переводов») — база данных, содержащая набор ранее переведенных текстов. Одна запись в такой базе данных соответствует «единице перевода» (англ. translation unit), за которую обычно принимается одно предложение (реже — часть сложносочинённого предложения, либо абзац). Если очередное предложение исходного текста в точности совпадает с предложением, хранящимся в базе (точное соответствие, англ. exact match), оно может быть автоматически подставлено в перевод. Новое предложение может также слегка отличаться от хранящегося в базе (неточное соответствие, англ. fuzzy match). Такое предложение может быть также подставлено в перевод, но переводчик будет должен внести необходимые изменения.

Помимо ускорения  процесса перевода повторяющихся фрагментов и изменений, внесенных в уже переведенные тексты (например, новых версий программных продуктов или изменений в законодательстве), системы ПП также обеспечивают единообразие перевода терминологии в одинаковых фрагментах, что особенно важно при техническом переводе. С другой стороны, если переводчик регулярно подставляет в свой перевод точные соответствия, извлеченные из баз переводов, без контроля их использования в новом контексте, качество переведенного текста может ухудшиться.

В каждой конкретной системе ПП данные хранятся в своем собственном формате (текстовый формат в Wordfast, база данных Access в Deja Vu), но существует международный стандарт TMX (англ. Translation Memory eXchange format), который основан на XML и который могут порождать практически все системы ПП. Благодаря этому результаты работы переводчиков можно обменивать между приложениями, то есть переводчик работающий с OmegaT может использовать ПП, созданную в ТРАДОСе и наоборот.

Большинство систем ПП как минимум поддерживают создание и использование словарей пользователя, создание новых баз данных на основе параллельных текстов (англ. alignment), а также полуавтоматическое извлечение терминологии из оригинальных и параллельных текстов.

 

1.3 Средства автоматизированного перевода (CAT-tools)

Наиболее распространенные CAT-средства

SDL Trados

Trados — система  автоматизированного перевода, первоначально  (с 1992 года) разработанная немецкой  компанией Trados GmbH. Является одним  из мировых лидеров в классе  систем Translation Memory (TM, Память переводов).

Trados GmbH была  основана в 1984 году в Штутгарте. В 1997 году 20 % акций компании были приобретены Microsoft. В 2002 году Trados объединилась с Uniscape Inc., и объединённая компания получила название Trados Inc. со штаб-квартирой в Александрии (США, штат Виргиния). В июне 2005 года компания Trados была приобретена британской SDL International, и в 2006 году был выпущен совместный продукт SDL Trados, включающий системы Trados и SDLX.

Система Trados состоит  из модулей, предназначенных для  перевода текстов различного формата: документов Microsoft Word, презентаций PowerPoint, текстов в формате HTML и других метаданных, документов FrameMaker, InterLeaf и др., а также для ведения терминологических баз данных (модуль MultiTerm). Последняя версия системы, выпущенная независимой компанией Trados — 7.0. Последняя версия Trados на сегодняшний день — SDL Trados Studio 2011.

Концепция Translation Memory предполагает выявление в переводимом  тексте фрагментов, переводы которых  уже имеются в базе данных переводов, и за счет этого сокращение объёма работы переводчика. Фрагменты, оставшиеся непереведёнными, передаются дальше для ручной обработки переводчику или системе машинного перевода (Machine Translation, MT). Переводчик на этом этапе может выделить вновь переведённые фрагменты и занести новые пары параллельных текстов на двух языках в базу данных. Такая схема наилучшим образом работает в случае однотипных текстов, где повторяемость словосочетаний достаточно высока, то есть в случае разного рода инструкций для пользователей, технических описаний и т. п.

Основные модули

  • Translator’s Workbench — модуль работы с базами данных памяти переводов TM (создания, обслуживания, импорта, экспорта). Создание документов перевода и их редактирование производятся в отдельных модулях.
  • Панель Trados в Microsoft Word — модуль для перевода документов в Microsoft Word.
  • TagEditor — модуль для перевода документов в формате PowerPoint, Excel, HTML, XML и т. п.
  • WinAlign — модуль для создания памяти переводов на основе ранее переведённых двуязычных текстов.
  • S-Tagger — модуль для перевода документов в формате FrameMaker и InterLeaf.
  • T-Window — модуль для перевода текста из буфера обмена.
  • MultiTerm — модуль для ведения глоссариев.
  • ExtraTerm — модуль для автоматического поиска терминологических кандидатов в тексте и создания глоссариев на их основе.

 

Déjà Vu

Déjà Vu — проприетарная система автоматизированного перевода, разработанная испанской компанией Atril Language Engineering. Является одним из мировых лидеров в классе систем памяти переводов.

Компания Atril Language Engineering основана в 1993 году. Компания занимается разработкой компьютерных систем для автоматизации работы переводчиков и переводческих агентств.

Версия продукта

Год выпуска

Поддерживаемая  ОС

Déjà Vu version 1

1993 — 1996

MS DOS

Déjà Vu 3

1996 — 2001

MS Windows 95

Déjà Vu X

2001 — 2011

MS Windows 98, ME, 2000, XP, Vista, 7

Déjà Vu X2

c 2011 года

MS Windows XP, Vista, 7

Версия продукта

Год выпуска

Поддерживаемая  ОС


 

Déjà Vu Х Standard

Целевая группа: переводчики-фрилансеры. Описание: данная версия предназначена для переводчиков, желающих получить простой и удобный инструмент для работы. Позволяет создавать полноценные проекты, однако в ней отсутствуют некоторые автоматизированные функции, которые есть в версии Professional.

Déjà Vu Professional

Целевая группа: переводчики-фрилансеры. Описание: классическая версия программы для переводчиков со всеми автоматизированными функциями «Интеллектуального качества»: «Предперевод», «Автопоиск» по базам данных, «Автоподстановка» перевода по всем аналогичным сегментам на проекте, «Автопополнение» баз данных, а также «Автосборка» перевода из фрагментов, хранящихся в базах данных. Использование функций Лексикона позволяет создавать глоссарии на основе переводимых Вами проектов, определить частотность употребления терминов и использовать полученные глоссарии для контроля качества.

Déjà Vu Workgroup

Целевая группа: переводческие агентства и отделы переводов. Описание: мощный инструмент, который включает все функции  версии Professional, плюс широкие возможности  по организации коллективной работы, управлению проектами и интеграции. Обладает всеми функциями Déjà Vu Professional, но также позволяет вести коллективную работу через создание проектов-сателлитов для переводчиков-фрилансеров или редакторов с текстами на перевод, памятью переводов и терминологией, либо через задания на перевод во внешнем формате, с которым можно работать с помощью любого текстового редактора.

Déjà Vu X TeaM Server

Гибкое решение, которое дает возможность пользователям Déjà Vu X2 Workgroup делиться базами данных в режиме реального времени по всему миру. Данное решение обеспечивает непревзойденное качество, единообразие и производительность, плюс более низкие проектные затраты. Возможные схемы лицензирования могут снизить или совсем исключить ручное администрирование проектов.

Поддерживаемые  форматы

Déjà Vu X способен создавать проекты и работать с Microsoft Word, Rich Text Format, Windows Help, Microsoft Excel, Micosoft PowerPoint, Microsoft Access, OpenOffice/StarOffice, Adobe FrameMaker MIF, Adobe InDesign, Adobe PageMaker tagged text, QuarkXPress XTG, Interleaf ASCII, HTML, ASP/ASP.NET, PHP, JavaScript, VBScript, HTML Help, SGML, XML, RC, C/C++/Java, Java properties, IBM TM untranslated segments, Trados WorkBench documents, TradosTag TTX, Trados TagEditor BIF, Trados TagEditor TMX, GNU PO и POT files и файлами в кодах ASCII — plain text files.

 

WORDfast (http://www.wordfast.net)

Wordfast - это программа  автоматизированного перевода (CAT), разработанная в качестве надстройки для Microsoft Word.

Разработка Wordfast ver. 1 (называемой в то время просто Wordfast) началась в 1999 в Париже Ивом Шамполионом. Это был набор макросов, запускаемых  из-под Microsoft Word, версии 97 или выше. В  то время все программы автоматизированного перевода работали из-под Microsoft Word, например Trados.

Вплоть до конца 2002 года, это ПО (теперь называемое Wordfast Classic) распространялось бесплатно. Благодаря  хорошим отзывам, Wordfast стал вторым по распространенности среди переводчиков средством автоматизированного перевода.

В 2006, была основана компания Wordfast LLC. До этого времени  разработка программы производилась  лично Ивом Шамполлионом.

В январе 2009 года, компания Wordfast выпустила в свет Wordfast Translation Studio включившую Wordfast Classic и Wordfast Professional, отдельно работающее Java приложение автоматизированного перевода. Оба инструмента могут быть приобретены как отдельно, так и вместе в составе студии.

В мае 2010 года, компания Wordfast запустила бесплатный онлайн инструмент Wordfast Anywhere. Данный инструмент позволяет переводчикам работать над проектами практически из любого места и с любого устройства, имеющего выход в сеть. К концу июля 2010 года на проекте зарегистрировалось более 5000 пользователей, а к ноябрю их число стало 10 000.

Wordfast использует  прозрачный, открытый формат для  всех своих данных и в то  же время поддерживает совместимость  с Trados и большинством программ  автоматизированного перевода. Можно переводить файлы Ms-Word, Ms-Excel, Ms-PowerPoint а также целый ряд размеченных документов. К Wordfast подключаются программы машинного перевода, например PowerTranslator, Systran, Reverso и т.д. Имеются широкие возможности работы с терминологией.

Хотя Wordfast в  основном предназначен для индивидуальной работы переводчика, он легко интегрируется в рабочий процесс бюро переводов и крупных клиентов. Вся эта мощь умещается в одном компактном шаблоне Word™ можно обмениваться данными посредством локальной сети или через Интернет.

Интеграция Wordfast с распространенными средствами перевода

Wordfast совместим  со всеми распространенными программами  перевода (Trados, IBM Translation Manager, SDLX, DéjàVu, Transit - либо через формат TMX, либо напрямую, на уровне собственного формата).

Wordfast сомвместим  с файлами, подготовленными (размеченными) для перевода с помощью стандартных программ, например фильтров Trados (Stagger) или RWS (Rainbow).

Wordfast совместим  с Trados на уровне переведенных (сегментированных, двуязычных) документов: файл, переведенный в Wordfast, можно очистить при помощи Trados и наоборот.

 Совместимость  с платформами:

Операционная  система

Примечания

Windows 95, 98, Me

Тест пройден: совместимы

Windows NT 4

Тест пройден: совместимы

Windows 2000

Тест пройден: совместимы

Windows XP

Тест пройден: совместимы

Windows Vista

Тест пройден (возможно потребуется отключить  управление учётными записями пользователей (UAC) в панели управления): совместимы

Mac OS 7, 8, 9

Идёт тестирование

Mac OSX (рекомендуется: OSX 10.3.4 или выше)

Идёт тестирование

Linux (Mandrake, XFCE, VMWare & Office 97)

Тест пройден: несовместимы

Linux (Suse, KDE2 + Crossover & Word 2000)

Тест пройден: несовместимы


 

Принцип работы САТ-средств. (http://www.tmemory.ru/)

Программа извлекает текст из файлов с оригиналом, делит его на сегменты (по знакам препинания или другим настраиваемым критериям) и представляет в виде таблицы, слева – сегменты оригинала, справа – пустые сегменты, куда переводчик заносит перевод. Простой табличный формат помогает переводчику следить за тем, чтобы не оставалось непереведенных фраз и предложений.  Из всех сегментов в паре «оригинал-перевод» составляются базы данных памяти перевода.

При обработке  нового текста, поступившего на перевод, система сравнивает каждое его предложение с сохраненными в базе сегментами прошлых переводов. Если идентичный или сегмент, подобный исходному, найден, то перевод этого сегмента отображается вместе с переводом и указанием совпадения в процентах. Слова и фразы, которые отличаются от сохраненного текста, выделяются цветом, в таком случае следует провести только редактирование, а в случае если совпадений с базой не найдено, выполняется перевод.

Помимо этого  осуществляется контроль над соблюдением  терминологии, соответствием числовых значений и дат, проверяется орфография, сокращается время на верстку и редактирование, осуществляется автоматический анализ трудозатрат и трудоемкости.

Базы данных памяти перевода можно составить  также из уже выполненных переводов  с помощью встроенных функций в самом начале работы с программой.

 

Преимущества  перевода с помощью CAT-средств (http://www.englishelp.ru)

  1. Обеспечивается единообразие перевода, что положительно сказывается на его качестве;
  2. Ускоряется сам темп работ по переводу за счет возможности не переводить одинаковые фрагменты текста дважды. В результате, сокращаются сроки, необходимые на перевод;
  3. Изменения, дополнения и замечания заказчика достаточно легко можно внести по всей базе переводов, что позволяет мгновенно исправить неточности в уже переведенных сегментах и избежать нового появления подобных ошибок.
  4. В случае если исходный документ предоставлен в одном из приведенных ниже форматов, то перевод осуществляется без нарушения структуры документа. Фактически необходимо лишь подправить текстовые фрагменты для устранения несоответствия объемов текста оригинала и перевода.
  5. CAT-средства позволяют снизить общую стоимость перевода для заказчика. В отличие от обычных расчетов на перевод, перевод с помощью CAT-средств тарифицируется по количеству слов с учетом следующих параметров:
        • количество одинаковых (повторяющихся) сегментов;
        • количество сегментов, совпадающих с памятью переводов в процентном соотношении.
Автоматизированный перевод