Лекция 10. Компьютерный перевод 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Лекция 10. Компьютерный перевод



Лекция 10. Компьютерный перевод

План лекции

 

 

1. Основы компьютерного перевода

2. Классификация технологий компьютерного перевода

3. Компьютерные переводческие программы

 

 

Практическое задание 1. Ознакомьтесь с заданием 1 по работе с компьютерными переводческими программами (Приложение 1)

 

 

О компании ПРОМТ

Компания ПРОМТ основана в 1991 году. Компания занимается исследованиями в области прикладной лингвистики, разработкой технологий и систем машинного перевода для европейских языков. ПРОМТ ставит своей целью создание программных средств, позволяющих свободно общаться на разных языках. Программные продукты компании распространяются по всему миру под торговыми марками PROMT, REVERSO, PROMT Internet, WebView.
Интернет-решения компании ПРОМТ работают на крупнейших мировых и российских порталах: Lycos (Lycos.ru, Lycos.es, Lycos.de), Voila, Caramail, e-lingo, Transparent Language, InfiniT. Стратегическим партнером компании ПРОМТ является компания Softissimo, SARL (Франция).

Оцените качество перевода на сайте бесплатного переводчика Translate.ru.

Получите скидку в Интернет-магазине компании ПРОМТ: http://www.e-promt.ru/

 

--------------------------------------------------------------------------------

ПРОДУКТ ПРОИЗВОДИТЕЛЬ ПРИМЕЧАНИЕ

Deja vu Atril Это сравнительно недорогой и самый многофункциональный продукт. Использующие его переводчики подают заявки на включение в него тех или иных полезных функций и эти заявки оперативно выполняются.

Translation Manager IBM По отзывам специалистов, это самая эффективная, хотя и не очень дружественная к пользователю программа.

SDLX SDL Недавно появившийся продукт, который быстро совершенствуется.

Transit Star Лучше других продуктов приспособлен к работе с кириллицей. Немаловажное достоинство — наличие российского дистрибьютора.

Translation’s Workbench Trados В этой программе в качестве служебного редактора используется MS Word. Учитывая так же, что Microsoft приобрела акции компании Trados и планирует использовать ее программное обеспечение в качестве внутреннего хранилища локализованных компонентов, у программы Translation’s Workbench (именуемой в просторечии Trados) есть хорошие шансы стать международным стандартом.

 

--------------------------------------------------------------------------------

Разумеется, у переводческих накопителей есть и свои недостатки. Помимо уже упоминавшихся ограничений на переводимые тексты, это прежде всего высокая цена большинства TM-продуктов (тысяча и более долларов), а также отсутствие стандарта. Все чаще, приглашая на работу переводчиков, заграничные заказчики оговаривают в качестве обязательного условия наличие у претендента той или иной TM-программы. Однако в объявлениях встречаются разные названия, поэтому, купив продукт, ориентированный на одного работодателя, вы можете не удовлетворять требованиям другого. Причем на овладение каждым из продуктов требуется потратить не только деньги, но и время.

 

При оценке затрат на эти программы следует учитывать, что переводческие пакеты продаются в виде набора модулей (утилиты создания и ведения базы данных, редактор, фильтры для работы с различными текстовыми процессорами и т.п.), часть из которых могут быть лично вам не нужны. Поэтому нужно внимательно следить за тем, что включено в базовый комплект, а за что вам придется платить отдельно.

 

Аппаратные аппетиты рассматриваемого класса продуктов вполне предсказуемы (чем всего больше, тем — как всегда — лучше). Причем, кроме всего прочего, TM-продукты предъявляют повышенные требования и к монитору. Поскольку друзья переводчика являются многооконными программами, для работы с ними желательно иметь большой монитор. Специалисты советуют не жалеть день-ги хотя бы на 17-дюймовый.

 

В мою задачу не входит подробное сравнение продуктов различных фирм — я только хотела обратить внимание читателей на новый пласт программного обеспечения. Те же, кто хотят подробнее ознакомиться со спецификой различных программ, могут посетить сайты ведущих производителей TM-продуктов.

 

Не могу удержаться и не упомянуть еще один продукт — WordFisher. Его нельзя отнести к категории широко распространенных, и я ни разу не видела, чтобы заказчики требовали его наличия. Однако у этой программы, составленной венгерским переводчиком Тибором Кёрнеи, есть два существенных достоинства: простота и дешевизна. WordFisher является комплектом макрокоманд для перевода документов в MS Word и распространяется как shareware по цене всего 30 долларов.

 

И последняя «информация к размышлению»:

Опрос, проведенный Международным институтом переводчиков, показал, что пока только около 15% переводчиков используют в своей работе переводческие накопители; однако среди переводчиков с высокими доходами доля пользователей TM-продуктов составляет 40–50%.

НЕДАВНО (см. Результат меняется от перестановки, или Что такое хорошо и что такое плохо?) была опубликована статья Н. Шаховой, посвященная TM-программам, или "накопителям переводчика" (возможно, более удачным является вариант "накопители переводов"), — теме, очень редко затрагиваемой на страницах компьютерных изданий. Продолжая эту тему, предлагаем вам обзор TM-программ, доступных в настоящее время на рынке. Напомним, что речь идет об интерактивных инструментах, позволяющих переводчику накапливать в специальной базе данных (БД) эквивалентные текстовые фрагменты на двух языках, чтобы в дальнейшем быстро находить образцы для перевода новых текстов. В качестве фрагментов могут выступать слова, словосочетания и целые фразы. При работе над текстами, близкими по жанру и тематике, такие инструменты по мере пополнения БД все больше упрощают и ускоряют перевод.

Мастер сопоставления параллельных текстов в DejaVu

 

Итак, основные функции TM-программы — пополнение БД парных фрагментов и анализ новых текстов для их поблочного перевода. Программа сегментирует переводимый текст (выделяет фразы или обособленные обороты) и сличает полученные сочетания с элементами БД, в случае совпадения предлагая переводчику подставить готовый перевод фрагмента в конечный текст (или же подставляя его автоматически). Во многих программах предусмотрен "нечеткий" (fuzzy) поиск.

Стандартной для этого класса продуктов стала возможность вести словари терминов и непереводимых имен, что очень важно для работы с текстами из узкой предметной области. Обычно ассортимент поддерживаемых TM-системами языковых пар довольно обширен; в последнее время все большее число разработчиков декларируют поддержку "двунаправленных языков" (bi-directional languages). Термин этот представляется не совсем корректным. Правильнее было бы в данном случае говорить не о языках, а скорее о текстах, содержащих фрагменты на языках с разным направлением письма (например, о смеси английского с арабским или ивритом).

Сама по себе идеология накопителей переводов не подразумевает использования развитых лингвистических технологий, однако в наиболее совершенных TM-программах имеются встроенные морфологические модули и средства проверки орфографии для нескольких языков, а также относительно интеллектуальные средства сопоставления (aligning) параллельных текстов с целью автоматического формирования парных фрагментов на двух языках. Процедуры сопоставления в разных программах различны, но, как правило, они включают элементы диалога и иногда требуют модификации одного из параллельных текстов (особенно если имеет место вольный перевод).

Большинство программ совместимы с популярными текстовыми процессорами и издательскими пакетами, с распространенными форматами типа RTF, PDF и HTML. Почти все TM-системы позволяют для удобства группировать рабочие файлы, БД и терминологические словари в отдельные "проекты".

Накопители переводов — дорогое профессиональное средство. Как правило, разработчики предлагают как корпоративные, сетевые, так и индивидуальные (freelance) версии своих TM-систем. В первом случае (особенно при поставке многофункциональных инструментальных комплексов) цена может превышать 1000 долл., во втором она составляет несколько сот долларов. Программы нередко защищаются с помощью аппаратных ключей.

Панель SDLX обеспечивает удобный доступ ко всем функциям

 

Trados 3.0

Одним из пионеров и лидеров рынка TM-программ является многонациональная компания Trados (http://www.trados.com/), предлагающая пакет Trados Translation Solution — линейку инструментов автоматизации перевода. Пакет поставляется в корпоративном (Team Edition) и однопользовательском (Freelance Edition, цена около 1 тыс. долл.) вариантах. Основной модуль пакета, Translator’s Workbench, предназначен для работы с базой данных TM, а также обеспечивает функции преобразования дат и единиц измерения, а при работе со сложными документами — еще и манипуляции со сносками, указателями и т. п. Модуль MultiTerm служит для ведения многоязычной БД терминов. Модуль WinAlign позволяет в полуавтоматическом режиме пополнять БД накопителя путем анализа параллельных текстов на двух языках. Кроме того, в пакет входит средство для перевода документов, содержащих разметку SGML и HTML, — TagEditor.

Версия Trados 3.0 совместима с Windows 2000, Office 2000 (Word 2000, PowerPoint 2000), издательскими пакетами FrameMaker, Interleaf, PageMaker, QuarkXPress и Ventura, языками XML, SGML и HTML. При инсталляции Trados встраивает свой инструментарий в панель инструментов и меню Word. Тесная интеграция с Office позволяет при переводе текстов в Word автоматически пополнять базу данных TM.

Программа автоматически анализирует тексты, разбивая их на сегменты, которые можно затем экспортировать в базу данных TM. Ограничителями сегментов по умолчанию служат табуляторы, маркеры абзацев и некоторые знаки препинания. Сегменты, не имеющие аналогов в БД, можно либо включить туда, снабдив переводом, либо поместить в словарь терминов. После сегментации текста функция автоматизированного перевода предлагает пользователю фрагменты для поблочного формирования перевода.

Инструментарий DejaVu

Компания Atril (http://www.atril.com/) выпускает набор мощных средств класса TM, главным из которых является программа DejaVu Interactive. Ее функция Pretranslate сегментирует исходный текст и автоматически подставляет в конечный переводы сегментов, найденных в БД. Для фрагментов, лишь частично соответствующих имеющимся образцам, функция fuzzy match в диалоговом режиме предлагает вариант перевода. Более интеллектуальные функции Assemble и Propagation позволяют, как утверждается, повысить степень автоматизации перевода и пополнения базы данных TM.

Как и в других TM-системах, в DejaVu есть средство работы с терминами, кроме того, добавлена возможность запрещать перевод отдельных фраз в исходных текстах.

Панель управления WordAlign

Программа совместима с многочисленными текстовыми редакторами и верстальными программами, в том числе Word, PowerPoint, FrameMaker, PageMaker, QuarkXPress, Interleaf, а также TM-программами IBM и Trados; поддерживаются форматы RTF, Help Contents, Java Properties files, HTML (включая ASP), HTML Help, SGML, RC, C/C++.

DejaVu позволяет в переводческих проектах выбирать языковые пары из обширного списка языков мира; имеется встроенное средство проверки орфографии для десятка европейских языков. В комплект DejaVu входит также модуль TermWatch, который обеспечивает доступ к терминологическому словарю из среды приложений, работающих с иноязычными текстами. Программа снабжена удобным справочником.

Все модули DejaVu используют общий OLE-сервер, на его базе можно разрабатывать приложения, содержащие вызовы функций API.

Цена DejaVu — от 790 до 990 долл. в зависимости от числа приобретаемых лицензий. На Web-узле разработчика можно загрузить бесплатную 30-дневную демоверсию программы.

SDLX 3.0

Компания SDL International (http://www.sdlintl.com/) предлагает TM-инструмент SDLX, позволяющий создавать и редактировать базу данных TM, пополнять ее путем сопоставления параллельных текстов, производить анализ, сегментацию и автоматизированный перевод текстов, вести пользовательский многоязычный глоссарий. Предусмотрен "нечеткий" поиск фрагментов в TM. Поддерживается перевод "двунаправленных" (неоднородных по направлению письма) текстов.

SDLX совместима с форматами документов HTML, RTF, MIF и TXT; предусмотрен импорт и экспорт баз данных TM различных форматов, включая Trados. Важным достоинством программы является возможность обрабатывать (анализировать и переводить) файлы в пакетном режиме.

На узле компании SDL можно загрузить демоверсию SDLX с ограниченной функциональностью. Полная корпоративная версия программы стоит 1000 долл. (она защищается аппаратным ключом), версия Light — 399 долл., версия для одиночных пользователей (без функций анализа текста, автоматического перевода и фильтров для SGML и XML) — 350 долл.

Transit и TermStar

Швейцарская компания STAR (http://www.star-ag.ch/) предлагает серию программ для автоматизации деятельности переводчика.

ТМ-программа Transit Professional использует технологию "нечеткого индекса" (fuzzy index): при поиске фрагментов в базе данных накопленных переводов ищутся сочетания, приблизительно соответствующие выделенному фрагменту.

Transit работает практически со всеми европейскими языками (включая русский), турецким, арабским, китайским и японским, поддерживаются также "двунаправленные" тексты.

Благодаря наличию фильтров импорта-экспорта программа совместима с множеством текстовых процессоров, издательских и прочих пакетов (Excel, PowerPoint, Word, WordPerfect, AmiPro, Interleaf, FrameMaker, PageMaker, Xyvision, Ventura, QuarkXPress), а также с распространенными форматами (HTML, SGML, XML, RTF).

Вместе с Transit распространяется программа TermStar — многоязычный менеджер терминологических гипертекстовых словарей, взаимодействующий с TM-средой и пригодный для многопользовательской работы.

TM-инструменты фирмы STAR поставляются в нескольких вариантах комплектации. Вариант Transit Professional 3.0, включающий TermStar, стоит 1245 евро; вариант Workstation, не имеющий функций импорта и экспорта, — 695 евро. Корпоративный пакет Translation Center Suite стоит около 4 тыс. евро, а его вариант с сетевыми возможностями Corporate Suite 3.0 — около 8 тыс. евро.

WordFisher 4

Независимый переводчик из Венгрии Корней Тибор создал недорогую (всего 30 долл.) TM-программу WordFisher. Программа, реализованная в виде макроса, интегрируется с Microsoft Word (версии 6 и выше) и обладает многими функциями, свойственными профессиональным пакетам этого класса: автоматически создает папку для хранения файлов переводческого проекта, формирует таблицу параллельных фрагментов и позволяет искать в исходном документе текстовые элементы из накопителя TM. Модуль управления глоссариями служит для работы со словарем терминов. Для автоматического построения БД накопителя переводов на основе сопоставления параллельных текстов служит дополнительный макромодуль WordAlign, более простой и быстрый, чем аналогичные средства в составе пакетов Trados, DejaVu и Star.

Полнофункциональную ознакомительную версию WordFisher можно бесплатно загрузить по адресу: http://www.wordfisher.com/wf4.htm

IBM TranslationManager 2.0

Программа TranslationManager корпорации IBM предоставляет стандартные для TM-систем возможности работы с БД накопителя переводов, группировки рабочих файлов в проекты, управления словарем терминов, автоматического анализа и сегментации текстов. Предусмотрен API для встраивания функций TranslationManager в приложения.

TranslationManager работает в среде Windows 9x, NT и OS/2 и обеспечивает совместимость с форматами RTF, HTML, WinWord, Word Pro, WordPerfect, PageMaker и QuarkXPress. Программа поддерживает перевод для любых пар языков из списка, включающего английский, немецкий, французский, испанский, итальянский, португальский, нидерландский, русский, шведский, греческий, иврит, японский (полная поддержка гарантируется для 34 языков). В комплект поставки входят базовые словари терминов (для полноценной работы необходимо расширять их или приобретать более совершенные), средство управления базами данных TM и сами данные.

На странице www-4.ibm.com/software/ad/translat/tm/tmdown.html доступна демоверсия программы, действующая в течение 60 дней. К сожалению, судя по информации на узле IBM, корпорация не очень активно развивает направление своей деятельности, связанное с TM (демоверсия датирована 1996 г.), однако и имеющихся функций достаточно, чтобы существенно облегчить работу переводчика.

 

С 1августа программа «Retrans Vista» доступна для посетителей крупнейших московских Интернет-центров Time-on-line (Манежная площадь, ТЦ «Охотный ряд», нижний уровень, с главного эскалатора направо) и CafeMax (м.Новокузнецкая, ул.Пятницкая, д.25, стр.1). Эти Интернет-центры являются безусловными лидерами в своей области и известны своим безупречным сервисом и качеством предоставляемых услуг. Установка на компьютерах программы «Retrans Vista» сделает работу с англоязычным Интернетом более простой и эффективной, позволит сохранить результаты работы для дальнейшего использования. Внимательные консультанты всегда готовы научить работе с программой и ответить на все интересующие вопросы.

6 марта компания Адвантис объявила об официальном выпуске нового программного продукта Retrans Vista, который может использоваться в качестве универсального инструмента для работы с русским и английским языками.

Retrans Vista предназначена для автоматизированного перевода текстов с русского языка на английский и с английского на русский. Основные словари системы содержат терминологию и фразеологические единицы по естественным и техническим областям науки, экономике, политике, бизнесу. Объем русско-английского и англо-русского политематических машинных словарей – более 3 млн. 300 тыс. словарных статей.

Из всех существующих систем машинного перевода только Retrans Vista имеет такую функцию как интерактивный перевод, позволяющий пользователям вмешиваться в процесс перевода и самим выбирать переводные эквиваленты. Программа предоставляет пользователю удобную функцию создания собственного словаря, который реализован как прототип Translation Memory. Словарные статьи, которыми могут быть слова, устойчивые словосочетания или фрагменты предложений, могут содержать от 1 до 16 слов. Словарь может заполняться автоматически в процессе интерактивного перевода. Максимальный объем пользовательского словаря – 65 тыс. словарных статей, хранится он в отдельном файле, что делает его доступным для тиражирования и переноса на другие компьютеры.

Технология фразеологического перевода компании «Виста Текнолоджиз» обеспечивает более точный и быстрый перевод текстов, предоставляет новые возможности для работы с обучающими программами, делает реальным создание новых и пополнение старых словарей, позволяет сохранять и накапливать собственный опыт изучения иностранного языка и, по желанию, передавать его другим.

Система Retrans Vista реализована в виде двух модификаций: Retrans Vista для Word и Retrans Vista для Web. Перевод текстов может осуществляться в автоматическом и интерактивном режимах, а также в режиме с приоритетом пользовательского словаря.

 

Переводчики в Интернет

Как переводить:

  1. Укажите в поле "Адрес сайта" адрес страницы, которую вам необходимо перевести.
  2. Выберите направление перевода и тематику переводимого текста из списка (например, "Интернет").
  3. В поле "Кодировка" вы можете указать кодовую страницу исходной страницы и страницы с переводом.
  4. Если при дальнейшем переходе по ссылкам вы хотите сразу же получать переведенную страницу, отметьте флажок "Автоматический перевод ссылок".
  5. Нажмите кнопку "Перевести".

 

 

ПРИЛОЖЕНИЕ 1.

Задания для использования сетевых переводчиков

Задание 1.

Программа «Promt-98».

В работе с лингвистическим материалом были определены следующие задачи:

1) Сравнение результата литературного перевода, выполненного компьютероми человеком;

2) Анализ часто встречающихся ошибок;

3) Выявление путей улучшения качества КП;

4) Определение причины несостоятельности компьютерной программы переводить так же качественно, как и человек;

5) Оценка качества КП от уровня разработанности и совершенства программ.

TASK 1. VARIANT 1.

I. TRANSLATE FROM ENGLISH INTO RUSSIAN:

 

 

Animated two stroke engine in operation

The internal combustion engine is an engine in which the combustion of a fuel (normally a fossil fuel) occurs with an oxidizer (usually air) in a combustion chamber. In an internal combustion engine the expansion of the high-temperature and -pressure gases produced by combustion applies direct force to some component of the engine, such as pistons, turbine blades, or a nozzle. This force moves the component over a distance, generating useful mechanical energy.[1][2][3][4]

The term internal combustion engine usually refers to an engine in which combustion is intermittent, such as the more familiar four-stroke and two-stroke piston engines, along with variants, such as the Wankel rotary engine. A second class of internal combustion engines use continuous combustion: gas turbines, jet engines and most rocket engines, each of which are internal combustion engines on the same principle as previously described.[1][2][3][4]

The internal combustion engine (or ICE) is quite different from external combustion engines, such as steam or Stirling engines, in which the energy is delivered to a working fluid not consisting of, mixed with, or contaminated by combustion products. Working fluids can be air, hot water, pressurized water or even liquid sodium, heated in some kind of boiler.

A large number of different designs for ICEs have been developed and built, with a variety of different strengths and weaknesses. Powered by an energy-dense fuel (which is very frequently petrol, a liquid derived from fossil fuels), the ICE delivers an excellent power-to-weight ratio with few disadvantages. While there have been and still are many stationary applications, the real strength of internal combustion engines is in mobile applications and they dominate as a power supply for cars, aircraft, and boats, from the smallest to the largest. Only for hand-held power tools do they share part of the market with battery powered devices. A 1906 gasoline engine

Applications. Internal combustion engines are most commonly used for mobile propulsion in vehicles and portable machinery. In mobile equipment, nternal combustion is advantageous since it can provide high power-to-weight ratios together with excellent fuel energy density. Generally using fossil fuel (mainly petroleum), these engines have appeared in transport in almost all vehicles (automobiles, trucks, motorcycles, boats, and in a wide variety of aircraft and locomotives). Where very high power-to-weight ratios are required, internal combustion engines appear in the form of gas turbines. These applications include jet aircraft, helicopters, large ships and electric generators.

Classification. At one time, the word, "Engine" (from Latin, via Old French, ingenium, "ability") meant any piece of machinery—a sense that persists in expressions such as siege engine. A "motor" (from Latin motor, "mover") is any machine that produces mechanical power. Traditionally, electric motors are not referred to as "Engines"; however, combustion engines are often referred to as "motors." (An electric engine refers to a locomotive operated by electricity.) Engines can be classified in many different ways: By the engine cycle used, the layout of the engine, source of energy, the use of the engine, or by the cooling system employed.

II. TRANSLATE FROM RUSSIAN INTO ENGLISH:

Дви́гатель вну́треннего сгора́ния (сокращённо ДВС) — это тип двигателя, тепловой машины, в которой химическая энергия топлива (обычно применяется жидкое или газообразное углеводородное топливо), сгорающего в рабочей зоне, преобразуется в механическую работу.

Двигатель внутреннего сгорания - это устройство в котором химическая энергия топлива превращается в полезную механическую работу.

Несмотря на то, что ДВС относятся к относительно несовершенному типу тепловых машин (громоздкость, сильный шум, токсичные выбросы и необходимость системы их отвода, относительно небольшой ресурс, необходимость охлаждения и смазки, высокая сложность в проектировании, изготовлении и обслуживании, сложная система зажигания, большое количество изнашиваемых частей, высокое потребление горючего и т.д.), благодаря своей автономности (используемое топливо содержит гораздо больше энергии, чем лучшие электрические аккумуляторы), ДВС очень широко распространены, — например, на транспорте.

Лекция 10. Компьютерный перевод

План лекции

 

 

1. Основы компьютерного перевода

2. Классификация технологий компьютерного перевода

3. Компьютерные переводческие программы

 

 

Практическое задание 1. Ознакомьтесь с заданием 1 по работе с компьютерными переводческими программами (Приложение 1)

 

 



Поделиться:


Последнее изменение этой страницы: 2016-12-29; просмотров: 709; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.222.111.24 (0.054 с.)