Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Системы автоматического переводаСодержание книги
Поиск на нашем сайте
Рассмотрим вкратце характеристики некоторых из таких систем, предназначенных для достижения максимальной скорости обработки больших потоков информации. Скорость перевода страницы текста у разных систем составляет от 0,5 до 2 с в автоматическом режиме. Полученный в результате текст в большинстве случаев понятен сразу. Поэтому, потратив какие-то минуты на осознание информации, пользователь может сразу сохранить документ для более тщательного изучения. Основными поставщиками подобных систем в настоящий момент являются московская компания «Арсеналъ» и санкт-петербурская «ПРОМТ». Одним из продуктов «Арсеналъ» является переводчик «СОКРАТ». Данная система поставляется в комплекте с общелексическим, коммерческим и компьютерным словарями. Данная база составляет 95 % требуемого словарного запаса для текстов, которые существуют в электронном виде. Отдельно существует 9 дополнительных подключаемых к системе «СОКРАТ» словарей специализированного назначения, среди которых словари по медицине, машиностроению, юриспруденции и др. Интерфейс представляет собой два окна, одно из которых содержит текст оригинала, а в другом появляется перевод. Известны версии «СОКРАТа», понимающие соответственно английский, немецкий и французский языки. Перевод в любом случае является двухсторонним, т. е. можно переводить не только с иностранного языка на русский, но и наоборот. Компания «ПРОМТ» давно специализируется на производстве языковых систем. Системы перевода STYLUS 2.xx и 3.хх известны пользователям Windows. «PROMT» также комплектуется общелексическим и компьютерным словарями. Однако основной особенностью данной программы является наличие гораздо большего количества подключаемых словарей. Их число составляет на данный момент несколько десятков. Существуют четыре коллекции или подборки словарей — наука, коммерция, техника и промышленность. Каждая из коллекций содержит от 5 до 10 словарей определенной направленности. Например, коллекция «Коммерция» содержит словари «Коммерческий», «Информатика» и «Юридический», причем для всех возможных языковых пар. Системы автоматического перевода Promt иXT - Diamond. Данные системы являются довольно типичными для рынка программных продуктов РФ и обеспечивают следующие возможности: • ручной выбор и настройку словарей предметной области; • пополнение словарей пользователем; • автоматическое определение предметной области, при необходимости; • выборочный или полный перевод текстового файла; • редактирование оригинала и результата перевода. На рис. 4.16—4.19 приведены примеры некоторых экранов данных систем, иллюстрирующие их возможности. В табл. 4.4 приведен пример исходного и результирующего технического текста при автоматизированном переводе различными системами, из которого видно, что несмотря на несомненные успехи в данной области, технология все еще имеет определенные резервы для своего совершенствования. Еще одна тенденция последних лет — слияние речевых технологий с лингвистическими. Показателен пример L&H, ставший действующим лицом в области машинного перевода с момента приобретения фирмы Mendez в 1996 г. После этого к L&H присоединились AILogic Corp. и NeocorTech (специализировавшиеся на машинном переводе с английского на японский и с японского на китайский и обратно), германская фирма Heitmann Group и, наконец Globalink. Новая версия известной программы-переводчика Power Translator Pro фирмы Globalink вышла уже под маркой L&H. Продукция L&H поддерживает в общей сложности 25 языков. Однако еще эффектнее выглядит программа Universal Translator фирмы LanguageForce (США). Серия Universal Translator включает четыре системы машинного перевода, работающие с MS Office, имеющие функции распознавания/синтеза речи и проверки орфографии; при этом Universal Translator 2000 Professional переводит с 40 языков: арабский, китайский (упрошенный и традиционный варианты), чешский, датский, нидерландский, английский британский и американский, эсперанто, фарси, финский, французский (канадский и европейский варианты), немецкий, греческий, иврит, венгерский, итальянский, индонезийский, латинский, японский, корейский, норвежский, польский, португальский (бразильский и европейский варианты) румынский, русский, словацкий, испанский (латиноамериканский и европейский варианты), суахили, шведский, тагальский, тайский, турецкий, украинский, вьетнамский, зулусский. Для Universal Translator 2000 Professional объявлена возможность перевода в любом направлении для любой языковой пары. Нетрудно подсчитать, что число таких пар составляет 1560. Кроме того, программа записывает текст под диктовку, читает вслух и проверяет грамотность написанного. Вместе с переводчиком поставляются две обучающие игры Space Attack и WortTris, которые должны, по-видимому, окончательно сразить потребителя и конкурентов. Лингвистический анализ текста — обязательная стадия процесса автоматического ввода текста под диктовку. Без этой стадии современное качество распознавания не могло бы быть достигнуто, и многие эксперты связывают перспективы речевых систем именно с дальнейшим развитием содержащихся в них лингвистических механизмов. Как следствие, речевые технологии делаются все более зависимыми от языка, с которым работают. В сфере распознавания слитной речи зависимость стала абсолютной, что подтверждается, в частности, отрицательным опытом локализации программного пакета фирмы Dragon Systems для русского языка (имеется в виду система «Горыныч», показавшая объявленного качества распознавания). Однако и других областях работы с речью, включая TTS и даже механизмы редактирования и сжатия, специфика языка все более дает себя знать. Следовательно распознавание, синтез и обработка русской речи являются той нишей, занять которую должны именно российские разработчики. Контрольные вопросы 1. Перечислите основные принципы распознавания символов (OCR) 2. Что такое OCR А и OCR В? 3. В чем заключается содержание метода сопоставления с образцом? 4. Перечислите основные особенности метода POWR. 5. Каковы возможности программного продукта Finereader? 6. Что такое принципы IPA? 7. В чем заключается MDA? 8. Что такое бинаризация изображения? 9. Какие типы классификаторов-распознавателей вам известны? 10. Перечислите основные принципы систем распознавания речи (STT). 11. Охарактеризуйте программные продукты STT. 12. Перечислите основные принципы систем генерации речи (TTS). 13. Охарактеризуйте программные продукты TTS. 14. Назовите основные принципы систем автоматизированного перевода. 15. Что такое фразеологический машинный перевод? 16. Какова структура машинного словаря? 17. Назовите возможности системы машинного перевода Promt. 18. В чем заключается интеграция систем перевода и обработки речи?
Глава 5
|
||||
Последнее изменение этой страницы: 2021-04-05; просмотров: 96; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.14.249.104 (0.008 с.) |