Новые информационные технологии (3) 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Новые информационные технологии (3)



1.1. Основные классы естественно-языковых систем

1.1.1. Функциональные компоненты естественно-языковых систем1.1.2. Сравнительная характеристика основных классов ЕЯ-систем1.1.2.1. Интеллектуальные вопросно-ответные системы

1.1.2.1.1. Информационно-поисковые системы

1.1.2.1.2. Системы общения с базами данных

1.1.2.1.3. Экспертные системы

1.1.2.1.4. Диалоговые системы решения задач

1.1.2.1.5. Интеллектуальные хранилища и цифровые библиотеки

1.1.2.2.Системы распознавания речи

1.1.2.2.1. Системы распознавания изолированно произносимых команд

1.1.2.2.2. Системы распознавания ключевых слов в потоке слитной речи

1.1.2.2.3. Системы распознавания слитной речи

1.1.2.2.4. Подход «анализ-через-синтез»

1.1.2.2.5. Системы чтения по губам

1.1.2.3.Системы обработки связных текстов

1.1.2.3.1. Системы реферирования текстов

1.1.2.3.2. Системы сравнения и классификации текстов

1.1.2.3.3. Системы кластеризации текстов

1.1.2.4.Системы синтеза

1.1.2.4.1. Системы синтеза речи

1.1.2.4.2. Системы клонирования голоса

1.1.2.4.3. Системы синтеза видеоряда по тексту

1.1.2.5.Системы машинного перевода. Системы понимания речи (текстов)

1.1.2.5.1. Системы фразового перевода1.1.2.5.2. Системы контекстного перевода1.1.2.5.3. Системы понимания речи (текстов)

1.1.2.6.Онтологии и тезаурусы

1.1.2.7.Речевые и текстовые базы

1.1.2.8.Компоненты интеллектуальных систем

1.1.3. Сравнительная характеристика естественно-языковых систем 2.2.2. Системы распознавания речи

Системы распознавания речи делятся на три основных категории: системы покомандного распознавания, системы распознавания слитной речи и системы понимания речи.

Наиболее сложным аспектом предмета распознавания речи является его междисциплинарный характер и необходимость применения комплексного подхода к решению частных проблем. Перечислим дисциплины, которые могут решать те или иные проблемы распознавания речи:

- обработка сигналов;

- физика (акустика);

- распознавание образов;

- теория информации и теория коммуникации;

- лингвистика;

- физиология, в том числе, нейрофизиология;

- компьютерные науки;

- психология, в том числе нейропсихология;

- математика;

- нейроинформатика.

Продукция речи начинается с формулирования сообщения, которое он хочет передать слушающему. Следующий шаг – конвертация сообщения в языковой код. Сообщения представляется последовательностью фонем, соответствующих звукам, составляющим слова, сопровождающихся просодическими маркерами, определяющими длительность фонем, громкость и ударения в соответствующих местах. Языковой код преобразуется в нейромышечные команды, определяющие сокращение и вибрацию связок, а также в форму речевого тракта, необходимую для производства конкретных звуков. На выходе мы имеем речевую волну. Нейромышечные команды одновременно управляют движением губ, языка, зубов, а также перегородки, которая позволяет реализовать назализованные звуки.

Дошедшая до слушающего речевая волна возбуждает стоячую волну на базилярной мембране внутреннего уха. При этом реализуется спектральный анализ входной речевой волны. Волосковые клетки преобразуют отклик базилярной мембраны в активность слухового нерва, которая эквивалентна потоку первичных признаков речевой волны. Далее эта активность в корковом конце слухового анализатора преобразуется в языковой код, который подвергается процессу понимания.

Рис.2.1. Схематическая диаграмма процесса порождения/восприятия речи человеком (по Фланагану [1]).

 

Процесс порождения/восприятия речи, как он принят в теории и практике распознавания речи, выглядит более машиноподобно (см. Рис. 2.2). Он синхронизирован со шкалой скорости передачи информации. Процесс формирования сообщения в дискретных символах соответствует скорости передачи 50 бит/сек., соответствующих 8 произносимым звукам в секунду. После конвертации сообщения в языковой код с добавлением просодической информации информационная скорость возрастает до 200 бит/сек. На уровне нейромышечного управления скорость передачи информации возрастает до 2000 бит/сек, а на уровне звуковой волны – до 30000-50000 бит/сек. Обратный процесс распознавания речи симметричен по скоростям передачи информации процессу порождения.

 

 

Рис.2.2. Взгляд на процесс порождения/восприятия речи с точки зрения компьютерных наук.

 

 

Рис. 2.3. Общая блок-схема ориентированной на задачу системы распознавания речи.

 

Общая модель распознавания речи, представленная на Рис. 1.1. начинается с порождения пользователем речевого сигнала с целью выполнения некоторой задачи. Сначала речевой сигнала декодируется в последовательность слов, которая удовлетворяет требованиям синтаксиса, семантики и прагматики. Значения распознанных слов затем уточняются в соответствие с контекстом ранее распознанных сообщений. Обратная связь от верхних уровней уменьшает сложность задачи распознавания ограничением перебора гипотез распознавания. Отвечает система пользователю синтезированным речевым сигналом, или некоторым ожидаемым от нее действием.

 



Поделиться:


Последнее изменение этой страницы: 2017-02-07; просмотров: 113; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.116.24.105 (0.005 с.)