Организация систем понимания речи 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Организация систем понимания речи



 

Понимание речи обычно трактуют как преобразование акустического представления речи в смысловое. Понимание речи следует отличать от распознавания речи, где целью является сопоставить речевое высказывание с соответствующими словами в словаре. Речевой сигнал является недостаточным источником информации, для успешного распознавания и интерпретации важно и знание контекста речевого высказывания.

Системы по распознаванию речи основаны на поиске наиболее точного соответствия между определенными произнесенными словами и словарем акустических образцов слов. Однако такой подход, работающий для распознавания изолированных слов, неприемлем для непрерывной речи, так как входной акустической сигнал в этом случае не может быть эффективно смоделирован, как простое сочетание произнесенных частей лексических единиц. Тем не менее, необходимо начинать с основных лингвистических единиц, таких как фонемы, и сохранять информацию о ритме и длительности речевого высказывания.

Если следуют таким путем, то подход к обработке речи, основанный скорее на знании, чем на соответствиях с образцами, становится неизбежным, так как, чтобы извлекать преимущества из распознавания конкретных лингвистических единиц в сигнале, необходимо знать, как данная единица связана с остальной частью языка.

СПР имеют дело со связанными единицами речи, такими как, фразы, предложения и даже параграфы, так как «понимание» изолированных слов может означать только тривиальный процесс сопоставления некоторого значения к каждому слову словаря системы. Понимание связанной речи - очень сложная задача, и на проектирование СПР повлияли исследования в таких разных областях, как акустическая обработка сигнала, нейро-физиология, психолингвистика, психология.

Посредником при преобразовании речи в ее значение должны служить определенные компоненты, которые используют разнообразные источники знания (ИЗ), т.к. речевой сигнал кодирует много различной информации, необходимой для восстановления значения. Единственной возможной организацией СПР и основных ИЗ является следующая:

 

РЕЧЬ — ОБРАБОТКА АКУСТИЧЕСКОГО СИГНАЛА — ФОНЕТИЧЕСКИЙ АНАЛИЗ — ФОНОЛОГИЧЕСКИЙ АНАЛИЗ — МОРФОЛОГИЧЕСКИЙ АНАЛИЗ — ЛЕКСИЧЕСКИЙ ДОСТУП К СЛОВАРЮ — СИНТАКСИЧЕСКИЙ АНАЛИЗ — СЕМАНТИЧЕСКИЙ АНАЛИЗ — ЗНАЧЕНИЕ.

 

При такой организации СПР информация течет вверх по мере того, как каждый элемент создает промежуточные представления, кодируя (частичные) гипотезы относительно ввода на основе ему доступного знания.

Акустическая обработка оцифровывает сигнал, трансформирует его так, чтобы представить в той форме, которая поддается фонетическому декодированию. Параметрический сигнал может затем быть помечен как дискретная последовательность фонем.

Фонологический анализ выполняется на фонетическом представлении, которое определяет лингвистически важные различия, имеющиеся в фонетическом представлении произнесения, например, уровни и расположение ударения, интонационный контур, структуры слога, последовательности фонем, лежащих в основе произнесения. Фонологический анализ необходим для лексического доступа, т.е. процесса, который сопоставляет фонетическую форму произнесения с каноническими фонемными представлениями слов в словаре, чтобы восстановить информацию, хранящуюся там относительно их морфологических, синтаксических, и семантических свойств. Фонологическое знание относительно допустимых последовательностей фонем в слогах может использоваться, чтобы распознать слог, и следовательно, границы слова.

Как только фонологический анализ завершен, дальнейшая обработка ввода будет подобна пониманию текста. Дальнейшие морфологический, синтаксический, семантический анализы способствуют распознаванию, эксплуатируя избыточность речи, в информационно-теоретическом смысле.

Прежде, чем слова, выделенные в речевом сигнале будут сопоставлены с лексическими входам в словаре системы, необходимо провести морфологический анализ, который приведет слова к их основной форме.

После морфологического анализа возникшее морфофонологическое представление речевого ввода может быть найдено в словаре системы, чтобы получить синтаксическую и семантическую информацию относительно гипотезы последовательности слов. Задача синтаксического анализа - исключить гипотезы слова на основе синтаксически недопустимых последовательностей.

На этапе семантического анализа гипотезы подвергаются дальнейшей обработке, учитывая смысловой фактор с помощью семантических отношений.

При создании как систем, обрабатывающих текст, к числу которых относятся СМП, так систем, обрабатывающих и понимающих речь, активно используются знания об уровнях языка, тесно связанные с этапами анализа в этих системах.

 


Лекция 4

 

В данной лекции будет рассмотрены уровни языка и их единицы, принципы организации систем понимания речи,акустическо-фонетический анализ.

 

 

Уровни языка

Язык членится на участки (планы, ярусы, уровни). Уровень - это крупная часть языка, состоящая из однородных единиц и включающая набор правил, регулирующих использование этих единиц, их группировку в классы и разряды. Уровни автономны, каждый из нихУровень характеризуется особой единицей, предельной и минимальной для каждого уровня.

Различают следующие уровни: 1)фонемный, 2)морфемный, 3) лексический, 4)семантико-синтаксический.

Уровнеобразующие единицы - сущность, отражающая характеристики объекта. Они характеризуются особой субстанцией, функциями, в зависимости от уровня выделяют следующие:

1. фонема — неделимая, единица, класс класс вариантов звука (аллофонов), фонему можно представить в виде набора дифференциальных признаков.

Функции -1. строительная 2. смыслоразличительная.

 

2. морфема -полноценная двусторонняя (имеет план выражения и план содержания) знаковая единица. Морфема обладает значением (лексическое, словообразовательное, грамматическое), но не является целостной единицей, не обладает грамматической оформленностью и смысловой самостоятельностью.

Функции - 1. семасиологическая (может выражать значение, например, суффикс л в глаголах указывает на прошедшее время - «проходила») 2. строительная.

 

3. слово (лексема) - целостная единица, обладающая морфологической оформленностью и смысловой самостоятельностью. Лексема (от греч. lexis — слово, выражение, оборот речи) — слово как самостоятельная единица языка, рассматриваемая во всей совокупности своих форм и значений. В одну лексему объединяются разные словоформы одного слова (например, «словарь, словарём, словарю» и т. п.).

Функции - 1. минимальная номинативная единица (может называть вещи в отличие от морфемы) 2. строительная (входит в состав словосочетания и предложения).

 

4. предложение - минимальная коммуникативная единица языка (с помощью нее осуществляется общение). Предложение утверждает наличие объекта, оно обладает временной характеристикой, модальностью. Предложение отличается от слова по степени сложности выражаемого им смысла и функцией. Предложение -сочетание нескольких слов. Любое предложение строится на предикации (выделение какого-либо объекта и приписывание ему признака).

Функции - 1. номинативная 2, строительная.

 

5. текст - особая единица языка (не уровень, но единица), В тексте предложения связаны между собой по смыслу. Наличие связности - важное свойство.

Функции -1.коммуникативная 2. информативная.

 

Свойства единиц на шкале:

- протяженность(чем выше, тем протяженней);

- единица каждого предыдущего уровня входит в состав единицы последующего уровня;

- каждая последующая единица сложнее по структуре;

- кумулятивность- (накопление свойств);

- каждая единица имеет особую структуру, а также особые отношения между единицами того же уровня;

- каждая единица на своем уровне обладает свойствами целостности и минимальности.

 

Некоторые аспекты фонологического анализа, особенно касающиеся ударения и интонации, будут способствовать правильному распознаванию произнесения. Ударение, например, необходимо для определения контекстуально новой информации и для нахождения зависимых слов для местоимений. Остановимся на этом виде лингвистического анализа более подробно.

 

 



Поделиться:


Последнее изменение этой страницы: 2017-02-07; просмотров: 146; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.144.109.5 (0.007 с.)