Фонетический и фонологический анализ 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Фонетический и фонологический анализ



 

Несомненно наиболее важная область в обработке речи, нуждающаяся в исследованиях, - это акустическо-фонетический анализ. Его цель — найти фонемное представление слова. Если акустическо-фонетический анализ слабый, то ошибочные гипотезы выдадут в итоге неправильный анализ. Сегментация и идентификация акустического сигнала в последовательности лингвистических единиц чрезвычайно трудна, поскольку акустическое сигналы, ассоциирующиеся с сегментами, непосредственно с ними не связанны; на эти сигналы сильно влияют соседние сегменты.

Акустическо-фонетический компонент необходим для любой обрабатывающей речь системы, основанной на знаниях, потому что система требует знания относительно фонологических процессов, активных в языке и в прикладных программах, чтобы восстанавливать канонические произношение слов, которые могут быть сопоставлены с соответствующими входами словаря, и получать дальнейшие сигналы к синтаксической и семантической/прагматической интерпретации речевого высказывания. Однако, фонологические компоненты в значительной степени ограничены лексическими, сегментными процессами и обычно имеют дело с фонологически управляемыми изменениями, генерируя альтернативное произношение для индивидуальных лексических единиц и сохраняя их в дополнительном словаре. Этот подход не может иметь дело адекватно с фонологическими процессами, которые соединяют границы слова, типа палатализации (смягчения). В этом случае полезна сегментация, которая, разлагая на слоги и слова речь, может обеспечить сведения для синтаксического анализа. Палатализация соединяет границы слова, но блокирована на границах главных синтаксических составляющих, так что ее отсутствие может использоваться, чтобы решить неоднозначность относительно присутствия такой границы в данном месте речевого сигнала.

Согласно артикуляционной теории звук образуется в 3 стадии:

1) экскурсия (приготовление);

2) произнесение;

3) рекурсия (расслабление).

В русском языке, так же как и во многих других, два типа звуков: гласные и согласные.

Гласные звуки характеризуются по ряду, длительности, лабиализации, напряженности; согласные — характеризуются по месту образования, способу, твердости/мягкости, глухости/звонкости, придыхательности.

Так как звуки речи произносятся неизолированно, а в звуковой цепи связной речи, то звуки могут, во-первых, влиять друг на друга, когда рекурсия предыдущего звука взаимодействует с экскурсией последующего, и, во-вторых, испытывать влияние общих условий произношения. В результате появляются следующие фонетические процессы:

1) редукция (изменение длительности звуков в безударных словах: количественная/качественная). Она тесно связана с ударением: -силовое -количественное(ударный звук произносится более долго) -тоновое(изменение высоты тона).

2) аккомодация - взаимное приспособление гласных и согласных(малый-мяло), качество согласного влияет на качество гласного и наоборот.

3) ассимиляция - качественное уподобление смежных по произношению звуков. Бывает -прогрессивной (когда предыдущий звук влияет на последующий) -регрессивной (когда последующий звук влияет на предыдущий, например вокзал - [вогзал], лодка - [лотка]).

4) диссимиляция - расподобление, когда из 2 одинаковых или подобных звуков получается 2 различных звука. Процесс, противоположный ассимиляции(кто - [хто]).

 

Фонема и звук - разные понятия, поскольку фонема - психическое явление, а звук — акустико-физиологическое.

Фонема – полифункциональная единица языка, которая: различает звуковые оболочки слов и морфем; доводит звуки речи до восприятия; является смыслоразличительная. При этом фонема - целиком психическое явление, равно как и аллофон, реализацией их в речи является звук. Одной фонеме могут соответствовать несколько различных ее реализаций или аллофонов. Аллофон - группа звуков, в которых реализуется данная фонема в зависимости от характера выполняемой ими функции, места в слове и соседства с другими звуками, а также ударности и безударности.

Для нахождения канонического фонемного представления слова русского языка в словаре по его фонетической форме произнесения необходимо учитывать следующее.

В русском языке существуют определенные буквенно-звуковые соотношения. К наиболее частотным и обычно вызывающим затруднение при написании транскрипции слова, или его звукового состава, относятся следующие:

- буква обозначает несколько звуков (е, ё, ю, я начале слова, после гласного, после разделительных Ь и Ъ): юла - [йула]. В отдельных случаях после Ь два звука может обозначать и гласная и: ручьи -[ручйи];

- несколько букв обозначают один звук (сч, жч, зч = [щ]; дс, тьс, тс = [ц]): возчик - [вощик], детский - [д'эцк'ий].

 

В зависимости от характера слога, в котором гласные звуки находятся, а их шесть: [а, о, э, у, ы, и] - они делятся на ударные и безударные. Все гласные могут находиться в ударном и безударном положении, но безударный гласный о встречается лишь в отдельных заимствованных словах: радио - [рад'ио].

Согласные звуки (их 36) характеризуются по твердости/мягкости и звонкости/глухости.

30 согласных образуют пары по твердости/мягкости: [ б - б', в - в', г - г', д - д', з - з', к - к',, л - л', м - м', н - н', п - п', р - р ', с - с', т - т', ф - ф ', х - х '].

Всегда твердыми, или твердыми непарными, являются [ ж, ш, ц ], а всегда мягкими, или мягкими непарными, - [ й, ч, щ ].

Всегда звонкими, или звонкими непарными, являются [ й, л, м, н, р ], а всегда глухими, или глухими непарными, - [ х, ц, ч, щ ].

Следует учитывать и наличие фонетических процессов, т.е. влияния звуков друг на друга в потоке речи. Например, произношение предлога к в положении перед глухим и звонким (к тебе - [кт'эб'э], к дому - [гдому]), начальную и в изолированном употреблении и при наличии предлога (идеал - [ид'эал], в идеале - [выд'эал'э]).

В некоторых случаях допускается несколько вариантов произношения того или иного слова: мясной - [м'исной] и [м'эсной], (о) терпении - [т'эрп'эн'ии], [т'эрп'эн'ийэ], [т'ирп'эн'ии] и [т'ирп'энийэ], цепочка - [цэпочка] и [цыпочка].

 

Основные прикладные аспекты фонетических исследований в речевых технологиях - автоматическое распознавание речи, синтез речи, идентификация говорящего по характеристикам речевого сигнала.

 


Лекция 5

 

В данной лекции будут даны определения основных понятий морфологии, приведена классификация описание основных методов и подходов к проведению морфологического анализа словоформ, а также указаны недостатки и достоинства каждого из методов.

 

Стадия морфологического анализа (МА) является наиболее проработанным лингвистическим этапом процесса обработки естественного текста. За последние два десятилетия создано, по крайней мере, несколько десятков алгоритмов для разных языков, в том числе 10-12 для русского. Прежде, чем приступить к изложению основных методов и алгоритмов МА, необходимо ознакомится с терминологией, используемой в морфологии.

 

 

Основные термины морфологии

 

МА тесно связан с морфологическим уровнем языка, единицей которого является морфема. Морфемы по обязательности наличия в слове делятся на: корневые (корни) — обязательные; аффиксальные (аффиксы) - необязательные.

 

Корень — основная значимая часть слова. Является обязательной частью любого слова — не существует слов без корня (кроме редких вторичных образований с утраченным корнем типа русского вы-ну-ть (префикс-суффикс-окончание).

Аффикс — вспомогательная часть слова, присоединяемая к корню и служащая для словообразования и выражения грамматических значений. По положению относительно корня:

· префиксы — перед корнем (традиционное название в русском языке — приставки);

· постфиксы — после корня.

По словоизменяющей функции:

· словонеизменяющие аффиксы — передают грамматическое и лексическое значение;

· флексии — словоизменяющие аффиксы, которые передают реляционное, т.е. указывающее на связь с другими членами предложения, значение и являются показателем комплекса грамматических категорий, выражающихся в словоизменении (в русском языке обычно называются окончаниями, так как являются исключительно постфиксами).

Различают внутреннюю и внешнюю флексию. Внутренняя флексия – это такой способ словоизменения, при котором формы слова образуются изменением звуков внутри основы (родилась — родился, пеку — пёк). Внешняя флексия (фузия) – словоизменение, пользующееся синтетическими аффиксами (пол-е, пол-я, пол-ей). Языки, в которых словоизменительное и словообразовательное значение выражается преимущественно флексией, называются флективными.

В отличие от флексии основа – это неизменяемая часть слова, которая выражает его лексическое значение, то есть соотнесённость звуковой оболочки слова с соответствующими предметами или явлениями объективной действительности. Применительно к русскому языку основа – это часть слова без окончания. В английском языке основа слова, как правило, полностью совпадает с самим словом.

Следовательно, слово можно представить следующим образом

 

префикс+корень+постфикс=СЛОВО=основа+флексия

Флективные языки, в свою очередь, делятся на синтетические и аналитические.

Синтетические языки — типологический класс языков, в которых преобладают синтетические формы выражения грамматических значений. В синтетических языках грамматические значения выражаются в пределах самого слова с помощью:

· аффиксации - присоединения аффиксов к основе слова;

· внутренней флексии - выражения грамматических значений при помощи изменения состава корня;

· ударения (замОкзАмок);

· супплетивизма - образования словоизменительной формы некоторого слова уникальным для языка образом, например, идти - шел, т. е. формами самих слов.

Для выражения отношений между словами в предложении могут быть использованы также элементы аналитического строя, а именно:

· служебные слова - слова, не способные выступать самостоятельно как члены предложения и служащие для связи знаменательных слов во фразе, например, союзы, предлоги, или для их грамматической (синтаксической) характеристики, например, артикли;

· порядок знаменательных слов - полнозначные слова, самостоятельные слова,— слова, обладающие лексической самостоятельностью, то есть называющие предметы и признаки или указывающие на них и таким образом наполняющиеся конкретным предметным или признаковым содержанием только в условиях речи, контекста, интонация).

Аналитические языки — языки, где грамматические значения главным образом выражаются вне слова, в предложении: английский, французский, болгарский и все изолирующие языки, например, вьетнамский. В этих языках слово — передатчик лексического значения, а грамматические значения передаются отдельно: порядком слов в предложении, служебными словами, интонацией и т.п.

Пример: В русской фразе отец любит сына слово сына принимает падежное окончание. Если изменить порядок слов — сына любит отец, то смысл фразы не изменится. В английской же фразе the father loves the son при смене порядка слов на the son loves the father меняется и смысл фразы — сын любит отца, так как падежные окончания отсутствуют и слово son звучит и пишется одинаково и в случае соответствия его именительному падежу русского языка, и косвенным падежам. Поэтому смысл предложения зависит от порядка слов в предложении. В русской фразе добро побеждает зло смысл зависит только от порядка слов в предложении.

Парадигма (от греч. παράδειγμα, «пример, модель, образец») — в лингвистике список словоформ, принадлежащих одной лексеме и имеющих разные грамматические значения. Обычно представлена в виде таблицы. Словоизменительная парадигма выступает образцом того, как строятся словоизменительные формы для целых классов лексем (склонений существительных, спряжений глаголов и т. п.)

Построение парадигм — одно из первых лингвистических достижений человечества; вавилонские глиняные таблички с перечнями парадигм обычно считаются первым памятником лингвистики как науки.

Обычно парадигмы упорядочены в некотором традиционном порядке граммем, например, парадигма русского склонения записывается в порядке падежей И — Р — Д — В — Т — П: рука, руки, руке, руку, рукой, о руке

Парадигма личного спряжения в европейских языках записывается обычно в порядке и ду-идёшь-идёт (и соответственно лица называются первым, вторым и третьим), а, например, в арабском языке порядок обратный.

Лемма — это начальная (словарная) форма лексемы. Процесс привода словоформы к лемме — её словарной форме называется лемматизацией. В русском языке начальными формами являются:

· для существительных — именительный падеж, единственное число;

· для прилагательных — именительный падеж, единственное число, мужской род;

· для глаголов, причастий, деепричастий — глагол в инфинитиве.

Примеры: кошками → кошка, бежал → бегать, боязненных → боязненный

 

 



Поделиться:


Последнее изменение этой страницы: 2017-02-07; просмотров: 339; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 54.224.124.217 (0.068 с.)