Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Статистичні характеристики мовних повідомлень

Поиск

Дослідження статистичних характеристик мовного сигналу базується на математичному представленні акустичного процесу утворення мови, який, у свою чергу, базується на фізичних процесах утворення мови. Розглянемо дискретну модель утворення мови (рис 1.25).

В цій моделі можна виділити дві системи, модель збудження і модель випромінювання. Більшість звуків мови можна віднести або до вокалізованих (голосних), або до невокалізованих (приголосних). У випадку вокалізованих звуків джерело збудження повинно формувати квазіперіодичну послідовність імпульсів. У випадку невокалізованих – випадкові шумові коливання [2].

Структурна схема пристрою, який реалізує один із способів одержання такого сигналу, показана на рис.1.25. Вона складається з генератора імпульсної послідовності (ГІП) з періодом слідування імпульсів , який дорівнює періоду основного тону мовного сигналу. З виходу ГІП сигнал надходить на лінійну інерційну систему імпульсна характеристика якої відповідає формі коливань в голосовій щілині. Коефіцієнт підсилення вокалізованого звуку визначає інтенсивність голосового збудження.

Для невокалізованих звуків модель збудження реалізується у вигляді генератора шуму (ГШ) з коефіцієнтом підсилення , який регулюється. Так, у дискретному часі замість ГШ може бути використано генератор випадкових чисел, який формує послідовність із рівномірним спектром та довільною функцією розподілу.

Рис.1.25. Дискретна модель утворення мови

Модель голосового тракту цілком характеризується передавальною функцією , полюси якої відповідають резонансам (формантам) мовного сигналу. Полюсна модель дає у більшості випадків хороше зображення голосового тракту для більшості звуків мови. Для розширення можливостей описаних звуків необхідно використовувати не тільки резонанси, а й антирезонанси, тобто враховувати не тільки полюси, але й нулі функції , що в деяких випадках і робиться.

Передавальну функцію можна реалізувати як аналоговими, так і цифровими пристроями.

Ефект випромінювання мови можна описати за допомогою передавальної функції . Звичайно, моделі голосового тракту об’єднують разом. При цьому результуючу передатну функцію процесу утворення мови записують у вигляді

.

Для управління такою моделлю повинна бути апріорна інформація про залежність відповідних параметрів (частоти основного тону, положення перемикача гучності та коефіцієнти передачі фільтрів) від часу.

Для вокалізованих звуків, які повільно змінюються у часі, ця модель виявляється найбільш точною. Для невокалізованих звуків, які швидко змінюються, розглянута модель утворення мови може не відповідати реальним фізичним процесам.

У будь-якому випадку припускається, що мовний процес, який є випадковим нестаціонарним процесом, повинен бути підданий короткочасному аналізу. Найчастіше вважають, що параметри моделі незмінні протягом 10...20 мс.

Під час синтезу та аналізу систем передачі мови використовують різні абстрактні моделі мовного процесу, що в якійсь мірі відповідають реальній дійсності. Найбільш поширена модель являє собою нестаціонарний гауссівський випадковий процес з дисперсією та спектральною щільністю, що повільно змінюються. У разі використання такої моделі можна синтезувати систему зв’язку з найкращими характеристиками. Але при цьому виходить досить складна система, яка сама настроюється, синтез її досить складний, тому що відсутні численні статистичні характеристики таких моделей мовного процесу.

Меншу точність має модель мовного сигналу, який являє собою нестаціонарний гауссівський процес з повільно змінюваною дисперсією та постійною усередненою спектральною щільністю, яка визначається експериментально з використанням усереднення за часом.

Разом з тим, для реальних мовних процесів на досить великих відрізках часу задовольняються умови стаціонарності, що дає можливість розглядати мовний сигнал як квазістаціонарний.

Для оцінки якості передачі мовного сигналу в цифрових системах передачі інформації широко використовуються різні апроксимації усередненої за часом щільності розподілу вірогідності розподілу мови (ЩВР) .

Найбільш зручною вважається така модель апроксимації ЩВР:

,

де ; .

Вважається, що вірогідності голосних та приголосних звуків однакові та дорівнюють 0,5.

Поряд з ЩВР важливе прикладне значення для аналізу систем передачі мови мають спектральні та кореляційні характеристики.

Найбільш поширена модель мовного процесу, який пройшов попереднє обмеження спектра за допомогою фільтра нижніх частот з частотою зрізу . Спектральна щільність потужності мовного процесу на виході такого фільтра визначається за співвідношенням:

;

; (1.52)

; ; . (1.53)

Для аналізу пристроїв перетворення мови, наприклад у вокодерах, використовують апроксимацію у вигляді

; .

Взагалі мовні випадкові процеси не є суттєво гауссівськими випадковими процесами.



Поделиться:


Последнее изменение этой страницы: 2016-08-16; просмотров: 269; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.40.121 (0.008 с.)