Методика проведения эксперимента 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Методика проведения эксперимента



 

Для проведения эксперимента использовалась плата EZKIT Lite с процессором серии ADSP 2181 фирма Analog Devices /12/. Эта плата позволяет использовать процессор ADSP 2181 для цифровой обработки аудио-сигналов без дополнительных аппаратных средств.

Для загрузки программ в сигнальный процессор, служит HOST-компьютер, совместимый с IBM PC, соединенный с EZ-KIT по последовательному порту. Начальная загрузка процессора производится из ПЗУ, в которое зашита программа монитор, через BDMA порт. После загрузки монитора во внутреннее ОЗУ процессора, он запускается, инициализируя кодек и осуществляя обмен с компьютером.

Эксперимент производился на отладочной плате EZ-KIT. Загрузка программы производилась по SPORT1, через интерфейс RS232 с компьютера IBM - Pentium. В эксперименте использовалась звуковая карта Creative AWE64. Тестовый сигнал, смоделированный в Cool Edit Pro, подавался с линейного выхода AWE64 на линейный вход EZ-KIT. Сигнал снимался с линейного выхода EZ-KIT и подавался на линейный вход AWE64 (AWE64 позволяет одновременно воспроизводить сигналы и записывать) и записывался в Cool Edit Pro (Windows 95 позволяет одновременно работать с несколькими приложениями в мультизадачном режиме).

В рамках данного проекта были сняты экспериментальные характеристики методов сжатия речи. Схема эксперимента приведена на рис.6.1 Результаты эксперимента приведены на рис.6.2.


Схема эксперимента

Рис.6.1

Результаты эксперимента

Рис.6.2

 

На рис.6.2 и 6.3 представлены временные диаграммы исследуемых процессов.

 

Рис.6.3

 

Спектральные диаграммы входного воздействия (синусоидальный сигнал) (рис.6.4) и сигнала на выходе модуля сжатия речи (рис.6.5).

 

Рис.6.4

 

Рис.6.5

 

Рис.6.6

 

Спектральные диаграммы входного воздействия (треугольные импульсы) (рис.6.6) и сигнала на выходе модуля сжатия речи (рис.6.7).

 

Рис.6.7

 

Рис.6.8

 

Спектральные диаграммы входного воздействия (пилообразный сигнал) (рис.6.8) и сигнала на выходе модуля сжатия речи (рис.6.9).

 

Рис.6.9

 

Рис.6.10

 

Спектральные диаграммы входного воздействия (прямоугольные импульсы) (рис.6.10) и сигнала на выходе модуля сжатия речи (рис.6.11).

 

Рис.6.11

 

Рис.6.12

 

Спектральные диаграммы входного воздействия (шум) (рис.6.12) и сигнала на выходе модуля сжатия речи (рис.6.13).

 

Рис.6.13

 

Для приведенных на рис.6.2 и 6.3 графиков рассчитаем среднеквадратическое отклонение выходной кривой от входной и модуль отклонения по формулам

 

, .

 

Для рис.6.2 (синусоидальное воздействие) получим , . Для рис.6.3 (треугольные импульсы) получим , . В расчете N=44, т.к. период составляют 44 отсчета сигнала (частота дискретизации Fд=44100 Гц, частота всех тестовых сигналов, приведенных в экспериментальном исследовании составляет f=1000 Гц).

В данной работе также представлены спектральные диаграммы следующих сигналов: пилообразные, прямоугольные импульсы, шум. По ним можно судить об изменении спектрального состава сигнала при прохождении через модуль сжатия речи. На всех спектральных диаграммах выходных сигналов можно видеть значительное обогащение спектра выходного сигнала по сравнению со спектром входного. Особенно это заметно на сигналах с короткими фронтами и спадами (пилообразные и прямоугольные импульсы), их длительность равна одному отсчету сигнала, а при частоте дискретизации Fд=44100 Гц, она составляет 22,68мкс. Такие значения фронтов и спадов не свойственны речевому сигналу, поэтому выходные временные диаграммы таких сигналов сильно искажены.

В ходе эксперимента были проведены субъективные оценки качества РС /17/. Оценка качества РС включает в себя разборчивость и узнаваемость речи. Под разборчивостью РС понимается адекватное произнесенному восприятие слов. Узнаваемость РС означает способность слушателя определить по голосу принадлежность слов тому или иному диктору. При проведении эксперимента была собрана группа экспертов из неподготовленных слушателей. Диктором поочередно зачитывались несвязанные между собой слова, а эксперты их записывали. Для полноты эксперимента в роли дикторов выступали мужчины и женщины (т.к. известно, что значение периода основного тона в мужском и женском голосе отличаются, то необходимо исследовать качество РС при данных условиях), голос которых знаком экспертам. При обработке эксперимента подсчитывались совпадения в процентном соотношении от общего числа произносимых диктором слов. Было отмечено, что при ухудшении качества передачи РС узнаваемость РС уменьшается быстрее чем его разборчивость.

Результаты эксперимента приведены в пятибалльной системе в табл.6.1.

 

Таблица 6.1

Субъективные оценки качества РС

Метод кодирования

Субъективные оценки качества РС, баллы

  Мужской голос Женский голос Среднее значение
АДИКМ (16 кбит/с) 4,7 4,5 4,6
ЛПК (7,8 кбит/с) 4,3 4,2 4,25

 

Проанализировав результаты эксперимента, сделаны следующие выводы:

Для получения хорошего качества РС, прошедшего через модуль сжатия речи, важно сохранение амплитудного спектра, т.е. соотношения между спектральными составляющими. Т.к. к фазовым искажениям слух не чувствителен, то вследствие наличия фазовых искажений в восстановленном РС временные характеристики могут сильно отличаться от исходных, хотя на слух это отличие не заметно. Т.о. образом, исследование временных характеристик не имеет существенного смысла.

При рассмотрении методов объективных оценок выяснилась их непригодность для определения качества передачи РС, т.к. они позволяют оценить степень сходства РС на выходе модуля сжатия с оригиналом, а для качественного восприятия РС это не обязательно. Также нет достаточно качественных методов для объективного определения качества сигналов, подвергшихся сжатию разными методами /1, 13/.

Для определения качества РС целесообразнее использовать субъективное восприятие по методу экспертных оценок.

Спектральные и временные диаграммы при проведении эксперимента были получены с помощью программы Cool Edit Pro. Расчеты были произведены в Mathcad 5+.



Поделиться:


Последнее изменение этой страницы: 2020-03-02; просмотров: 116; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.139.107.241 (0.01 с.)