Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Уменьшение влияния однолучевого гауссовского канала с флуктуациями амплитуд и фаз сигнала (с общими замираниями).

Поиск

При длительном ухудшении состояния ка­нала, необхо­димо просто предусмотреть достаточную мощность излучения, раз­мер антенны и т. д. (так называемый системный запас). Получаю­щаяся в результате система может казаться неоправданно слож­ной для работы в обычных условиях. Однако такое усложнение не­обходимо для обеспечения работоспособности системы при относи­тельно редких условиях, которые разработчик системы связи все же должен учитывать.

Трудности, возникающие из-за ухудшения состояния канала, можно также преодолеть, вводя изменения параметров системы в процессе передачи. Подобные системы обычно называют адаптив­ными. Как правило, при падении отношения сигнал/помеха про­цесс адаптации состоит в снижении скорости посылки информации в канал (иначе говоря, приходится учиты­вать снижение пропускной способности канала). Другой распро­страненный способ адаптации, позволяющий противостоять дли­тельным изменениям отношения сигнала к помехе в канале, заклю­чается в использовании таких простых приемов, как изменение рабочей частоты при дальней коротковолновой радиосвязи.

6.Охарактеризуйте цифровые методы преобразования речевых сигналов в информационно-телекоммуникационных системах с позиций уменьшения объема их битового представления.

 

Для повышения эффективности использования коммуникационных и информационно-вычислительных ресурсов ИТС при передаче и хранении речевых данных применяются различные методы и средства. Среди них весьма важную роль играют методы, обеспечивающие сжатие (кодирование) речи, т.е., уменьшение объема занимаемого информацией на физических носителях, или скорости ее передачи по цифровым каналам связи. В таких системах речевой сигнал, преобразованный в цифровой вид, перед записью на носитель или передачей кодируется при помощи специального алгоритма сжатия, а при воспроизведении с носителя или на приеме - декодируется.

Это позволяет значительно разгрузить каналы связи и системы обработки и хранения данных за счет исключения ненужных или дублирующих сведений, что эквивалентно повышению пропускной способности систем сбора, передачи и обработки данных или увеличению емкости запоминающих устройств (ЗУ).

Для кодирования объемов речевых данных, в настоящее время используются методы с потерями, которые разделяются на два основных класса, называемых кодированием волны (прямое цифровое кодирование речевых сигналов с использованием разнообразных приемов снижения скорости их передачи) и кодированием источника (моделирование голосового аппарата с применением подходящих методов оценки параметров модели). Методы без потерь для сжатия речи не используются, так как они не позволяют устранить заложенную в ней избыточность.

Простейшими кодерами речи, вообще не использующими информацию о том, как был сформирован сигнал, а просто старающимися максимально при­близить декодированный сигнал по форме к оригиналу, являются кодеры формы сигнала. Теоретически они не зависят от характера сигнала, подавае­мого на их вход, и могут использоваться для кодирования любых, в том числе и не речевых, сигналов.

Самым простым и понятным способом кодирования формы сигнала явля­ется так называемая импульсно-кодовая модуляция - ИКМ (или PCM - Pulse Code Modulation), при использовании которой производятся просто дискрети­зация и равномерное квантование входного сигнала, а далее - преобразование полученного результата в равномерный двоичный код. Процедура иллюстри­руется рисунком 1.

 

Рисунок 1. Процедура кодирования формы сигнала

 

Для речевого сигнала характерно то, что малые уровни сигнала появляют­ся значительно чаще, чем большие. Используя неравномерное квантование (более точное для малых уровней сигнала и более грубое для больших его уровней, таким образом, чтобы относительная ошибка квантования была постоянной для всех уровней сигнала), можно достичь того же самого субъек­тивного качества восстановления речевого сигнала, но при гораздо меньшем числе уровней квантования.

На практике, вместо не очень удобного в техническом исполнении нерав­номерного квантования обычно применяют логарифмическую компрессию сигнала, а после этого - обычное равномерное квантование. В современных ИТС наиболее часто используются два закона компандирования: А-закон и Мю – закон.

Амплитудная характеристика логарифмического компрессора описывается выражением

где | x | - амплитуда сигнала на входе, | y | - амплитуда на выходе, μ - пара­метр, который подбирается, чтобы получить требуемую характеристику ком­прессии. На рисунке 2 приведены характеристики компрессии для некоторых значений μ. При μ = 0 компрессия отсутствует.

В результате логарифмического квантования величина шумов квантова­ния уменьшается примерно на 24 дб в сравнении с равномерным квантовани­ем, таким образом, появляется возможность уменьшить длину кода до 8 бит без потери качеств и результирующая скорость кода составит 64 кбит/с.

Рисунок 2. Характеристики компрессии

 

ИКМ с логарифмическим сжатием и скоростью кода 64 кбит/с является одним из международных стандартов кодирования речевых сигналов - G.711.

Поскольку логарифмическое сжатие является стандартом в телефонии, исходной для любого сравнения эффективности и качества кодирования ре­чевых сигналов может служить скорость кода, равная 64 кбит/с.

Логарифмическая ИКМ никак не использует взаимную корреляцию между соседними отсчетами речи, поэтому первым примером сжимающей обработки стоит считать дифференциальную ИКМ (ДИКМ), при которой осуществляется предсказание речи первого порядка. Предыдущий отсчет берется с определенным весом, формируя прогноз. Разница между предсказанным и реальным отсчетом речи подвергается квантованию. Позднее появилась технология, названная адаптивной дифференциальной импульсно-кодовой модуляцией (АДИКМ), которая была принята в качестве стандарта в 1984 г. под названием G.726. Данная технология воспроизводит речь почти с такой же субъективной оценкой качества, как и ИКМ, используя только 32 Кбит/с. АДИКМ снижает скорость битового потока вдвое путем обработки разности между двумя соседними отсчетами, а не самих отсчетов.

При АДИКМ размеры шкалы квантования подстраивают в соответствии с энергией речи так, чтобы слабые сигналы квантовались малыми ступенями квантования, а сильные сигналы - большими. Благодаря непрерывной подстройке шага квантования к текущей мощности речи, разрядность шкалы квантования при АДИКМ удалось снизить до четырех бит и получить кодек со скоростью передачи 32 кбит/с и качеством, близким к ИКМ.

Дельта-модуляцию (ДМ) можно рассматривать как простейшую форму ДИКМ, в которой используется двухуровневый (1-битовый) квантователь и фиксиро­ванный предсказатель нулевого порядка. При использовании ДМ текущее значение ошибки предсказания кодируется и передается всего одним битом, а восстанавливаемый сигнал аппроксимируется некоторой ступенчатой функцией (рисунок 3). По­нятно, что для хорошей аппроксимации сигнал s (t) должен изменяться мед­ленно в сравнении с частотой дискретизации. Поэтому, при использовании ДМ частоту дискретизации обычно выбирают в 5 - 6 раз большей, чем требу­ется по условиям Котельникова.

 

Рисунок 3. Аппроксимация сигнала ступенчатой функцией

 

Дельта-модуляция из-за простоты кодирования и восстановления сигнала широко используется в простых цифровых системах передачи как речевых, так и других медленно меняющихся сигналов (в измерительных системах, в телеметрии и т.д.).

Описанные выше кодеры формы сигнала использовали чисто временной подход к описанию этого сигнала. Однако возможны и другие подходы. При­мером может служить так называемое кодирование поддиапазонов или подполос (Sub-Band Coding - SBC), при котором входной сигнал разбивается (или расфильтровывается) на несколько частотных диапазонов (поддиапазонов -sub-bands) и сигнал в каждом из этих поддиапазонов дискретизуется и коди­руется по отдельности, например, с использованием техники АДИКМ.

Поскольку каждый из частотных поддиапазонов имеет более узкую поло­су ΔFmiт (все поддиапазоны в сумме дают полосу исходного сигнала Fm), то и частота дискретизации в каждом поддиапазоне также будет меньше. В резуль­тате суммарная скорость всех кодов будет по крайней мере не больше, чем скорость кода для исходного сигнала во всей полосе. Однако у такой техники есть определенные преимущества. Дело в том, что субъективная чувствитель­ность слуха к сигналам и их искажениям различна на разных частотах. Она максимальна на частотах 1-1,5 кГц и уменьшается на более низких и более высоких частотах. Таким образом, если в диапазоне более высокой чувстви­тельности слуха квантовать сигнал более точно, а в диапазонах низкой чувст­вительности более грубо (и представлять полученные данные меньшим чис­лом бит), то можно получить выигрыш в результирующей скорости кода. Действительно, при использовании технологии кодирования поддиапазонов получено хорошее качество кодируемой речи при скорости кода 16-32 кбит/с. Кодер получается несколько более сложным, чем при простой АДИКМ, однако гораздо проще, нежели для других эффективных способов сжатия речи.

Дальнейшее увеличение степени сжатия речевых данных основано на кодировании источника (моделирование голосового аппарата с применением подходящих методов оценки параметров модели), т.е. на учете особенностей их структуры. Для параметрического описания речи обычно используется подход, основанный на вычислении параметров, описывающих передаточную функцию речевого тракта человека и функцию возбуждения. Такими параметрами, например, являются: коэффициенты линейного предсказания (модель авторегрессии) и, связанные с ними, - коэффициенты отражения или отношение площадей поперечного сечения смежных акустических резонаторов в соответствии с моделью речевого тракта человека, представленной системой акустических резонаторов. В последнее время, наибольшее распространение получил метод, позволяющий вычислять непосредственно полюса передаточной функции речевого тракта в частотной области, упорядоченные по возрастанию частоты (LSF- liner spectral frequancy). Обычно для кодирования речи используются 8-10 параметров (один из вышеперечисленных наборов), вычисляемых на интервалах порядка 5-40 мсек, кроме того, вычисляется параметр, характеризующий изменение амплитуды либо мощности сигнала, период основного тона речи, а также признак типа тон/шум/пауза, характеризующий способ возбуждения речевого сигнала.

Таким путем удается снизить информационную емкость речевого сигнала до уровня 16- 1,2 кбит/сек, причем с сохранением разборчивости и индивидуальных особенностей речи говорящего.

Следующим шагом в направлении дальнейшего увеличения сжатия является создание фонемного вокодера. Как известно, минимальной слогоразличительной (и словоразличительной) единицей речи является фонема. Поэтому, создание устойчивого метода распознавания фонем, позволит снизить скорость кодирования речевой информации до 100 бит/сек, что соответствует информационной скорости текста. Заметим, что на приемном конце речь будет восстановлена синтезатором речи по фонемному тексту. При этом информация об индивидуальности диктора будет утрачена.

И, наконец, последним этапом сжатия может явиться создание системы автоматического распознавания слов и возможно целых фраз. В этом случае по каналу связи может быть передан только его код, а на приемном конце будет получен номер слова из некоторого ограниченного словаря и с помощью синтезатора превращен в речевой сигнал.



Поделиться:


Последнее изменение этой страницы: 2016-08-26; просмотров: 156; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.133.155.253 (0.012 с.)