Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь
FAQ
Написать работу

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ Написать работу

Уменьшение влияния однолучевого гауссовского канала с флуктуациями амплитуд и фаз сигнала (с общими замираниями).

↑

⇐ ПредыдущаяСтр 4 из 7Следующая ⇒

При длительном ухудшении состояния канала, необходимо просто предусмотреть достаточную мощность излучения, размер антенны и т. д. (так называемый системный запас). Получающаяся в результате система может казаться неоправданно сложной для работы в обычных условиях. Однако такое усложнение необходимо для обеспечения работоспособности системы при относительно редких условиях, которые разработчик системы связи все же должен учитывать.

Трудности, возникающие из-за ухудшения состояния канала, можно также преодолеть, вводя изменения параметров системы в процессе передачи. Подобные системы обычно называют адаптивными. Как правило, при падении отношения сигнал/помеха процесс адаптации состоит в снижении скорости посылки информации в канал (иначе говоря, приходится учитывать снижение пропускной способности канала). Другой распространенный способ адаптации, позволяющий противостоять длительным изменениям отношения сигнала к помехе в канале, заключается в использовании таких простых приемов, как изменение рабочей частоты при дальней коротковолновой радиосвязи.

6.Охарактеризуйте цифровые методы преобразования речевых сигналов в информационно-телекоммуникационных системах с позиций уменьшения объема их битового представления.

Для повышения эффективности использования коммуникационных и информационно-вычислительных ресурсов ИТС при передаче и хранении речевых данных применяются различные методы и средства. Среди них весьма важную роль играют методы, обеспечивающие сжатие (кодирование) речи, т.е., уменьшение объема занимаемого информацией на физических носителях, или скорости ее передачи по цифровым каналам связи. В таких системах речевой сигнал, преобразованный в цифровой вид, перед записью на носитель или передачей кодируется при помощи специального алгоритма сжатия, а при воспроизведении с носителя или на приеме - декодируется.

Это позволяет значительно разгрузить каналы связи и системы обработки и хранения данных за счет исключения ненужных или дублирующих сведений, что эквивалентно повышению пропускной способности систем сбора, передачи и обработки данных или увеличению емкости запоминающих устройств (ЗУ).

Для кодирования объемов речевых данных, в настоящее время используются методы с потерями, которые разделяются на два основных класса, называемых кодированием волны (прямое цифровое кодирование речевых сигналов с использованием разнообразных приемов снижения скорости их передачи) и кодированием источника (моделирование голосового аппарата с применением подходящих методов оценки параметров модели). Методы без потерь для сжатия речи не используются, так как они не позволяют устранить заложенную в ней избыточность.

Простейшими кодерами речи, вообще не использующими информацию о том, как был сформирован сигнал, а просто старающимися максимально приблизить декодированный сигнал по форме к оригиналу, являются кодеры формы сигнала. Теоретически они не зависят от характера сигнала, подаваемого на их вход, и могут использоваться для кодирования любых, в том числе и не речевых, сигналов.

Самым простым и понятным способом кодирования формы сигнала является так называемая импульсно-кодовая модуляция - ИКМ (или PCM - Pulse Code Modulation), при использовании которой производятся просто дискретизация и равномерное квантование входного сигнала, а далее - преобразование полученного результата в равномерный двоичный код. Процедура иллюстрируется рисунком 1.

Рисунок 1. Процедура кодирования формы сигнала

Для речевого сигнала характерно то, что малые уровни сигнала появляются значительно чаще, чем большие. Используя неравномерное квантование (более точное для малых уровней сигнала и более грубое для больших его уровней, таким образом, чтобы относительная ошибка квантования была постоянной для всех уровней сигнала), можно достичь того же самого субъективного качества восстановления речевого сигнала, но при гораздо меньшем числе уровней квантования.

На практике, вместо не очень удобного в техническом исполнении неравномерного квантования обычно применяют логарифмическую компрессию сигнала, а после этого - обычное равномерное квантование. В современных ИТС наиболее часто используются два закона компандирования: А-закон и Мю – закон.

Амплитудная характеристика логарифмического компрессора описывается выражением

где | x | - амплитуда сигнала на входе, | y | - амплитуда на выходе, μ - параметр, который подбирается, чтобы получить требуемую характеристику компрессии. На рисунке 2 приведены характеристики компрессии для некоторых значений μ. При μ = 0 компрессия отсутствует.

В результате логарифмического квантования величина шумов квантования уменьшается примерно на 24 дб в сравнении с равномерным квантованием, таким образом, появляется возможность уменьшить длину кода до 8 бит без потери качеств и результирующая скорость кода составит 64 кбит/с.

Рисунок 2. Характеристики компрессии

ИКМ с логарифмическим сжатием и скоростью кода 64 кбит/с является одним из международных стандартов кодирования речевых сигналов - G.711.

Поскольку логарифмическое сжатие является стандартом в телефонии, исходной для любого сравнения эффективности и качества кодирования речевых сигналов может служить скорость кода, равная 64 кбит/с.

Логарифмическая ИКМ никак не использует взаимную корреляцию между соседними отсчетами речи, поэтому первым примером сжимающей обработки стоит считать дифференциальную ИКМ (ДИКМ), при которой осуществляется предсказание речи первого порядка. Предыдущий отсчет берется с определенным весом, формируя прогноз. Разница между предсказанным и реальным отсчетом речи подвергается квантованию. Позднее появилась технология, названная адаптивной дифференциальной импульсно-кодовой модуляцией (АДИКМ), которая была принята в качестве стандарта в 1984 г. под названием G.726. Данная технология воспроизводит речь почти с такой же субъективной оценкой качества, как и ИКМ, используя только 32 Кбит/с. АДИКМ снижает скорость битового потока вдвое путем обработки разности между двумя соседними отсчетами, а не самих отсчетов.

При АДИКМ размеры шкалы квантования подстраивают в соответствии с энергией речи так, чтобы слабые сигналы квантовались малыми ступенями квантования, а сильные сигналы - большими. Благодаря непрерывной подстройке шага квантования к текущей мощности речи, разрядность шкалы квантования при АДИКМ удалось снизить до четырех бит и получить кодек со скоростью передачи 32 кбит/с и качеством, близким к ИКМ.

Дельта-модуляцию (ДМ) можно рассматривать как простейшую форму ДИКМ, в которой используется двухуровневый (1-битовый) квантователь и фиксированный предсказатель нулевого порядка. При использовании ДМ текущее значение ошибки предсказания кодируется и передается всего одним битом, а восстанавливаемый сигнал аппроксимируется некоторой ступенчатой функцией (рисунок 3). Понятно, что для хорошей аппроксимации сигнал s (t) должен изменяться медленно в сравнении с частотой дискретизации. Поэтому, при использовании ДМ частоту дискретизации обычно выбирают в 5 - 6 раз большей, чем требуется по условиям Котельникова.

Рисунок 3. Аппроксимация сигнала ступенчатой функцией

Дельта-модуляция из-за простоты кодирования и восстановления сигнала широко используется в простых цифровых системах передачи как речевых, так и других медленно меняющихся сигналов (в измерительных системах, в телеметрии и т.д.).

Описанные выше кодеры формы сигнала использовали чисто временной подход к описанию этого сигнала. Однако возможны и другие подходы. Примером может служить так называемое кодирование поддиапазонов или подполос (Sub-Band Coding - SBC), при котором входной сигнал разбивается (или расфильтровывается) на несколько частотных диапазонов (поддиапазонов -sub-bands) и сигнал в каждом из этих поддиапазонов дискретизуется и кодируется по отдельности, например, с использованием техники АДИКМ.

Поскольку каждый из частотных поддиапазонов имеет более узкую полосу ΔF_mi_т (все поддиапазоны в сумме дают полосу исходного сигнала F_m), то и частота дискретизации в каждом поддиапазоне также будет меньше. В результате суммарная скорость всех кодов будет по крайней мере не больше, чем скорость кода для исходного сигнала во всей полосе. Однако у такой техники есть определенные преимущества. Дело в том, что субъективная чувствительность слуха к сигналам и их искажениям различна на разных частотах. Она максимальна на частотах 1-1,5 кГц и уменьшается на более низких и более высоких частотах. Таким образом, если в диапазоне более высокой чувствительности слуха квантовать сигнал более точно, а в диапазонах низкой чувствительности более грубо (и представлять полученные данные меньшим числом бит), то можно получить выигрыш в результирующей скорости кода. Действительно, при использовании технологии кодирования поддиапазонов получено хорошее качество кодируемой речи при скорости кода 16-32 кбит/с. Кодер получается несколько более сложным, чем при простой АДИКМ, однако гораздо проще, нежели для других эффективных способов сжатия речи.

Дальнейшее увеличение степени сжатия речевых данных основано на кодировании источника (моделирование голосового аппарата с применением подходящих методов оценки параметров модели), т.е. на учете особенностей их структуры. Для параметрического описания речи обычно используется подход, основанный на вычислении параметров, описывающих передаточную функцию речевого тракта человека и функцию возбуждения. Такими параметрами, например, являются: коэффициенты линейного предсказания (модель авторегрессии) и, связанные с ними, - коэффициенты отражения или отношение площадей поперечного сечения смежных акустических резонаторов в соответствии с моделью речевого тракта человека, представленной системой акустических резонаторов. В последнее время, наибольшее распространение получил метод, позволяющий вычислять непосредственно полюса передаточной функции речевого тракта в частотной области, упорядоченные по возрастанию частоты (LSF- liner spectral frequancy). Обычно для кодирования речи используются 8-10 параметров (один из вышеперечисленных наборов), вычисляемых на интервалах порядка 5-40 мсек, кроме того, вычисляется параметр, характеризующий изменение амплитуды либо мощности сигнала, период основного тона речи, а также признак типа тон/шум/пауза, характеризующий способ возбуждения речевого сигнала.

Таким путем удается снизить информационную емкость речевого сигнала до уровня 16- 1,2 кбит/сек, причем с сохранением разборчивости и индивидуальных особенностей речи говорящего.

Следующим шагом в направлении дальнейшего увеличения сжатия является создание фонемного вокодера. Как известно, минимальной слогоразличительной (и словоразличительной) единицей речи является фонема. Поэтому, создание устойчивого метода распознавания фонем, позволит снизить скорость кодирования речевой информации до 100 бит/сек, что соответствует информационной скорости текста. Заметим, что на приемном конце речь будет восстановлена синтезатором речи по фонемному тексту. При этом информация об индивидуальности диктора будет утрачена.

И, наконец, последним этапом сжатия может явиться создание системы автоматического распознавания слов и возможно целых фраз. В этом случае по каналу связи может быть передан только его код, а на приемном конце будет получен номер слова из некоторого ограниченного словаря и с помощью синтезатора превращен в речевой сигнал.

⇐ Предыдущая 1 2 345 6 7 Следующая ⇒

Познавательные статьи:

Коммуникативные барьеры и пути их преодоления

Рынок недвижимости. Сущность недвижимости

Решение задач с использованием генеалогического метода

История происхождения и развития детской игры

Последнее изменение этой страницы: 2016-08-26; просмотров: 156; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.133.155.253 (0.012 с.)