Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь
FAQ
Написать работу

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ Написать работу

Средний уровень спектра речи и динамический диапазон разговорной речи

↑

⇐ ПредыдущаяСтр 8 из 29Следующая ⇒

Речевые сигналы ограничены частотным диапазоном 100 — 10000 Гц и уровнями от 50 до 80 дБ. При этом основные голосовые тоны составляют диапазон частот 100 — 250 Гц. Энергия гласных фонем сосредоточена главным образом в диапазоне 200 — 1500 Гц, а энергия согласных звуков — в диапазоне 1000 — 6000 Гц. На частотах 200—1000 Гц содержится максимальная энергия звуков речи (гласные звуки), которая уменьшается примерно по 5 — 8 дБ на октаву при расширении речевого диапазона частот от 100 до 6000 Гц (см. рис. 21).

Фонемы отличаются не только по частотному составу, но и по уровню; гласные фонемы имеют большую интенсивность, чем согласные. Различия уровней гласных и согласных звуков достигают 25 — 30 дБ. Интенсивность речи обычно выражают через условный эквивалентный уровень, время суммирования которого составляет не менее 60 с (Р. Герлих, 1960). Средний или эквивалентный уровень речи может быть приближенно определен с помощью прецизионного шумомера измерением в режиме «быстро» или «медленно» с усреднением регистрируемых максимальных значений (соответственно за вычетом 3 дБ или с добавлением 2 дБ).

Пиковые амплитуды изменения речи приблизительно на 12 дБ выше, а минимальные «провалы» примерно на 18 дБ ниже среднего уровня речи. Диапазон изменения УЗД звуков речи в среднем равен 30 дБ. Наибольшие отклонения мгновенных пиковых значений обнаруживаются на более высоких частотах. Так, для области средних частот наибольшие различия между максимальными и минимальными мгновенными значениями уровня речи составля-

100 200 500 1000 2000 5000 10000

Частота, Гц :••-

Рис. 21. Область звуков речи и средний уровень спектра речи "''''.

ют приблизительно 14—16 дБ, а для частот 2000 — 4000 Гц они достигают 30 — 35 дБ (Г.Фант, 1970).

Разборчивость речи

Распознавание речи, как следует из многочисленных экспериментальных и теоретических исследований, по-видимому, происходит последовательно в два этапа. Сначала слуховая система осуществляет перевод простых физических или акустических признаков речевого сигнала в дискретный ряд фонем. На втором этапе происходит непосредственный перевод фонем в языковую единицу (А. И. Соловьева, 1972; Н.А-Позин и др., 1972; И.А.Вартанян, 1978).

Чтобы речь была услышана, ее уровень должен быть выше порога слышимости или порога обнаружения. Только в этом случае слушающий начинает различать отдельные слова.

Основным методом количественной оценки разборчивости речевых сигналов является артикуляционный метод, согласно которому определяют количество слогов, слов или предложений, произнесенных диктором или записанных на магнитный носитель и правильно повторенных слушателем. Разборчивость речи выражают через коэффициент разборчивости или в процентах.

Многочисленными экспериментами установлено, что с повышением интенсивности речевых сигналов их разборчивость повышается. Пороги разборчивости зависят как от фонемного состава речевого материала и количества слогов в слове, так и от частоты их употребления, а также от наличия и характера шумовой помехи. Разборчивость речи зависит не только от морфологических, синтаксических и лингвистических особенностей речевого материала, но также и от акустических условий и других физических факторов, влияющих на качество звука и его воспроизведение.

Оценка спектрального состава, а также амплитудных соотношений периодических звуков — наиболее важный ключ для распознавания речи. Хотя речевые сигналы содержат частоты от 500 до 10000 Гц, однако в реальных условиях человек обычно воспринимает их в более узком диапазоне частот. Так, при разгово-I ре по телефону достаточно высокая разборчивость речи обеспечивается при сохранении только части частотного диапазона, на-| пример от 300 до 3500 Гц.

Эксперименты по разборчивости речи, пропущенной через I фильтры низких и высоких частот, позволили установить влияние различных участков частотного диапазона на качество звучания речи и разборчивость (Д. Ликлайдер, Д.Миллер, 1963; М.М.Эф-| русси, 1975). Результаты этих исследований показали, что частоты выше 3400 Гц практически не вносят вклада в разборчивость, поскольку диапазон частот от 100 до 3400 Гц обеспечивает более 90 % разборчивости речи.

На разборчивость речи влияют также ее амплитудные ограничения. Типичным амплитудным искажением является клиппиро-вание звуковых сигналов. При этом если ограничение пиковых амплитуд сигнала составляет 0 —20 дБ от их максимальных значений, то разборчивость речи уменьшается незначительно и снижается до 90 — 96 % по сравнению с разборчивостью речи без клип-пирования. Если же амплитуды речевого сигнала ограничиваются от 20 до 50 дБ, то разборчивость речи снижается до 70 % и остается на этом уровне практически до бесконечного клиппирования (Д.Ликлайдер). При этом форма сигнала становится практически прямоугольной с различными длительностями и интервалами между импульсами.

Один из видов амплитудных искажений — центральное ограничение речевого сигнала: форма пиковых значений сигнала сохраняется, но исключается информация о местах и времени пе-

ресечения звуковой волны с центральной осью. Именно такие виды искажений вызывают резкое снижение разборчивости речи. Однако наибольшее ее снижение происходит при суммации разных видов амплитудных искажений.

На форму речевого сигнала также влияет время реверберации, определяемое акустическими условиями помещений. С его повышением, начиная от 0,4 до 5 с, разборчивость речи снижается. Так, при увеличении времени реверберации от 2 до 8 с разборчивость речи понижается от 60 до 20 %.

Помимо указанных факторов на разборчивость речи влияет также скорость воспроизведения или произнесения говорящим слогов или слов. Нормальная скорость воспроизведения речи составляет 100—140 слогов в минуту; разборчивость заметно снижается, если скорость воспроизведения достигает 180 — 200 слогов в минуту. Искажения возникают, если не совпадают скорость воспроизведения и скорость записи. При этом меняется тембровая окраска речевых звуков, что обусловлено изменением спектрального состава речи.

Аналогичные искажения речи происходят и при сдвиге спектра речевого сигнала в сторону высоких или низких частот (Ю. В. Крылов и др., 1980; Д.Ликлайдер, Д.Миллер, 1963). Такой вид частотных искажений иногда наблюдается при передаче и приеме речевых сигналов через приемопередающие системы. Линейный сдвиг спектра речи приводит к резкому нарушению ее разборчивости. При этом потеря разборчивости пропорциональна величине сдвига спектра речи.

Вопросы и задания

1. Дайте определение понятия «звук».

2. Какую форму имеет звуковая волна?

3. От чего зависят сила и интенсивность звука?

4. На какие группы можно разделить звуки?

5. Дайте определение понятия «область звукового восприятия».

6. В каких единицах принято выражать силу и частоту звука?

7. Дайте определение понятия «слуховая чувствительность».

8. Что такое маскировка? Какой звук является маскирующим?

9. Назовите преимущества бинаурального слуха.

10. Чем отличаются гласные звуки от согласных с точки зрения акустики?

11. Каков частотный диапазон речевых сигналов? Каков диапазон основных голосовых тонов.

12. В каких диапазонах сосредоточена энергия гласных фонем, энергия согласных звуков?

13. От чего зависит разборчивость речи?

Глава 3

⇐ Предыдущая 3 4 5 6 789 10 11 12 Следующая ⇒

Познавательные статьи:

Техника прыжка в длину с разбега

Тактические действия в защите

История Олимпийских игр

История развития права интеллектуальной собственности

Последнее изменение этой страницы: 2017-01-19; просмотров: 1023; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 52.14.219.203 (0.012 с.)