Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь
FAQ
Написать работу

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ Написать работу

Применение скрытых марковских моделей для распознавания речи

↑

⇐ ПредыдущаяСтр 13 из 17Следующая ⇒

Скрытой Марковской Моделью (СММ, HMM – Hidden Markov Model) называется модель состоящая из N состояний, в каждом из которых некоторая система может принимать одно из M значений какого-либо параметра. Вероятности переходов между состояниями задается матрицей вероятностей A={a_ij}, где a_ij – вероятность перехода из i-го в j-е состояние. Вероятности выпадения каждого из M значений параметра в каждом из N состояний задается вектором B={b_j(k)}, где b_j(k) – вероятность выпадения k-го значения параметра в j-м состоянии. Вероятность наступления начального состояния задается вектором π={π_i}, где π_i – вероятность того, что в начальный момент система окажется в i-м состоянии. Таким образом, скрытой марковской моделью называется тройка λ={A,B,π}. Использование скрытых марковских моделей для распознавания речи основано на двух приближениях:

1) Речь может быть разбита на фрагменты, соответствующие состояниям в СММ, параметры речи в пределах каждого фрагмента считаются постоянными.

2) Вероятность каждого фрагмента зависит только от текущего состояния системы и не зависит от предыдущих состояний.

Модель называется «скрытой», так как нас, как правило, не интересует конкретная последовательность состояний, в которой пребывает система. Мы либо подаем на вход системы последовательности типа O={o₁,o₂,…o_τ} - где каждое o_i – значение параметра (одно из M), принимаемое в i-й момент времени, а на выходе ожидаем модель λ ={A,B,π}с максимальной вероятностью генерирующую такую последовательность, - либо наоборот подаем на вход параметры модели и генерируем порождаемую ей последовательность. И в том и другом случае система выступает как «черный ящик», в котором скрыты действительные состояния системы, а связанная с ней модель заслуживает названия скрытой.

Скрытые марковские модели являются мощным инструментом, позволяющим распознавать речевой сигнал с высоким качеством. Используют статистические свойства сигналов и учитывают непосредственно их пространственные характеристики. HMM состоит из двух взаимосвязанных частей.

1. Ненаблюдаемая марковская цепь с конечным числом состояний, матрица переходных вероятностей и вектор вероятностей начальных состояний.

2. Функция плотности, ассоциируемые с каждыми состояниями.

Таким образом, НММ представляет собой конечный автомат, изменяющий свое состояние в каждый дискретный момент времени t (см. рис. 6.1). Переход из состояния s_i в состояние s_j осуществляется случайным образом с вероятностью a_ij. В каждый дискретный момент времени модель порождает вектор наблюдений o_t (который в конкретной задаче является вектором признаков, полученным в преобразователе сигнала) с вероятностью b_j(o_t). Распределение плотности вероятности наблюдений моделируется конечной гаусовской смесью с четырьмя компонентами. Каждая такая модель обозначает один из звуков речи или отсутствие звука (одна из моделей).

Pисунок 6.1 – Представление скрытой марковской модели

Относительно скрытых Марковских моделей решаются как правило три задачи:

Задача 1

Дана последовательность наблюдений O={o₁,o₂,…o_τ} и модель λ={A,B,π}. Необходимо вычислить вероятность появления указанной последовательности для данной модели. То есть решение этой задачи непосредственно связано с задачей распознавания речи. Если, например, состояния модели соответствуют отрезкам времени, в которые снимаются параметры речевого сигнала, и в каждом из этих состояний (отрезков) некие параметры речевого сигнала принимают некоторые значения, которые мы представляем в виде O={o₁,o₂,…o_τ}, то решив задачу отыскания вероятности появления этой последовательности для каждой из имеющихся у нас моделей λ={A,B,π}, соответствующих, например, фонемам (звукам речи) или словам, мы можем выбрать ту из фонем (слов), которая(ое) в наибольшей степени соответствует исходному отрезку речевого сигнала. А это и значит распознать речевую единицу (фонему или слово).

Задача 2

Дана последовательность наблюдений O={o₁,o₂,…o_τ} и модель λ={A,B,π}. Необходимо выбрать последовательность состояний Q= {q₁,q₂,…q_τ}, которая с наибольшей вероятностью порождает указанную последовательность. Данные, полученные при решении этой задачи используются для изучения поведения полученной модели.

Задача 3

Дана последовательность наблюдений O={o₁,o₂,…o_τ} и модель λ={A,B,π}. Необходимо подобрать параметры модели так, чтобы максимизировать вероятность данной последовательности наблюдений. Это в чистом виде задача обучения модели на наборах входных данных, для того чтобы в дальнейшем использовать эту модель для решения задачи 1, то есть распознавания. То есть опять же состояния модели соответствуют отрезкам времени (как правило 10-30 мс), в которых снимаются значения параметра речевого сигнала, а принимаемые на некотором временном отрезке значения параметра и образуют последовательность наблюдений O.

Рассмотрим алгоритмы решения указанных задач.

⇐ Предыдущая 8 9 10 11 121314 15 16 17 Следующая ⇒

Познавательные статьи:

Техника прыжка в длину с разбега

Тактические действия в защите

История Олимпийских игр

История развития права интеллектуальной собственности

Последнее изменение этой страницы: 2022-09-03; просмотров: 121; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 216.73.216.137 (0.009 с.)