Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ

Анализ закономерностей нуклеотидных последовательностей на основе использования марковских цепей

⇐ ПредыдущаяСтр 4 из 10Следующая ⇒

Введем некоторые определения, конкретизирующие смысл марковской цепи.

1) Случайным процессом x (t) называется функция неслучайного аргумента (как правило времени), значение которой для любого произвольного момента времени представляет собой СВ.

2) Случайный процесс x(t) называется процессом с дискретным временем, если он способен менять свои состояния лишь в фиксированные моменты времени t₁, t₂, …, t_m, число которых счетно или конечно.

3) Случайный процесс x(t) называется процессом с дискретным временем и дискретными состояниями, если в каждый из фиксированных моментов времени t₁, t₂, …, t_m случайный процесс может находиться в одном и только в одном состоянии из конечного набора возможных состояний x₁, x₂, …, x_n. Т.е. в любой фиксированный момент времени t_i случайный процесс может принять только одно из конечного набора возможных состояний: x(t_i) = x₁ или x(t_i) = x₂или … или x(t_i) = x_n

4) Случайный процесс с дискретным временем и дискретным состоянием называется марковской цепью порядка k, если вероятность будущего состояния процесса x_i₊₁ зависит только от того, в каких именно состояниях находился процесс в k предшествующих моментах времени.

Иными словами, для марковской цепи справедливо следующее условие:

P{x_i₊₁/(x_i, x_i_-1, …, x₂, x₁)} = P{x_i₊₁/(x_i, x_i_-1, …, x_i_-_k)}

Оказывается, что марковская цепь является удобной математической моделью, позволяющей исследовать закономерности структур нуклеотидной последовательности. В этом случае аналогом дискретного времени выступает номер позиции нуклеотидной последовательности. В каждой позиции нуклеотидной последовательности возможно появление одного и только одного из четырех типов нуклеотидных оснований, которые и являются аналогами дискретного состояния марковской цепи.

В рамках подобного представления задача сводится к определению такого порядка марковской цепи, которая наилучшим образом описывает исследуемую нуклеотидную последовательность. Если в результате анализа в качестве оптимальной будет определена марковская цепь первого порядка (k = 1), это значит то появление определенного основания в нуклеотидной последовательности зависит от того, какое основание находилось в предшествующей позиции. Если оптимальным окажется второй порядок марковской цепи (k = 2), это значит, что появление определенного основания в нуклеотидной последовательности зависит от того, какие именно основания находились в двух предшествующих позициях и т.д.

Для определения оптимального порядка марковской цепи используется так называемый Байесовский информационный критерий. Основу этого критерия составляет функция правдоподобия L(k).

Функция правдоподобия L (k) определяет вероятность получения исследуемой последовательности оснований, если описывать эту последовательность марковской цепью порядка k.

Функция правдоподобия рассчитывается на основе следующего выражения:

где k – порядок марковской цепи;

n – количество оснований в исследуемой последовательности;

P(x₁, x₂, …, x_k) – вероятность, с которой в исследуемой последовательности встречается комбинация оснований, располагаемых в первых k позициях;

– условная вероятность того, что в позиции с номером i+1 располагается основание типа x_i₊₁ при условии, что в предшествующих k позициях располагались основания x_i, x_i_-1, …, x_i_-_k.

В качестве оптимального k^* порядка марковской цепи выступает такой, при котором достигается максимум функции правдоподобия:

В том случае, если оптимальный порядок марковской цепи k^* = 1, то значит, что появление некоторого основания не является случайным, а зависит от того, какой именно нуклеотид находится в предшествующей позиции.

Если k^* = 2, то значит, что появление некоторого основания зависит от того, какие именно нуклеотиды находились в двух предшествующих позициях. И т.д.

Проиллюстрируем механизм вычисления функции правдоподобия на примере короткой нуклеотидной последовательности:

AGTCATCCGTAC

В соответствии с приведенным выше определением функция правдоподобия для марковской цепи порядка k=1 рассчитывается следующим образом:

Оценки вероятностей, присутствующих в этом выражении, рассчитываются следующим образом:

n_A – количество оснований типа А в исследуемой последовательности, n – длина последовательности;

n_AG – количество пар оснований типа AG в исследуемой последовательности;

n_AC – количество пар оснований типа AC в исследуемой последовательности.

Функция правдоподобия для марковской цепи порядка k=2:

n_AG – количество пар оснований AG в исследуемой последовательности;

n_•• – общее число всех последовательных парных комбинаций в исследуемой последовательности.

Таким образом, последовательно повышая порядок цепи Маркова, находится такое его оптимальное значение, при котором достигается максимум функции правдоподобия. Иными словами, в качестве оптимального порядка марковской цепи выбирается такой, при котором вероятность получения исследуемой последовательности нуклеотидов будет максимальной.

⇐ Предыдущая 1 2 345 6 7 8 9 10 Следующая ⇒

Читайте также:

Как правильно слушать собеседника

Типичные ошибки при выполнении бросков в баскетболе

Принятие христианства на Руси и его значение

Средства массовой информации США

Последнее изменение этой страницы: 2021-01-08; просмотров: 116; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.116.21.229 (0.01 с.)