Байесовское решающее правило 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Байесовское решающее правило



Недостатком рассмотренных выше методов является то, что они могут применяться только тогда, когда классы чётко разделяются друг от друга. На практике часто встречаются случаи, когда объекты, имеющие совпадающие свойства, относятся к разным классам. Примером могут служить ходовые свойства отцепов. Как правило, тяжёлые отцепы являются хорошими бегунами, а лёгкие – плохими. Но бывает наоборот, тяжёлый бегун оказывается плохим бегуном, а лёгкий – хорошим. Таким образом, объект, имеющий вектор Х свойств, может быть отнесён, с какой-то вероятностью, к любому классу.

Обозначим через P(Vi/X) вероятность того, что объект, имеющий вектор свойств Х, принадлежит классу Vi и через Cij – потери, вызванные тем, что объект, принадлежащий классу Vi,ошибочно отнесён к классу Vj. Так как объект Х может принадлежать любому из k классов, математическое ожидание потерь, вызванное отнесением этого объекта к классу Vj, будет равно:

Эта величина называется условным средним риском или условными средними потерями.

Вычислим условные средние потери для каждого класса R1(X), R2(X), …,Rk(X). Минимальное значение условных средних потерь при отнесении объекта к какому-нибудь классу можно считать признаком того, что объект принадлежит этому классу.

Воспользовавшись формулой Байеса

выражение расчёта условной средней потери можно представить в следующем виде:

Поскольку выражение 1/P(X) входит в качестве множителя во все формулы вычисления условных средних потерь, его можно отбросить.

Для упрощения рассуждений будем считать, что Cij=0, если i=j (класс определён правильно, потери равны нулю), и Cij =1, если i ¹ j (потери одинаковы при любой ошибке). Представим функцию потерь в следующем виде: Сij=1-dij,, где dij =1, если i = j, и dij=0, если i ¹ j.

В этом случае математическое ожидание потерь будет равно:

Поскольку суммирование ведётся по всем классам сумма произведений вероятности класса и вероятности объекта в классе равна вероятности объекта:

Если объект принадлежит классу Vi, должно соблюдаться неравенство:

Отбросив P(X), получим:

Таким образом, решающее правило будет иметь вид:

При этом объект зачисляется в класс Vi, если qi(x)> qj(x), j =1..k, j¹ i.

P(Vi)= ni/n, n – общее число объектов обучающей последовательности, ni – число объектов обучающей последовательности, принадлежащих классу Vi.

Ri (X)=P(X)P(Vi /X). Как и в предыдущем случае, Р(Х) можно отбросить. Таким образом, основной можно считать решающую функцию:

Ri (X)= P(Vi /X).

В отличие от предыдущей функции её можно использовать даже при сравнительно небольшой выборке объектов обучающей последовательности.

Ri (X)>0,5 – объект принадлежит классу V1, иначе к V2.


Вопрос 17

Нахождение коэффициентов решающей функции, построенной с использованием критерия Байеса.

Если число классов равно двум, то R2(X)=P(V2/X)=1-P(V1/X)= 1-R1(X). В связи с этим достаточно знать только функцию R1(X) (в дальнейшем её будем обозначать R(X)).

Поскольку классы разделяются гиперплоскостями, решающую функцию будем искать в виде:

где с – вектор коэффициентов решающей функции, с = (с01,…,ck); х – вектор свойств объекта, х = (х0, х1,…,хk); х0 =1;

Вероятностный алгоритм обучения представляет собой следующую рекуррентную процедуру.

Пусть после просмотра n-1 – го вектора объекта обучающей последовательности получено n –е приближение с (k) коэффициентов решающей функции и рассматривается n –й вектор. Тогда (k+1) –ое приближение коэффициентов определится следующим образом:

 

Процесс вычисления коэффициентов с решающей функции заключается в следующем:

– первоначально коэффициентам с присваиваются произвольные значения, например, с01=…=сk=0;

– поочерёдно в решающую функцию подставляют свойства вектора Х объектов обучающей последовательности и корректируют значения коэффициентов с с использованием указанных выше преобразований.

Для получения более точных значений коэффициентов объекты обучающей последовательности на вход алгоритма подаются многократно. Процедура заканчивается, если разность между одноимёнными коэффициентами двух очередных реализаций алгоритма не превышают значение ошибки e (обычно e =10-6).


Вопрос 18

Имитационные модели

Имитационное моделирование основано на представлении порядка функционирования системы или отдельного её узла в виде набора алгоритмов. Имитационные математические модели – это алгоритмические модели, отражающие развитие процесса (поведение исследуемого объекта) во времени при заданных внешних воздействий на процесс (объект).

Имитационное моделирование основано на прямом описании моделируемого объекта. Существенной характеристикой таких моделей является структурное подобие объекта и модели. Это значит, что каждому существенному с точки зрения решаемой задачи элементу объекта ставится в соответствие элемент модели. При построении имитационной модели описываются законы функционирования каждого элемента объекта и связи между ними.

Имитационные модели представляют собой описание объекта исследования на некотором языке, которое имитирует элементарные явления, составляющие функционирование исследуемой системы, с сохранением их логической структуры, последовательности протекания во времени, особенностей и состава информации о состоянии процесса. Можно отметить имеющуюся аналогию между исследованием процессов методом имитационного моделирования и экспериментальным их исследованием.

Работа с имитационной моделью заключается в проведении имитационного эксперимента. Процесс, протекающий в модели в ходе эксперимента, подобен процессу в реальном объекте. Поэтому исследование объекта на его имитационной модели сводится к изучению характеристик процесса, протекающего в ходе эксперимента.

Ценным качеством имитационных моделей является возможность управлять масштабом времени, создавать экстремальные ситуации, которые затруднительно или даже невозможно создать при экспериментальном испытании объекта.

При построении имитационных моделей, как привило, используется агрегатный метод, Для этого вся система разбивается на отдельные агрегаты, выполняющие сравнительно небольшой круг задач. Агрегаты могут соответствовать элементам и узлам моделируемого устройства (например, процессор, ОЗУ, устройства обмена информацией и т.д.). В качестве агрегатов могут выступать математические объекты, с помощью которых описывается работа отдельных узлов устройства. По существу агрегат представляет собой описание функций объекта, соответствующих цели исследования.

Агрегаты задаются в параметрической форме, т.е. указываются параметры, характеризующие конкретный объект. Например, система массового обслуживания характеризуется дисциплиной обслуживания заявок, числом каналов и законом распределения длительности обслуживания (указываются параметры закона распределения). Функции агрегата (рис.2.19, а) представляются в алгоритмической форме – в виде процедуры Фq(a1,…ak, b1,…bl, cl,…cm), где параметры a1,…ak определяют состояние входов элемента, b1,…bl – режим его функционирования, и c1,…cm – состояние выходов. Таким образом, агрегат представляет собой устройство, преобразующее поток информации, поступающий на его входы А(а1,…аn), в выходной поток C(c1,…cm) по алгоритму, определяемому состоянием входов B(b1,…bm).

Имитационная модель собирается путём соединения выходов одних агрегатов с входами других (рис. 1.19, б). Состав агрегатов, структура связи ними и наборы параметров агрегатов и определяют имитационную модель. Таким образом, имитационные модели воспроизводят процесс функционирования и свойства исследуемых систем исходя из априорно известных свойств элементов системы за счёт объединения моделей элементов в структуру, соответствующую исследуемой системе, и имитации функционирования элементов в их взаимодействии.

 

Важнейшие свойства имитационных моделей:

– с помощью имитационных моделей можно исследовать системы любой степени сложности. Усложнение объекта исследования приводит только к увеличению числа данных, вводимых в модель, усложнению алгоритма их обработки и увеличение времени решения модели. При этом структура модели остаётся неизменной.

– Метод имитации не ограничивает уровень детализации. С помощью алгоритмов можно воспроизводить любые сколь угодно своеобразные взаимосвязи между элементами системы и процессы функционирования. Более детальное представление организации системы сказывается только на объёме алгоритмического описания модели (программы) и затратах времени на моделирование.

– Имитационные модели являются неограниченным источником данных о поведении исследуемой системы, особенно в экстремальных ситуациях. При этом могут быть получены характеристики как системы в целом, так и отдельных её узлов и элементов.

К недостаткам имитационных моделей следует отнести:

– большие затраты времени, необходимые для создания модели и частный характер полученных результатов;

большие затраты времени, необходимые для испытания модели. Опыт создания имитационных моделей сложных систем показывает [9], что для одной реализации модели ЭВМ требуется выполнить 108…1012 операторов. Поскольку при исследовании модели требуется её многократная прогонка, исследование модели может длиться несколько суток.


Вопрос 19



Поделиться:


Последнее изменение этой страницы: 2016-04-07; просмотров: 438; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.118.150.80 (0.009 с.)