Принятие решений в условиях неопределенности. Критерии Сэвиджа и Лапласа. 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Принятие решений в условиях неопределенности. Критерии Сэвиджа и Лапласа.



Критерий Сэвиджа (минимаксный). Суть его заключается в выборе стратегии, не допускающей слишком высоких потерь. Для этого используется матрица рисков, в которой вычисляется максимальная прибыль при каждом варианте действия игрока, и среди результатов выбирается наименьший. Его формула выглядит как min (max i)

Критерий Лапласа- опирается на «принцип недостаточного основания», согласно которому все состояния природы Bj полагаются равновероятными, т.е. вероятности того, что природа окажется в одном из n своих состояний, одинаковы и равны: .
Если для ЛПР решение элементы матрицы aij платёжной матрицы – выигрыши, то оптимальной считается та стратегия Ai, для которой среднее арифметическое возможных выигрышей максимально, т.е. критерий: (

Если принимающий решение является игроком B, то критерий становится таким:

Неопределенность типа «активный партнер». Гипотезы 1, 2 и 3 о поведении партнера

Гипотеза 1. Каждый из субьектов А и Б не имеет информации о выборе, который сделан второй стороной. Дополнительные гипотезы о характере поведения второго игрока отсутствуют. В этом случае можно поступать аналогично решению задачи в условиях полной неопределенности. Это, по-существу, в точности тот же случай, и мы можем воспользоваться известным принципом наилучшего гарантированного результата. Для субьекта А гарантированная оценка будет равна

I* = max min I(x,z),

xÎX zÎZ

а для субьекта Б: I* = max minI(x,z)

zÎZ xÎX

Решая задачи максимизации, мы находим и векторы x*,z*, реализующие соответствующие гарантированные оценки.

Гипотеза 2. Предполагаем, что субъект Б следует принципу максимина и выбирает z* из условия Гипотезы 1:

I* = max min I(x,z).

zÎZ xÎX

Тогда мы можем выбирать x согласно правилу

I (x,z*) ®max,

xÎX

где z* - гарантирующее решение второго игрока. Обозначим решение задачи (18) через x**. При этом оказывается, что

I** = I(x**,z*) ³ I*,

где I* - наша гарантированная оценка, получаемая по принципу максимина.

Гипотеза 3. Мы теперь можем допустить, что субъект рассуждает точно так же, как и мы в предыдущем случае, т.е. использует не стратегию z*, а аналогичную стратегию z**. Поэтому мы можем это учесть и выбирать оптимальное решение с учетом уже этой гипотезы:I(x,z**) ® max Þx***,I***.

xÎX

Неопределенность типа «активный партнер». Гипотезы о знании первых ходов субъектов А и Б.

Мы по условиям игры знаем первый ход субъекта Б (он нам его обязан сообщить). Тогда наше поведение будет определяться стратегией в виде функции x=x(z). Мы можем ее определить в результате решения задачи оптимизации

I(x,z) ®max. Условие позволяет для каждого фиксированного z определить искомое значение x, т.е. задать функцию x(z). Для этого случая мы также можем определить гарантированный результат : = min max I(x,z) = min I(x(z),z). Результат будет отличаться от значения I*, найденного согласно гипотезе 1. Именно, во всех случаях будем иметь ³ I*. Таким образом, принятие гипотезы 4 вновь позволяет улучшить результат, полученный по принципу максиминного гарантированного результата. Докажем неравенство (21), которое имеет вид min max I(x,z) ³ max min I(x,z). Для любых фиксированных и , очевидно, справедливо неравенство

j1() ³ j2(), где j1() D max I(x, ); j2() D minI(,z). Действительно, пусть max I(x, ) = I(, );

min I(,z) = I(, ). Отсюда имеем: j1() = I(, ) ³ I(, ) ³ I(, ) = j2().

Так как x, могут быть любыми, то их можно выбрать следующим образом: = argmax j2(x); = argmin j1(z).

Принцип устойчивости Нэша.

по имени автора - американского математика Джона Нэша. Он гласит, что выбор рациональной стратегии h должен производиться среди множества точек равновесия. Равновесные решения называются так же оптимальными по Нэшу. Данный принцип отражает очень важное свойство коллективного решения. Именно, если оба субъекта А и Б смогли договорится о том, чтобы придерживаться выбора x= , z= , то тот субъект, который нарушает договоренность, прежде всего и пострадает: свойство устойчивости решения дает известную гарантию против нарушения договоренности. Все вышеизложенное справедливо и для случая N игроков, где N>2.

Множество Парето.

Множество, включающее в себя все эффективные решения, обозначается PI(X) или просто P(X) (если ясно, о каком векторном критерии I идет речь) и называется множеством Парето для векторного отображения I: Х Em, I = (I1,I2...,Im). Очевидно, P(X) X. Образ множества P(X) в пространстве критериев Em обозначается P(I). Множество P(I) = I(P(X)) называется множеством э ффективных оценок. Множество эффективных оценок часто также называется множеством Парето в пространстве критериев.

Смысл введенного понятия эффективного решения состоит в том, что оптимальное решение следует искать только среди элементов множества P(X) (принцип Парето). В противном случае всегда найдется точка x X, оказывающаяся более предпочтительной с учетом всех частных целевых функций Ii(x). Точка X называется слабо эффективным решением задачи (2), если не существует такой точки X, для которой выполняются строгие неравенства Ii()>Ii(), i = 1,2,...,m. Иначе говоря, решение называется слабо эффективным, если оно не может быть улучшено сразу по всем m критериям “полезности”, задаваемым с помощью функционалов Ii(x), i =1,2,...,m. Множество слабо эффективных решений будет обозначаться через SI(X). Очевидно, P(X) S(X) (докажите это). Аналогично вводим обозначение: S(I) I(S(X)).



Поделиться:


Последнее изменение этой страницы: 2016-08-01; просмотров: 208; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.195.110 (0.02 с.)