Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ

Принятие решений в условиях неопределенности. Критерии Сэвиджа и Лапласа.

⇐ ПредыдущаяСтр 3 из 3

Критерий Сэвиджа (минимаксный). Суть его заключается в выборе стратегии, не допускающей слишком высоких потерь. Для этого используется матрица рисков, в которой вычисляется максимальная прибыль при каждом варианте действия игрока, и среди результатов выбирается наименьший. Его формула выглядит как min (max i)

Критерий Лапласа- опирается на «принцип недостаточного основания», согласно которому все состояния природы B_j полагаются равновероятными, т.е. вероятности того, что природа окажется в одном из n своих состояний, одинаковы и равны:

Если для ЛПР решение элементы матрицы aij платёжной матрицы – выигрыши, то оптимальной считается та стратегия Ai, для которой среднее арифметическое возможных выигрышей максимально, т.е. критерий:

(

Если принимающий решение является игроком B, то критерий становится таким:

Неопределенность типа «активный партнер». Гипотезы 1, 2 и 3 о поведении партнера

Гипотеза 1. Каждый из субьектов А и Б не имеет информации о выборе, который сделан второй стороной. Дополнительные гипотезы о характере поведения второго игрока отсутствуют. В этом случае можно поступать аналогично решению задачи в условиях полной неопределенности. Это, по-существу, в точности тот же случай, и мы можем воспользоваться известным принципом наилучшего гарантированного результата. Для субьекта А гарантированная оценка будет равна

I^*= max min I(x,z),

xÎX zÎZ

а для субьекта Б: I^* = max minI(x,z)

zÎZ xÎX

Решая задачи максимизации, мы находим и векторы x^*,z^*, реализующие соответствующие гарантированные оценки.

Гипотеза 2. Предполагаем, что субъект Б следует принципу максимина и выбирает z^* из условия Гипотезы 1:

I^* = max min I(x,z).

zÎZ xÎX

Тогда мы можем выбирать x согласно правилу

I (x,z^*) ®max,

xÎX

где z^* - гарантирующее решение второго игрока. Обозначим решение задачи (18) через x^**. При этом оказывается, что

I^** = I(x^**,z^*) ³ I*,

где I^*- наша гарантированная оценка, получаемая по принципу максимина.

Гипотеза 3. Мы теперь можем допустить, что субъект рассуждает точно так же, как и мы в предыдущем случае, т.е. использует не стратегию z^*, а аналогичную стратегию z^**. Поэтому мы можем это учесть и выбирать оптимальное решение с учетом уже этой гипотезы:I(x,z^**) ® max Þx^***,I^***.

xÎX

Неопределенность типа «активный партнер». Гипотезы о знании первых ходов субъектов А и Б.

Мы по условиям игры знаем первый ход субъекта Б (он нам его обязан сообщить). Тогда наше поведение будет определяться стратегией в виде функции x=x(z). Мы можем ее определить в результате решения задачи оптимизации

I(x,z) ®max. Условие позволяет для каждого фиксированного z определить искомое значение x, т.е. задать функцию x(z). Для этого случая мы также можем определить гарантированный результат : = min max I(x,z) = min I(x(z),z). Результат будет отличаться от значения I^*, найденного согласно гипотезе 1. Именно, во всех случаях будем иметь ³ I^*. Таким образом, принятие гипотезы 4 вновь позволяет улучшить результат, полученный по принципу максиминного гарантированного результата. Докажем неравенство (21), которое имеет вид min max I(x,z) ³ max min I(x,z). Для любых фиксированных и , очевидно, справедливо неравенство

j₁() ³ j₂(), где j₁() D max I(x, ); j₂() D minI(,z). Действительно, пусть max I(x, ) = I(, );

min I(,z) = I(, ). Отсюда имеем: j₁() = I(, ) ³ I(, ) ³ I(, ) = j₂().

Так как x^’, могут быть любыми, то их можно выбрать следующим образом: = argmax j₂(x); = argmin j₁(z).

Принцип устойчивости Нэша.

по имени автора - американского математика Джона Нэша. Он гласит, что выбор рациональной стратегии h должен производиться среди множества точек равновесия. Равновесные решения называются так же оптимальными по Нэшу. Данный принцип отражает очень важное свойство коллективного решения. Именно, если оба субъекта А и Б смогли договорится о том, чтобы придерживаться выбора x= , z= , то тот субъект, который нарушает договоренность, прежде всего и пострадает: свойство устойчивости решения дает известную гарантию против нарушения договоренности. Все вышеизложенное справедливо и для случая N игроков, где N>2.

Множество Парето.

Множество, включающее в себя все эффективные решения, обозначается P_I(X) или просто P(X) (если ясно, о каком векторном критерии I идет речь) и называется множеством Парето для векторного отображения I: Х E^m, I = (I₁,I₂...,I_m). Очевидно, P(X) X. Образ множества P(X) в пространстве критериев E^mобозначается P(I). Множество P(I) = I(P(X)) называется множеством э ффективных оценок. Множество эффективных оценок часто также называется множеством Парето в пространстве критериев.

Смысл введенного понятия эффективного решения состоит в том, что оптимальное решение следует искать только среди элементов множества P(X) (принцип Парето). В противном случае всегда найдется точка x X, оказывающаяся более предпочтительной с учетом всех частных целевых функций I_i(x). Точка X называется слабо эффективным решением задачи (2), если не существует такой точки X, для которой выполняются строгие неравенства I_i()>I_i(), i = 1,2,...,m. Иначе говоря, решение называется слабо эффективным, если оно не может быть улучшено сразу по всем m критериям “полезности”, задаваемым с помощью функционалов I_i(x), i =1,2,...,m. Множество слабо эффективных решений будет обозначаться через S_I(X). Очевидно, P(X) S(X) (докажите это). Аналогично вводим обозначение: S(I) I(S(X)).

⇐ Предыдущая 1 23

Читайте также:

Техника прыжка в длину с разбега

Тактические действия в защите

История Олимпийских игр

История развития права интеллектуальной собственности

Последнее изменение этой страницы: 2016-08-01; просмотров: 208; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.195.110 (0.02 с.)