Выигрыш-функция в смешанных стратегиях и различные формулы ее представления. 
";


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Выигрыш-функция в смешанных стратегиях и различные формулы ее представления.



Выигрыш игрока А в ситуации (P,Q) в смешанных стратегиях представляет собой дискретную случайную величину, принимающую значения аij с вероятностью piqj. Тогда средний выигрыш игрока А в ситуации (P,Q) в смешанных стратегиях есть математическое ожидание указанной случайной величины. Функцией выигрыша игрока А в смешанных стратегиях называют функцию Н, заданную на декартовом произведении SA*SB множеств смешанных стратегий, ставящую в соответствие с каждой ситуации (P,Q)? SA*SBв смешанных стратегиях средний выигрыш игрока А в этой ситуации, определяемый как Н(P,Q)= ∑(i=1 m)∑(j=1 n)piaijqj

(P,Q)?SA*SBгде Р=(p1,…, pm)Q= (q1, q2, …,qn). Данная форма задания функции выигрыша в смешанных стратегиях называется координатной. Функцию Н можно задать и в матричной форме

Н(P,Q)=PAQT, где Р=(p1,…, pm) – вектор-строка размера 1хm,

,

- матрица игры (матрица выигрышей игрока А в чистых стратегиях) размера mxn,

QT- вектор-столбец размера nx1.

Для игрока А: Н(Ak,Q)=Σ(j=1,n)akjqj=AkAQT

Для игрока В: H(P,Bl)=Σ(i=1,m)piail=PABlT

Для функции Н можно вывести и некоторые другие формулы. Так, например, применяя матричную форму и при k=i будем иметь: H(P,Q)=PAQT=Σ(i=1,m)piH(Ai,Q)

Аналогично, H(P,Q)=ΣH(P,Bj)qj

20. Показатель эффективности смешанной стратегии игрока относительно множества смешанных стратегий игрока и доказательство теоремы о его существовании.

Для каждой смешанной (в частности, чистой) стратегии P? SAигрока А существует (достигается) α (P, SB)=min(Q? SВ)H(P,Q).Число α (P, SB) – показатель эффективности смешанной стратегии P?SAигрока А относительно множества SВ смешанных стратегий игрока В.

Стандартным n -симплексом называется подмножество пространства действительных чисел, определяемое как

.

Его вершинами являются точки:

,

,

.

Стандартным n- симплексом называется подмножество пространства Rn+1 действительных чисел, где ∆n – множество точек t0,…,tnтаких, что сумма ti=1 и для любой координаты ti≥0

Ограниченность симплекса – компакт (ограниченное замкнутое множество):

рассмотрим симплекс SA(1 строчка)

нормалюбого элемента определяется по правилу (2 строчка)

Сначала покажем, что симплекс является ограниченным замкнутым множеством, т.е. компактом.

Рассмотрим симплекс

в евклидовом пространстве . Так как норма вектора в пространстве определяется следующим образом:

,

то для любой точки симплекса справедливо неравенство

,

означающее ограниченность симплекса .

Пусть последовательность точек

, ,

сходится к точке при . Так как сходимость в является покоординатной, то означает, что , . Поскольку , то и .

Так как для каждого k, то

.

Таким образом, предельная точка принадлежит симплексу , что доказывает его замкнутость.

Непрерывная на компакте функция достигает своих нижней и верхней границ а значит для любой P? SAнайдется хотя бы одна точка Q0?SB:α(P)=minH (P,Q)=H(P,Q0)

21. Показатель эффективности смешанной стратегии игрока относительно множества смешанных стратегий игрока и доказательство теоремы о его существовании.

Для каждой смешанной (в частности, чистой) стратегии Q? SBигрока B существует (достигается) ß (Q, SA)=max(P?SA) H(P,Q).Число ß (Q, SA) – показатель неэффективности смешанной стратегии Q? SBигрока B относительно множества SAсмешанных стратегий игрока A.

Стандартным n -симплексом называется подмножество пространства действительных чисел, определяемое как

.

Его вершинами являются точки:

,

,

.

Стандартным n- симплексом называется подмножество пространства Rn+1 действительных чисел, где ∆n – множество точек t0,…,tnтаких, что сумма ti=1 и для любой координаты ti≥0

Ограниченность симплекса – компакт (ограниченное замкнутое множество):

рассмотрим симплекс SB(1 строчка)

нормалюбого элемента определяется по правилу (2 строчка)

Сначала покажем, что симплекс является ограниченным замкнутым множеством, т.е. компактом.

Рассмотрим симплекс

в евклидовом пространстве . Так как норма вектора в пространстве определяется следующим образом:

, то для любой точки симплекса справедливо неравенство

,

означающее ограниченность симплекса .

Пусть последовательность точек

, ,

сходится к точке при . Так как сходимость в является покоординатной, то означает, что , . Поскольку , то и .

Так как для каждого l, то

.

Таким образом, предельная точка принадлежит симплексу , что доказывает его замкнутость.

Непрерывная на компакте функция достигает своих нижней и верхней границ а значит для любой Q? SBнайдется хотя бы одна точка P0?SB:α(Q)=maxH (P,Q)=F(Po,Q)

Показатель эффективности смешанной стратегии игрока А относительно множества чистых стратегий игрока В. Доказательство теоремы о совпадении показателей эффективности смешанной стратегии игрока А относительно множеств смешанных и чистых стратегий игрока В

Число α (P; )назовем показателем эффективности смешанной стратегии PÎ игрока A относительно множества смешанных стратегий игрока В. Если в этом определении множество смешанных стратегий игрока В заменить на множество его чистых стратегий, то получим определение показателя эффективности смешанной стратегии PÎ игрока А относительно множества чистых стратегий игрока В. Расширение множества чистых стратегий игрока В до множества его смешанных стратегий не изменяет показателей эффективности стратегий игрока А, точнее имеет место следующая теорема: α (P; ) = α (P; )

Так как , то {H (P,Q):QÎ } ﬤ{H (P,Q): QÎ } и,

следовательно £ (P; ) = (QÎ minH(P,Q) ≤ (): (QÎ minH (P,Q) = α (P; )
(для 23 вопроса не min, amax; и )



Поделиться:


Последнее изменение этой страницы: 2017-01-27; просмотров: 320; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.14.246.254 (0.003 с.)