Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь
FAQ
Написать работу

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ Написать работу

Выигрыш-функция в смешанных стратегиях и различные формулы ее представления.

↑

⇐ ПредыдущаяСтр 8 из 11Следующая ⇒

Выигрыш игрока А в ситуации (P,Q) в смешанных стратегиях представляет собой дискретную случайную величину, принимающую значения а_ij с вероятностью p_iq_j. Тогда средний выигрыш игрока А в ситуации (P,Q) в смешанных стратегиях есть математическое ожидание указанной случайной величины. Функцией выигрыша игрока А в смешанных стратегиях называют функцию Н, заданную на декартовом произведении S_A*S_B множеств смешанных стратегий, ставящую в соответствие с каждой ситуации (P,Q)? S_A*S_Bв смешанных стратегиях средний выигрыш игрока А в этой ситуации, определяемый как Н(P,Q)= ∑(i=1 m)∑(j=1 n)p_ia_ijq_j

(P,Q)?S_A*S_Bгде Р=(p₁,…, p_m)Q= (q₁, q_{2, …,}q_n). Данная форма задания функции выигрыша в смешанных стратегиях называется координатной. Функцию Н можно задать и в матричной форме

Н(P,Q)=PAQ^T, где Р=(p₁,…, p_m) – вектор-строка размера 1хm,

- матрица игры (матрица выигрышей игрока А в чистых стратегиях) размера mxn,

Q^T- вектор-столбец размера nx1.

Для игрока А: Н(A_k,Q)=Σ(j=1,n)a_kjq_j=A_kAQ^T

Для игрока В: H(P,B_l)=Σ(i=1,m)p_ia_il=PAB_l^T

Для функции Н можно вывести и некоторые другие формулы. Так, например, применяя матричную форму и при k=i будем иметь: H(P,Q)=PAQ^T=Σ(i=1,m)p_iH(A_i,Q)

Аналогично, H(P,Q)=ΣH(P,B_j)q_j

20. Показатель эффективности смешанной стратегии игрока относительно множества смешанных стратегий игрока и доказательство теоремы о его существовании.

Для каждой смешанной (в частности, чистой) стратегии P? S_Aигрока А существует (достигается) α (P, S_B)=min₍_Q_?_S_В)H(P,Q).Число α (P, S_B) – показатель эффективности смешанной стратегии P?S_Aигрока А относительно множества S_Всмешанных стратегий игрока В.

Стандартным n -симплексом называется подмножество пространства действительных чисел, определяемое как

Его вершинами являются точки:

…

Стандартным n- симплексом называется подмножество пространства Rⁿ⁺¹ действительных чисел, где ∆ⁿ – множество точек t₀,…,t_nтаких, что сумма t_i=1 и для любой координаты t_i≥0

Ограниченность симплекса – компакт (ограниченное замкнутое множество):

рассмотрим симплекс S_A(1 строчка)

нормалюбого элемента определяется по правилу (2 строчка)

Сначала покажем, что симплекс является ограниченным замкнутым множеством, т.е. компактом.

Рассмотрим симплекс

в евклидовом пространстве . Так как норма вектора в пространстве определяется следующим образом:

то для любой точки симплекса справедливо неравенство

означающее ограниченность симплекса .

Пусть последовательность точек

, ,

сходится к точке при . Так как сходимость в является покоординатной, то означает, что , . Поскольку , то и .

Так как для каждого k, то

Таким образом, предельная точка принадлежит симплексу , что доказывает его замкнутость.

Непрерывная на компакте функция достигает своих нижней и верхней границ а значит для любой P? S_Aнайдется хотя бы одна точка Q⁰?S_B:α(P)=minH (P,Q)=H(P,Q⁰)

21. Показатель эффективности смешанной стратегии игрока относительно множества смешанных стратегий игрока и доказательство теоремы о его существовании.

Для каждой смешанной (в частности, чистой) стратегии Q? S_Bигрока B существует (достигается) ß (Q, S_A)=max₍_P_?_SA₎H(P,Q).Число ß (Q, S_A) – показатель неэффективности смешанной стратегии Q? S_Bигрока B относительно множества S_Aсмешанных стратегий игрока A.

Стандартным n -симплексом называется подмножество пространства действительных чисел, определяемое как

Его вершинами являются точки:

…

Ограниченность симплекса – компакт (ограниченное замкнутое множество):

рассмотрим симплекс S_B(1 строчка)

нормалюбого элемента определяется по правилу (2 строчка)

Сначала покажем, что симплекс является ограниченным замкнутым множеством, т.е. компактом.

Рассмотрим симплекс

в евклидовом пространстве . Так как норма вектора в пространстве определяется следующим образом:

, то для любой точки симплекса справедливо неравенство

означающее ограниченность симплекса .

Пусть последовательность точек

, ,

сходится к точке при . Так как сходимость в является покоординатной, то означает, что , . Поскольку , то и .

Так как для каждого l, то

Таким образом, предельная точка принадлежит симплексу , что доказывает его замкнутость.

Непрерывная на компакте функция достигает своих нижней и верхней границ а значит для любой Q? S_Bнайдется хотя бы одна точка P⁰?S_B:α(Q)=maxH (P,Q)=F(P^o,Q)

Показатель эффективности смешанной стратегии игрока А относительно множества чистых стратегий игрока В. Доказательство теоремы о совпадении показателей эффективности смешанной стратегии игрока А относительно множеств смешанных и чистых стратегий игрока В

Число α (P; )назовем показателем эффективности смешанной стратегии PÎ игрока A относительно множества смешанных стратегий игрока В. Если в этом определении множество смешанных стратегий игрока В заменить на множество его чистых стратегий, то получим определение показателя эффективности смешанной стратегии PÎ игрока А относительно множества чистых стратегий игрока В. Расширение множества чистых стратегий игрока В до множества его смешанных стратегий не изменяет показателей эффективности стратегий игрока А, точнее имеет место следующая теорема: α (P; ) = α (P; )

Так как ﬤ , то {H (P,Q):QÎ } ﬤ{H (P,Q): QÎ } и,

следовательно £ (P; ) = (QÎ minH(P,Q) ≤ (): (QÎ minH (P,Q) = α (P; )
(для 23 вопроса не min, amax; и )

⇐ Предыдущая 2 3 4 5 6 789 10 11 Следующая ⇒

Познавательные статьи:

Техника прыжка в длину с разбега

Тактические действия в защите

История Олимпийских игр

История развития права интеллектуальной собственности

Последнее изменение этой страницы: 2017-01-27; просмотров: 342; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.144.108.200 (0.005 с.)