Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь
FAQ
Написать работу

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ Написать работу

Выигрыш-функция в смешанных стратегиях и различные формулы ее представления (Координатная формула. Векторно-матричные формулы выигрыш-функции в смешанных стратегиях)

↑

⇐ ПредыдущаяСтр 3 из 11Следующая ⇒

Функция выигрыша игрока 𝐴 в смешанных стратегиях – функция 𝐻, определенная на декартовом произведении 𝑆𝐴× 𝑆𝐵 множеств смешанных стратегий соответственно игроков 𝐴 и 𝐵, и ставящая в соответствие каждой ситуации (𝑃, 𝑄) ∈ 𝑆𝐴× 𝑆𝐵 в смешанных стратегиях средний выигрыш игрока 𝐴 в этой ситуации, определяемый следующим образом: 𝐻(𝑃,𝑄) = ∑𝑚𝑖=1 ∑𝑛𝑗=1 𝑝𝑖𝑎𝑖𝑗𝑞𝑗,

где 𝑃 = (𝑝1,...,𝑝𝑚), 𝑄 = (𝑞1,...,𝑞𝑛) (1)

Так как и, следовательно, , то декартово произведение множеств смешанных стратегий игроков А и В является расширение декартова произведения множеств чистых стратегий игроков А и В.

Если

𝑃 = (𝑝1 = 0,...,𝑝𝑖−1 =0,𝑝𝑖=1,𝑝𝑖+1 =0,...,𝑝𝑚=0)=𝐴𝑖,

𝑄=(𝑞1 =0,...,𝑞𝑗−1 =,𝑞𝑗=1,𝑞𝑗+1 =0,...,𝑞𝑛=0)=𝐵𝑗

т.е. (𝑃,𝑄) = (𝐴𝑖,𝐵𝑗) ∈ 𝑆𝐴𝐶×𝑆𝐵𝐶, то из (1) следует, что: 𝐻(𝑃,𝑄)=𝐻(𝐴𝑖,𝐵𝑗)=𝑎𝑖𝑗=𝐹(𝐴𝑖,𝐵𝑗)=𝐹(𝑃,𝑄). Данное равенство означает, что функция выигрыша в смешанных стратегиях Н совпадает на декартовом произведении 𝑆𝐴𝐶× 𝑆𝐵𝐶с функцией выигрыша в чистых стратегиях 𝐹 и, следовательно, является ее расширением (продолжением) с декартова произведения 𝑆𝐴𝐶× 𝑆𝐵𝐶на декартово произведение 𝑆𝐴× 𝑆𝐵.

Форма 𝐻(𝑃,𝑄) = ∑𝑚𝑖=1 ∑𝑛𝑗=1 𝑝𝑖𝑎𝑖𝑗𝑞𝑗, (𝑃, 𝑄) ∈𝑆𝐴× 𝑆𝐵задания функции выигрыша в смешанных стратегиях называется координатной. Функцию Н можно задать и в матричной форме

(1)

где 𝑃 = (𝑝1,...,𝑝𝑚) –вектор-строка размера 1*m

- матрица игры (матрица выигрышей игрока А в чистых стратегиях) размера m*n

- вектор-столбец размера n*1

Подчеркнем, что размеры матриц – множители в правой части (1) – удовлетворяют условиям возможности перемножения этих матриц, т.е. для двух соседних множителей число столбцов левого равно числу строк правого.

Показатель эффективности смешанной стратегии игрока А относительно множества смешанных стратегий игрока В и его существование

Для каждой смешанной стратегии игрока А существует

Число называется показателем эффективности смешанной стратегии игрока А относительно множества смешанных стратегий игрока В

Доказательство:

Если зафиксировать произвольную смешанную стратегию , то функция выигрыша будет функцией одного векторного аргумента Q, определенного на симплексе . Из аналитического выражения

функции видно, что она непрерывна по аргументу Q на множестве которое является компактом, а непрерывная на компакте функция достигает своей нижней и верхней граней. Поэтому для любого существует , т.е. для любого найдется хотя бы одна точка такая, что

Показатель неэффективности смешанной стратегии игрока В относительно множества смешанных стратегий игрока А и его существование

Для каждой смешанной стратегии игрока B существует

Число называется показателем неэффективности смешанной стратегии игрока В относительно множества смешанных стратегий игрока A.

Доказательство:

Если зафиксировать произвольную смешанную стратегию , то функция выигрыша будет функцией одного векторного аргумента P, определенного на симплексе . Из аналитического выражения функции видно, что она непрерывна по аргументу P на множестве которое является компактом, а непрерывная на компакте функция достигает своей нижней и верхней граней. Поэтому для любого существует , т.е. для любого найдется хотя бы одна точка такая, что

Показатель эффективности смешанной стратегии игрока А относительно множества чистых стратегий игрока В. соотношение между показателями эффективности смешанной стратегии игрока А относительно множеств смешанных и чистых стратегий игрока В

Число

называется показателем эффективности смешанной стратегии игрока А относительно множества чистых стратегий игрока В. В частности, если – чистая стратегия, то - показатель эффективности чистой стратегии (относительно множества чистых стратегий игрока В).

Теорема. Показатели эффективности любой смешанной (в частности, чистой) стратегии игрока А относительно множества и соответственно чистых и смешанных стратегий противника В равны:

Доказательство.

Так как то

И, следовательно

Докажем противоположное неравенство.

Пусть и

Тогда используя формулы

и и , получим неравенство

Для любых и . Так как правая часть этого неравенства не зависит от Q, то из него с учетом будем иметь

Последнее неравенство и

противоположны, следовательно

Показатель неэффективности смешанной стратегии игрока В относительно множества чистых стратегий игрока В. Соотношение между показателями неэффективности смешанной стратегии игрока В относительно множеств смешанных и чистых стратегий игрока А

Число

называется показателем неэффективности смешанной стратегии Q игрока B относительно множества чистых стратегий игрока A. В частности, если – чистая стратегия, то - показатель неэффективности чистой стратегии (относительно множества чистых стратегий игрока A).

Теорема. Показатели неэффективности любой смешанной (в частности, чистой) стратегии игрока B относительно множества и соответственно чистых и смешанных стратегий противника В равны:

Доказательство.

Так как то

И, следовательно

Докажем противоположное неравенство.

Пусть и

Тогда используя формулы

и , получим неравенство

Для любых и . Так как правая часть этого неравенства не зависит от P, то из него с учетом будем иметь

Последнее неравенство и

противоположны, следовательно

⇐ Предыдущая 1 234 5 6 7 8 9 10 Следующая ⇒

Познавательные статьи:

Техника прыжка в длину с разбега

Организация работы процедурного кабинета

Области применения синхронных машин

Оптимизация по Винеру и Калману

Последнее изменение этой страницы: 2016-04-23; просмотров: 1368; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 216.73.216.102 (0.009 с.)