Чистые и смешанные стратегии и их свойства 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Чистые и смешанные стратегии и их свойства



Различают стратегии чистые и смешанные.

А. Чистая стратегия Аi(i = ) игрока А (чистая стратегия Bj (j = ) игрока В) – это возможный ход игрока А (в), выбранный им с вероятностью, равной 1.

Если игрок А имеет m-стратегий, а игрок В – n-стратегий, то для лю­бой пары стратегий игроков А и В чистые стратегии можно представить в виде единичных векторов, например: для пары стратегий А1, В2 чистые стратегии первого и второго игроков запишутся в виде:

для стратегии A1;  = (1; 0;..; 0);

для стратегии В2; g2 = (0; 1; 0; …; 0).

Для пары стратегий Аi, Вj чистые стратегии можно записать в виде:

для стратегии Аi; pi = (0;...; 0; 1; 0; …; 0)

                                              |® i-место;

для стратегии ; gj = (0,..., 0; 1; 0; …; 0)

                                              |® j-место.

Теорема. В матричной игре нижняя чистая цена меньше или равна верхней чистой цене игры, т. е., α £ b.

Доказательство. Возьмем i – строку и j – столбец. По определению a i = min a ij, £ aij, а b j = max a ij ³ a ij Þ a i £ a ij, £ bj Þ a i £ b i,        

          j                               i

(i = , j = ).

Итак как это справедливо для любого i и j, то, следовательно   a £ b.

Если для чистых стратегий Аi, Вj игроков А и В имеет место равен­ство a = b, то пару чистых стратегий (Аi, Вj) называют седловой точкой матричной игры, элемент a ijседловым элементом платежной матрицы, а число u = a = b – чистой ценой игры.

Пример 21. Найти нижнюю и верхнюю чистые цены, устано-вить на­личие седловых точек матричной игры .

Решение.

Определим нижние и верхние чистые цены игры, для этого составим платежную матрицу,

  B1 B2 B3 B4 ai

a = max ai = 5

b = min bj = 5

u = a = b = 5, имеем одну седловую точку (),

A1 A2 A3 9 1 6 [5] 4 3 6 3 2 7 8 – 4 [5] 1 – 4
bj 9 [5] 6 8  

а седловой элемент равен а12 = 5, этот элемент является наименьшим в первой строке и наибольшим во втором столбце.

Если в матричной игре есть седловой элемент, то наилучшими для игроков являются их максиминные и мини­максные стратегии, и эти чистые стратегии, образующие седловую точку – есть оптимальные чистые стратегии.

Отклонение игрока А от maxmin стратегии А1 ведет к уменьшению его выигрыша, а отклонение игрока В от минимаксной стратегии ведет к увеличению его проигрыша.

Б. Смешанные стратегии.

Если же матричная игра не имеет седловой точки, то решение игры затрудняется. В этих играх a < b. Применение минимаксных стратегий в таких играх приводит к тому, что для каждого из игроков выигрыш £ a, а проигрыш ³ b. Для каждого игрока возникает вопрос увеличения своего выиг­рыша. Решение находят, применяя смешанные стратегии.

Смешанной стратегией игрока А (В) называется вектор

, где  и

 где ,

Вектор  означает вероятность применения i -ой чистой страте­гии игроком А (j -ой чистой стратегии игроком В). Так как игроки выбирают свои стратегии случайно и независимо друг от друга, то величина выигрыша (проигрыша) есть случайная величина. Ее средняя величина – математическое ожидание – является функцией от смешанных стратегий и :

Функция  – называется платежной функцией игры.

Стратегии = ('р1*,..., рm*,), = (g1*, …, gn*) называются оптималь­ными, если для произвольных стратегий = (р1, р2,..., рm) и = (g1, g2, …, gm) выполняется условие £  £ .

Использование в игре оптимальных смешанных стратегий обеспечивает игроку А выигрыш не меньший, чем при использовании им любой другой стратегии р, а 2-му игроку – проигрыш не больший, чем при использовании им любой другой стратегии. Совокупность оптимальных стратегий и цены игры составляет решение игры. Цена игры  Чистые стратегии игрока, входящие в его оптимальную смешан­ную стратегию с вероятностями неравными 0, называются активными стратегиями игрока.

В. Свойства смешанных стратегий.

1. Для того чтобы смешанные стратегии p*=(p1*, p2*, …, pm*) и g* = (g1*, g2*, …, gn*) были оптимальными, для игроков А и B с ценой игры u должны выполняться неравенства:

2. Решение матричной игры можно упростить, выяснив при этом до­минирование одних стратегий над дру­гими. Рассмотрим стратегии игрока А, для этого сравним элементы строк s и t:

а) если все , то выигрыш игрока стратегии Аs будет больше, чем при стратегии Аt, тогда стратегия Аs называется доминирующей, а стратегия Аt – доминируемой;

б) игрок В заинтересован в минимизации проигрыша поэтому доминирующим будет столбец с меньшими элементами;

в) в матричной игре строки (столбцы) с одними и теми же элементами называются дублирующими. Доминируемые и дублирующие строки (столбцы) можно опускать, т. к. это не влияет на решение игры.

3. Платежную матрицу можно преобразовать в матрицу с положи­тельными числами, умножив все элементы матрицы на какое-либо число b или прибавив к ним какое-либо число с, то есть получив матрицу (b · aij + c) m × n.

Пример 22. Выполнить всевозможные упрощения матричной игры

Решение:

а) поскольку соответствующие элементы второй и четвертой строк матрицы равны, то есть имеем две дублирующие строки, то опустим, например, четвертую строку. Получим

б) сравним соответствующие элементы строк и столбцов: элементы первого столбца доминируют (<) над элементами третьего и шестого столбцов, то есть игроку В невыгодно применять стратегии В3 и В6. Вычеркнем их. Элементы второго столбца доминируют (<) над элементами четвертого столбца. Опустим его. Получим:

в) элементы 2 строки меньше соответствующих элементов 3-й строки, т. е. 3-я строка доминирует над 2-й строкой (поэтому 2-ю строку опускаем) Þ .

г) если требуется получить матрицу с положительными членами, то доста­точно прибавить к ее элементам, например число с = 3. Получаем:

.



Поделиться:


Последнее изменение этой страницы: 2020-11-11; просмотров: 170; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.43.140 (0.007 с.)