Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ

Чистые и смешанные стратегии и их свойства

⇐ ПредыдущаяСтр 11 из 15Следующая ⇒

Различают стратегии чистые и смешанные.

А. Чистая стратегия А_i(i = ) игрока А (чистая стратегия B_j (j = ) игрока В) – это возможный ход игрока А (в), выбранный им с вероятностью, равной 1.

Если игрок А имеет m-стратегий, а игрок В – n-стратегий, то для любой пары стратегий игроков А и В чистые стратегии можно представить в виде единичных векторов, например: для пары стратегий А₁, В₂ чистые стратегии первого и второго игроков запишутся в виде:

для стратегии A₁; = (1; 0;..; 0);

для стратегии В₂; g₂ = (0; 1; 0; …; 0).

Для пары стратегий А_i, В_j чистые стратегии можно записать в виде:

для стратегии А_i; p_i = (0;...; 0; 1; 0; …; 0)

|® i-место;

для стратегии ; g_j = (0,..., 0; 1; 0; …; 0)

|® j-место.

Теорема. В матричной игре нижняя чистая цена меньше или равна верхней чистой цене игры, т. е., α £ b.

Доказательство. Возьмем i – строку и j – столбец. По определению a _i = min a _ij, £ a_ij, а b _j = max a _ij ³ a _ij Þ a _i £ a _ij, £ b_j Þ a _i £ b _i,

j i

(i = , j = ).

Итак как это справедливо для любого i и j, то, следовательно a £ b.

Если для чистых стратегий А_i, В_j игроков А и В имеет место равенство a = b, то пару чистых стратегий (А_i, В_j) называют седловой точкой матричной игры, элемент a _ij – седловым элементом платежной матрицы, а число u = a = b – чистой ценой игры.

Пример 21. Найти нижнюю и верхнюю чистые цены, устано-вить наличие седловых точек матричной игры .

Решение.

Определим нижние и верхние чистые цены игры, для этого составим платежную матрицу,

B₁

B₂

B₃

B₄

a_i

a = max a_i = 5

b = min b_j = 5

u = a = b = 5, имеем одну седловую точку (),

A₁ A₂ A₃

9 1 6

[5] 4 3

6 3 2

7 8 – 4

[5] 1 – 4

b_j

[5]

а седловой элемент равен а₁₂ = 5, этот элемент является наименьшим в первой строке и наибольшим во втором столбце.

Если в матричной игре есть седловой элемент, то наилучшими для игроков являются их максиминные и минимаксные стратегии, и эти чистые стратегии, образующие седловую точку – есть оптимальные чистые стратегии.

Отклонение игрока А от maxmin стратегии А₁ ведет к уменьшению его выигрыша, а отклонение игрока В от минимаксной стратегии ведет к увеличению его проигрыша.

Б. Смешанные стратегии.

Если же матричная игра не имеет седловой точки, то решение игры затрудняется. В этих играх a < b. Применение минимаксных стратегий в таких играх приводит к тому, что для каждого из игроков выигрыш £ a, а проигрыш ³ b. Для каждого игрока возникает вопрос увеличения своего выигрыша. Решение находят, применяя смешанные стратегии.

Смешанной стратегией игрока А (В) называется вектор

, где и

где ,

Вектор означает вероятность применения i -ой чистой стратегии игроком А (j -ой чистой стратегии игроком В). Так как игроки выбирают свои стратегии случайно и независимо друг от друга, то величина выигрыша (проигрыша) есть случайная величина. Ее средняя величина – математическое ожидание – является функцией от смешанных стратегий и :

Функция – называется платежной функцией игры.

Стратегии = ('р₁*,..., р_m*,), = (g₁^*, …, g_n*) называются оптимальными, если для произвольных стратегий = (р₁, р₂,..., р_m) и = (g₁, g₂, …, g_m) выполняется условие £ £ .

Использование в игре оптимальных смешанных стратегий обеспечивает игроку А выигрыш не меньший, чем при использовании им любой другой стратегии р, а 2-му игроку – проигрыш не больший, чем при использовании им любой другой стратегии. Совокупность оптимальных стратегий и цены игры составляет решение игры. Цена игры Чистые стратегии игрока, входящие в его оптимальную смешанную стратегию с вероятностями неравными 0, называются активными стратегиями игрока.

В. Свойства смешанных стратегий.

1. Для того чтобы смешанные стратегии p*=(p₁^*, p₂^*, …, p_m^*) и g^* = (g₁^*, g₂^*, …, g_n^*) были оптимальными, для игроков А и B с ценой игры u должны выполняться неравенства:

2. Решение матричной игры можно упростить, выяснив при этом доминирование одних стратегий над другими. Рассмотрим стратегии игрока А, для этого сравним элементы строк s и t:

а) если все , то выигрыш игрока стратегии А_s будет больше, чем при стратегии А_t, тогда стратегия А_s называется доминирующей, а стратегия А_t – доминируемой;

б) игрок В заинтересован в минимизации проигрыша поэтому доминирующим будет столбец с меньшими элементами;

в) в матричной игре строки (столбцы) с одними и теми же элементами называются дублирующими. Доминируемые и дублирующие строки (столбцы) можно опускать, т. к. это не влияет на решение игры.

3. Платежную матрицу можно преобразовать в матрицу с положительными числами, умножив все элементы матрицы на какое-либо число b или прибавив к ним какое-либо число с, то есть получив матрицу (b · a_ij + c) _m _× _n.

Пример 22. Выполнить всевозможные упрощения матричной игры

Решение:

а) поскольку соответствующие элементы второй и четвертой строк матрицы равны, то есть имеем две дублирующие строки, то опустим, например, четвертую строку. Получим

б) сравним соответствующие элементы строк и столбцов: элементы первого столбца доминируют (<) над элементами третьего и шестого столбцов, то есть игроку В невыгодно применять стратегии В₃ и В₆. Вычеркнем их. Элементы второго столбца доминируют (<) над элементами четвертого столбца. Опустим его. Получим:

в) элементы 2 строки меньше соответствующих элементов 3-й строки, т. е. 3-я строка доминирует над 2-й строкой (поэтому 2-ю строку опускаем) Þ .

г) если требуется получить матрицу с положительными членами, то достаточно прибавить к ее элементам, например число с = 3. Получаем:

⇐ Предыдущая 6 7 8 9 101112 13 14 15 Следующая ⇒

Читайте также:

Техника нижней прямой подачи мяча

Комплекс физических упражнений для развития мышц плечевого пояса

Стандарт Порядок надевания противочумного костюма

Общеразвивающие упражнения без предметов

Последнее изменение этой страницы: 2020-11-11; просмотров: 170; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.43.140 (0.007 с.)