ТОП 10:

Анализ матричных антагонистических игр двух игроков .



Рассмотрим биматричную игру с нулевой суммой. Пусть для первого игрока X1={1,2,...,m}, для второго X2={1,2,...,n}. Выбираемые стратегии будем обозначать соответственно i и j. Каждой паре стратегий (i, j) поставлено в соответствие некоторое число j1(i, j)=аij, выражающее выигрыш игрока 1, j2(i, j)=–аij – выигрыш 2–го игрока (аij – его проигрыш). Для первого игрока предпочтителен выбор пары (i, j), увеличивающий значение аij. Для второго игрока предпочтителен выбор пары (i, j), уменьшающий значение аij. Эту модель будем записывать так

Такая игра является антагонистической игрой двух лиц. Допустим, что каждый из игроков делает один ход: игрок 1 выбирает свою i–ю стратегию i=1,2,3,…, m, а игрок 2 – свою j–ю стратегию j=1,2,3,…, n. После выполнения ходов игрок 1 получает выигрыш аij за счёт игрока 2 (если аij< 0, то это значит, что игрок 1 платит второму сумму | аij | ). На этом игра заканчивается. Стратегии игроков i=1,2,3,…, m, и j=1,2,3,…, n будем называть чистыми стратегиями.

Если рассмотреть матрицу

А = ,

то проведение каждой партии матричной игры с матрицей А сводится к выбору игроком 1 i–й строки, а игроком 2 j–го столбца и получения игроком 1 (за счёт игрока 2) выигрыша аij.

Введем понятие гарантированных стратегий игроков. В это понятие вложим следующий смысл: стратегия игрока называется гарантированной, если применение этой стратегии обеспечивает выигрыш, который не может быть уменьшен при всевозможных стратегиях другого игрока. Исходя из этих позиций, игрок 1 исследует матрицу выигрышей А следующим образом: для каждого значения i=1,2,3,…, m определяется j(i), для которого значение выигрыша по стратегиям 2–го игрока минимально

Среди значений i=1,2,3,…, m и соответствующих им значений j(i) выбирается то значение i1, j1=j(i1) для которого

Это выражение можно переписать

(3. 1).

 

Определение 3.1. Число , определённое по формуле (3. 1), называется нижней чистой ценой игры и показывает, какой выигрыш может гарантировать себе игрок 1, применяя свои чистые стратегии при всевозможных действиях игрока 2.

Игрок 2 при при поиске своего гарантированного проигрыша должен стремится по возможности за счёт своих стратегий максимально уменьшить выигрыш игрока 1. Поэтому для игрока 2 определяется с начала для каждого j=1,2,3,…, n определяется i(j), для которого

,

т.е. для каждого j=1,2,3,…, n определяется величина наибольшего проигрыша. Затем среди этих проигрышей выбирается наименьший, т.е. выбираем j2 и соответственно i2=i(j2), для которых

при условии, что игрок 2 применит свою j–ю чистую стратегию, затем игрок 2 отыскивает такую свою j=j2 стратегию, при которой он получает гарантированный проигрыш, т.е. находит

(3. 2).

Определение 3.2. Число , определяемое по формуле (3.2), называется чистой верхней ценой игры и показывает, какой проигрыш за счёт своих стратегий может себе гарантировать игрок 2.

Другими словами, применяя свои чистые стратегии, игрок 1 может обеспечить себе выигрыш не меньше , а игрок 2 за счёт применения своих чистых стратегий может себе обеспечить проигрыш не более, чем .

Определении 3.3. Под состоянием равновесия в игре будем понимать пару чистых стратегий (i0,j0), для которых , т.е. отклонение любого (только одного) из игроков этой стратегии приводит к ухудшению (неулучшению) его критерия.

Не трудно видеть, что точка (i0,j0) является седловая точкой функции аij, i = 1,2,...,m, j = 1,2,..., n.

Вопрос о существовании равновесия в матричной игре двух игроков с нулевой суммой определяется следующей теоремой.

Теорема. Для того, чтобы в задаче существовала седловая точка, необходимо и достаточно, чтобы

(3.3)

 

Таким образом, исходя из (3.3), седловой элемент является минимальным в i0 –й строке и максимальным в j0 – м столбце в матрице А. Отыскание седловой точки матрицы А происходит следующим образом: в матрице А последовательно в каждой строке находят минимальный элемент и проверяют, является ли этот элемент максимальным в своём столбце. Если да, то он и есть седловой элемент, а пара стратегий, ему соответствующая, образует седловую точку. Пара чистых стратегий (i0,j0) игроков 1 и 2, образующая седловую точку и седловой элемент называется решением игры. При этом i0 и j0 являются чистыми стратегиями, гарантирующие выигрыш и проигрыш соответственно игроков 1 и 2.

 

Пример 1.

Пусть .

Всю информацию по матрице и результаты анализа запишем в таблицу:

    стратегии 2–го игрока    
     
стратегии 1–го игрока –3 –2 –3  
 
     
       

 

 

Точкой равновесия является пара (i0; j0)=(3,1), при которой . Заметим, что хотя выигрыш в ситуации (3;3) также равен , она не является равновесной, т.к. этот выигрыш не является максимальным среди выигрышей третьего столбца.

Пример 2

Пусть .

Всю информацию по матрице и результаты анализа запишем в таблицу:

    стратегии 2–го игрока    
     
стратегии 1–го игрока –3 –2 –3  
 
     
       

 

Из анализа матрицы выигрышей видно, что , т.е. данная матрица не имеет точки равновесия.

 

Рассмотрим некоторые широко известные содержательные игры, имеющие конечные множества стратегий.

Пример 3. Два игрока кладут одновременно на стол по монете. Если обе монеты выложены одной стороной, то они достаются первому игроку, в противном случае они достаются второму игроку.

Для нее матрица игры будет иметь вид

Пример 4. Игра Морро.

Игроки одновременно показывают не более m пальцев и в тоже время называют число, не большее n. Если число, названное одним из игроков, совпадает с общим числом пальцев, то игрок получит от своего противника выигрыш равный этому числу. Если оба угадают верно, то чистый платёж будет равен нулю. Таблица игры для случая m=2, n=4 будет иметь вид. В ней skl означает, l – показанных пальцев, k – названное число первым игроком. Аналогично tkl для второго игрока.

    Стратегии 2–го игрока
    t12 t13 t23 t24
Стратегии 1-игрока s12 –3
s13 –2
s23 –4
s24 –3

 

Пример 5. Оборона города («Игра полковника Блотто»)

Полковник Блотто имеет т полков, а его противник — n полков. Противник защищает две позиции. Позиция будет занята полковником Блотто, если на ней наступающие полки окажутся в численном превосходстве. Противоборствующим сторонам требуется распределить полки между двумя позициями.

Определим выигрыш полковника Блотто (игрока 1)на каждой позиции. Если у него на позиции полков больше, чем у противника (игрока 2), то его выигрыш на этой позиции равен числу полков противника плюс один (занятие позиции равносильно захвату одного полка). Если у игрока 2полков на позиции больше, чем у игрока 1,то игрок 1теряет все свои полки на этой позиции и еще единицу (за потерю позиции). Если обе стороны имеют одинаковое число полков на позиции, то имеет место ничья и каждая из сторон ничего не получит. Общий выигрыш игрока 1равен сумме выигрышей на обеих позициях.

Игра, очевидно, антагонистическая. Опишем стратегии игроков. Пусть, для определенности, т>п. Игрок I имеет следующие стратегии: х0=(т,0) — послать все полки на первую позицию, xl =(т—i,i)—( m–i) полков послать на первую позицию, а i — на вторую, хm = (0, m). Противник имеет такие стратегии: У0=(п,0), у1=(п —i, i),..., у„ =(0, п).

Так, при m=4, n = 3, рассмотрев всевозможные ситуации, получим матрицу выигрышей этой игры:

  Y0 Y1 Y2 Y3
X0
X1 –1
X2 –2 –2
X3 –1
X4

 

Самостоятельная работа № 5.

1. Составить матрицу игры Морро для случаев, представленных в таблице, и найти состояние равновесия (если оно существует). Номера вариантов записаны в таблице на пересечении строк и столбцов в части таблицы, обведенной двойной линией.

    Число показываемых пальцев
   
Называемое число

 


2. Составить матрицу игры полковника Блотто для случаев, представленных в таблице, и найти состояние равновесия (если оно существует).

    Значение n
   
Значение m

 

 







Последнее изменение этой страницы: 2016-06-29; Нарушение авторского права страницы

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 34.200.226.179 (0.008 с.)