Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь
FAQ
Написать работу

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ Написать работу

Матрица выигрышей. Представление игр в нормальной форме

↑

⇐ ПредыдущаяСтр 4 из 11Следующая ⇒

Игрой в нормальной форме называется совокупность , где N - множество всех игроков; U_i - множество стратегий i— го игрока; g_i - функция выигрыша i — го игрока, которую он стремится максимизировать.

Обычно игроков нумеруют в произвольном порядке от 1 до n (n — число игроков), поэтому N={1,2,...,n}. Стратегия i— го игрока для игры в нормальной форме сводится к одноактному выбору любой точки из множества U_i. Функция выигрыша ставит в соответствие каждому элементу и=(u₁,...,u_n) из множества называемому исходом или ситуацией игры, действительное число. Таким образом, g_i есть однозначное отображение множества U→R.

Исходная постановка игры в нормальной форме не предполагает никакой дополнительной информации у игроков о действиях друг друга. Поэтому можно считать, что все игроки одновременно и независимо осуществляют выбор своих стратегий, т.е. элементов u_i ∈ U_i. В результате складывается ситуация и, однозначно определяющая выигрыши всех игроков g₁(u),...g_n(u).

Рассмотрим парную игру с игроками А и В. Пусть игрок А имеет т стратегий ={А₁, A₂,..., А_т}, а (противник) игрок В - п стратегий ={В₁, B₂,..., В_п}. Натуральные числа т и п в общем случае никак не связаны между собой.

Если каждый из игроков А и В сознательно определенным образом выбирает стратегии А_i и В_j соответственно, то сложившаяся ситуация (в чистых стратегиях) (А_i,B_j) однозначно определяет выигрыш игрока А, выражающийся действительным числом а_ij, которое одновременно является и проигрышем игрока В. А число (- a_ij) выражает проигрыш игрока А и выигрыш игрока В. Если число a_ij отрицательно, то в принятой нами формализованной терминологии оно будет представлять отрицательный выигрыш игрока А, а по сути - его проигрыш. Числа а_ij - это значения функции выигрыша F_A игрока A: F_A(i, j) = F_A(A_i, B_j) = а_ij. Ходы игроков с сознательным выбором одной из возможных своих чистых стратегий называют иногда личными ходами.

Выигрыши a_ij, i = 1,..., m, j = 1,..., n, можно расположить в виде матрицы, номера строк которой соответствуют номерам стратегий игрока А, а номера столбцов - номерам стратегий игрока В.

B_j

A =

A_i

B ₁

B ₂

…

B_n

A ₁

a ₁₁

a ₁₂

…

a _{1 n}

A ₂

a ₂₁

a ₂₂

…

a _{2 n}

…

A_m

a_m ₁

a_m ₂

…

a_mn

Матрица А называется матрицей выигрышей игрока A.

Обозначим через b_ij значения функции выигрыша F_B игрока В, т. е. F_B(j, i) = F_B(В_j, A_i) = b_ji, j = 1,..., n, i = 1,..., т. Тогда матрица выигрышей игрока В будет иметь вид

A_i B_j

B =

A ₁

A ₂

…

A_m

B ₁

b ₁₁

b ₁₂

…

b _{1 n}

B ₂

b ₂₁

b ₂₂

…

b _{2 n}

…

B_n

b_n ₁

b_n ₂

…

b_nm

Если рассматриваемая игра - антагонистическая (т.е. с нулевой суммой выигрышей), то функции выигрышей F_A и F_B игроков А и В связаны между собой равенством F _B(B_j, A_i) = - F_A(A_i, B_j), i = 1, …, m, j = 1,..., n и, следовательно,

b_ji = F_B(B_j, А_i) = -F_A(A_i, B_j) = -а_ij, i = 1,..., т, j = 1,..., n.

Эти равенства означают, что матрица выигрышей В игрока В является противоположной транспонированной матрице A: B = - A ^T.

Таким образом, матрица В вполне определяется матрицей А. Матрицу А также называют матрицей игры, или платежной матрицей. Матрица А имеет размер т × п, где первая компонента размера т указывает на число строк (т.е. число стратегий игрока А), а вторая п - на число столбцов (число стратегий игрока В). Поэтому часто такую игру называют т × п - игрой.

Отметим, что матрица игры существенно зависит от упорядочений множеств и стратегий игроков А и В. При другой нумерации стратегий этих множеств мы получим, вообще говоря, другую матрицу игры. Так что одна и та же игра может описываться различными матрицами. Но при всевозможных матрицах игры функция F_A выигрыша игрока А остается одной и той же, определенной на декартовом произведении × с множеством значений в множестве действительных чисел R. Это замечание относится и к функции F_B выигрыша игрока В.

Всякую конечную антагонистическую игру можно привести к матричной форме.

Матрица игры А формируется в зависимости от значений функции выигрыша F_A, которая может задаваться таблично, аналитически (в виде формулы) или словесно-описательным способом.

Максиминный принцип игры

Рассмотрим матричную т × п - игру с игроками А и В,в которой игрок А обладает т чистыми стратегиями ={А₁,..., А_т}, a игрок В - п чистыми стратегиями ={В₁,..., В_п}. Значения функции выигрыша игрока A обозначим через а_ij,т. е. F_A (i, j) = а_ij, и тогда матрица игры будет иметь вид

B_j

A =

A_i

B ₁

B ₂

…

(1)

B_n

A ₁

a ₁₁

a ₁₂

…

a _{1 n}

A ₂

a ₂₁

a ₂₂

…

a _{2 n}

…

A_m

a_m ₁

a_m ₂

…

a_mn

Перед игроком А стоит задача выбора чистой стратегии из множества , эффективной в определенном смысле, в результате применения которой он получит максимально возможный гарантированный выигрыш. Если игрок А выбрал стратегию А_i (i =1, …, m),, то его выигрышем может быть один из выигрышей

а_i ₁, а_i ₂, …, а_in,

расположенных в i -й строке матрицы выигрышей, в зависимости от выбранной игроком В стратегии. Предполагая поведение игрока А крайне осмотрительным, необходимо считать, что игрок В сыграет наилучшим для себя образом и на выбор игроком А стратегии А_i выберет ту стратегию B_j, при которой выигрыш игрока А окажется минимальным. Обозначим минимальный среди выигрышей а_i ₁, а_i ₂, …, а_in через α _i:

и назовем его показателем эффективности стратегии А_i. Продолжая действовать разумно, игрок А должен выбрать ту стратегию, которая максимизирует показатель эффективности, т.е. для которой число α _i максимально. Если обозначить это максимальное число через α:

то по формуле

Описанный принцип выбора эффективной стратегии игроком А называется максиминным принципом, а выигрыш α - максимином.

Пусть игрок А выбрал максиминную стратегию а игрок В - какую-то произвольную стратегию B_l, l = 1,..., п. Тогда в создавшейся ситуации ( B_l) выигрыш игрока А в чистых стратегиях будет для которого в силу равенств и будет справедливо неравенство

Это неравенство означает, что если игрок А в игре будет следовать максиминной стратегии, то ему при любой игре противника В гарантирован выигрыш в чистых стратегиях, не меньший максимина α.

Минимаксный принцип игры

B_j

A =

A_i

B ₁

B ₂

…

(1)

B_n

A ₁

a ₁₁

a ₁₂

…

a _{1 n}

A ₂

a ₂₁

a ₂₂

…

a _{2 n}

…

A_m

a_m ₁

a_m ₂

…

a_mn

Рассмотрим игру с точки зрения игрока В, который стремится минимизировать выигрыш игрока А, исходя из посылки, что игрок А играет наилучшим для себя и наихудшим для игрока В образом. Если игрок В выберет стратегию , то выигрышем игрока А может быть один из

а _{1 j}, а _{2 j}, …, а_mj, (1)

выигрышей, стоящих в j -м столбце матрицы выигрышей, в зависимости от того, какой стратегии будет придерживаться игрок А. Но так как игрок В предполагает, что игрок А играет наилучшим для себя образом, то выигрышем игрока А будет максимальное из чисел (1); обозначим его через β_j:

и назовем показателем неэффективности стратегии В_j. Таким образом, для любой стратегии B_j игрока В наибольший его проигрыш равен β _j. В интересах игрока В - выбрать стратегию с минимальным показателем неэффективности. Наименьшее из чисел (2) обозначим β:

Отсюда в силу формулы (2) получим для β выражение:

Критерий выбора эффективной стратегии для игрока В называется минимаксным принципом, а выигрыш β называется минимаксом.

⇐ Предыдущая 1 2 345 6 7 8 9 10 Следующая ⇒

Познавательные статьи:

Коммуникативные барьеры и пути их преодоления

Рынок недвижимости. Сущность недвижимости

Решение задач с использованием генеалогического метода

История происхождения и развития детской игры

Последнее изменение этой страницы: 2017-01-27; просмотров: 961; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.86.5 (0.029 с.)