Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь
FAQ
Написать работу

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ Написать работу

Показатели эффективности чистых стратегий. Максиминные и минимаксные стратегии.

↑

⇐ ПредыдущаяСтр 5 из 11Следующая ⇒

Рассмотрим матричную m × n - игру с игроками А и В,в которой игрок А обладает mчистыми стратегиями ={А₁,..., А_m}, a игрок В - n чистыми стратегиями ={В₁,..., В_n}. Значения функции выигрыша игрока A обозначим через а_ij,т. е. F_A (i, j) = а_ij, и тогда матрица игры будет иметь вид

B_j

A =

A_i

B ₁

B ₂

…

B_n

A ₁

a ₁₁

a ₁₂

…

a _{1 n}

A ₂

a ₂₁

a ₂₂

…

a _{2 n}

…

A_m

a_m ₁

a_m ₂

…

a_mn

Перед игроком А стоит задача выбора чистой стратегии из множества , эффективной в определенном смысле, в результате применения которой он получит максимально возможный гарантированный выигрыш. Если игрок А выбрал стратегию А_i (i =1, …, m),, то его выигрышем может быть один из выигрышей

а_i ₁, а_i ₂, …, а_in,

расположенных в i -й строке матрицы, в зависимости от выбранной игроком В стратегии. Предполагая поведение игрока А крайне осмотрительным, необходимо считать, что игрок В сыграет наилучшим для себя образом и на выбор игроком А стратегии А_i выберет ту стратегию B_j, при которой выигрыш игрока А окажется минимальным. Обозначим минимальный среди выигрышей через α _i:

и назовем его показателем эффективности стратегии А_i.

Продолжая действовать разумно, игрок А должен выбрать ту стратегию, которая максимизирует показатель эффективности, т.е. для которой число α _i максимально. Если обозначить это максимальное число через α:

тогда

Описанный принцип выбора эффективной стратегии игроком А называется максиминным принципом, а выигрыш α - максимином. Стратегия соответствующая максимину α, т. е. стратегия номер i ₀которой максимизирует показатель эффективности α _i, т. е.

называется максиминной стратегией игрока А.

Пусть игрок А выбрал максиминную стратегию а игрок В - какую-то произвольную стратегию B_j, j = 1,..., п. Тогда в создавшейся ситуации ( B_j) выигрыш игрока А в чистых стратегиях будет для которого в силу равенств и будет справедливо неравенство

Данное неравенство означает, что если игрок А в игре будет следовать максиминной стратегии, то ему при любой игре противника В гарантирован выигрыш в чистых стратегиях, не меньший максимина α. Именно поэтому максимин α, определяемый по формуле , называют нижней ценой игры в чистых стратегиях.

Теперь рассмотрим игру с точки зрения игрока В, который стремится минимизировать выигрыш игрока А, исходя из посылки, что игрок А играет наилучшим для себя и наихудшим для игрока В образом. Если игрок В выберет стратегию , то выигрышем игрока А может быть один из

а ₁ _j, а ₂ _j, …, а_mj,

выигрышей, стоящих в j -м столбце игровой матрицы, в зависимости от того, какой стратегии будет придерживаться игрок А. Но так как игрок В предполагает, что игрок А играет наилучшим для себя образом, то выигрышем игрока А будет максимальное из чисел а ₁ _j, а ₂ _j, …, а_mj; обозначим его через β_j:

и назовем показателем неэффективности стратегии В_j. Таким образом, для любой стратегии B_j игрока В наибольший его проигрыш равен β _j. В интересах игрока В - выбрать стратегию с минимальным показателем неэффективности. Наименьшее из чисел обозначим β:

Отсюда в силу формулы получим для β выражение:

Выбор игроком В стратегии с наименьшим показателем β _j оправдывает то, что он назван показателем неэффективности.

Критерий выбора эффективной стратегии для игрока В называется минимаксным принципом, а выигрыш β называется минимаксом. Стратегия для которой

называется минимаксной стратегией игрока В.

При выборе игроком В стратегии , его проигрышем может быть один из проигрышей а ₁ _j, а ₂ _j, …, а_mj, или, другими словами, его выигрышем может быть один из выигрышей

b_j1 = -a_1j, b_j2 = -a_2j,..., b_jm = -a_mj.

Тогда показателем эффективности стратегии B_j (относительно выигрышей игрока В) будет минимальное из этих чисел, которое, в силу обозначения , можно представить так:

а максимином будет число выражающееся иначе следующим образом:

Таким образом, показатель эффективности стратегии B_j (относительно выигрышей игрока B) противоположен показателю неэффективности стратегии B_j (относительно проигрышей игрока В) и максимин (относительно выигрышей игрока В) противоположен минимаксу (относительно проигрышей игрока B).

⇐ Предыдущая 1 2 3 456 7 8 9 10 Следующая ⇒

Познавательные статьи:

Формы дистанционного обучения

Передача мяча двумя руками снизу

Значение правильной осанки для жизнедеятельности человека

Основные ошибки при выполнении передач мяча на месте

Последнее изменение этой страницы: 2017-01-27; просмотров: 553; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.141.42.41 (0.021 с.)