Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Выигрыш-функция в смешанных стратегиях и различные формулы ее представления (Координатная формула. Векторно-матричные формулы выигрыш-функции в смешанных стратегиях)Содержание книги
Похожие статьи вашей тематики
Поиск на нашем сайте
Функция выигрыша игрока 𝐴 в смешанных стратегиях – функция 𝐻, определенная на декартовом произведении 𝑆𝐴× 𝑆𝐵 множеств смешанных стратегий соответственно игроков 𝐴 и 𝐵, и ставящая в соответствие каждой ситуации (𝑃, 𝑄) ∈ 𝑆𝐴× 𝑆𝐵 в смешанных стратегиях средний выигрыш игрока 𝐴 в этой ситуации, определяемый следующим образом: 𝐻(𝑃,𝑄) = ∑𝑚𝑖=1 ∑𝑛𝑗=1 𝑝𝑖𝑎𝑖𝑗𝑞𝑗, где 𝑃 = (𝑝1,...,𝑝𝑚), 𝑄 = (𝑞1,...,𝑞𝑛) (1) Так как и, следовательно, , то декартово произведение множеств смешанных стратегий игроков А и В является расширение декартова произведения множеств чистых стратегий игроков А и В. Если 𝑃 = (𝑝1 = 0,...,𝑝𝑖−1 =0,𝑝𝑖=1,𝑝𝑖+1 =0,...,𝑝𝑚=0)=𝐴𝑖, 𝑄=(𝑞1 =0,...,𝑞𝑗−1 =,𝑞𝑗=1,𝑞𝑗+1 =0,...,𝑞𝑛=0)=𝐵𝑗 т.е. (𝑃,𝑄) = (𝐴𝑖,𝐵𝑗) ∈ 𝑆𝐴𝐶×𝑆𝐵𝐶, то из (1) следует, что: 𝐻(𝑃,𝑄)=𝐻(𝐴𝑖,𝐵𝑗)=𝑎𝑖𝑗=𝐹(𝐴𝑖,𝐵𝑗)=𝐹(𝑃,𝑄). Данное равенство означает, что функция выигрыша в смешанных стратегиях Н совпадает на декартовом произведении 𝑆𝐴𝐶× 𝑆𝐵𝐶с функцией выигрыша в чистых стратегиях 𝐹 и, следовательно, является ее расширением (продолжением) с декартова произведения 𝑆𝐴𝐶× 𝑆𝐵𝐶на декартово произведение 𝑆𝐴× 𝑆𝐵. Форма 𝐻(𝑃,𝑄) = ∑𝑚𝑖=1 ∑𝑛𝑗=1 𝑝𝑖𝑎𝑖𝑗𝑞𝑗, (𝑃, 𝑄) ∈𝑆𝐴× 𝑆𝐵задания функции выигрыша в смешанных стратегиях называется координатной. Функцию Н можно задать и в матричной форме (1) где 𝑃 = (𝑝1,...,𝑝𝑚) –вектор-строка размера 1*m - матрица игры (матрица выигрышей игрока А в чистых стратегиях) размера m*n - вектор-столбец размера n*1 Подчеркнем, что размеры матриц – множители в правой части (1) – удовлетворяют условиям возможности перемножения этих матриц, т.е. для двух соседних множителей число столбцов левого равно числу строк правого. Показатель эффективности смешанной стратегии игрока А относительно множества смешанных стратегий игрока В и его существование Для каждой смешанной стратегии игрока А существует Число называется показателем эффективности смешанной стратегии игрока А относительно множества смешанных стратегий игрока В Доказательство: Если зафиксировать произвольную смешанную стратегию , то функция выигрыша будет функцией одного векторного аргумента Q, определенного на симплексе . Из аналитического выражения функции видно, что она непрерывна по аргументу Q на множестве которое является компактом, а непрерывная на компакте функция достигает своей нижней и верхней граней. Поэтому для любого существует , т.е. для любого найдется хотя бы одна точка такая, что Показатель неэффективности смешанной стратегии игрока В относительно множества смешанных стратегий игрока А и его существование Для каждой смешанной стратегии игрока B существует Число называется показателем неэффективности смешанной стратегии игрока В относительно множества смешанных стратегий игрока A. Доказательство: Если зафиксировать произвольную смешанную стратегию , то функция выигрыша будет функцией одного векторного аргумента P, определенного на симплексе . Из аналитического выражения функции видно, что она непрерывна по аргументу P на множестве которое является компактом, а непрерывная на компакте функция достигает своей нижней и верхней граней. Поэтому для любого существует , т.е. для любого найдется хотя бы одна точка такая, что Показатель эффективности смешанной стратегии игрока А относительно множества чистых стратегий игрока В. соотношение между показателями эффективности смешанной стратегии игрока А относительно множеств смешанных и чистых стратегий игрока В
Число называется показателем эффективности смешанной стратегии игрока А относительно множества чистых стратегий игрока В. В частности, если – чистая стратегия, то - показатель эффективности чистой стратегии (относительно множества чистых стратегий игрока В). Теорема. Показатели эффективности любой смешанной (в частности, чистой) стратегии игрока А относительно множества и соответственно чистых и смешанных стратегий противника В равны: Доказательство. Так как то И, следовательно Докажем противоположное неравенство. Пусть и Тогда используя формулы и и , получим неравенство Для любых и . Так как правая часть этого неравенства не зависит от Q, то из него с учетом будем иметь Последнее неравенство и противоположны, следовательно Показатель неэффективности смешанной стратегии игрока В относительно множества чистых стратегий игрока В. Соотношение между показателями неэффективности смешанной стратегии игрока В относительно множеств смешанных и чистых стратегий игрока А
Число называется показателем неэффективности смешанной стратегии Q игрока B относительно множества чистых стратегий игрока A. В частности, если – чистая стратегия, то - показатель неэффективности чистой стратегии (относительно множества чистых стратегий игрока A). Теорема. Показатели неэффективности любой смешанной (в частности, чистой) стратегии игрока B относительно множества и соответственно чистых и смешанных стратегий противника В равны: Доказательство. Так как то И, следовательно Докажем противоположное неравенство. Пусть и Тогда используя формулы и и , получим неравенство Для любых и . Так как правая часть этого неравенства не зависит от P, то из него с учетом будем иметь Последнее неравенство и противоположны, следовательно
|
||||
Последнее изменение этой страницы: 2016-04-23; просмотров: 1263; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.88.104 (0.007 с.) |