С полной или неполной информацией 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

С полной или неполной информацией



Важное подмножество последовательных игр составляют игры с полной информацией. В такой игре участники знают все ходы, сделанные до текущего момента, равно как и возможные стратегии противников, что позволяет им в некоторой степени предсказать последующее развитие игры. Полная информация не доступна в параллельных играх, так как в них неизвестны текущие ходы противников. Большинство изучаемых в математике игр — с неполной информацией. Например, вся «соль» Дилеммы заключённого или Сравнения монеток заключается в их неполноте.

В то же время есть интересные примеры игр с полной информацией: «Ультиматум», «Многоножка». Сюда же относятся шахматы, шашки, го, манкала и другие.

Часто понятие полной информации путают с похожим — совершенной информации. Для последнего достаточно лишь знание всех доступных противникам стратегий, знание всех их ходов необязательно.

Игры с бесконечным числом шагов

Игры в реальном мире или изучаемые в экономике игры, как правило, длятся конечное число ходов. Математика не так ограничена, и в частности, в теории множеств рассматриваются игры, способные продолжаться бесконечно долго. Причём победитель и его выигрыш не определены до окончания всех ходов.

Задача, которая обычно ставится в этом случае, состоит не в поиске оптимального решения, а в поиске хотя бы выигрышной стратегии. Используя аксиому выбора, можно доказать, что иногда даже для игр с полной информацией и двумя исходами — «выиграл» или «проиграл» — ни один из игроков не имеет такой стратегии. Существование выигрышных стратегий для некоторых особенным образом сконструированных игр имеет важную роль в дескриптивной теории множеств.

Дискретные и непрерывные игры

Большинство изучаемых игр дискретны: в них конечное число игроков, ходов, событий, исходов и т. п. Однако эти составляющие могут быть расширены на множество вещественных чисел. Игры, включающие такие элементы, часто называются дифференциальными. Они связаны с какой-то вещественной шкалой (обычно — шкалой времени), хотя происходящие в них события могут быть дискретными по природе. Дифференциальные игры также рассматриваются в теории оптимизации, находят своё применение в технике и технологиях, физике.

Метаигры

Это такие игры, результатом которых является набор правил для другой игры (называемой целевой или игрой-объектом). Цель метаигр — увеличить полезность выдаваемого набора правил. Теория метаигр связана с теорией оптимальных механизмов (англ.).

Основные понятия теории игр

В задачах оптимизации решение выбиралось при предположении о том, что известны целевая функция, различные способы действия и ограничения. Рассмотрим задачи принятия решений в ситуациях с несколькими участниками, когда значение целевой функции для каждого из субъектов зависит и от решений, принимаемых всеми остальными участниками.

Предметом теории игр являются такие ситуации, в которых важную роль играют конфликты и совместные действия.

Всякая претендующая на адекватность математическая модель социально-экономического явления должна отражать присущие ему черты конфликта, т.е. описывать:

1. множество заинтересованных сторон (игроков);

2. возможные действия каждой из сторон (стратегии или ходы);

3. интересы сторон, представленные функциями выигрыша (платежа) для каждого из игроков.

В теории игр предполагается, что функции выигрыша и множество стратегий, доступных каждому из игроков, общеизвестны, т.е. каждый игрок знает свою функцию выигрыша и набор имеющихся в его распоряжении стратегий, а также функции выигрыша и стратегии всех остальных игроков, и в соответствии с этой информацией организует свое поведение.

Формализация содержательного описания конфликта представляет собой его математическую модель, которую называют игрой.

Теория игр впервые была систематически изложена Дж. фон Нейманом и О. Монгерштерном в 1944 г., хотя отдельные результаты были опубликованы еще в 20-х годах. Нейман и Монгерштерн написали оригинальную книгу, которая содержала главным образом экономические примеры, поскольку экономическому конфликту легче всего придать численную форму. Во время второй мировой войны и сразу после нее теорией игр серьезно заинтересовались военные, которые увидели в ней аппарат для исследования стратегических решений. Затем главное внимание снова стало уделяться экономическим проблемам. Сейчас ведется большая работа, направленная на расширение сферы применения теории игр.

Классификация игр

Различные виды игр можно классифицировать, основываясь на том или ином принципе: по числу игроков, по числу стратегий, по свойствам функций выигрыша, по возможности предварительных переговоров и взаимодействия между игроками в ходе игры.

Формальное представление игр

Дадим формальное описание перечисленных элементов конфликта. Множество всех игроков, обозначаемое I, в случае конечного их числа может задаваться простым перечислением игроков. Например, I = {1, 2} при игре в орлянку, I = {Продавец, Покупатель} в ситуации монополия-монопсония, I = {1, 2,., n} в случае анализа результатов голосования в парламенте.

Множество стратегий игрока i обозначим через Xi. При игре в орлянку каждый игрок располагает двумя стратегиями: Xi = {Орел, Решка}; каждый участник голосования имеет выбор на множестве стратегий {За, Против}. В случае взаимодействия на рынке как Продавец, так и Покупатель могут назначать некоторую неотрицательную цену на продаваемый (покупаемый) товар, т.е. множество стратегий каждого из них Xi: Рi > 0.

В каждой партии игрок выбирает некоторую свою стратегию xi Xi, в результате чего складывается набор стратегий x = {x1, x2,., xn}, называемый ситуацией. Так, ситуацию в Парламенте описывает список {За, За, Против, За,.}, полученный в итоге проведенного голосования.

Заинтересованность игроков в ситуациях проявляется в том, что каждому игроку i в каждой ситуации х приписывается число, выражающее степень удовлетворения его интересов в данной ситуации. Это число называется выигрышем игрока i и обозначается через hi(x), а соответствие между набором ситуаций и выигрышем игрока i называется функцией выигрыша (платежной функцией) этого игрока Нi.

В случае конечной игры двух лиц функции выигрыша каждого из игроков удобно представлять в виде матрицы выигрышей, где строки представляют стратегии одного игрока, столбцы – стратегии другого игрока, а в клетках матрицы указываются выигрыши каждого из игроков в каждой из образующихся ситуаций. Данная форма представления конечных игр двух лиц объясняет общее для них название – матричные игры.

Например, в случае игры в орлянку каждый из игроков имеет по две стратегии, именуемые Орел и Решка. Если игроки выбирают одинаковые стратегии, т.е. в случаях, если оба говорят «Орел» или оба говорят «Решка», 1-й игрок выигрывает 1 рубль, а второй игрок проигрывает 1 рубль. В ситуациях, когда оба игрока выбирают различные стратегии, 1‑й игрок проигрывает 1 рубль, а 2‑й игрок соответственно этот 1 рубль выигрывает.

В итоге матрица выигрышей 1‑го игрока Н1 выглядит следующим образом:

  Стратегии 2-го игрока
    Орел Решка  
Стратегии 1-го игрока Орел    
Решка  

Соответственно матрица выигрышей 2‑го игрока Н2 имеет вид:

  Стратегии 2-го игрока
    Орел Решка  
Стратегии 1-го игрока Орел    
Решка  

Для антагонистических игр, в которых выигрыш одного игрока равен проигрышу другого (игр с нулевой суммой), выполняется соотношение Н1 = –Н2. Игра в орлянку, очевидно, является примером такой игры.

Часто для наглядности матрицы выигрышей для обоих игроков совмещают в одну, которая дает полное представление о всей игре:

  Стратегии 2-го игрока
    Орел Решка  
Стратегии 1-го игрока Орел    
Решка  

В каждой клетке этой матрицы слева указаны значения выигрыша 1‑го игрока, справа – значения выигрыша 2‑го игрока.Рассмотрим пример задания матрицы выигрышей для игры с нулевой суммой, называемой в литературе по теории игр Дилемма Заключенного. Содержание игры следующее: два преступника ожидают приговора суда за совершенное злодеяние. Адвокат конфиденциально предлагает каждому из преступников облегчить его участь (и даже освободить!), если он сознается и даст показания против сообщника, которому грозит угодить в тюрьму за совершенное преступление на 10 лет. Если никто не сознается, то обоим угрожает заключение на определенный срок (скажем, 1 год) по обвинению в незначительном преступлении. Если сознаются оба преступника, то, с учетом чистосердечного признания, им обоим грозит попасть в тюрьму на 5 лет. Каждый заключенный имеет на выбор 2 стратегии: не сознаваться или сознаваться, выдав при этом сообщника. В итоге можно получить следующую матрицу «выигрышей» для обоих игроков:

  Стратегии 2-го игрока
    Сознаться Не сознаться  
Стратегии 1-го игрока Сознаться    
Не сознаться  

Приведем пример записи функции выигрыша для бесконечной игры. В случае дуополии каждый из игроков может объявить цену р, по которой он хотел бы продать некоторое количество товара. При этом предполагается, что потребители приобретут товар у фирмы, объявившей меньшую цену, или распределяет свой спрос поровну между фирмами в случае, если они назначили одинаковую цену. Если функцию спроса в зависимости от цены на товар обозначить как d(p), то функция выигрыша 1‑й фирмы П1(р1, р2) будет иметь вид

{ р1d(p1), если p1 < p2,

П1(р1, р2) = { если p1 = p2,

{ 0, если p1 > p2.

Аналогично выглядит функция выигрыша 2-й фирмы П2(р1, р2).

 



Поделиться:


Последнее изменение этой страницы: 2016-12-15; просмотров: 633; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.236.139.73 (0.112 с.)