Многоагентное взаимодействие и равновесные ситуации 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Многоагентное взаимодействие и равновесные ситуации



Равновесие по Нэшу

Пример биматричной игры в табл. 4.1 демонстрирует, что даже в игре размером  может быть неочевидно, какую стратегию поведения стоит выбирать каждому из игроков. Один из подходов к решению подобных моделей – выделение равновесных ситуаций, к которым должны сходиться рациональные игроки.

Понятие равновесия (по Нэшу) в некоалиционных играх было предложено Джоном Нэшем (John Forbes Nash) в диссертации и серии работ 1950-1953 гг.

Ситуация  в игре называется равновесием по Нэшу, если для любого игрока выполняется:

.         (4.2.1)

Таким образом, равновесие по Нэшу, это такая ситуация в игре, от которой ни одному из игроков невыгодно отклоняться в одиночку.

Рассмотрим также отображения, которые для каждого игрока в каждой возможной подситуации  ставят в соответствие некоторую стратегию - наилучший ответ:

.

При этом называют отображением отклика игрока. Из (4.2.1) следует, что равновесие по Нэшу - это ситуация, образуемая наилучшими ответами каждого игрока на наилучшие ответы остальных игроков:

К примеру, игра дилемма заключенных (см. табл. 4.1) имеет единственное равновесие по Нэшу: (Сознаться; Сознаться). Действительно, ни одному из заключенных невыгодно отклоняться от данной ситуации поодиночке. Если один заключенный решит сменить стратегию с Сознаться на Молчать, то этим он только уменьшит свой выигрыш с  до . Одновременно, положение второго игрока улучшится (выигрыш увеличится с  до ), и тому тоже невыгодно будет менять стратегию.

Стоит отметить, что равновесная ситуация в данной игре не является эффективным решением. Ситуация (Молчать; Молчать) максимизирует сумму выигрышей для игроков. Однако недостаток данной ситуации в неустойчивости: каждому игроку выгодно сменить стратегию на признание и предать соперника (подельника). В этом смысле дилемма заключенных демонстрирует разницу между равновесием по Нэшу и оптимальностью по Парето.

Равновесие по Нэшу - необязательно выгодная, но устойчивая ситуация. С другой стороны, ситуация оптимальна по Парето в том случае, когда полезность ни одного из участников не может быть увеличена без уменьшения полезностей других участников.

Упрощенная игровая модель взаимодействия граждан в обществе аналогична дилемме заключенных и представлена в виде биматричной игры в табл. 4.2.

Таблица 4.2

Гражданин 1

Гражданин 2

Альтруизм Эгоизм
Альтруизм 2, 2 -1, 2+ε
Эгоизм 2+ ε, -1 0, 0

 

Множества стратегий поведения игроков одинаковы ={Альтруизм; Эгоизм}, .При ε > 0 у каждого игрока всегда есть мотивация отклониться от ситуации общего блага (Альтруизм; Альтруизм), и рациональный игрок должен им воспользоваться. Таким образом, равновесием по Нэшу является устойчивая ситуация (Эгоизм; Эгоизм).

Из приведенных определений и примеров можно сделать вывод, что рациональным игрокам (соперникам), стремящимся максимизировать собственный выигрыш, а также гарантировать некоторое минимальное значение выигрыша, следует разыгрывать равновесные ситуации.

Подобными биматричными моделями можно представить множество различных проблем принятия решений, например, понижение/повышение цен на предлагаемые товары (ресурсы) конкурирующими фирмами, конфликт ядерных держав и т.п.

 

Равновесие дрожащей руки

Вопрос обоснованности выбора равновесия по Нэшу в качестве решения игры становится сложнее с учетом того, что существуют игровые модели и с несколькими равновесиями. Однако существуют подходы для дополнительной классификации равновесных ситуаций.

Равновесие дрожащей руки - принцип оптимальности в некооперативных играх, представляющий собой равновесие Нэша, обладающее дополнительным свойством устойчивости к небольшим возмущениям в стратегиях игроков при повторном разыгрывании. Возмущения могут быть вызваны ошибками участников, выбором различных равновесий или же неверными действиями, совершенными дрожащей рукой.

Рассмотрим пример на табл. 4.3:

 

Таблица 4.3

Игрок 1

Игрок 2

Недоверие Доверие
Недоверие 1, 1 2, 0
Доверие 0, 2 2, 2

 

Игровая модель, заданная таблицей 4.3, представляет собой взаимоотношение двух игроков с точки зрения взаимного доверия. В данной модели имеется два равновесия по Нэшу: (Недоверие; Недоверие) и (Доверие; Доверие).

Проанализируем ситуацию с позиции первого игрока в равновесии (Доверие; Доверие). Случайное отклонение Игрока 1 и выбор стратегии Недоверие не изменит его личный выигрыш, а выигрыш соперника уменьшится до 0. Рациональным ответом Игрока 2 в следующем раунде будет изменение стратегии на Недоверие для повышения собственного выигрыша. Таким образом, при последующем разыгрывании рациональные игроки придут к равновесию (Недоверие; Недоверие). В силу симметричности матриц аналогичные рассуждения можно провести при отклонении от равновесия второго игрока.

Рассмотрим теперь последствия единичного отклонения от ситуации (Недоверие; Недоверие). При выборе первым игроком стратегии Доверия, его выигрыш уменьшится до 0, в то время как выигрыш соперника увеличится до 2. В то же время у соперника не будет мотивов изменять собственную стратегию поведения на Доверие, так как это не увеличит его выигрыш. А первому игроку, наоборот, выгодно вернуться к стратегии Недоверия. Таким образом, случайное изменение стратегии любого из игроков не приводит к изменению разыгрываемой ситуации, и равновесие (Недоверие; Недоверие) является равновесием дрожащей руки.

Рассмотренная модель может служить иллюстрацией к тому, что истинное доверие зачастую приходится зарабатывать годами, а потерять его можно за считанные мгновения.

 

 



Поделиться:


Последнее изменение этой страницы: 2020-12-09; просмотров: 97; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.218.15.248 (0.005 с.)