Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Оптимальные стратегии и их выбор.Содержание книги
Похожие статьи вашей тематики
Поиск на нашем сайте
Очевидно, что, выбирая ту или иную стратегию, каждый из игроков стремится удовлетворить свои интересы: первый - обеспечить себе максимально возможный выигрыш, а второй - минимально возможный проигрыш. Стратегия игрока называется оптимальной, если при ее применении выигрыш (проигрыш) игрока не может быть уменьшен (увеличен), какими бы стратегиями не пользовался другой игрок. Рассмотрим применение принципа осторожности в общем случае, т.е. когда первый игрок имеет m стратегий, второй игрок - n стратегий, а матрица выигрышей Н имеет соответственно m строк и n столбцов: H= Анализируя платежную матрицу Н, первый игрок для каждой своей стратегии i (i= 1,..., m) найдет минимальное значение hi=minjhij, ожидаемого выигрыша, который может им быть получен при выборе этой стратегии, а затем из m отобранных элементов выберет максимальный maximinjhij и соответствующую ему стратегию i*, которую называют максиминной стратегией игрока, поскольку она соответствует величине: V^=maximinjhij. Величину V^ называют нижней ценой игры (или максимином). Эта величина показывает выигрыш, который может обеспечить себе первый игрок при выборе вторым игроком любой из его возможных стратегий, т.е. выигрыш, который не зависит от действий второго игрока. В свою очередь, анализируя платежную матрицу Н, второй игрок для каждой своей стратегии j (j=1,..., n) найдет максимальное значение проигрыша hj=maxihj, который может быть им получен при выборе этой стратегии, а затем из n отобранных элементов выберет минимальный minjmaxihij и соответствующую ему стратегию j*, которую называют минимаксной стратегией игрока, поскольку она соответствует величине: V^=minjmaxihij. Величину V^ называют верхней ценой игры (или минимаксом). Эта величина показывает проигрыш, который может обеспечить себе второй игрок при выборе первым игроком любой из его возможных стратегий, т.е. проигрыш, который не зависит от действий первого игрока. Принцип, диктующий игрокам выбор соответственно максиминной и минимаксной стратегии, называется принципом минимакса. Выбирая свои стратегии в соответствии с этим принципом, оба игрока поступают очень осторожно, стремясь получить гарантированный, т.е. не зависящий от действий другого игрока выигрыш (проигрыш). Принцип максимина был впервые сформулирован Джоном фон Нейманом в 1928 г. Ситуация (i*, j*) называется ситуацией равновесия в чистых стратегиях, если для любого i=1,...,m и для любого у=1,...,n выполняется неравенство V^≤hi*j*≤V^ или hij*≤hi*j*≤hi*j Проанализируем содержательное значение вышеприведенных неравенств. Неравенство hij*<hi*j* показывает, что величина проигрыша, которую может обеспечить себе второй игрок, выбравший свою оптимальную стратегию j*, будет меньше либо равна величине того проигрыша, которую получит второй игрок в том случае, если оба игрока используют свои оптимальные стратегии i* и j*, т.е. максиминную и минимаксную стратегии. Неравенство: hi*j*≤hi*j показывает, что величина выигрыша, которую может обеспечить себе первый игрок, выбравший свою оптимальную стратегию i*, будет больше либо равна величине того выигрыша, которую получит первый игрок, в том случае, если оба игрока используют свои оптимальные стратегии i* и j*, т.е. максиминную и минимаксную стратегии. Если ситуация равновесия в чистых стратегиях существует, то верхняя и нижняя цены игры совпадают: V^=V^=V и равны значению V, которое называется ценой игры. В рассмотренном выше примере V^=2, V^= 2, из чего следует, что в данной игре существует ситуация равновесия в чистых стратегиях. Максиминная и минимаксная стратегии i*, j*, соответствующие цене игры, являются оптимальными стратегиями первого и второго игроков, а их совокупность - решением игры.
Оптимизационные модели. Оптимизационные модели – это модели, предполагающие нахождение экстремума (минимума или максимума) целевой функции цели оптимизации, при заданной системе ограничений на целевую функцию. Например, целевой функцией может быть максимизацию прибыли предприятия при ограничениях на наличие трудовых ресурсов (материальных, трудовых, финансовых). Практически невозможно построить четкий алгоритм процедуры построения оптимизационных моделей. Прежде чем построить математическую модель задачи, т.е. записать ее с помощью математических символов, необходимо четко разобраться с ситуацией, описанной в условии. В общем виде схема построения математической оптимизационной модели состоит из следующих этапов: Этап 1. Выбор и обозначение переменных задачи. Этап 2. Представление целевой функции задачи (способ расчета значений критерия эффективности задачи). Этап 3. Представление ограничений задачи. Условия, налагаемые на переменные и ресурсы задачи, записываются в виде системы равенств или неравенств, т.е. ограничений. В процессе записи математической модели рекомендуется указывать единицы измерения переменных задачи, целевой функции и всех ограничений.
Основные понятия теории игр. Математическим описанием конфликтных ситуаций занимается теория игр. Не цель - выработка рекомендаций по разумному поведению участников конфликта. Каждая конкретная конфликтная ситуация очень сложна. Чтобы сделать возможным математический анализ конфликта, отбрасываются несущественные факторы и строится математическая модель, которую называют игрой. Стороны, участвующие в конфликте, называются игроками, исход игры называется выигрышем. Oт реального конфликта игра отличается наличием формальных правил. Правила устанавливают возможные варианты действий игроков и исход игры, то есть выигрыш или проигрыш участников в зависимости от сложившейся обстановки. Будем считать, что выигрыши участников имеют количественное выражение. Игра называется парной, если в ней участвуют два игрока и множественной, если число участников более двух. Игра называется игрой с нулевой суммой, если выигрыш одной стороны равен проигрышу другой. Игра состоит из отдельных ходов участников. Различают личные и случайные ходы. Личный ход - это сознательный выбор игроком одного из вариантов действий. Случайный ход определяется не волей игрока, а случайно, например, подбрасыванием монеты. Игры, в которых возможны личные ходы, называются стратегическими. Стратегией игрока называется совокупность правил, определяющих выбор личных хода игрока в зависимости от сложившейся ситуации. Игра называется конечной, если у каждого игрока имеется конечное число стратегий и бесконечной, в противном случае, например, в шахматах число ходов конечно, хотя и весьма велико, а дуэль, в которой участники могут стрелять друг в друга в любой момент данного отрезка времени, является игрой с бесконечным чистом ходов. Оптимальной называется стратегия игрока, обеспечивающая ему максимальный выйгрыш. Если игра повторяется многократно и содержит кроме личных и случайные ходы, максимизируется средний выигрыш. При нахождении оптимальных стратегий предполагается, что противник ведет себя разумно и стремится минимизировать свой проигрыш. Решить-эту игру - это значит выбрать стратегию каждого игрока, удоалетворяющую усл овию оптимальност и, то есть один игрок должен получить максимальный выигрыш, в то же время второй игрок должен иметь минимальный проигрыш.
|
||||
Последнее изменение этой страницы: 2016-09-05; просмотров: 1216; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.133.157.133 (0.008 с.) |