Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву
Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
И. Н. Булгакова, Ю. В. Бондаренко, Г. Д. ЧернышоваСодержание книги
Поиск на нашем сайте И.Н.Булгакова, Ю.В.Бондаренко, Г.Д.Чернышова Теория игр и Исследование операций
Методическое пособие
ВОРОНЕЖ СОДЕРЖАНИЕ
Основные понятия исследования операций. Математическая модель операции Изложение любого предмета начинается с определения или описания используемых в нем основных понятий. В исследовании операций естественно надо начинать с самого понятия «операция». Операцией называется совокупность действий, направленных на достижение некоторой цели, или совокупность целенаправленных действий. Наличие цели в операции подразумевает существование активных участников, которые преследуют эту цель. Для выделения таких участников в особую группу существует понятие оперирующей стороны. Оперирующей стороной (ОС) называется совокупность лиц, которые стремятся в данной операции к поставленной цели. Кроме того, в операции могут присутствовать и другие действующие лица, которые оказывают влияние на ход операции, но не преследуют цель оперирующей стороны, в частности могут стремиться к собственным целям. При изучении операции рассмотрение ведется с позиции оперирующей стороны, а основная задача исследования состоит в поиске и сравнении различных путей достижения поставленной цели. В оперирующей стороне удобно выделить участника, который называется исследователем операции. Исследователь операции принадлежит к оперирующей стороне и преследует ту же цель, однако он, как правило, сам не принимает решения по выбору способов действий, а только помогает в этом оперирующей стороне, дает научную основу для принятия решений. Принципиальное отличие исследователя операции от оперирующей стороны в целом состоит в том, что в момент проведения исследования, которое зачастую отделено от самой операции весьма большим промежутком времени, он может не иметь всей информации, которая будет у оперирующей стороны в момент проведения операции. Однако он должен предвидеть возможность поступления такой информации и давать рекомендации с учетом этой информации, т. е. предлагать не фиксированные действия, а правила поведения как функции от ожидающейся информации. Это обстоятельство еще более осложняет задачу исследователя операции. Ответственность за принятие решений и окончательный выбор лежит на оперирующей стороне. Основным инструментом исследователя операции являются математические модели. Несмотря на их большое разнообразие, существуют важнейшие элементы, которые присутствуют практически во всех моделях. Так, в любой операции для достижения поставленной цели оперирующая сторона должна иметь некоторый запас ресурсов (например, минеральное сырье, техническое оборудование, деньги, рабочую силу, вычислительную технику и т. д.). В математической модели операции соответствующий элемент принято называть активными средствами. Действия, направленные на достижение поставленной цели, представляют собой способы использования активных средств. Соответствующий элемент математической модели называют стратегией и обычно обозначают переменной х. Переменная х может быть скалярной величиной, вектором или функцией. Стратегии являются факторами, влияющими на ход операции, контролируемыми оперирующей стороной, т. е. выбираемыми ею по своему усмотрению. Кроме них существуют неконтролируемые факторы, влияющие на ход операции, которыми оперирующая сторона не распоряжается, например природные условия. Неконтролируемые факторы будем обозначать переменной у. Общее описание модели должно включать также сведения об информированности оперирующей стороны и исследователя операции об обстановке протекания операции, т. е. о значениях неконтролируемых факторов. Неконтролируемые факторы, исходя из информированности о них исследователя операции, можно разбить на три группы: фиксированные, случайные, неопределенные. Фиксированные неконтролируемые факторы - это такие факторы, значения которых точно известны исследователю операции. Случайные неконтролируемые факторы представляют собой случайные величины, законы (функции) распределения которых точно известны исследователю операции. Неопределенные неконтролируемые факторы являются детерминированными или случайными величинами, относительно которых исследователю операции известна лишь область возможных значений или класс возможных законов распределения. Необходимо подчеркнуть, что неконтролируемые факторы описываются с позиции исследователя операции, что же касается оперирующей стороны в целом, то у нее в момент проведения операции может появиться дополнительная информация, существенно сужающая или даже исключающая неопределенность. Но так как мы занимаемся вопросами исследования операций, для нас важна именно информированность исследователя, т. е. информация, доступная в момент проведения исследования, хотя возможное содержание информации, поступающей в момент проведения операции, при этом также должно учитываться. Ход операции можно описать некоторым набором фазовых переменных. Степень соответствия хода операции поставленной цели в математической модели характеризуется критерием эффективности W, который представляет собой некоторую функцию (в общем случае, вектор-функцию), зависящую от фазовых переменных, стратегий и неконтролируемых факторов. В математической модели эквивалентом цели операции является, как правило, требование максимизации критерия эффективности. Существует много различных классификаций математических моделей. В частности, модели бывают динамические, в которых явно присутствует переменная времени, и статические, в которых этой переменной нет. В реальности все процессы протекают во времени, поэтому динамические модели, вообще говоря, более точно описывают действительность. Но для проведения исследования часто ограничиваются более простыми статическими моделями. При этом стратегию и воздействие неконтролируемых факторов представляют в виде единичного акта, фазовые переменные исключают, и критерий эффективности представляют как функцию только стратегий и неконтролируемых факторов, т. е.
Переход от динамической формы модели к статической называется нормализацией. Фактически в ходе исследования можно сразу строить статическую модель, минуя динамическую. Несмотря на внешнюю простоту выражения (1.1), связь между значениями критерия, стратегии и неконтролируемого фактора может быть весьма сложной. Иногда ее не удается представить в явном виде, тогда она задается с помощью промежуточных соотношений или в виде вычислительного алгоритма. С учетом изложенного получаем математический объект X - множество (пространство) допустимых стратегий, Y - множество значений неконтролируемых факторов, W - функция, определенная на прямом произведении Этот объект называется статической (нормальной) формой математической модели операции. Содержательно всякая задача исследования операций является оптимизационной, т. е. состоит в выборе среди некоторого множества допустимых стратегий тех, которые можно в том или ином смысле квалифицировать как оптимальные. При этом допустимость каждого решения понимается в смысле возможности его фактического осуществления, а оптимальность — в смысле его целесообразности. Допустимость определяется возможностью реализации соответствующих действий при имеющихся ресурсах. Ограниченность ресурсов выражается в виде математических ограничений, чаще всего имеющих вид равенств и неравенств. Оптимальность, целесообразность решения предполагает наличие в каждой задаче исследования операций некоторой системы целей, описываемых критерием (критериями) эффективности, и принципа оптимальности (иногда называемого критерием оптимальности). Формально принципом оптимальности называется отображение из множества всех допустимых стратегий в некоторое его подмножество. Чаще всего оно определяется требованиями максимизации (или минимизации) одной или нескольких числовых функций, значения которых выражают степень осуществления целей при соответствующем допустимом решении. Каждая такая функция называется критерием эффективности, или целевой функцией. Иногда эффективность определяется не целевой функцией, а отношением предпочтения, когда применительно к парам допустимых решений указывается, какое из решений этой пары предпочтительней. - Для построения математической модели операции в общем случае рекомендуется выполнить следующую последовательность работ: - изучение условий задачи и определение важнейших факторов; - выделение известных и неизвестных параметров; - выявление управляемых и неуправляемых факторов; - анализ информации о значениях параметров и дополнение условий задачи недостающими сведениями; - составление математической модели (математическое выражение целевых функций и соотношений и связей между параметрами); - определение принципа оптимальности (в общем случае весьма нетривиальный и ответственный этап) и формулировка задачи. Примеры
Пример 1. Рассмотрим следующую игру. Игроки выбирают одновременно одно из трех чисел: «один», «два», «три». Выигрыш Р1 (проигрыш Р2) положителен и равен названному числу, если он правильно угадал выбор второго игрока и 0 в противном случае.
В данной задаче
Пример 2. Оборона города (игра полковника Блотто). Полковник Блотто (игрок Р1) имеет 4 полка, а его противник (Р2) – 3 полка. Противник защищает 2 позиции. Позиция будет занята полковником Блотто, если на ней наступающие полки окажутся в численном превосходстве. При этом, если у полковника Блотто на позиции полков больше, чем у противника, то его выигрыш на этой позиции равен числу полков противника плюс один (за захват позиции). Если у Р2 полков больше, то Р1 теряет все свои полки и 1 за позицию. Если число полков Р1 и Р2 на позиции одинаково, то имеет место ничья и никто ничего не получает. Считая, что суммарный выигрыш Р1 равен сумме его выигрышей по двум позициям и игра является антагонистической, сформировать матрицу игры.
Решение Стратегией первого игрока является пара
Рассмотрим формирование элементов матрицы на примере
3.2 Ситуация равновесия в чистых стратегиях: понятие и существование
Рассмотрим антагонистическую игру В теории игр предполагается, что оба игрока ведут себя рационально, то есть стремятся получить максимально возможную величину гарантированного выигрыша. Пусть игрок 1 выбрал стратегию
Замечание 1. Для матричной игры
Лемма 1. Для любой антагонистической игры
Рассмотрим вопрос оптимального поведения игроков. Ситуация
Определение 3. В антагонистической игре
Так как
Замечание 2. В матричной игре ситуация
Свойства ситуаций равновесия Пусть 1) 2) Необходимые и достаточные условия существования ситуации равновесия в чистых стратегиях доказываются следующей теоремой.
Теорема 1. Для того, чтобы в игре
и выполнялось равенство: Доказательство 1. Необходимость. Пусть По определению ситуации равновесия:
Тогда Так как
Аналогично:
Из (*), (**) следует: 2. Достаточность. Пусть существуют Пусть
Докажем, что
Тогда, так как правые части неравенств равны по условию, то
В случае если верхняя цена игры и нижняя совпадают, величину Для антагонистической игры справедлива следующая лемма о масштабе.
Лемма 2. (Лемма о масштабе) Пусть
Примеры Пример 1. Найти верхнюю и нижнюю цены игры и ситуацию равновесия, при условии, что она существует, если матрица имеет вид:
Решение Найдем нижнюю цену игры. Если Р1 выберет первую стратегию, то он получит гарантированно Если Р1 выберет стратегию 2, то он получит гарантированно Если Р1 выберет стратегию 3, то он получит гарантированно Тогда выбором своей стратегии Р1 может получить, по крайней мере не меньше Найдем верхнюю цену игры. Если Р2 выберет первую стратегию, то он проиграет гарантированно не больше Если Р2 выберет стратегию 2, то он проиграет гарантированно не больше Если Р2 выберет стратегию 3, то он проиграет гарантированно не больше Тогда выбором своей стратегии Р2 может проиграть, по крайней мере, не меньше
Пример 2. Пусть дана матрица выигрышей игрока P1 Решение В данной игре
Упражнения к § 3.1. – 3.2
№ 1. Найдите верхнюю, нижнюю цену игры, ситуации равновесия (если они существуют) для игр, заданных следующими матрицами: 1) 4)
№ 2. В игре Морра с тремя пальцами каждый игрок показывает 1, 2 или 3 пальца одновременно, называя число пальцев, которые покажет его оппонент. Выигрывает тот, кто правильно назовет число пальцев, показанных противником. Выигрыш равен сумме пальцев, показанных обоими игроками. Написать матрицу игры и показать, что она не имеет ситуации равновесия.
№ 3. Каждый из двух игроков имеет n рублей. Они хотят получить некоторый предмет стоимостью C>0. Каждый дает за него i рублей (
№ 4. (Дискретная игра типа дуэли). Игроки продвигаются навстречу друг другу на n шагов одновременно. После каждого сделанного шага игрок может выстрелить или нет, но во время игры он может выстрелить только один раз. Считается, что вероятность того, что игрок попадет в своего противника, если выстрелит, продвинувшись на k шагов, равна
№ 5. В системе ПВО объекта могут применяться 3 типа средств поражения воздушной цели (1, 2, 3), которые должны быть распределены между двумя стартовыми установками. У противника (P2) имеется 2 типа самолетов (тип 1, тип 2). Вероятности поражения самолета одним средством сведены в таблицу
Предполагается, что возможно нападение только одним из самолетов. Выигрыш первого игрока равен вероятности поражения самолета системой ПВО. Построить матрицу игры и выяснить, имеет ли игра решение в чистых стратегиях.
№ 6. На каждой из двух торговых баз ассортиментный минимум составляет один и тот же набор из n видов товаров. Каждая база должна поставить в свой магазин только один из этих видов товара. Магазины, обозначим их A и B, конкурируют между собой. Один и тот же вид товара в обоих магазинах продается по одной и той же цене. Однако, товар, поставляемый в магазин B, более высокого качества. Если магазин A завезет с базы товар i -го вида Требуется формализовать данную конфликтную ситуацию и построить матрицу игры при n=3.
№ 7. Торговый агент должен встретиться с иногородним клиентом и собирается лично вручить ему заказ на 3000 у.д.ед. Если агент поедет поездом, то потеряет день на работе, который принес бы ему 1500 у.д.ед. Полет самолетом позволит сократить рабочий день, но если самолет не полетит из-за тумана, то личная встреча с клиентом не состоится и день на работе не будет потерян. В этом случае придется говорить с клиентом по телефону, что уменьшит сумму заказа до 500 у.д.ед. Вероятность тумана оценивается как 0,1. Требуется формализовать данную конфликтную ситуацию и построить матрицу игры.
№ 8. Фирма А производит некоторый сезонный товар, имеющий спрос в течение n единиц времени, и который она может поставить на рынок в один из моментов i Для конкурентной борьбы с фирмой А дочерняя фирма В концерна D, не заботясь о собственных доходах, производит аналогичный товар, который поступает на рынок в один из моментов j Требуется построить функцию выигрыша фирмы А, где под выигрышем понимается доход этой фирмы, зависящий от складывающихся ситуаций. Используя функцию выигрыша, составить матрицу игры для случая n =4 и выписать конкретный вид этой матрицы, который она приобретает в случае, когда доход с =6 денежным единицам.
3.3 Смешанное расширение игры
Если игра не имеет ситуации равновесия в чистых стратегиях, то игроки, применяя свои максиминную и минимаксную чистые стратегии, создают неустойчивую ситуацию, которую один из игроков может изменить с выгодой для себя. С другой стороны, представляется, что ничего другого осторожным игрокам рекомендовать нельзя. И все-таки из этого положения есть выход. Каждый из игроков может выбирать свои чистые стратегии случайно, то есть может определить распределение вероятностей на множестве чистых стратегий, а затем предоставить выбор конкретной чистой стратегии случайному механизму. Выбор игроками своих чистых стратегий с некоторыми заранее заданными вероятностями – по существу один из планов проведения игры и в этом смысле тоже является некоторой стратегией. В отличие от первоначально заданных (чистых), такие стратегии называются смешанными. Рассмотрим матричную игру
Пусть При выборе смешанной стратегии игроки руководствуются критерием максимизации математического ожидания своего выигрыша. Отсутствие обмена информацией между игроками делает их случайные выборы своих чистых стратегий независимыми. Поэтому, если они применяют свои смешанные стратегии
Определение 4. Тройка
Определение 5. Решением смешанного расширения матричной игры
Для смешанного расширения игры
Лемма 3. Пусть
Сформулируем несколько теорем, представляющих свойства оптимальных смешанных стратегий в антагонистической игре, используя которые в дальнейшем (п. 2.5), сможем доказать теорему о существовании ситуации равновесия в смешанных стратегиях.
Свойства оптимальных стратегий и цены смешанного расширения игры 1. Пусть
2. Пусть
При этом
3. Для матричной игры | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
| Поделиться: |
Познавательные статьи:
Последнее изменение этой страницы: 2016-04-26; просмотров: 509; Нарушение авторского права страницы; Мы поможем в написании вашей работы!
infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 216.73.216.214 (0.013 с.)