Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь
FAQ
Написать работу

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ Написать работу

Но что же назвать риском всей игры.

↑

⇐ ПредыдущаяСтр 5 из 5

Риск можно измерять по разному, как размах вариации R= _max - _min,

как среднее линейное отклонение: М / - М /

Обычно считают среднее кавдратичное отклонение: r=

В нашем случае риск: ²

35. Матричная игра как модель конкуренции и сотрудничества. Графическое решение игр с матрицей 2*n и m*2 доминирование чистых стратегий.

Пусть, например, A= , тогда: В матрице А 3-й столбец доминирует 2-й, поэтому исключим 2-й столбец из рассмотрения: A’= . Проверим, нет ли седловой точки, поскольку при ее наличии решение игры сразу ясно. max min aij = -2; min max aij= 1

i j j i

Видим, что седловой точки нет. Обозначим искомую оптимальную стратегию Первого (x, 1 – x). Обозначим n_j(x) – средний выигрыш Первого в расчете на партию, когда он использует стратегию (x,1–x), а Второй – j-ю чистую стратегию. Имеем n₁(x)=4x-2(1-x), n₃(x)=-2x+(1-x). Возьмем на плоскости систему координат, по горизонтальной оси вправо отложим x, по вертикальной оси – значения функций n_j(x).

I n₁(x)=6x-2 III n₃(x)=-3x+1

Находим нижнюю огибающую семейства прямых. Отыщем ее высшую точку. Она и дает решение игры. Ее координаты определяются решением уравнения n₁(x)=n₃(x), откуда x^*=1/3, n*=n₂(x^*)=n₃(x^*)=0.

Таким образом, оптимальная стратегия Первого есть Р^*=(1/3; 2/3), а цена игры n*= 0.

Обозначим вероятность выбора Вторым первого столбца через y, а третьего столбца – через (1-y).

Воспользуемся утверждением, что M(1;y^*)=n*, т.е. 4y^*-2(1-y^*)= 0, откуда y^*=1/3. Таким образом, оптимальная стратегия Второго Q^*=(1/3;0, 2/3).

Окончательный ответ следующий: оптимальная стратегия Первого – Р^*=(1/3; 2/3), оптимальная стратегия Второго – Q^*=(1/3;0, 2/3), цена игры n*= -1/2. Она достигается в пяти вариантах игры:

1) P*Q*

2) P¹Q*

3) P²Q*

4) P*Q¹

5) P*Q³

Где Pⁱ i-я чистая стратегия Первого игрока, а Q^j j-я чистая стратегия Второго игрока.

Рассчитаем риски во всех эти случаях. Риски максимальны в 4) и 2); минимальны в 3) и 5).

Соответственно 4) и 2) модели конкуренции, а 3) и 5) сотрудничества.

P(1/3,2/3)

Q(1/3,0,2/3)

a_ij

-2

a_ij²

p_i

q_j

1/3

2/3

1/3

2/3

p_i*q_j

1/9

2/9

4/9

p_i*q_j*a_ij

4/9

- 4/9

4/9

p_i*q_j*a_ij²

1 7/9

8/9

4/9

2,00

P(1,0)

Q(1/3,0,2/3)

a_ij

-2

a_ij²

p_i

q_j

1/3

2/3

1/3

2/3

p_i*q_j

1/3

2/3

p_i*q_j*a_ij

1 1/3

-1 1/3

p_i*q_j*a_ij²

5 1/3

2 2/3

2,83

P(0,1)

Q(1/3,0,2/3)

a_ij

-2

a_ij²

p_i

q_j

1/3

2/3

1/3

2/3

p_i*q_j

1/3

2/3

p_i*q_j*a_ij

- 2/3

2/3

p_i*q_j*a_ij²

1 1/3

2/3

1,41

P(1/3,2/3)

Q(1,0,0)

a_ij

-2

a_ij²

p_i

q_j

1/3

2/3

p_i*q_j

1/3

2/3

p_i*q_j*a_ij

1 1/3

-1 1/3

p_i*q_j*a_ij²

5 1/3

2 2/3

2,83

P(1/3,2/3)

Q(0,0,1)

a_ij

-2

a_ij²

p_i

q_j

1/3

2/3

p_i*q_j

1/3

2/3

p_i*q_j*a_ij

- 2/3

2/3

p_i*q_j*a_ij²

1 1/3

2/3

1,41

Если игроки договорятся играть по 3) или 5) вариантам то есть:

3) Первый игрок по 2-й чистой стратегии, а Второй по оптимальной стратегии или

4) Первый по оптимальной, а Второй по3-й чистой стратегии,

то они смогут сократить риск игры по сравнению с оптимальными стратегиями (с 2 до ), при этом цена игры останется такой же, как если бы оба они играли по оптимальным стратегиям.

36. Матричная игра типа m*n. Критерий оптимальности стратегий.

37. Теорема о преобразовании матрицы игры, сохраняющем оптимальные стратегии игроков.

38. Основная теорема теории игр, выражение оптимальных стратегий игроков через решения пары двойственных задач ЛП.

Математической моделью такого конфликта двух участников с противоположными интересами является игра с нулевой суммой. Участники это – игроки. Стратегия игрока – это выбор одного из множества возможных вариантов его действий. Рассмотрим конечные игры, в кот. множества стратегий игроков конечны; стратегии первого игрока пронумеруем от 1 до m, а стратегии второго игрока – от 1 до n. Если первый игрок выбрал свою i-ю стратегию, а второй игрок свою j-ю стратегию, то результатом такого совместного выбора будет платеж a_ij второго игрока первому. Таким образом, игра с нулевой суммой однозначно определяется платежной матрицей. Строки - соответствуют стратегиям первого игрока, столбцы -второго игрока. Игра происходит партиями.

а₁₁а₂₁ а₁_n

П= а₂₁ а₂₂ а₂_n

а_m₁ а_m₂ а_mn

Смешанной стратегий первого игрока называется вектор P (p_1,p_2,…p_m), где все p_i₀(i=1,2,…,m), а p =1. при этом p - вероятность, с которой первый игрок выбирает вою i-ю стратегию. Аналогично определяются смешанные стратегии и Q (q₁, q₂,…q_n)второго игрока. Чистая стратегия также попадает под определение смешанной – если все вероятности равны нулю, кроме одной, равной единице.

Если игроки применяют свои смешанные стратегии P (p_1,p_2,…p_m) и Q (q₁, q₂,…q_n) соответственно, Выигрыш первого: выигрыш a_ij

Вероятность p_i q_j_.

То есть первый игрок с вероятностью p_i g_j_. выигрывает a_ij_.. Математическое ожидание выигрыша первого игрока равно М(P,Q)= p_i q_j a_ij есть средний выигрыш. И это равно математическому ожиданию проигрыша второго игрока. Если игроки озабочены только максимизацией среднего дохода за партию игры то они будут играть со своими оптимальными стратегиями: – Первый игрок и – второй, оптимальны стратегии если М(P,Q*) М(P*,Q*) М(P*,Q)

Математическое ожидание с. в. называется ценой игры, обозначим ее .

Строка k доминирует над строкой i, если все элементы строки k не меньше соответствующих элементов строки i и хотя бы один строго больше. Доминируемую строку можно временно удалить, потому что в оптимальной стратегии ей будет соответствовать вероятность ноль. Столбец l доминирует над столбцом j, если все его элементы не больше соответствующих элементов столбца j, а хотя бы один строго меньше.

Доминируемый столбец j можно временно удалить, т.к. в оптимальной стратегии 2-го игрока ей будет соответствовать вероятность ноль.

Основная теорема теории матричных игр:

В матричной игре с нулевой суммой у игроков есть оптимальные стратегии.

Другими словами: Всякая матричная игра имеет седловую точку в смешанных стратегиях.

39. Игры с природой: основные понятия, матрицы рисков, критерии Вальда, Севиджа, Гурвица.

Предположим, что лицо, принимающее решения может выбрать одну из возможных решений . Ситуация является неопределенной, понятно лишь, что наличествует какой-то из вариантов .

Если будет принято -e решение, а состояние внешней среды соответствует -й ситуации, то фирма, возглавляемая ЛПР, получит доход . Матрица называется матрицей последствий (возможных решений).

Неопределенная ситуация похожа на матричную игру, отличие состоит в том, что противником в данном случае является природа, цели которой не всегда противоположны нашим: они могут совпадать с целями ЛПР, а могут и не совпадать. Поэтому ситуация с неопределенностью называют еще играми с природой.

В ситуации полной неопределенности могут быть высказаны лишь некоторые рекомендации предварительного характера. Они не обязательно будут приняты ЛПР. Многое будет зависеть, например, от его склонности к риску. Но как оценить риск в данной схеме?

Допустим, мы хотим оценить риск, который несет -e решение. Нам неизвестна реальная ситуация. Но если бы ее знали, то выбрали бы наилучшее решение, т.е. приносящее наибольший доход. Т.е. если ситуация есть -я, то было бы принято решение, дающее доход .

Значит, принимая -e решение мы рискуем получить не , а только , значит принятие -го решения несет риск недобрать . Матрица называется матрицей рисков.

Более широкое понятие – неопределенность. Ситуация полной неопределенности характеризуется отсутствием какой бы то ни было дополнительной информации.

Правило Вальда (крайнего пессимизма): рекомендует принять такое решение i₀, что Правило Сэвиджа (правило минимального риска): анализируется матрица рисков . Рекомендует принять решение , такое что

Правило Гурвица (взвешивающее пессимистический и оптимистический подходы к ситуации). Принимается решение , на котором достигается максимум где . Значение выбирается из субъективных соображений.

40. Многокритериальная оптимизация.

Задачи многокритериальной, или векторной, оптимизации возникают в тех случаях, когда имеется несколько целей, которые не могут быть отражены одним критерием (стоимость, надежность и т.п.)

Требуется найти точку области допустимых решений, которая максимизирует или минимизирует все эти критерии. Обозначим i-й частный критерий через _I(x), а область допустимых решений через Q. Учитывая, что изменением знака функции всегда можно свести задачу минимизации к задаче максимизации и наоборот, можно сформулировать задачу векторной оптимизации следующим образом: max x

В идеальном случае в этой задаче можно вести поиск такого решения, которое принадлежит пересечению множеств оптимальных решений однокритериальных задач. Однако указанное пересечение обычно оказывается пустым множеством, и потому приходится рассматривать переговорное множество решений Парето. Вектор х* Q называется эффективным решением, если не существует такого х что Z (x) Z (x*), i=1,2,.,m, причем хотя бы для одного i имеет место строгое неравенство. Множество допустимых решений, для которых невозможно одновременно улучшить все частные показатели эффективности, принято называть областью Парето или областью компромиссов, а принадлежащие ей решения – эффективными или оптимальными по Парето.

Основной вопрос, который изучается в многокритериальной оптимизации, - формулировка подходящего обобщенного критерия в зависимости от конкретной ситуации. В некоторых случаях вместо одного обобщенного критерия и решения одной задачи скалярной оптимизации предлагается рассматривать последовательность задач скалярной оптимизации.

⇐ Предыдущая 1 2 3 45

Познавательные статьи:

Формы дистанционного обучения

Передача мяча двумя руками снизу

Значение правильной осанки для жизнедеятельности человека

Основные ошибки при выполнении передач мяча на месте

Последнее изменение этой страницы: 2016-08-01; просмотров: 195; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.15.235.85 (0.009 с.)