Поддержка решений в статистически определенной ситуации 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Поддержка решений в статистически определенной ситуации



Эта ситуация характеризуется наличием неопределенных факторов, вероятностное описание которых известно (определено). В большинстве случаев это неопределенность состояния окружающей среды, но может быть и неопределенность параметров системы и т.п. Для простоты в дальнейшем будем полагать случайными состояния внешней среды, или, как часто говорят, состояния природы.

Пусть S={s1,s2,…sn} - дискретное множество возможных состояний природы, на котором заданы вероятности P(S=si)=P(si). Или, если множество S непрерывно, плотность вероятности f(s).

Поскольку S является случайной величиной, то значение W(U,S,C) также случайная величина. Для устранения неопределенности можно провести операцию усреднения, т.е.

 

W(U,C) = Ms [W(U,S,C)] = i W(U,si, C)*P(si) (13)

 

Критерий (13) уже не является случайной величиной, и на его основе можно осуществлять ранжирование и оптимизацию альтернатив любым из рассмотренных выше методов.

Наиболее принципиальным и специфическим для данной ситуации моментом является отыскание законов распределения состояний природы.. Эта задача решается путем априорных наблюдений, и уточненмя их результатов с помощью экспериментов специально организуемых в ходе решения задачи. Т.к. наблюдения случайных величин в свою очередь являются случайными, то процедура уточнения априорных распределений строится в соответствии с идеологией, заложенной в известной формуле Байеса (теорема гипотез), и решения, получаемые на этой основе, соответственно называют байесовыми. Напомним эту формулу

 

P(si/x)= P(si) P(x/si) / åP(si)P(x/si) (14)

f(s/x) = f(s) f(x/s) / f(s) f(x/s) dx (15)

 

здеcь х- результат эксперимента, si - возможные состояния природы (гипотезы). Вероятности гипотез P(si) "i называются априорными (доопытными) и они должны быть известны, причем å P(si)=1. Также необходимо знать условные вероятности P(x/si) "i. Искомые вероятности P(s/x) апостериорными (послеопытными) вероятностями гипотез.

В случае, когда множество состояний природы непрерывно, от формулы (14) переходят к формуле (15), оперирующей с априорными и апостериорными распределениями S.

Итак, эксперимент позволяет уточнить вероятность состояния среды.

Так как эксперимент подразумевает определенные затраты, можно определить цену, больше которой за него не стоит платить. Для этого необходимо посчитать среднее значение W без эксперимента, тоже при его наличии, а затем вычислить разницу, которая и будет чистой ценой эксперимента..

Вопрос о целесообразности проведения эксперимента можно решить и без вычисления его чистой цены. Для этого достаточно стоимость эксперимента рассматривать в качестве одной из компонент векторного критерия, по которому осуществляется оптимизация или ранжирование решений

Рассмотрим пример, иллюстрирующий решение задачи с использованием и без использования эксперимента.

Пусть имеются неразличимые между собой урны с черными и белыми шарами. Известно, что урн типа А - 80%, а типа В - 20%. Урна типа А содержит 7 белых и 3 черных шара, а типа В - 1 белый и 9 черных. Требуется определить тип наудачу выбранной урны. По условию игры правильный ответ приносит выигрыш (+), неправильный – проигрыш (-). Размеры платежей приведены в таблице 1 (платежная матрица). Возможны три стратегии: «а» - называем тип А, «б» - называем В, «с» - отказываемся от игры. Кроме того, играющему разрешается провести эксперимент, заключающийся в том, что перед ответом он может вынуть один шар из выбранной урны и посмотреть его цвет. Плата за право провести эксперимент указана в последнем столбце платежной матрицы.

Возможность проведения эксперимента увеличила число стратегий с трех до пяти: d1 = c, d2 = e0*a, d3 = e0*b, d4 = e*a, d5 = e*b, где «е0» означает отказ от эксперимента, а «е» его проведение.

Целью игрока является выигрыш, поэтому его величину и следует использовать для оценки качества решений. Т.к. ситуация стохастическая, то в качестве критерия оптимизации решений разумно принять ее математическое ожидание - M[W].

 

табл.1

  a b с Э
А   -5    
В -20      

 

 

Mf[W]=40*0.8+0.2*(-20)=28

Mb[W]=-5*0.8+100*0.2=16

Mc[W]=0

По результатам видно, что целесообразней принять стратегию А, так как ее выбор дает в среднем больший выигрыш. Но для большой достоверности можно провести эксперимент. Допустим, выбрав урну, мы сначала вынимаем один шар, а затем определяем, к какому типу она принадлежит. Если мы вынем два шара, то точность определения урны возрастет, но эксперимент станет дороже. Также можно менять условия эксперимента. Можно вынуть шар и положить обратно, а можно отложить. Лучше шар возвращать в урну, так как среда должна оставаться реальной, а опыты независимы.

Итак, проведем опыт: будем вынимать один шар перед тем как определить тип урны.

Появился белый шар, тогда:

вероятность,что это урна типа А

P(A/Б)= [P(A)*P(Б/A)] [P(A)*P(Б/A)+P(B)*P(Б/B)]=0.56/0.58

 

вероятность, что это урна типа В

P(B/Б)=1-P(A/Б)=0.02/0.58

 

Тогда Мб[W/a]=40*0.56/0.58-20*0.02/0.58=37,93

Мб[W/b]=4.43

Из расчетов видно, что если мы будем проводить эксперимент и вынем белый шар, а затем определим тип урны как А, то наш выигрыш по сравнению с первым случаем будет на 12 единиц выше.

Если появился черный шар, тогда:

Мч[W/а]=14.5

Мч[W/b]=40.15

 

Субъективные вероятности.

Если рассматривать вероятность как объективную меру, то она не зависит от ЛПР. Но в некоторых случаях удобно назначать вероятности на основе собственных представлений. При этом главное, чтобы выполнялись основные аксиомы теории вероятности. Такие назначаемые вероятности называются субъективными вероятностями. Существуют разные процедуры, помогающие субъекту назначать вероятности. Рассмотрим одну из них.

Метод эталонных лотерей.

Задача: как организовать процедуру назначения субъективной вероятности, чтобы помочь ЛПР.

Пример. Играют две футбольные команды, имеющие сравнительно равные силы. Болельщики делают ставки на предполагаемого победителя. Им предлагается два типа лотереи:

1. Человек делает ставку на команду, исходя из личных симпатий и предыдущих заслуг команды.

2. Есть 100 билетов, из которых, например, 2 выигрышных.

Если человек уверен, что выиграет команда №1, то при малом количестве выигрышных билетов во второй лотереи он будет выбирать первую лотерею. Но по мере увеличения числа выигрышных билетов (от 2 до 80) человек начинает колебаться, в какую лотерею ему сыграть. Каждый раз субъект оценивает вероятность выигрыша 1ой команды и сравнивает ее с вероятностью выигрыша во второй лотереи при данном количестве счастливых билетов. Если таких билетов 80, и человек при таком количестве начинает выбирать первую лотерею, следовательно, он оценил вероятность выигрыша команды №1 как 80/100. Вторая лотерея называется эталонной, а процедуру называют назначением вероятностей с помощью эталонных лотерей. Момент, когда человеку становится безразлично, какую лотерею выбрать, называется точкой безразличия.

Обычно наряду с прямой лотереей проводят обратную лотерею и смотрят, где в этом случае находится точка безразличия. При этом сумма вероятностей должна быть равна 1, иначе необходима корректировка. Также вероятности следует проверять на транзитивность.

 

 

4.2.3.Статистически неопределенная ситуация.

В статистически неопределенной ситуации, когда случайные факторы не имеют статистического описания, выполнить вероятностное осреднение, или найти вероятность не представляется возможным. По этой причине мы не можем воспользоваться принципом наилучшего среднего результата, или принципом вероятностной гарантии. В этой ситуации используют другие подходы.

Игровая ситуация.. Эта ситуация, как уже говорилось ранее, предполагает наличие двух сторон: оперирующей, в интересах которой ведется поиск решений, и конкурирующей, которая может противостоять оперирующей стороне (антагонистические игры), сотрудничать с ней (кооперативные игры) или же действовать бессознательно (игры с природой).

Пусть U - вектор управления (решений) оперирующей стороны,

S - состояние внешней среды (действия конкурента).

а) Оперирующей стороне известно множество возможных действий конкурента, но неизвестно какое именно он выберет. Если при этом конкурент является антагонистом оперирующей стороны, то разумно использовать принцип наилучшего гарантированного результата. Суть принципа заключается в том, что выбор оптимального решения ведется при наихудших значениях факторов управляемых конкурирующей стороной.

В этом случае оптимальное решение запишется в виде

 

. U0 = arg max min W(U,S,C) (8)

u s

 

Ф-ла (8) отражаетпринцип максимина. В соответствии с ним оперирующая сторона выбирает свое решение в предположении, что конкурирующая сторона информирована о ее возможных действиях, и выбирает такое значение фактора S, которое обеспечивает наихудший результат операции, осуществляемой оперирующей стороной.

Рассуждая аналогичным образом, конкурирующая сторона будет выбирать решения, исходя из ф-лы (9), отражающей принцип минимакса.

 

U0 =arg min max W(U,S,C)) (9)

s u

 

Обе формулы относятся к случаю, когда обе стороны стремятся к увеличению значений критерия. Если направление критерия изменить, то min и max следует поменять местами.

Рассмотрим ситуацию, когда конкурент помогает оперирующей стороне, т.е. управляемые им факторы принимают значения на множестве, наиболее благоприятные для операции, осуществляемой оперирующей стороной. Тогда оптимальная стратегия запишется в виде:

 

U 0 =arg max max W(U,S,C), или arg min min W(U,S,C) (10)

u s u s

Этот подход называют принципом максимакса или минимина в зависимости от смысла критерия.

Применение оперирующей стороной принципа (10) связано с большой степенью риска. Использовать на практике этот принцип в случае противодействия конкурирующей стороны неразумно. Однако принимать решения с некоторой степенью риска все же возможно. В этом случае можно объединить рассмотренные выше стратегии в одну, Эта смесь, основанная на принципе субъективного риска, определяется Формулой Гурвица:

U0=arg max [(1-a) minW(U,S,C)+a maxW(U,S,C)] (11)

 

Значения показателя aÎ[0,1] выбирается оперирующей стороной и отражает степень рискованности решения.

При a=0 риск отсутствует и мы получаем принцип максимина, а при a=1 риск наибольший и это принцип максимакса. Его также именуют обобщенным максимином (естественно, что, изменив направление критерия, получим обобщенный минимакс).

Нечеткая ситуация. Наиболее принципиальным моментом, отличающим эту ситуацию от всех предыдущих, является то, что решение носит также нечеткий характер и описывается с помощью функции принадлежности. Иными словами, для принятия окончательного решения надо производить выбор на нечетком множестве. К этой задаче существует несколько различных подходов. Укажем некоторые из них.

а) На нечетком множестве решений выделяется подмножество, для элементов которого значения функции принадлежности не менее, чем а, где «а» - некоторый заданный уровень. На этом подмножестве ЛПР выбирает конкретное решение. Этот подход аналогичен выбору решений на парето-оптимальном множестве. Если функция принадлежности, задающая нечеткие исходные данные, имеет смысл вероятности того, что наудачу выбранный эксперт признает данный элемент принадлежащим нечеткому множеству, то при таком подходе можно утверждать, что решения, принимаемые ЛПР, основываются на данных, поддержанных не менее, чем 100а% экспертов.

б) В качестве оптимального ЛПР выбирает тот элемент нечеткого множества «подходящих» решений, которому отвечает наибольшее значение функции принадлежности. В некотором смысле такое решение можно рассматривать как наиболее надежное.

в) Вычисляется положение центра тяжести фигуры ограниченной функцией принадлежности решений нечеткому множеству «подходящих», и в качестве оптимального, выбирается координата этого центра тяжести.

Помимо указанных существуют и другие подходы к оптимизации решений в нечеткой ситуации. В частности, в / / описан алгоритм нечеткой оптимизации с использованием так называемых нечетких оптимизирующих множеств.

 

 

 



Поделиться:


Последнее изменение этой страницы: 2016-08-12; просмотров: 222; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.145.77.114 (0.023 с.)