Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Оптимальное распределение инвестиций как задача динамического программирования.

Поиск

Инвестор выделяет средства в размере D условных единиц, которые должны быть распределены между n -предприятиями. Каждое k -тое предприятие при инвестировании в него средств x приносит прибыль Wk (S, xk) условных единиц, k=1...n. Нужно выбрать оптимальное распределение инвестиций между предприятиями, обеспечивающее максимальную прибыль.

Выигрышем F в данной задаче является прибыль, приносимая n -предприятиями.

Построение математической модели:

1. Определение числа шагов. Число шагов n равно числу предприятий, в которые осуществляется инвестирование.

2. Определение состояний системы. Состояние системы на каждом шаге характеризуется количеством средств Sk, имеющихся в наличии перед данным шагом, .

3. Выбор шаговых управлений. Управление на k -м шаге является количество средств, инвестируемых в k -тое предприятие.

4. Функция выигрыша на k -м шаге:

(53.1)

это прибыль, которую приносит k- тое предприятие при инвестировании в него средств .

, (53.2)

следовательно, данная задача может быть решена методом динамического программирования.

5. Определение функции перехода в новое состояние.

. (53.3)

Таким образом, если на k -м шаге система находилась в состоянии , а выбрано управление , то на (k+1) -м шаге система будет находиться в состоянии . Другими словами, если в наличии имеются средства в размере у.е., и в k -тое предприятие инвестируется у.е., то для дальнейшего инвестирования остается () у.е.

6. Составление функционального уравнения для k=n:

, (53.4)

. (53.5)

На последнем шаге, т.е. перед инвестированием средств в последнее предприятие, условное оптимальное управление соответствует количеству средств, имеющихся в наличии; т.е. сколько средств осталось, столько и надо вложить в последнее предприятие. Условный оптимальный выигрыш равен доходу, приносимому последним предприятием.

7. Составление основного функционального уравнения.

Подставив в формулу (53.2) выражения (53.1) и (53.3), получим следующее функциональное уравнение:

(53.6)

Поясним данное уравнение. Пусть перед k -м шагом у инвестора остались средства в размере у.е. Тогда у.е. он может вложить в k -тое предприятие, при этом оно принесет доход , а оставшиеся () у.е.—в остальные предприятия с k+1 -го до n- го. Условный оптимальный выигрыш от такого вложения . Оптимальным будет то условное управление , при котором сумма и максимальна.

Пример: D =5000, n =3. Значения , заданы в таблице 34.1.

Таблица 53.1

тыс. усл. ед. тыс. усл. ед. тыс. усл.ед. тыс. усл.ед.
  1,5   1,7
    2,1 2,4
  2,5 2,3 2,7
    3,5 3,2
  3,6   3,5

Для . (53.7)

Для простоты в задаче сделано предположение, что вкладываются только тысячи условных единиц.

Проведем условную оптимизацию.

По ее результатам заполняется таблица 53.2.

Таблица 53.2

S k=3 k=2 k=1
    1,7        
    2,4   3,7    
    2,7   4,4    
    3,2   4,7    
    3,5 1/4 5,2   6,4

 

В первой колонке таблицы записываются возможные состояния системы S=1..5, в верхней строке - номера шагов i =1..3. На каждом шаге определяются условные оптимальные управления и уcловные оптимальные выигрыши .

· Проведение условной оптимизации для последнего шага i =3. Функциональное уравнение на последнем шаге имеет вид:

, (53.8)

поэтому два столбца таблицы 33.2, соответствующие i =3, заполняются автоматически по таблице 33.1 исходных данных.

· Условная оптимизация для i =2. Функциональное уравнение

. (53.9)

Для проведения условной оптимизации заполним ряд вспомогательных таблиц (таблицы 34.3—34.8), соответствующих различным значениям S, т.е. различным исходам окончания предыдущего шага.

1) S=1

Таблица 53.3

      1,7 1,7
         

, следовательно , .

2) S=2

Таблица 53.4

      2,4 2,4
      1,7 3,7
    2,1   2,1

, следовательно ;

3) S=3

 

Таблица 53.5

      2,7 2,7
      2,4 4,4
    2,1 1,7 3,8
    2,3   2,3

, следовательно ;

4) S=4

Таблица 53.6

      3,2 3,2
      2,7 4,7
    2,1 2,4 4,5
    2,3 1,7  
    3,5   3,5

, следовательно ; .

5) S=5

 

Таблица 53.7

      3,5 3,5
      3,2 5,2
    2,1 2,7 4,8
    2,3 2,4 4,7
    3,5 1,7 5,2
         

Для S =5 возможны два условных варианта управления: и .

· Условная оптимизация для i =1.

Перед первым шагом состояние системы известно.

S = D =5 тыс. у.е., и условную оптимизацию следует проводить только для этого значения

S =5

 

Таблица 53.8

      5,2 5,2
    1,5 4,7 6,2
      4,4 6,4
    2,5 3,7 6,2
         
    3,6   3,6

, следовательно, , .

Оптимальная прибыль, приносимая тремя предприятиями при инвестировании в них 5000 у.е., равна 6,4 тыс. у.е.

.

Проведем безусловную оптимизацию.

Ее результаты отмечены в таблице 34.2.

Для i =1 ; .

Для i =2 по формуле (34.3) .

; .

Для i =3 .

; .

.

Следует пронимать, что полученное решение есть лишь некоторое приближение к оптимальному решению. Его можно улучшить, т.е. приблизить к оптимальному, взяв более мелкий шаг оптимизации, например, вкладывать в предприятия средства, кратные 500 у.е.

 

Теория игр. Игровые модели.

Игра – это идеализированная математическая модель коллективного поведения: несколько индивидуумов (участников, игроков) влияют на ситуацию (исход игры), причем их интересы (их выигрыши при различных возможных ситуациях) различны.

Математическая теория определяет теорию игр, как раздел математики, ориентированный на построение формальных моделей принятия оптимальных решений в ситуации конкурентного взаимодействия. Данное определение главной задачей теории игр ставит последовательность действий эффективного поведения в условиях конкуренции, конфликтности.).

В теории игр участников конкурирующего взаимодействия называют игроками, каждый из них имеет непустое множество допустимых действий, совершаемых им по ходу игры, которые называются ходами или выборами. Набор всех возможных ходов по одному из списка возможных ходов каждого игрока (участвующих в парах, тройках и т.д. ходов) называется стратегией. Грамотно построенные стратегии взаимно исключают друг друга, т.е. взаимно исчерпывают все способы поведения игроков. Исходом игры называется реализация игроком выбранной им стратегии. Каждому исходу игры соответствует определяемое игроками значение полезности (выигрыша), называемое платежом.

Классификацию игр можно проводить: по количеству игроков, количеству стратегий, характеру взаимодействия игроков, характеру выигрыша, количеству ходов, доступности информации и т.д.

1. В зависимости от количества игроков различают парные игры и игры n игроков. Математический аппарат реализации парных игр наиболее проработан. Игры трёх и более игроков исследовать сложнее из-за трудностей технической реализации алгоритмов решения.

2. По количеству стратегий игры бывают конечные и бесконечные. Конечной называется игра с конечным числом возможных стратегий игроков. Если же хотя бы один из игроков имеет бесконечное количество возможных стратегий, то игра называется бесконечной.

3. По характеру взаимодействия игры делятся на:

· бескоалиционные: игроки не имеют права вступать в соглашения, образовывать коалиции;

· коалиционные (кооперативные) – игроки могут вступать в коалиции.

В кооперативных играх коалиции жестко заданы на этапе постановки задачи и не могут меняться во время игры.

4. По характеру выигрышей игры делятся на:

· игры с нулевой суммой (общий капитал всех игроков не меняется, а перераспределяется между игроками; сумма выигрышей всех игроков равна нулю);

· игры с ненулевой суммой.

5. По виду функций выигрыша игры делятся на: матричные, биматричные, непрерывные, выпуклые, сепарабельные, дуэли и др.

Матричная игра – это конечная парная игра двух игроков с нулевой суммой, в которой задаётся выигрыш игрока 1 в виде матрицы (строка матрицы соответствует номеру применяемой стратегии игрока 2, столбец – номеру применяемой стратегии игрока 2; на пересечении строки и столбца матрицы находится выигрыш игрока 1, соответствующий применяемым стратегиям).

Для матричных игр доказано, что любая из них имеет решение и оно может быть легко найдено путём сведения игры к задаче линейного программирования.

Биматричная игра – это конечная игра двух игроков с ненулевой суммой, в которой выигрыши каждого игрока задаются матрицами отдельно для соответствующего игрока (в каждой матрице строка соответствует стратегии игрока 1, столбец – стратегии игрока 2, на пересечении строки и столбца в первой матрице находится выигрыш игрока 1, во второй матрице – выигрыш игрока 2.)

Для биматричных игр также разработана теория оптимального поведения игроков, однако решать такие игры сложнее, чем обычные матричные.

Непрерывной считается игра, в которой функция выигрышей каждого игрока является непрерывной в зависимости от стратегий. В теории математики доказано, что игры этого класса имеют решения, однако пока не разработано практически приемлемых методов их нахождения.

Целью любой игры является максимизация каждым игроком своей выгоды. Смысл математической теории игр, построенной на приведенной выше классификации, состоит в формализации (упрощении) и облегчении оптимального выбора. Множество всех возможных стратегий игр составляет большое число, растущее тем сильнее, чем больше игроков и набор доступных каждому ходов. Так для пары игроков, если условия игры позволяют каждому совершить по n ходов, в игре существует 2n стратегий.

Простой перебор и оценка (сравнение) такого числа стратегий представляют собой технически очень сложную задачу и неприемлемы на практике. Математический аппарат позволяет значительно снизить число требующих анализа и сравнения стратегий, отбросив заведомо неэффективные. Когда же получен ограниченный, разумный для анализа набор точек равновесия (одинаково предпочитаемых всеми игроками исходов игры), на основе анализа выигрышей игроков, выбирается наиболее рациональный результат. При выборе результата существуют два основных подхода, которые дают название окончательной стратегии игры:

· Минимаксная стратегия (выбор из максимальных (наихудших) проигрышей минимальных (наилучших).

· Максиминная стратегия (выбор из минимальных (наихудших) выигрышей максимальных (наилучших).

Развитием теории игр с использованием методов вероятностного анализа является математическая теория принятия решений. Эта теория оперирует не действительным (актуальным) решением, а средним, которое есть ожидаемое решение игры в течение ее многократного повторения. Данное свойство актуально для решения правовых задач, поскольку нормативный характер права означает, что оно ориентировано на неопределенного субъекта и предполагает многократное повторение правоотношений. Чтобы не вдаваться в глубокие математические выкладки, отметим лишь, что теория принятия решений предлагает систему критериев (например, критерий Гурвица, Хаджи-Лемана, критерий ожидаемого значения), которые с помощью вероятностного анализа исходов игр позволяют осуществить выбор оптимального решения в условиях риска и неопределенности.



Поделиться:


Последнее изменение этой страницы: 2016-12-14; просмотров: 807; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.219.13.244 (0.009 с.)