Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ

Принцип оптимальности Беллмана

⇐ ПредыдущаяСтр 11 из 13Следующая ⇒

Основным методом динамического программирования является метод рекуррентных соотношений; который основывается на использовании принципа оптимальности, разработанного американским математиком Р.Беллманом.

Суть принципа:

Каковы бы ни были начальное состояние на любом шаге и управление, выбранное на этом шаге, последующие управления должны выбираться ОПТИМАЛЬНЫМИ относительно состояния, к которому придет система в конце каждого шага.

Использование данного принципа гарантирует, что управление, выбранное на любом шаге, не локально лучше, а лучше с точки зрения процесса в целом.

Условная оптимизация

Безусловная оптимизация

S_i – состояние системы на i-м шаге. Основная рекуррентная формула динамического программирования в случае решения задачи максимизации имеет вид:

, где максимум в данной формуле берется по всем возможным решениям в ситуации, когда система на шаге m находится в состоянии i.

Величина f_m(i) – есть максимальная прибыль завершения задачи из состояния i, если предположить, что на шаге m, система находится в состоянии i.

Максимальная прибыль может быть получена максимизацией суммы прибылей самого шага m и максимальной прибыли шага (m+1) и далее, чтобы дойти до конца задачи.

Планируя многошаговую операцию надо выбирать управление на каждом шаге с учетом всех его будущих последствий на ещё предстоящих шагах.

Управление на i-м шаге выбирается не так, чтобы выигрыш именно на данном шаге был максимальным, а так, чтобы была максимальна сумма выигрышей на всех оставшихся шагах плюс данный шаг.

Среди всех шагов последний шаг планируется без оглядки на будущее, т.е. чтобы он сам, как таковой принес наибольшую выгоду.

Задача динамического программирования решается в два этапа:

1 этап (от конца к началу по шагам): Проводится условная оптимизация, в результате чего находится условные оптимальные управления и условные оптимальные выигрыши по всем шагам процесса.

2 этап (от начала к концу по шагам): Выбираются (просчитываются) уже готовые рекомендации от 1-го шага до последнего и находится безусловное оптимальное управление х*, равный х*₁, х*₂, …, х*_m.

Пример. Имеется запас средств, который нужно распределить между предприятиями, чтобы получить наибольшую прибыль. Пусть начальный капитал S₀ =100 д.ед. Функции дохода предприятий даны в матрице прибылей по каждому предприятию.

Х	1 предприятие f (х₁)	2 предприятие f (х₂)	3 предприятие f (х₃)	4 предприятие f (х₄)
20	3	2	3	3
40	4	5	4	6
60	9	8	9	8
80	11	7	5	7
100	12	15	12	14

Используем принцип Беллмана. Каковы бы ни были начальное состояние на любом шаге и управление, выбранное на этом шаге, последующие управления должны выбираться оптимальными относительно состояния, к которому придет система в конце каждого шага.

Схема решения:

Математическая модель задачи:

Экономический смысл переменных:

x_i – количество денег, вкладываемых в i предприятие.

S_i – количество денег, оставшихся после вложения в i-предприятие (состояние системы на i-шаге);

F(x_i) – прибыль от вложенной суммы денег;

S₀ – начальный капитал.

Рассмотрим 4-й шаг:

На 4-ом предприятии может остаться либо 0, либо 20, либо 40, либо 60, либо 80, либо 100 ден. ед. Тогда прибыль от вложения денег можно получить следующую.

S₃	Х₄	f (x₄)	F₄
0	0	0	0
20	20	3	3
40	40	6	6
60	60	8	8
80	80	7	7
100	100	14	14

Рассмотрим 3-й шаг:

На 3-ем и 4-ем предприятии может остаться либо 0, либо 20, либо 40, либо 60, либо 80, либо 100 ден. ед. Рассмотрим первую возможность. Если 3-му предприятию мы выдаем 20 ден. ед. то 4-му предприятию ничего не остается, и наоборот. Соответственно 40 ден. ед. можно поделить так (0;40), (20;20);

60 ден. ед. – (0;60), (20;40), (40;20), (60;0).

Прибыль от вложения денег в 3-е предприятие берется в исходной матрице прибылей, а прибыль от вложений, денег в 4-е предприятие берется из таблицы предыдущего шага

Прибыль на 3-м шаге берется максимальной по каждому вложению.

Вклад

Проект

Остаток

Прибыль из матрицы

Прибыль за шаг

Прибыль на шаге

S₂

Х₃

S₃

f (x₃)

F₄

f+ F

F₃

100

Рассмотрим 2 -й шаг:

Вклад	Проект	Остаток	Прибыль из матрицы	Прибыль за шаг		Прибыль на шаге
S₁	Х₂	S₂	f (x₂)	F₃	f+ F	F₂
0	0	0	0	0	0	0
20	0	20	0	3	3	3
20	20	0	2	0	2	3
40	0	40	0	6	6	6
	20	20	2	3	5
	40	0	5	0	5
60	0	60	0	9	9	9
	20	40	2	6	8
	40	20	5	3	8
	60	0	8	0	8
80	0	80	0	12	12	12
	20	60	2	9	11
	40	40	5	6	11
	60	20	8	3	11
	80	0	7	0	7
100	0	100	0	15	15	15
	20	80	2	12	14
	40	60	5	9	14
	60	40	8	6	14
	80	20	7	3	10
	100	0	15	0	15

Рассмотрим 1-й шаг:

Вклад	Проект	Остаток	Прибыль из матрицы	Прибыль за шаг		Прибыль на шаге
S₀	Х₁	S₁	f (x₁)	F₂	f+ F	F₁
100	0	100	0	15	15	15
	20	80	3	12	15
	40	60	4	9	13
	60	40	9	6	15
	80	20	11	3	14
	100	0	12	0	12

Анализ результатов:

Максимальная прибыль равна 15 д.ед. Расположить денежные средства между проектами можно несколькими способами:

1) 1 предприятие – 0 ден. ед., 2 предприятие – 0 ден. ед., 3 предприятие – 60 ден. ед., 4 предприятие т – 40 ден. ед.

2) 1 предприятие – 0 ден. ед., 2 предприятие – 100 ден. ед., 3 предприятие – 0 ден. ед., 4 предприятие – 0 ден. ед.

3) 1 предприятие – 20 ден. ед., 2 предприятие – 0 ден. ед., 3 предприятие – 60 ден. ед.., 4 предприятие – 20 ден. ед.

4) 1 предприятие – 60 ден. ед., 2 предприятие – 0 ден. ед., 3 предприятие – 20 ден. ед., 4 предприятие – 20 ден. ед.

5) 1 предприятие – 60 ден. ед., 2 предприятие – 0 ден. ед., 3 предприятие – 0 ден. ед., 4 предприятие т – 40 ден. ед.

⇐ Предыдущая 4 5 6 7 8 9 101112 13 Следующая ⇒

Рынок недвижимости. Сущность недвижимости

Решение задач с использованием генеалогического метода

История происхождения и развития детской игры

Последнее изменение этой страницы: 2021-02-07; просмотров: 146; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.17.79.59 (0.019 с.)