Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь FAQ Написать работу КАТЕГОРИИ: ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву
Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Метод динамического программирования. Принцип оптимальности и уравнение Беллмана.Содержание книги
Поиск на нашем сайте Метод динамического программирования состоит в том что оптимальное управление строится постепенно. На каждом шаге оптимизируется управление только этого шага. Вместе с тем на каждом шаге управление выбирается с учётом последствий, так как управление, оптимизирующее целевую функцию только для данного шага, может привести к неоптимальному эффекту всего процесса. Управление на каждом шаге должно быть оптимальным с точки зрения процесса в целом. Это основное правило динамического программирования, сформулированное Беллманом, называется принципом оптимальности. Так, если система в начале k - шага находится в состоянии Выбрав оптимальное управление Назовем величину
получившего название основного функционального уравнения динамического программирования, или основного рекуррентного уравнения Беллмана. Из уравнения (1) может быть получена функция
Решая уравнение (1) для определения условного максимума показателя эффективности за В результате последовательного решения п частных задач на условный максимум определяют две последовательности функций: Если начальное состояние определяют максимум целевой функции
а затем - искомое безусловное оптимальное управление по цепочке
Если задано множество
откуда находят В рассмотренных рекуррентных соотношениях предписывают начинать вычисления с последнего этапа и затем передвигаться назад до этапа 1. Такой метод вычислений известен как алгоритм обратной прогонки. Если расчеты осуществляются в естественном порядке следования этапов, то такой метод вычислений известен как алгоритм прямой прогонки. Приведем рекуррентные соотношения для этого случая. Уравнения состояний для прямого хода удобно записывать в виде
Введем в рассмотрение условные максимумы показателя эффективности за k шагов, от 1-го до k- говключительно, - величину
В результате решения этих уравнений получим последовательности
Далее определим безусловное оптимальное управление по цепочке
|
||
|
Последнее изменение этой страницы: 2016-09-05; просмотров: 349; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 216.73.216.62 (0.009 с.) |