Московский энергетический институт 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Московский энергетический институт



МОСКОВСКИЙ ЭНЕРГЕТИЧЕСКИЙ ИНСТИТУТ

(ТЕХНИЧЕСКИЙ УНИВЕРСИТЕТ)

 

 

М.Б. Коломейцева

 

 

АДАПТАЦИЯ И ОПТИМИЗАЦИЯ В СИСТЕМАХ АВТОМАТИЧЕСКОГО УПРАВЛЕНИЯ.

 

Учебное пособие по курсам

 

«Теория управления»

«Теория автоматического управления»

«Основы теории цифрового управления»

 

Для студентов, обучающихся по направлениям

 

«Автоматизация и управление»

«Информатика и вычислительная техника»

«Электротехника, электромеханика и электротехнологии»


Оглавление

Часть I Методы теории оптимизации динамических систем.. 4

Введение. 4

§ 1. Постановка задачи оптимального управления. 4

§2. Классификация задач оптимального управления. 7

Глава I. РЕШЕНИЕ ЗАДАЧИ ОПТИМАЛЬНОГО УПРАВЛЕНИЯ НА ОСНОВЕ ВАРИАЦИОННОГО ИСЧИСЛЕНИЯ И МЕТОДА МНОЖИТЕЛЕЙ ЛАГРАНЖА. 10

§1.1. Метод множителей Лагранжа. 10

§ 1.2. Уравнение Эйлера-Лагранжа. 13

§1.3. Решения задачи оптимального управления при наличии интегральных ограничений. 22

Глава II. ПРИНЦИП МАКСИМУМА.. 26

§2.1. Задача с закрепленными концами и фиксированным временем. 27

§2.2. Задача с подвижными концами и нефиксированным временем. 30

§ 2.3. Задача быстродействия для траектории с закреплёнными концами. 31

Глава III. МЕТОД ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ.. 38

§3.1. Принцип оптимальности Беллмана. 38

§3.2. Решение дискретных задач оптимизации. 39

§3.3. Необходимые условия оптимальности для непрерывных систем.. 43

Часть II Адаптивные системы автоматического управления. 52

Глава I: Основные понятия адаптивных систем управления. 52

§ 1. Определение адаптивной системы управления. Функциональная блок-схема системы. 52

§2. Классификация и способы реализации структур адаптивных систем управления. 54

§3. Вычислительные аспекты алгоритма адаптации. 58

Глава II: Варианты построения адаптивных систем. 66

§4. Адаптивная система с определением градиента методом вспомогательного оператора, содержащая настраиваемую модель (идентификационного типа). 66

§5. Адаптивная система управления с эталонной моделью. 70

§ 6 Адаптивная система управления с неявной эталонной моделью. 72

§ 7. Самонастраивающиеся системы со стабилизацией качества управления. 77

§ 8. Адаптивная система с нечетким регулятором. 79

§9. Экстремальные системы управления. 86

§10 Аналитическая самонастраивающаяся система по внешним воздействиям. 88

Литература. 90

Контрольные вопросы.. 92

 

 


Часть I Методы теории оптимизации динамических систем

Введение.

 

Назначение систем автоматического управления (САУ) динамическими объектами – обеспечить заданное (желаемое) изменение выходных переменных или, что то же самое, обеспечить заданное движение объекта в пространстве состояния. Исследование и синтез САУ проводится на основе теории автоматического управления, методы которой позволяют решить два основных вопроса: обеспечить устойчивость и получить требуемое качество работы системы. Решение задачи синтеза является неоднозначным, и поэтому появляется возможность следующей постановки задачи управления: обеспечение «наилучшего» движения объекта исходя из выбранного критерия. Система автоматического управления, реализующая такое движение, называется оптимальной. Оптимальность САУ обеспечивается либо за счет оптимизации параметров и структуры системы, либо путем реализации оптимального управляющего воздействия (оптимальной программы управления). Во всех случаях решением проблемы оптимального движения объекта занимается теория оптимального управления, начало которой было положено методом вариационного исчисления.

 

 

Рис.1.

 

Где , - координаты положения ракеты, , - координаты скорости, - масса ракеты, - величина тяги двигателя, - угол между направлением тяги и осью , - секундный расход массы. Кроме силы тяги на ракету действует сила тяжести, сопротивление атмосферы и т.д. Суммарные проекции этих сил на координатные оси обозначены через и (рис.1). Для рассматриваемой задачи множество - это некоторая заданная область пространства, окружающего Землю, допустимая для движения ракеты. Траектория ракеты не может пересекать поверхность Земли, не должна заходить в зону радиационных поясов и т.п. Управление полетом ракеты осуществляется за счет регулирования величины и направления вектора тяги двигателя: управляющие функции – это тяга и угол . Тогда множество - это множество тех значений , которые допустимы из конструктивных соображений. Кроме того, могут быть заданы начальное положение, скорость и масса ракеты. Тогда первое из условий (3) можно представить:

 

, , , ,

 

где , , , , - фиксированные числа.

Предположим, что ракета должна быть выведена на круговую орбиту заданного радиуса . Тогда второе из условий (3) будет иметь вид:

 

(2п)

 

где - скорость соответствующего кругового вращения. Первое их этих условий означает, что точка с координатами в момент времени направлена по касательной к окружности заданного радиуса R. Второе условие означает, что радиус орбиты R и скорость движения по круговой орбите , имеющие соответствующие компоненты и , ортогональны, т.е. скорость точки в момент направлена по касательной к окружности заданного радиуса. Из третьего условия следует, что скорость движения объекта при должна равняться скорости движения по круговой орбите. Условия (2п) гарантируют, что если при двигатель будет выключен, то последующее свободное движение будет движение по окружности. Цель управления содержится во втором условии (3). Достижение системой (1п) за заданное время некоторого конечного состояния (например, достижение аппаратом заданной высоты, или выход аппарата на орбиту) может быть реализовано бесчисленным множеством вариантов управляющих воздействий (или программных движений). Это обстоятельство позволяет ставить вопрос об отыскании управления, оптимального в смысле выбранного критерия. Тогда это уже будет постановка задачи оптимального управления. В технических задачах часто возникает вопрос об отыскании наиболее «экономного» управления. В рассматриваемом примере управление ракетой будет более экономичным, если меньшее количество топлива будет израсходовано. Математическое выражение этого факта, согласно последнему уравнению (1п), состоит в том, что управление должно быть выбрано из условия минимума интеграла:

(3п)

Функция называется оптимальным управлением или оптимальной программой, если она удовлетворяет всем ограничениям, обеспечивает достижение объектом цели управления и доставляет минимальное значение интегралу (3п). Не менее часто встречается и другая постановка задачи. Например, при заданной энергии, которая может быть израсходована для вывода ракеты, заданном времени вывода и заданном расстоянии до перигея необходимо так построить программу управления, то есть выбрать функцию и соответствующую ей траекторию , чтобы расстояние до апогея было максимальным. При соответствующем выборе переменных эта техническая постановка задачи сводится к отысканию управления, минимизирующего функционал

 

 

где - некоторая компонента вектора . Первая из задач называется задачей Лагранжа, вторая – задачей Майера.

 

Метод множителей Лагранжа.

 

Задачи на определение координат экстремума () функции многих переменных принято называть экстремальными. При этом возможны два варианта постановки задачи. Допустимая область существования , в которой ищется , обеспечивающий не ограничена. Такие задачи называются задачами на безусловный экстремум. Согласно определению функция имеет в точке минимум (максимум) если выполняется неравенство

 

(минимум) (максимум) (1.1)

 

Правило решения таких задач сформулировано в теореме Ферма.

Теорема 1.1 Пусть функция многих переменных дифференцируема в точке . Для того, чтобы в этой точке существовал экстремум (минимум или максимум) функции необходимо выполнение условия

 

при при (1.2)

 

Доказательство теоремы основывается на том факте, что при малом изменении какого-либо аргумента, например, придания значения , значение функции описывается соотношением

 

(1.3)

 

Далее делается допущение, что является точкой минимума . Выбирая достаточно малым и придавая ему произвольный знак, всегда можно добиться того, чтобы условие (1.1) было нарушено, если не выполнено условие (1.2), что противоречит прямому допущению. Точки , в которых выполняется соотношение (1.2), называют стационарными.

Если принадлежит ограниченной области и не является внутренней точкой , то условие (1.2) не является необходимым. Например, пусть допустимыми являются только значения и точка такова, что какая-либо компонента, например, . Тогда в этой точке может достигаться минимум, если даже , что также прямо следует из (1.3), поскольку в этой формуле можно выбирать только . Как правило, допустимая область явно задается с помощью системы условий в виде уравнений или неравенств, которым должны удовлетворять значения . Кратко это можно записать в виде:

 

(1.4)

 

Экстремальная задача при наличии ограничений на называется задачей на условный экстремум. Если определен экстремум функции при наличии ограничений, то этот экстремум называется условным (локальным).

Для решения задач на экстремум функции многих переменных французским математиком Лагранжем в веке был предложен метод, который получил название «метод множителей Лагранжа».

Пусть ограничения на область имеют форму равенств , требуется определить

 

(1.5)

 

Для решения задачи составляется функция Лагранжа (лагранжиан) как сумма экстремизируемой функции и функций ограничения умноженных на множители Лагранжа , :

 

(1.6)

 

Далее, согласно методу Лагранжа решается задача на экстремум функции без ограничений. Следовательно, метод Лагранжа позволяет свести задачу на условный экстремум к задаче на безусловный экстремум. Сформулированная ниже теорема показывает что стационарные точки исходной и приведенной задачи совпадают. Однако, надо отметить, что вид экстремума (min или max, точка перегиба) может не совпадать.

Теорема 1.2. Пусть в задаче (1.5) все функции непрерывно дифференцируемы в окрестности точки . Если - точка локального экстремума в задаче (1.5), то необходимо существование множителей Лагранжа , не равных одновременно нулю и таких, что выполняются условия стационарности функции Лагранжа по .

 

при

(1.7)

 

Если при этом выполняются условия регулярности , то заведомо существуют такие , причем [2]. Нужно заметить, что множители Лагранжа определены с точностью до пропорциональности. Если известно, что , то можно, умножив все на константу, добиться равенства . Тогда число уравнений (1.7) сравняется с числом неизвестных. Согласно содержанию метода Лагранжа, точки являются подозрительными на экстремум. Для того, чтобы выяснить, будет ли в этих точках в действительности реализовываться локальный минимум, максимум или точка перегиба, нужно провести дополнительные исследования либо путем привлечения вторых производных функций Лагранжа по переменной , либо путем вычисления .

Теперь рассмотрим вопрос применения метода множителей Лагранжа при наличии ограничений в виде неравенств. Для определенности рассмотрим задачу:

определить (1.8)

 

где - гладкие функции, . Путем введения новых переменных превратим ограничения неравенства в уравнения:

 

(1.9)

 

Переменная берется в квадрате для того, чтобы не вводить ограничения на ее знак, обеспечивающий равенство (1.9). Решение задачи (1.8) с учетом (1.9) проводим по вышеописанной методике. Составляем расширенный лагранжиан:

 

, (1.10)

 

Функция , в отличие от , зависит от переменных . Необходимые условия безусловного экстремума состоят из следующих уравнений:

Условия минимума по :

 

, (1.11)

 

Условия минимума по

 

, (1.12)

 

При этом минимум достигается только при условии

 

, (1.13)

 

Ограничения (1.13) называются условиями неотрицательности. Они имеют тот же смысл, что и в линейном программировании. При отсутствии ограничения на величину (всегда положительного слагаемого) и при решении задачи на минимум функции отрицательное значение дает . Условия (1.12) означают, что в точке минимума либо , либо , т.е. с учетом (1.9):

 

, (1.14)

 

Эти условия обычно называют условиями дополняющей нежесткости (если какое-либо неравенство выполняется в точке минимума нежестко, т.е. точка не лежит на поверхности, определенной условием (1.9), то соответствующий множитель должен быть жестко равен нулю или наоборот). Строгий результат может быть сформулирован в виде теоремы [3].

Теорема 1.3. Для того, чтобы в точке достигался минимум функции в области

, необходимо, чтобы существовали числовые множители , , не равные одновременно нулю, и такие, чтобы они совместно с удовлетворяет системе условий:

 

(1.15)

 

Функции предполагаются непрерывно дифференцируемыми в точке . Если, кроме того, при выполнено условие регулярности для , кроме таких, для которых , то указанный набор множителей существует, причем , так что функция Лагранжа может быть записана с .

 

Уравнение Эйлера-Лагранжа.

 

Как показывает практика, в теории оптимального управления наиболее распространенной формой критерия оптимизации является интегральный функционал. Значение функционала определяется формой кривой подынтегральной функции. Функция, экстремизирующая функционал, называется экстремалью. Решение задачи определения экстремали было дано математиком Эйлером в середине XVIII века [2]. Аппроксимируя подынтегральные кривые ломаными, Эйлер вывел дифференциальное уравнение второго порядка, которому должны были удовлетворять экстремали. Впоследствии Лагранж назвал это уравнение уравнением Эйлера. В дальнейшем перед математиками встал вопрос решения более сложной задачи. Требуется определить экстремаль функционала при наличии ограничений в виде равенств, которым должна удовлетворять экстремаль. При решении этой задачи исследователи применили правило множителей Лагранжа, что позволило получить необходимые условия, которым должна удовлетворять искомая экстремаль. При этом уравнение Эйлера вошло в эти условия как составная часть. Далее рассмотрим вывод необходимых условий экстремума функционала при ограничениях в виде дифференциальных уравнений объекта, для которого решается задача оптимизации. Эти ограничения называются уравнениями связи. Однако прежде чем перейти к изложению вывода, напомним некоторые сведения, характеризующие понятие и свойство функционала [4].

1.2.1. Определение функционала. Если каждой функции из множества поставлено в соответствие по некоторому правилу число , то говорят, что на множестве (в классе ) определен функционал . Множество функции (класс функций ), на котором определен функционал , называется областью задания функционала.

Вариация аргумента функционала. Вариацией или приращением аргумента функционала называется разность между двумя функциями и из выбранного множества :

 

, .

 

Кривые и , заданные на отрезке , близки в смысле близости нулевого порядка, если модуль разности для , где - малая величина. Геометрически это означает, что кривые при близки по ординатам. Если для этих же кривых и при (где обозначено ), то кривые близки в смысле близости первого порядка. Геометрически это означает, что кривые при близки как по ординатам, так и по направления касательных в соответствующих точках. Кривые и близки в смысле близости -го порядка, если выполняются неравенства:

 

, ,…

 

при . Если кривые близки в смысле близости -го порядка, то они тем более близки в смысле близости любого меньшего порядка.

Непрерывность функционала. Функционал , определенный на множестве функции , называется непрерывным на элементе множества в смысле близости -го порядка, если для любого числа существует число , такое, что для всех допустимых функций , удовлетворяющих условиям

 

, ,…

 

выполняется неравенство . Функционал, не являющийся непрерывным смысле близости -го порядка, называется разрывным в смысле названной близости.

Приращение функционала. Приращением функционала , отвечающим приращению аргумента , называется величина:

 

 

Дифференцируемость функционала. Вариация функционала. Функционал , заданный на множестве , называется дифференцируемым в точке , если существует такой линейный относительно приращения аргумента функционал , что для любого допустимого приращения функции приращение функционала имеет вид:

 

и

 

При этом называется сильным дифференциалом (дифференциал Фреше) функционала или его первой вариацией и обозначается

 

(1.16)

 

Экстремум функционала. Если в окрестности точки функционального пространства , где , разность сохранят знак, то функционал имеет локальный экстремум на кривой . Если неравенство выполняется для всех кривых функционального пространства определения функционала, то на кривой достигается абсолютный максимум. Аналогично, если справедливо неравенство для всех кривых , то на кривой достигается абсолютный минимум.

Теорема 1.4. Необходимое условие экстремума функционала. Если дифференцируемый функционал имеет экстремум на , где - внутренняя точка области определения функционала, то на кривой выполняется неравенство

 

(1.17)

 

Функции, для которых , называют стационарными функциями или стационарными точками функционального пространства задания функционала [4].

Основная лемма вариационного исчисления. Если функция , заданная на отрезке , непрерывна и для любой непрерывной функции , заданной на отрезке , имеет место равенство

, то

1.2.2. Вывод уравнения Эйлера-Лагранжа. Рассматривается задача Больца с закрепленными концами и безусловными ограничениями в виде дифференциальных уравнений связи. Исходные данные имеют следующий вид:

 

критерий оптимизации функционал

уравнения связи (уравнения объекта) ; (1.18)

граничные условия: , .

Функции являются непрерывными и дифференцируемыми (принадлежат пространству ), функция - непрерывная (принадлежит пространству ). Постановка задачи оптимизации:

 

определить ,

 

На основании метода Лагранжа перейдем от решения оптимизационной задачи на условный экстремум функционала (при наличии ограничений в виде уравнений связи) к задаче на безусловный экстремум. Для этого составим лагранжиан:

 

(1.19)

 

где - непрерывная вектор-функция множителей Лагранжа.

Поскольку ограничения в виде уравнений объекта (1.18) должны быть выполнены в любой момент времени , что фактически означает наличие бесконечного числа ограничений, числовые множители Лагранжа представляются функцией времени.

От первоначальной задачи переходим к задаче:

 

(1.20)

 

Предположим, что оптимальное управление найдено. Следовательно, определена оптимальная траектория САУ , на которой функционал (1.20) достигает экстремума. Рассмотрим его приращение за счет малой - вариации оптимального уравнения и соответствующей ей вариации траектории системы . Так как функции и являются гладкими, малые вариации управления дают и малые вариации значения функционала . Допустим, что функция непрерывна по совокупности своих аргументов и имеет непрерывные частные производные второго порядка по всем аргументам в области , , , . Приращение функционала , отвечающее приращению аргумента, где имеет вид

 

(1.21)

 

В постановке оптимизационной задачи концы траектории закреплены, вариация траектории на концах недопустима, поэтому терминантный член функционала (функция ) отсутствует в выражении (1.21). Представим разность функций под интегралом (1.21) в виде разложения Тейлора, что допустимо вследствие непрерывности функции

 

(1.22)

 

где - остаточный член разложения ряда Тейлора. После подстановки (1.22) в (1.21) получим

 

(1.23)

 

Первое слагаемое в правой части (1.23) линейно относительно и . Пусть все вторые частные производные функции по , , и не превосходит по абсолютной величине некоторой константы . Выберем таким образом, чтобы была справедлива оценка:

 



Поделиться:


Последнее изменение этой страницы: 2017-02-08; просмотров: 476; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.16.81.94 (0.14 с.)