Заглавная страница Избранные статьи Случайная статья Познавательные статьи Новые добавления Обратная связь КАТЕГОРИИ: АрхеологияБиология Генетика География Информатика История Логика Маркетинг Математика Менеджмент Механика Педагогика Религия Социология Технологии Физика Философия Финансы Химия Экология ТОП 10 на сайте Приготовление дезинфицирующих растворов различной концентрацииТехника нижней прямой подачи мяча. Франко-прусская война (причины и последствия) Организация работы процедурного кабинета Смысловое и механическое запоминание, их место и роль в усвоении знаний Коммуникативные барьеры и пути их преодоления Обработка изделий медицинского назначения многократного применения Образцы текста публицистического стиля Четыре типа изменения баланса Задачи с ответами для Всероссийской олимпиады по праву Мы поможем в написании ваших работ! ЗНАЕТЕ ЛИ ВЫ?
Влияние общества на человека
Приготовление дезинфицирующих растворов различной концентрации Практические работы по географии для 6 класса Организация работы процедурного кабинета Изменения в неживой природе осенью Уборка процедурного кабинета Сольфеджио. Все правила по сольфеджио Балочные системы. Определение реакций опор и моментов защемления |
Билет №5 (Принцип максимума для задачи ОУ с закрепленными концами)
Следующая теорема (необходимое условие оптимальности ), главным содержанием которой является равенство (22), имеет вид:
Пусть u(t), t0≤t≤t1, такое допустимое управление, что соответствующая ему фазовая траектория (t), исходящая в момент времени t0 из точки (0,x0), проходит в момент времени t1 через некоторую точку прямой П (см. рис. 6). Для оптимальности управления u(t) и траектории (t) необходимо существование такой ненулевой непрерывной вектор-функции (t) = {ψ0(t),ψ1(t),…ψn(t)}, соответствующей (t) и u(t), что:
1) при любом t, t0≤t≤t1, функция H( ,x(t),u) переменного u достигает в точке u =u(t) максимума M( (t), x(t)) H( ,x(t),u) = M( (t), x(t)) (22) 2) в начальный момент времени t1 , выполнено соотношение ψ0(t1)≤0 и M( (t1), x(t1)) = 0.
Если максимум функции H( ,x(t),u) достигается во внутренней точке области управления , то для выполнения условия максимума (22) необходимо (23)
Билет №6(Принцип максимума для задачи ОУ по быстродействию)
Пример задачи синтеза Рассмотрим уравнение ,где u–вещественное число, удовлетворяющее условию |u|≤1, управляющий параметр. В фазовых координатах: x1 x, x2= . Это уравнение будет иметь следующий вид:
-система двух дифференциальных уравнений первого порядка. (1)
Рассмотрим (для фазовой точки, движущейся по закону (1)) задачу о быстрейшем попадании в начало координат (0,0) из любого заданного начального состояния x0, иначе говоря, мы будем рассматривать задачу об оптимальном быстродействии. Имеем задачу с закрепленными концами. Решение: Функция Гамильтона имеет вид: H=(,f), где f1=x2, f2=u, , - вектор-функция, тогда:
. (2)
Для сопряженных (вспомогательных) переменных и мы получаем систему сопряженных уравнений из Гамильтоновой системы:
. Это система линейных дифференциальных уравнений с постоянными коэффициентами для сопряженных переменных и . Рассмотрим решение первого уравнения. Подставляя, во второе дифференциальное уравнение получаем: . Проинтегрировав, обе части уравнения получаем: .
Соотношение принципа максимума (9) дает нам, учитывая (8) и условия максимума для u , u(t ) = , из условия максимума. Подставляем и в (2) получаем: .
Находим максимум гамильтониана в любой момент времени, при фиксированных значениях и . Функция H становится линейной функцией u.
u=
u(t)=1.
Рис.10
Для данной функции Гамильтона u принимает граничные значения 1,если u(t)= (3) 1,если . Такая функция имеет вид: u=sign . Из (3) следует, что каждое оптимальное управление u(t), t0≤t≤t1 является кусочно-постоянной функцией принимающей значения и имеющей не более двух интервалов постоянства (потому что линейная функция или имеет не более одного раза смены знака на интервале от t0 до t1) (рис. 10).
Далее, преступаем к решению системы дифференциальных уравнений для фазовых координат: 1) Для отрезка времени на котором . В этом случае имеем следующую систему дифференциальных уравнений
Получаем:
, где s1 и s2- постоянные интегрирования.
Преобразуем и получим зависимость:
, где . Это уравнение параболы при заданном s (рис. 11). Рис.11 Определим направление движения фазовой точки по данным траекториям. По этим параболам (рис. 11) фазовая точка движется снизу вверх, так как - производная больше нуля, то x2 возрастает для любого t.
2) Для отрезка времени на котором имеем:
Это семейство парабол (рис. 12). Рис.12
Движение сверху вниз, так как . Каждое оптимальное управление u(t) является кусочно-постоянной функцией, принимающей значения , и имеющий не более двух интервалов постоянства (не более одной точки пересечения с осью абсцисс).
Если управление u(t) сначала, в течение некоторого времени, равнялось +1, а затем стало равно -1, то фазовая траектория движения по двум "кускам" парабол, примыкающих друг к другу, причем второй из этих "кусков" лежит на первой параболе (рис. 13).
Рис.13 Наискорейший путь.
Причем второй из этих "кусков" лежит на параболе (u=-1), которая проходит через начало координат.
Если u равнялось -1, а затем +1, то траектория движения будет (рис. 14).
Все семейство парабол показано на следующем рисунке (рис. 15).
Рис.15
Все семейство точек выше AOB будет смотри (рис. 15).
Область I: Семейство траекторий, ведущее в начало координат, без переключения управления.
Область II: Семейство траекторий, ведущее в начало координат, с управлением u=-1. Область III: Для всех точек, находящихся выше линии AOB траектории будут состоять из "куска" траектории с управлением u=-1, до тех пор, пока фазовая точка не попадёт на параболу AO (рис. 15). Область IV: Для всех точек, находящихся ниже линии AOB траектории будут состоять из "куска" траектории с управлением u=1, до тех пор, пока фазовая точка не попадет на параболу BO.
Полученное в рассмотренном примере, решение оптимальной задачи можно истолковать следующим образом. Обозначим v(x1,x2) или v(x), функцию заданную на плоскости, следующим образом.
+1, если ниже линии AOB или на дуге AO. v(x)= -1, если выше линии AOB или на дуге BO.
Тогда на каждой оптимальной траектории значение u(t), управляющего параметра, в произвольный момент времени t равно v(x(t)), то есть равно значению функции v в той точке, в которой в момент времени t находится фазовая точка, пробегающая оптимальную траекторию.
Задача синтеза
Будем рассматривать оптимальную задачу в общей постановке, рассматривая все возможные начальные состояния и каждый раз, предписывая в качестве конечной точки x1 начало координат О. Тогда существует такая функция v(x), заданная в фазовом пространстве x и принимающая значения в области U, что уравнение
определяет все оптимальные траектории, ведущее в начало координат.
Следовательно, оптимальное управление оказывается, естественно, искать не в форме u=u(t), а в форме u=v(x), то есть искомое оптимальное управление в каждый момент времени t зависит лишь от того, в какой точке фазового пространства находится в данный момент фазовая точка.
Если мы уже попали в фазовую точку x, то дальнейшее движение (из точки x в точку O) должно быть оптимальным, по этому значение оптимального управления u(t), в момент прохождения фазового положения x, зависит только от x и не зависит от того в какой точке началось движение и времени, во время которого фазовая точка двигалась из точки x0 в точку x.
функция v(x), дающую оптимальные траектории, будем называть синтезирующей функцией, а задачу нахождения этой функции будем называть задачей синтеза.
|
||||||
Последнее изменение этой страницы: 2017-02-17; просмотров: 411; Нарушение авторского права страницы; Мы поможем в написании вашей работы! infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.88.249 (0.022 с.) |