Билет №5 (Принцип максимума для задачи ОУ с закрепленными концами) 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Билет №5 (Принцип максимума для задачи ОУ с закрепленными концами)



Следующая теорема (необходимое условие оптимальности ), главным содержанием которой является равенство (22), имеет вид:

 

Пусть u(t), t0≤t≤t1, такое допустимое управление, что соответствующая ему фазовая траектория (t), исходящая в момент времени t0 из точки (0,x0), проходит в момент времени t1 через некоторую точку прямой П (см. рис. 6). Для оптимальности управления u(t) и траектории (t) необходимо существование такой ненулевой непрерывной вектор-функции (t) = {ψ0(t),ψ1(t),…ψn(t)}, соответствующей (t) и u(t), что:

 

1) при любом t, t0≤t≤t1, функция

H( ,x(t),u) переменного u достигает в точке u =u(t) максимума M( (t), x(t))

H( ,x(t),u) = M( (t), x(t)) (22)

2) в начальный момент времени t1 , выполнено соотношение ψ0(t1)≤0 и

M( (t1), x(t1)) = 0.

 

Если максимум функции H( ,x(t),u) достигается во внутренней точке области управления , то для выполнения условия максимума (22) необходимо

(23)

 

Билет №6(Принцип максимума для задачи ОУ по быстродействию)

 

Пример задачи синтеза

Рассмотрим уравнение ,где u–вещественное число, удовлетворяющее условию |u|≤1, управляющий параметр.

В фазовых координатах: x1 x, x2= .

Это уравнение будет иметь следующий вид:

 

-система двух дифференциальных уравнений первого порядка. (1)

 

Рассмотрим (для фазовой точки, движущейся по закону (1)) задачу о быстрейшем попадании в начало координат (0,0) из любого заданного начального состояния x0, иначе говоря, мы будем рассматривать задачу об оптимальном быстродействии.

Имеем задачу с закрепленными концами.

Решение:

Функция Гамильтона имеет вид:

H=(,f), где f1=x2, f2=u, , - вектор-функция, тогда:

 

. (2)

 

Для сопряженных (вспомогательных) переменных и мы получаем систему сопряженных уравнений из Гамильтоновой системы:

.

Это система линейных дифференциальных уравнений с постоянными коэффициентами для сопряженных переменных и .

Рассмотрим решение первого уравнения.

Подставляя, во второе дифференциальное уравнение получаем:

.

Проинтегрировав, обе части уравнения получаем:

.

 

Соотношение принципа максимума (9) дает нам, учитывая (8) и условия максимума для u , u(t ) = , из условия максимума.

Подставляем и в (2) получаем: .

 

Находим максимум гамильтониана в любой момент времени, при фиксированных значениях и . Функция H становится линейной функцией u.

 

u=

 

u(t)=1.

 

Рис.10

 

Для данной функции Гамильтона u принимает граничные значения

1,если

u(t)= (3)

1,если .

Такая функция имеет вид: u=sign .

Из (3) следует, что каждое оптимальное управление u(t), t0≤t≤t1 является кусочно-постоянной функцией принимающей значения и имеющей не более двух интервалов постоянства (потому что линейная функция или имеет не более одного раза смены знака на интервале от t0 до t1) (рис. 10).

 

Далее, преступаем к решению системы дифференциальных уравнений для фазовых координат:

1) Для отрезка времени на котором . В этом случае имеем следующую систему дифференциальных уравнений

 

 

 

Получаем:

 

, где s1 и s2- постоянные интегрирования.

 

Преобразуем и получим зависимость:

 

, где .

Это уравнение параболы при заданном s (рис. 11).

Рис.11

Определим направление движения фазовой точки по данным траекториям.

По этим параболам (рис. 11) фазовая точка движется снизу вверх, так как - производная больше нуля, то x2 возрастает для любого t.

 

2) Для отрезка времени на котором имеем:

 

 

Это семейство парабол (рис. 12).

Рис.12

 

Движение сверху вниз, так как .

Каждое оптимальное управление u(t) является кусочно-постоянной функцией, принимающей значения , и имеющий не более двух интервалов постоянства (не более одной точки пересечения с осью абсцисс).

 

Если управление u(t) сначала, в течение некоторого времени, равнялось +1, а затем стало равно -1, то фазовая траектория движения по двум "кускам" парабол, примыкающих друг к другу, причем второй из этих "кусков" лежит на первой параболе (рис. 13).

 

Рис.13

Наискорейший путь.

 

Причем второй из этих "кусков" лежит на параболе (u=-1), которая проходит через начало координат.

 

Если u равнялось -1, а затем +1, то траектория движения будет (рис. 14).

 

 

Все семейство парабол показано на следующем рисунке (рис. 15).

 

 

 

Рис.15

 

Все семейство точек выше AOB будет смотри (рис. 15).

 

Область I: Семейство траекторий, ведущее в начало координат, без переключения управления.

Область II: Семейство траекторий, ведущее в начало координат, с управлением u=-1.

Область III: Для всех точек, находящихся выше линии AOB траектории будут состоять из "куска" траектории с управлением u=-1, до тех пор, пока фазовая точка не попадёт на параболу AO (рис. 15).

Область IV: Для всех точек, находящихся ниже линии AOB траектории будут состоять из "куска" траектории с управлением u=1, до тех пор, пока фазовая точка не попадет на параболу BO.

 

Полученное в рассмотренном примере, решение оптимальной задачи можно истолковать следующим образом.

Обозначим v(x1,x2) или v(x), функцию заданную на плоскости, следующим образом.

 

+1, если ниже линии AOB или на дуге AO.

v(x)=

-1, если выше линии AOB или на дуге BO.

 

Тогда на каждой оптимальной траектории значение u(t), управляющего параметра, в произвольный момент времени t равно v(x(t)), то есть равно значению функции v в той точке, в которой в момент времени t находится фазовая точка, пробегающая оптимальную траекторию.

 

Задача синтеза

 

Будем рассматривать оптимальную задачу в общей постановке, рассматривая все возможные начальные состояния и каждый раз, предписывая в качестве конечной точки x1 начало координат О. Тогда существует такая функция v(x), заданная в фазовом пространстве x и принимающая значения в области U, что уравнение

 

 

определяет все оптимальные траектории, ведущее в начало координат.

 

 

Следовательно, оптимальное управление оказывается, естественно, искать не в форме u=u(t), а в форме u=v(x), то есть искомое оптимальное управление в каждый момент времени t зависит лишь от того, в какой точке фазового пространства находится в данный момент фазовая точка.

 

Если мы уже попали в фазовую точку x, то дальнейшее движение (из точки x в точку O) должно быть оптимальным, по этому значение оптимального управления u(t), в момент прохождения фазового положения x, зависит только от x и не зависит от того в какой точке началось движение и времени, во время которого фазовая точка двигалась из точки x0 в точку x.

 

функция v(x), дающую оптимальные траектории, будем называть синтезирующей функцией, а задачу нахождения этой функции будем называть задачей синтеза.

 



Поделиться:


Последнее изменение этой страницы: 2017-02-17; просмотров: 411; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.191.88.249 (0.022 с.)