Заглавная страница
Избранные статьи
Случайная статья
Познавательные статьи
Новые добавления
Обратная связь
FAQ
Написать работу

ТОП 10 на сайте

Приготовление дезинфицирующих растворов различной концентрации

Техника нижней прямой подачи мяча.

Франко-прусская война (причины и последствия)

Организация работы процедурного кабинета

Смысловое и механическое запоминание, их место и роль в усвоении знаний

Коммуникативные барьеры и пути их преодоления

Обработка изделий медицинского назначения многократного применения

Образцы текста публицистического стиля

Четыре типа изменения баланса

Задачи с ответами для Всероссийской олимпиады по праву

Мы поможем в написании ваших работ!

ЗНАЕТЕ ЛИ ВЫ?

Влияние общества на человека

Приготовление дезинфицирующих растворов различной концентрации

Практические работы по географии для 6 класса

Организация работы процедурного кабинета

Изменения в неживой природе осенью

Уборка процедурного кабинета

Сольфеджио. Все правила по сольфеджио

Балочные системы. Определение реакций опор и моментов защемления

Главная Избранные Случайная статья Познавательные Новые добавления Обратная связь FAQ Написать работу

Принцип максимуму Понтрягіна

↑

⇐ ПредыдущаяСтр 6 из 7Следующая ⇒

1956 року в роботах академіка Л.С. Понтрягіна та його учнів було обґрунтовано принцип максимуму як необхідна і достатня ознака оптимального процесу для лінійних систем і необхідна ознака для нелінійних систем.

Між принципом максимуму і принципом оптимальності Беллмана існує прямий зв’язок.

Розглянемо спочатку матеріальну точку масою m=1, яка вільно і без тертя рухається по горизонтальній прямій і має двигун, що розвиває силу F_д. Тоді рівняння руху точки мають вигляд:

dS/dt = V; dV/dt = a; a = F_д, (10.41)

де S, V, a – переміщення, швидкість і прискорення точки відповідно.

Позначимо:

y₁ = S; y₂ = V; u = F_д,

і тоді запишемо рівняння (10.41) у вигляді:

(10.42)

Знайдемо оптимальне керування точкою, при якому вона перейде з початкового положення S_п до кінцевого положення S_к за мінімальний час, тобто I = T = min (функціонал 10.4).

На керування накладають обмеження:

(10.43)

Інтегруючи рівняння (10.41) отримаємо:

(10.44)

де S_п, V_п – початкові умови.

Для виконання умови T=min, необхідно, аби середня швидкість руху на відрізку [S_п, S_к] була як можна більшою, тобто

Побудуємо діаграми зміни a, V, S з урахуванням (10.43) і (10.44) за умови, що V_п= 0, S_п= 0 (рис. 10.7).

Для точного влучення у точку S_к необхідно правильно вибрати точку початку гальмування. Визначимо для цього шлях гальмування S_г із умов:

де - час гальмування, переміщення і швидкість точки у початку гальмування.

Оскільки то

(10.45)

Це є рівняння параболи.

Якщо записати замість відповідно S, V – поточні координати початку гальмування, то рівняння (10.45) можна записати у вигляді:

(10.46)

Знак “мінус” ставиться при V > 0, знак “плюс” – при V < 0.

Побудуємо залежність S=f(V) на фазовій площині з урахуванням обмежень (рис. 10.8).

Початок координат відповідає кінцевій точці S_к (зупинка руху).

Якщо точка знаходиться на ділянці фазової траєкторії 1-0-1¢, то для того, щоб точка влучила у задане положення, необхідно почати гальмування з максимальним сповільненням.

Якщо точка знаходиться на ділянці 2-1 або 2¢-1¢, то гальмування слід починати тільки після досягнення точок 1 (1¢). До цього моменту швидкість повинна залишатися максимальною і постійною.

Якщо гальмування починати, наприклад, у точці 3 (3¢), то тіло “проскочить” задане положення, влучивши у точку 4 (4¢). Тоді тіло слід розігнати на ділянці 4-5 (4¢-5¢) а потім гальмувати по лінії 5-0 (5¢-0¢).

Якщо у початковий момент часу тіло знаходиться у точці 6 (6¢), то його слід спочатку розігнати до точки 7 (7¢), а потім гальмувати по лінії 7-0 (7¢-0).

Таким чином, для досягнення максимальної швидкодії необхідно працювати на межі можливостей (за реальних умов це не завжди так, якщо запас енергії обмежений).

Отже, фазовий портрет можна розділити на дві зони:

- зона А, в якій швидкість V зростає, тобто а > 0;

- зона В, в якій швидкість V знижується, тобто а < 0.

Межа, що розділяє ці зони, називається лінією перемикання. За відомими рівнянням цієї лінії та станом системи X (швидкість V і положення відносно S_к), можна завжди визначити керуючий вплив:

Рівняння (10.45) можна записати у вигляді:

, при |V| < V_max, або

при |V| < V_max, (10.47)

де (10.48)

Для зон А і В, відповідно, виконуються умови:

Тоді сигнал керування повинен мати вигляд:

(10.49)

Умова (10.49) виражає алгоритм керування, що реалізує оптимальні за швидкодією процеси у системі.

Аналіз фазового портрета показує, що для переміщення з будь-якої точки S_п до заданої точки S_к керування змінюється максимум один раз або має одне перемикання (два інтервали). У точках перемикання u(t) має розрив першого роду. Такі керування належать до класу припустимих (рис. 10.3).

Тепер перейдемо до розгляду принципу максимуму. Скористаємось рівнянням (10.36).

Позначимо: , тоді вектор запишемо:

Оскільки max(-y) = -min(y) (рис. 10.9), то можна записати:

або

(10.50)

Отже, умову мінімуму інтегралу (10.35) запишемо у вигляді:

(10.51)

де - скалярний добуток двох векторів.

Отриманий вираз (10.51) є математичним записом принципу максимуму Понтрягіна.

Зазначимо, що під час застосування методу динамічного програмування у загальному випадку необхідно попередньо знайти функцію S, що пов’язано з розв’язком диференціальних рівнянь у частинних похідних. Використання принципу максимуму потребує знання вектора , що розглядають на оптимальній траєкторії. А цей вектор можна знайти простіше, розв’язавши так звані спряжені рівняння:

(10.52)

Часто рівняння (10.51) і (10.52) записують у більш компактній формі, позначивши скалярний добуток векторів через H. Тоді отримуємо:

(10.53)

(10.54)

де (з урахуванням того, що ).

Узявши частинну похідну H за y_і, отримаємо рівняння руху об’єкта:

(10.55)

Із виразу (10.53) можна зробити такі висновки:

- якщо процес є оптимальним, то у будь-який момент часу t оптимальне керування u(t) – це таке керування, що максимізує величину Н;

- у будь-якій точці оптимальної траєкторії максимальне значення величини Н одне й те саме: воно дорівнює нулю.

Функцію Н називають функцією Гамільтона. Вона має визначений фізичний смисл. Зокрема для консервативних механічних систем функція Н є повною енергією системи, яка повинна залишатися постійною й максимальною у процесі керування. Функції y_і є імпульсами і задають напрямок руху.

Для неконсервативних систем, наприклад електричних, функція Н – потужність, а y_і– також імпульси.

Звідси випливає фізичний смисл оптимального керування: необхідно надавати об’єкту таку кількість енергії, яка забезпечувала б його рух, при якому функціонал, вибраний як критерій оптимальності, досягав би екстремального значення за обмежень, що накладені на фазові координати та керування. Ця енергія надається за допомогою керування u, тому Н є функцією також і від u.

Таким чином, принцип максимуму в загальному випадку можна сформулювати так:

Для отримання оптимальної системи, у смислі мінімуму функціоналу І, необхідне існування таких ненульових безперервних функцій y₀(t), …, y_n(t), які є розв’язком системи що при будь-якому t з інтервалу 0 £ t £ T, величина Н як функція змінних u₁, …, u_r у заданій зоні їх припустимих значень, досягає максимуму відповідно до умови:

Принцип максимуму є найдоцільнішим з усіх методів знаходження оптимальних керувань при розв’язуванні задач про швидкодію.

Розв’язування задачі виконують у такій послідовності:

1. Складають функцію Гамільтона Н, що дорівнює скалярному добутку векторів , тобто причому .

2. Беруть частинні похідні Н за керуванням u_i, які визначають екстремум функції Н. У разі лінійної залежності Н від u_i частинна похідна є функцією однієї або декількох складових вектора . При цьому для досягнення додатного максимуму Н необхідно, аби u_i = +u_max при y_і(t) > 0 і u_i = -u_max при y_і(t) < 0, тобто

u_i = u_max×sign y_і(t). (10.56)

Таким чином, у даному випадку керуючий вплив стрибком набуває значення +u_max або -u_max. Момент зміни знаку називається моментом перемикання.

У разі нелінійної залежності Н від u_i частинну похідну дорівнюють нулю і з отриманого рівняння визначають u_i, при якому максимізується Н.

3. Для знаходження допоміжної функції y_і(t), яка визначає керування, складають і розв’язують систему спряжених рівнянь (10.54)

4. У разі замкнутої системи визначають залежність керування від вихідних координат системи, що визначають оптимальну траєкторію: При цьому моменти перемикання визначаються автоматично при відхиленні фактичної траєкторії від оптимальної.

У разі розімкнутої системи визначають кількість змін знаку y_і(t), тобто визначають, скільки разів y_і(t) переходить через нуль або інакше, скільки коренів має функція y_і(t). Моменти перемикання можна визначити за методом стикування розв’язків диференціальних рівнянь зі знакозмінною правою частиною.

Приклад 10.5 Система задана рівняннями (10.41),(10.42):

Необхідно розв’язати задачу про максимальну швидкодію, тобто знайти оптимальне керування u ^*, при якому перехід системи з початкового стану в кінцевий (рівноважний) стан відбувався б за мінімальний час. При цьому на керування накладається обмеження: | u | £ u _max.

Запишемо функцію Гамільтона:

Оскільки Н лінійна відносно u, то для визначення максимуму Н необхідно знайти y₂. Запишемо систему спряжених рівнянь:

Звідси випливає:

y₁ = С₁;

де С₁,С₂ – сталі інтегрування.

Для досягнення максимуму Н необхідно, щоб y₂ і u були одного знаку, тобто:

u = u_max×signy₂. (10.57)

Оскільки функція має один корінь t₁=C₂/C₁, то керування u має одну зміну знаку (два інтервали керування), що співпадає з раніше отриманим результатом (рис. 10.8). Після закінчення керування (рис.10.10).

Принцип максимуму дає тільки якісну сторону зміни керуючої дії, тобто визначає кількість інтервалів керування, і не дає кількісної оцінки закону керування, оскільки сталі С₁ і С₂ не можна визначити через невідомі початкові умови для функції y(t). Це є його суттєвим недоліком.

Для конструювання оптимального регулятора цього недостатньо. Необхідно обов’язково знати моменти перемикання керуючої дії.

У даному прикладі у разі замкнутої системи це можна зробити, якщо знайти рівняння лінії перемикання (10.47):

або

При цьому

У разі розімкнутої системи моменти перемикання знаходять методом стикування розв’язків диференціальних рівнянь. У прикладі (10.5) маємо два інтервали часу (два інтервали керування). Тому необхідно знайти моменти часу:

t₁ – момент зміни знаку керування;

T = t₂ – закінчення керування.

Нехай у початковий момент часу (t = t₀ = 0) тіло знаходиться у точці В (рис. 10.10), тобто S(t₀) = -S₀ = -y₁₀;

Кінцеве значення координат: S(t₂) = y₁(t₂)=0;

При цьому з рис. 10.10 видно, що перший інтервал керування є додатним (u = +u_max), а другий – від’ємним (u = -u_max).

Розв’язуємо диференціальне рівняння: тобто рівняння зі знакозмінною правою частиною. Характеристичне рівняння: s² = 0, тобто маємо два нульових кратних кореня s₁=s₂=0. Тоді розв’язок має вигляд:

(10.58)

де С₁ і С₂ – сталі інтегрування.

Після диференціювання отримуємо:

(10.59)

Запишемо рівняння (10.58) і (10.59) для різних моментів часу:

- для t = t₀ = 0 (початок першого інтервалу):

(10.60)

Звідси С₁₀ = 0, С₂₀ = -y₁₀;

- для t = t₁ (кінець першого, початок другого інтервалу); оскільки функції безперервні, то можна виконати стикування розв’язків на межі першого і другого інтервалів:

(10.61)

Звідси отримуємо:

- для t = t₂ = T (кінець другого інтервалу):

(10.62)

Звідси

Дорівнюємо вирази для С₁₁, а також для С₂₁. Тоді отримуємо відповідно:

або t₂ = T = 2t₁;

Після підстановки першого рівняння до другого отримаємо:

Звідси знаходимо:

- момент перемикання керування:

- момент закінчення руху:

У даному прикладі розглядали систему другого порядку і було отримане рівняння лінії перемикання. Розв’язуючи задачу для систем більш високих порядків, отримують рівняння поверхні перемикання у багатомірному фазовому просторі. При цьому кількість перемикань визначається відповідно до теореми про n-інтервалів, яку 1953 року довів у своїх роботах О.А.Фельдбаум:

Якщо характеристичне рівняння системи n-го порядку має тільки дійсні недодатні корені (від’ємні та нульові), процес керування матиме не більше (n-1) перемикань. Якщо є комплексні корені (включаючи чисто уявні), то перемикань може бути більше залежно від початкових умов.

Можна зробити висновок, що оптимальна за швидкодією система має релейний перемикаючий елемент, що керується за допомогою спеціального обчислювального пристрою. При цьому необхідно безперервно вимірювати всі n фазових координат, тобто регульовану величину і (n -1) її похідних і подавати інформацію на вхід обчислювального пристрою.

Оскільки ідеальні диференціювальні ланки фізично не реалізуються, то для систем високого порядку можна здійснити лише близькі до оптимальних системи. Крім того, для систем високого порядку знаходження поверхонь перемикання є досить складною задачею, яка розв’язана лише для окремих випадків.

Приклад 10.6 Визначити закон змінювання струму якоря двигуна постійного струму з незалежним збудженням, що забезпечує відпрацювання кутового переміщення q₀ протягом мінімального часу Т при обмеженні струму якоря |i| £ і_max і статичному моменті М_с=0.

Рівняння, що описують динаміку двигуна, мають вигляд:

де w - кутова швидкість двигуна; с – струмова стала двигуна; J – момент інерції електропривода.

Позначимо: w = y₁, q = y₂, i = u. Тоді рівняння двигуна матимуть вигляд:

(10.63)

за початкових умов y₁(0) = 0, y₂(0) = 0 і при кінцевих значеннях змінних y₁(Т) = 0, y₂(Т) = q₀.

Складаємо функцію Гамільтона:

Функція Н лінійна відносно u. Запишемо систему спряжених рівнянь:

(10.64)

Звідси отримуємо: y₂ = С₂;

де С₁ і С₂ – сталі інтегрування.

Для досягнення максимуму Н необхідно, щоб y₁ і u були одного знаку, тобто

u = u_max×signy₁= і_max×signy₁= і_max×sign(C₁- C₂t).

Функція має один корінь t₁=C₁/C₂, тому керування u має одну зміну знаку:

(10.65)

Визначимо момент перемикання t₁. Для цього використаємо перше рівняння системи (10.63). На першій ділянці при t < t₁ керування u = i_max, тому dy₁/dt = ci_max/J.

За початкових умов y₁(0) = 0 отримуємо розв’язок цього рівняння:

При t = t₁ швидкість у кінці першої ділянки обчислюється за формулою:

(10.66)

На другій ділянці при t ³ t₁ керування u = - і_max, тому dy₁/dt = -ci_max/J.

Розв’язок цього рівняння знаходимо за формулою:

Сталу інтегрування С₃ визначимо з умови, що функція y₁(t) при t = t₁ безперервна і на другій ділянці слушна формула (10.66). Тоді отримуємо:

При t = T маємо y₁(T) = 0, тобто звідки t₁= T/2.

Час Т визначимо з умови, що за цей час кутове переміщення дорівнює q₀. Тоді з другого рівняння системи (10.63) маємо:

або

звідки знаходимо:

З урахуванням позначень струму якоря і кутової швидкості запишемо закони їх змінювання під час відпрацювання двигуном заданого переміщення:

Закон змінювання напруги на якорі можна визначити з рівняння: u_я = іR + cw.

Цей закон має вигляд:

⇐ Предыдущая 1 2 3 4 567 Следующая ⇒

Познавательные статьи:

Где возникла философия и почему?

Относительная высота сжатой зоны бетона

Сущность проекции Гаусса-Крюгера и использование ее в геодезии

Тарифы на перевозку пассажиров

Последнее изменение этой страницы: 2016-12-27; просмотров: 264; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 18.218.75.222 (0.011 с.)