Системы с адаптацией в особых фазовых состояниях 


Мы поможем в написании ваших работ!



ЗНАЕТЕ ЛИ ВЫ?

Системы с адаптацией в особых фазовых состояниях



Недостаток адаптивных систем с контуром самонастройки – сложность реализации вычислительных блоков для определения условий экстремума, снижение надежности функционирования.

В отдельных случаях задача адаптации решается более простыми средствами, используя особенности нелинейных систем.

В нелинейных системах могут возникать автоколебательные или скользящие режимы, что может быть использовано для получения дополнительной информации об управляемом, процессе либо особый режим преднамеренно организуется, придавая системе свойства адаптации к параметрическим или внешним возмущениям.

Рассмотрим два класса таких систем: релейные автоколебательные системы и адаптивные системы с переменной структурой.

2.5.1.Релейные автоколебательные системы управления

 
 

В нелинейной системе, состоящей из релейного элемента и линейной части с передаточной функцией W0(p) (рис. 2.8), используя метод гармонической линеаризации, можно определить зависимость параметров автоколебаний от параметров линейной части.

Пусть передаточная функция линейной части

(2.68)

где Т1, Т2 – постоянные времени, константы;

k0(t) – переменный коэффициент усиления.

Уравнение релейного элемента

(2.69)

При g(t) = 0 общее уравнение для оператора нелинейной системы

(2.70)

Гармоническая линеаризация релейного элемента

(2.71)

Поэтому (3) можно записать

(2.72)

откуда при условии p = jw находятся амплитуда и частота автоколебаний:

(2.73)

Таким образом,

Поддерживая амплитуду автоколебаний на заданном уровне, можно создать систему, адаптирующуюся к указанному параметрическому возмущению.

 
 

На рис. 9 приведена такая система с регулируемым уровнем ограничения релейного элемента.

На основании (2.73) амплитуда автоколебаний может поддерживаться на постоянном уровне при изменениях k0(t) за счет изменения уровня ограничения реле [u0+Du0(t)].

Уравнения системы:

релейного элемента

. (2.74)

Уравнение фильтра, настроенного на частоту автоколебаний a0

yф = kфpy(t). (2.75)

Уравнение двухполупериодного выпрямителя сигнала автоколебаний

za = |yф|. (2.76)

Уравнение исполнительного устройства для перестройки уровня ограничения релейного элемента

(2.77)

где

Уравнение основного контура

(2.78)

После гармонической линеаризации (2.78) получим

(2.79)

откуда параметры автоколебаний

(2.80)

.

Пусть экстремальный режим определяется следующими значениями:

a = a0; k0(t) = k0; Du0(t) = 0; Dz = 0, (2.81)

тогда можно определить значение опорного напряжения z(a0):

(2.82)

Линеаризация (2.82) по постоянной составляющей даст

z(a0) = 2kфa0w0/p. (2.83)

Учитывая (2.80) и (2.81), получим

(2.84)

При изменении коэффициента k0(t) будут изменяться амплитуда автоколебаний и среднее выпрямленное напряжение za. Появляющееся рассогласование Dz=z(a0)-za, будет воздействовать на изменение уровня ограничения релейного элемента Du­0(t) таким образом, чтобы уменьшалась до нуля величина Dz.

2.5.2.Адаптивные системы с переменной структурой

В системах с переменной структурой за счет нелинейного сочетания различных линейных структур удается организовать специфическое вынужденное движение – скользящий режим – режим перехода от движения, соответствующего одной линейной структуре, к движению, соответствующему другой линейной структуре. Этот переход осуществляется логическим переключателем связей в системе в зависимости от ее фазового состояния. Такой переход осуществляется с большой частотой, в пределе стремящейся к бесконечности.

После возникновения скользящего режима движение системы происходит вдоль границы переключения и становится независимым от параметров управляемого объекта. Поэтому переменные параметры объекта не оказывают влияния на динамические свойства системы с переменной структурой, находящейся в скользящем режиме.

Пусть система с переменной структурой описывается дифференциальными уравнениями

(2.85)

где xi – фазовые координаты;

ai(t) – переменные параметры системы;

u – управление.

Известны диапазоны изменения параметров:

. (2.86)

Управление выбирают в следующем виде:

(2.87)

где yi – коэффициенты, являющиеся разрывными функциями фазового состояния системы

(2.88)

– постоянные величины.

Гиперповерхность g=0 является поверхностью разрыва коэффициентов yi, т.е. вдоль этой поверхности происходит движение в скользящем режиме. Так как уравнение движения по поверхности g=0 зависит только от постоянных коэффициентов ci, выбираемых из условия обеспечения требуемого качества переходных процессов, то движение в скользящем режиме не зависит от переменных параметров ai(t).

Для обеспечения скользящего режима необходимо выбирать значения постоянных коэффициентов ai и bi в соответствии с условием gdg/dt < 0 или неравенствами

(2.89)

 
 

При постоянных значениях ai и bi условия (22) накладывают ограничения на выбор коэффициентов поверхности скольжения сi из допустимой области при изменениях параметров ai(t) в заданном диапазоне

На рис. 2.10 для двумерного случая заштрихована область изменения коэффициентов поверхности скольжения c, полученная из условий обеспечения скользящего режима.

При этом cmax выбирают из условий (2.89), а cmin – из условия максимальной заданной длительности переходного процесса tmax.

Если в экстремальном режиме функционирования системы необходимо поддерживать максимальное быстродействие в переходных процессах, то в процессе изменения параметров объекта ai(t) необходимо определять значение cmax и перестраивать коэффициенты поверхности скольжения при их несоответствии этому значению. Такая задача может быть решена адаптивной системой с переменной структурой, использующей информацию о наличии скользящего режима в системе.

Принцип действия такой адаптивной системы заключается в следующем.

В начале переходного процесса в регуляторе формируется функция переключения

g0 = cminx1+x2, (2.90)

где cmin – определяется либо из максимальной заданной длительности переходного процесса, либо из условия (2.89) при минимальных значениях ai(t) из диапазона

На поверхности g0 (в данном случае прямая) возникает скользящий режим при любых значениях ai(t) из заданного диапазона.

Факт возникновения скользящего режима регистрируется индикатором, выходной сигнал которого скачкообразно изменяется при уменьшении относительной длительности пребывания системы в состоянии одной из имеющихся структур, т.е. при повторных изменениях знака функции g0. По сигналу индикатора скользящего режима функция переключения перестраивается с g0 на g1:

g1 = (cmin+Dc)x1+x2. (2.91)

В системе вновь возникает скользящий режим, но уже на линии переключения g1=0. С помощью индикатора скользящего режима происходит дальнейшее перестроение функции переключения

gi = (cmin+iDc)x1+x2, (2.92)

до тех пор, пока значение коэффициента (cmin+iDc) не превысит значение Сmax, после чего скользящий режим по условию (2.89) возникнуть не сможет, и перестроение функции переключения закончится. Движение фазовой точки после того момента будет происходить по близкой к границе gmax=cmaxx1+x2=0 фазовой траектории одной из структур без скользящего режима (рис. 2.11).

Шаг приращения Dс должен выбираться в зависимости от допустимого перерегулирования h в переходном процессе.

Таким образом, за счет предельного по условию (2.89) режима работы поддерживается максимальное быстродействие системы управления при изменении параметров объекта.


2.5.3.Пример адаптивной системы управления с переменной структурой

В большинстве случаев к СУ предъявляются порой противоречивые требования: максимального быстродействия в случае аварийных ситуаций и максимальной точности в нормальных режимах работы.

В таких случаях используют нелинейные алгоритмы управления, которые при малых отклонениях выходной координаты являются линейными, обеспечивающими высокую точность управления, а в аварийных режимах – приближаются к релейным, обеспечивая быстрое изменение выходной координаты объекта.

Существует множество разновидностей таких алгоритмов, которые в общем виде можно представить в такой форме

(2.93)

где e – ошибка регулирования;

Т – постоянная времени интегрирующего звена;

F1(e), F2(e) – нелинейные функции от e.

В качестве Fі(e) можно использовать следующие:

F(e) = e2sign e;

F(e) = ae3; (2.94)

F(e) = ae5 и т.д.,

где а – константа.

При этом на управляющее воздействие наложены ограничения

(2.95)

где Jmin, Jmax – минимальное и максимальное значения управления J(t).

 
 

На рис. 2.12 приведена функциональная схема нелинейного адаптивного регулятора с идентификацией коэффициента усиления объекта (см. рис. 2.7) и переменной структурой.

2.5.4.Контрольные вопросы и упражнения

1. Каковы преимущества релейных автоколебательных систем и систем с переменной структурой по сравнению с самонастраивающимися системами?

2. Покажите зависимость амплитуды автоколебаний релейной системы от характеристик релейного элемента и параметров линейной части системы.

3. Приведите структурную схему адаптивной релейной системы управления.

4. В чем заключается сущность скользящего режима системы управления?

5. Каковы необходимые условия существования скользящего режима.

6. В чем заключается принцип действия адаптивной системы в скользящем режиме?

7. Приведите пример адаптивной системы управления.

Обучающиеся системы

Обучающиеся системы создаются на основе принципа обучения, заключающегося в постепенном накоплении опыта формирования поведения системы при высокой степени неопределенности ее исходных состояний, по результатам которого происходит улучшение функционирования системы.

Способы накопления опыта могут быть разные, однако у всех есть общая черта – постепенное выделение «области знаний» из всей совокупности незнания. Это нашло отражение в использовании методов распознавания образов (классификации). Под классификацией понимается установление по результатам накопленного опыта границ между определенными классами сложных ситуаций.

Задача автоматического обучения классификации формулируется следующим образом.

Каждой возможной ситуации из множества рассматриваемых ставится в соответствие точка некоторого пространства х. Заранее известно, что в пространстве х необходимо выделить две или большее число областей или классов ситуаций.

Расположение границ между областями неизвестно, и нет определения правил, по которым можно определить принадлежность той или иной точки любой из заданных областей. Цель обучения заключается в построении поверхности, разделяющей предъявленные точки из указанного множества на заданное число классов.

Существует два подхода к обучению такому разделению:

1) обучение с поощрением, когда к классифицирующему автомату предъявляют ряд случайных точек из множества в пространстве х и сообщают информацию о принадлежности этих точек определенным классам. После цикла обучения автомат строит разделяющую поверхность и в дальнейшем может отличать принадлежность разным классам любых точек в пространстве х;

2) обучение без поощрения, когда автомат определяет факт компактного расположения нескольких точек по наблюдениям и строит разделяющие поверхности на основе меры близости компактных групп точек к разделяющей поверхности.

Сложность обучения заключается в том, что не всегда классы из близко расположенных друг к другу точек строго отделимы, т.е. возможно пересечение классов.

2.6.1.Метод секущих плоскостей

Пусть требуется разделить три фигуры, состоящие из набора точек. В автомат вводят сначала значения двух точек 1 и 2 (рис. 2.13). Автомат запоминает их и строит произвольную плоскость, разделяющие эти точки (точка 2 принадлежит классу В).

После предъявления точки 3 эта точка оказывается выше плоскости I и, следовательно, должна быть отнесена к классу В. Однако известно, что эта точка из класса А.

Противоречие разрешается построением новой плоскости II. При появлении новых точек 4 и 5 противоречий не возникает, и автомат не проводит новых плоскостей. При появлении точки 6 возникает противоречие между этой точкой, принадлежащей классу В и точками 4 и 5. Тогда сначала строят плоскость III, разделяющую точки 1 и 6, а затем плоскость IV, разделяющую точки 5 и 6.

Постепенно области, где точки противоречат разделению, сужаются и вероятность возникновения противоречий уменьшается. После цикла обучения построению разделяющих поверхностей можно отбросить лишние участки и получить разделяющую поверхность, состоящую из нескольких гиперплоскостей.

2.6.2.Метод потенциальных функций

Обычно задача обучения классификации рассматривается как задача разделения на два класса: Q и R. В детерминированной постановке оба класса не пересекаются друг с другом и могут быть четко отделены друг от друга.

Метод потенциальных функций позволяет за конечное число показов входных сигналов из обучающей последовательности построить разделяющую функцию Ф(х), принимающую положительные значения в точках, соответствующих классу Q и отрицательное в точках, соответствующих классу R.

Ф(х) в N-мерном пространстве признаков должна быть ограничена и представима линейной комбинацией ограниченных на х функций

(2.96)

где ci – неизвестные коэффициенты, обеспечивающие «достаточную гладкость» Ф(х);

ji –система функций разложения.

Причем должно соблюдаться условие

(2.97)

где li – последовательность положительных чисел, для которой

Каждой входной ситуации в пространстве Х ставится в соответствие потенциальная функция двух переменных:

. (2.98)

Ввиду ограниченности линейно независимой системы функций ji(х) функция ограничена по модулю при

При появлении точек из обучающейся последовательности х1, х2, …, хк строится потенциальная функция для каждой точки.

Для первой точки х1

(2.99)

Для второй точки х2

(2.100)

При невыполнении (2.99) k2(x) получается из k1(x) добавлением со знаком множества Q или R (по принадлежности х2) потенциала k(x1,x2).

На n-м шаге обучения строится потенциальная функция

(2.101)

где xs,xq – значения, подстановка которых в предшествующий потенциал приводила к ошибке.

На (n+1)-м шаге обучения возможны следующие сочетания:

(2.102)

При совпадении знаков множества Q или R (по принадлежности xn+1) и функции kn(xn+1)

(2.103)

При несовпадении знаков необходимо исправление kn(x):

(2.104)

где k(x,xn+1) имеет знак «+» в (2.102) для n = 3 и знак «–» в (2.102) для n = 4.

Таким образом, алгоритм построения разделяющей функции можно записать в следующем виде

(2.105)

Алгоритм (2.105) обеспечивает конечное число исправлений ошибок, если функция Ф(х) строго разделяет множества Q и R и представима разложением (2.96). Число исправлений в этом случае не превышает k, т.е.

(2.106)

На основании (2.106) следующий вывод об уменьшении числа исправлений k при прочих равных условиях с увеличением , т.е. чем более компактны разделяющие множества, тем меньше требуется исправлений ошибок для полного разделения множеств.

2.6.3.Вероятностные алгоритмы обучения

Трудноразделимые классы ситуаций требуют при автоматической классификации и распознавании образов вероятностных методов. При этом существенное значение приобретают априорные сведения о вероятностных характеристиках принадлежности объектов к тем или иным классам. Если априорные сведения достаточно полны, тогда можно использовать классический байесовский подход теории статистических решений, основанные на минимизации функции среднего риска R:

(2.107)

где х – предъявляемые для классификации ситуации;

Х – пространство ситуаций с классами Хk, Xm;

Pk – априорная вероятность ситуации в Хk;

Fkm – функция потерь, характеризующая ошибочность отнесения ситуации класса Хk к классу Xm,

M – число неизвестных заранее классов, причем функция потерь Fkm в классическом подходе выбирается либо постоянной, либо ее можно представить в виде

(2.108)

– фиксированный вектор параметров;

pk(x) – условная плотность распределения ситуаций класса Xk.

Границы между классами Хk и Xm определяются с помощью характеристических функций вида

(2.109)

также зависящих от вектора параметров .

Подставляя (2.108), (2.109) в (2.107), получим параметрическую форму записи функции среднего риска R(c):

. (2.110)

Учитывая, что в (2.110) средний риск R() зависит только от вектора параметров с, можно получить необходимые условия минимума среднего риска за счет приравнивания градиента R() по нулю:

(2.111)

Второе слагаемое в (2.111) определяет чувствительность характеристических функций и граничную или разделяющую любые классы xl и xm функцию

(2.112)

по знаку которой можно определить принадлежность ситуаций х к классу Xl или Xm (соответственно при или ).

Результатом решения уравнения (2.111) является экстремальное значение вектора параметров . Решение такого нелинейного уравнения в общем виде затруднено, поэтому экстремальное значение вектора определяется с помощью итеративных процедур в виде разностных уравнений, связывающих предшествующие и последующие дискретные значения с:

, (2.113)

или в виде дифференциальных уравнений в случае непрерывных c(t)

(2.114)

где Г[n], Г(t) – квадратные матрицы, определяющие шаг итерации и сходимости значений вектора к *.

В случае разделения пространства ситуаций Х только на два класса Х1 и Х2 средний риск R() равен

(2.115)

Необходимые условия минимума среднего риска

. (2.116)

Отсюда разделяющая функция получает следующий вид:

. (2.117)

Правило решения об отнесении ситуаций к классам выглядит так:

если то ;

если то . (2.118)

В классическом подходе используются постоянные функции потерь F11, F12, F21, F22 в виде

(2.119)

поэтому разделяющую функцию можно записать иначе:

(2.120)

или

(2.121)

где – отношение правдоподобия l(x);

– фиксированный порог h.

Следовательно, правило классификации (2.118) можно теперь представить таким образом:

(2.122)

Итак классическое байесовское правило классификации заключается в вычислении отношения правдоподобия l(x) и сравнении его с фиксированным порогом h, который зависит от выбранного правила оценки априорных вероятностей P1 и Р2. Нетрудно видеть, что отсутствие априорной информации об отношении правдоподобия лишает возможности использовать классический подход в задачах классификации и распознавания образов. В таких случаях используют методы обучения.

2.6.4.Обучение с поощрением

Пусть разделяющая функция имеет вид

. (2.123)

На этапах обучения сообщается информация о принадлежности ситуаций х к классам и :

Поощрение правильного распознавания или его ошибочность определяется в соответствии с неравенствами

– правильное распознавание;

– неправильное распознавание

и функцией штрафа в виде выпуклой функции разности у и

(2.124)

Учитывая, что разделяющая функция не известна, ее аппроксимируют комбинацией линейно независимых функций

(2.125)

тогда функция штрафа принимает вид

(2.126)

Подставив ее в выражение среднего риска R из (2.115), получим

(2.127)

где P(x) = P1p1(x) + P2p2(x) – совместная плотность распределения

В соответствии с условием среднего риска

, (2.128)

определяются итеративные алгоритмы обучения в дискретном виде

, (2.129)

и в непрерывном виде

(2.130)

Если вместо функции штрафа (2.126) взять выпуклую функцию J(c) в виде среднеквадратической ошибки аппроксимации разделяющей функции с помощью , т.е.

(2.131)

то минимизацию J(c) можно осуществить в соответствии с условием

, (2.132)

или

(2.133)

Обозначив , получим

(2.134)

Учитывая, что получим

(2.135)

откуда можно получить дискретные алгоритмы:

(2.136)

если ;

(2.137)

если .

Таким образом, неизвестная разделяющая функция адаптивно восстанавливается в результате обучения.

2.6.5.Самообучение

В отличие от обучения с поощрением самообучение происходит только по предъявляемым ситуациям без дополнительной информации о принадлежности ситуации к определенному классу. Теперь система должна автоматически определять не только принадлежность ситуации к классам, но и количество классов, которое, очевидно, не должно быть равно числу предъявленных ситуаций, а меньше его.

Информация о количестве классов может быть получена из выражения совместной плотности распределения

(2.138)

входящей в формулу среднего риска

(2.139)

где – функция потерь;

– неизвестный заранее составной вектор параметров.

По числу максимумов М совместной плотности распределения р(х) определяется число классов, поэтому при самообучении задача заключается в восстановлении совместной плотности распределения р(х) путем ее аппроксимации в виде

(2.140)

где j(х) – выбранная вектор-функция с ортонормированными компонентами;

– неизвестные коэффициенты.

В результате минимизации функционала

, (2.141)

получаем в дискретном виде алгоритм определения ат:

(2.142)

Минимизируя средний риск (2.139), можно получить разделяющую функцию fkm. Например, для случая двух максимумов М=2 (классов) средний риск

(2.143)

Условия минимума R:

(2.144)

где

Разделяющая функция имеет вид

Отсюда дискретные алгоритмы самообучения

(2.145)

если и

(2.146)

если

где Г1 и Г2 – матрицы коэффициентов, определяющие сходимость вектора к оптимуму.

2.6.6.Персептронная модель автоматической классификации

Рассмотрим принцип действия персептрона МАРК-1 (рис. 2.14).

В качестве воспринимающего устройства в персептроне использовано поле рецепторов в виде фотоэлектрического устройства, состоящего из нескольких сотен фотоэлементов. Каждый фотоэлемент может находиться в одном из двух состояний: 0 и 1. Выходные сигналы фотоэлементов поступают на входы «ассоциативных элементов» А, число которых сравнимо с числом фотоэлементов. Каждый А-элемент имеет несколько входов и один выход.

Входы А-элементов соединяются с выходами фотоэлементов случайным образом и со случайными знаками. В процессе обучения случайные связи сохраняются неизменными. А-элементы осуществляют алгебраическое суммирование поданных на их входы сигналов с фотоэлементов и сравнивают получаемую сумму с постоянным числом Q в соответствии с алгоритмом

(2.147)

где

 
 

Выходные сигналы А-элементов после переключения на независимые переменные коэффициенты lj складываются

, (2.148)

и поступают на вход регулирующего элемента R, который может находиться в одном из двух состояний: 0 или 1 в зависимости от положительности суммы (2.148), т.е.

(2.149)

В процессе обучения персептрон должен выдавать выходной сигнал 0 при предъявлении объектов класса А и выдавать 1 при предъявлении объектов класса В. Обучение заключается в том, что коэффициенты lj при каждом показе объектов класса А и получении на выходе А-элементов сигналов 1 увеличиваются на некоторую величину, а при показе объектов класса В уменьшаются на эту величину. Постепенно правильность ответов на предъявляемые объекты увеличивается, так как повышается сумма (2.148) при правильной классификации. По окончании обучения на последовательности объектов конечной длины автомат распознает с определенной точностью объекты классов А и В, если они и не предъявлялись ему на этапе обучения.

Решающее правило имеет вид:

(2.150)

Значение коэффициентов li изменяются в соответствии с правилом обучения:

(2.151)

2.6.7.Примеры адаптивных систем управления с использованием метода самообучения

Идентификация вероятностных характеристик возмущающих воздействий

Возмущающие воздействия объектов управления имеют стохастический характер и зачастую плотности распределения имеют сложный характер, отличающийся от гауссовского распределения.

Используя изложенный выше алгоритм классификации, можно определить центры классов, их дисперсии и вероятности.

Рассмотрим случай двух классов.

Условия минимума среднего риска имеют следующий вид:

(2.152)

где uk – центр k-го класса.

Разделяющая функция

(2.153)

Условие (2.152) определяет оптимальные значения параметров смеси , характеризующие центры классов.

Решение уравнений (2.152), (2.153) для случая двух классов приводит к следующим выражениям:

(2.154)

если

(2.155)

если

где gi(t) – коэффициент, удовлетворяющий следующим условиям:

.

Тогда при четной функции потерь разделяющая линия определяется равенством:

а решающее правило имеет вид:

при

при

Дисперсия определяется следующим образом:

где – дисперсия класса.

При квадратичной функции потерь минимизируется дисперсия, поэтому центры классов u1, u2 определяются по формулам:


Схема идентификатора приведена на рис. 2.15.

2.6.8.Адаптивное управление объектами при контролируемых возмущающих воздействиях

В большинстве промышленных объектов возмущающие воздействия представляют собой смеси двух классов. Если идентифицировать вероятностные характеристики возмущающих воздействий, можно использовать их для адаптации управляющего воздействия.

Рассмотрим случай аддитивной помехи. В зависимости от того, какие вероятностные характеристики возмущающего воздействия определяются, изменяется и алгоритм управляющего устройства.

Если идентифицируются только оценки центров классов возмущающего воздействия, то алгоритм имеет вид

(2.156)

где m1, m2 – коэффициенты усиления объекта соответственно по управляющему и возмущающему входам;

q1(t) – вероятность появления управляющего воздействия u1(t).

y* – задание.

Если алгоритм изучения предусматривает вычисление вероятности появления классов в смеси и , управляющее воздействие для случая двух классов имеет вид

(2.157)

где p1(t) – текущее значение вероятности появления первого класса в смеси;

q2(t) – неизвестный параметр.

В случае вычисления вероятности появления классов в смеси в управляющем устройстве управляющее воздействие определяется по формуле

(2.158)

где – заданная вероятность.

Ниже приведены структурные схемы СУ в соответствии с полученными алгоритмами.

Алгоритм (2.156) определяет случайную, (2.157) – смешанную и (2.158) – регулярную стратегии управления.

СУ со случайной стратегией применяют в случаях, когда возмущающие воздействия сравнительно медленно меняются во времени, а объект имеет стационарные параметры. Возмущающие воздействия полностью контролируемые.



Поделиться:


Последнее изменение этой страницы: 2016-12-16; просмотров: 525; Нарушение авторского права страницы; Мы поможем в написании вашей работы!

infopedia.su Все материалы представленные на сайте исключительно с целью ознакомления читателями и не преследуют коммерческих целей или нарушение авторских прав. Обратная связь - 3.135.205.146 (0.224 с.)