ФЭА / АИТ / Комиссарчик В. Синтез многомерных дискретных регуляторов в пространстве состояния
(автор - student, добавлено - 14-04-2013, 13:37)
7. Синтез многомерных дискретных регуляторов в пространстве состояния 7.1. Формулировка задачи оптимального управления Задача синтеза многомерного регулятора в пространстве состояния формализуется обычно в виде задачи о максимальной точности с интегральным квадратичным функционалом I :
(249) где 10, (1- соответственно начальное и конечное время, ( - *0)- интервал управления (при (1 имеем бесконечный интервал управления), х - вектор переменных состояния системы размерностью п (п - вектор); и - г - вектор переменных управления; ^ - (п х п) - квадратная положительно определенная диагональная матрица весовых коэффициентов состояния; К - (г х г) - квадратная положительно полуопределенная диагональная матрица весовых коэффициентов управления. Вообще говоря, в критерии задачи (249) вместо вектора состояния х следовало бы писать отклонение вектора состояния от его заданного значения хзад. Однако для упрощения записи полагаем хзад = 0 . Размерность вектора состояния равна порядку дифференциального уравнения (системы уравнений), которыми описывается данная динамическая система. Первое слагаемое (квадратичная форма матрицы 0) вводится в критерий задачи (249) с целью минимизации суммы интегральных коэффициентами равными элементам матрицы ^. Второе слагаемое в критерии задачи (249) (квадратичная форма матрицы К ) позволяет минимизировать сумму квадратичных интегральных критериев для переменных управления взятых с весами равными элементам матрицы К и таким образом ввести ограничения на управление. Поскольку многомерные регуляторы проще всего реализовать с помощью цифровых вычислительных устройств, перейдем к дискретному аналогу задачи (249): (250) где N - число периодов квантования по времени в интервале управления (Как в задаче (240), последующее состояние и предыдущее управление в силу запаздывания в объекте управления отнесены к одному шагу). 7.2. Уравнения состояния и измерения При решении задачи оптимального управления (249) уравнения динамики объекта (системы) управления записывают в виде системы дифференциальных уравнений первого порядка в матричной форме записи и называют матричным уравнением состояния. Для линейных стационарных систем уравнение состояния имеет вид:
х = Ах + Ви, где х - п - вектор первых производных переменных состояния, А и В - соответственно (п х п) - и (п х г) - матрицы состояния и управления. В реальных условиях измерению доступны только отдельные элементы вектора состояния или их линейные комбинации, поэтому уравнение состояния дополняется матричным уравнением измерения (выхода), связывающим 1 - вектор выходных переменных у с вектором состояния: у = С • х, (252) где С - (1 х п) - матрица выхода. В качестве примера рассмотрим получение матричного уравнения состояния для одномерного по управлению объекта, описываемого дифференциальным уравнением п - го порядка (2), которое перепишем в виде п-1 т т-1 Лп^ч Лп—1^ лтЛ1 Лт—1л, а у а у а и а и ап + ап 1----------------------- +---------- + а0 у = Ът + Ът л +---------- + Ъ0 и п &п жп—1 т аг от4 0 Пусть для определенности т = п 1. Запишем преобразование Лапласа уравнения (253) (апРП + ап-1 РП~1 + • ” + а0 Ьу(Р) = (ъп—1РП—1 + Ъп-2РП— + • ” + Ъ0 )и(Р) , (254) или А( Р) у( Р) = В( Р)и (Р), (255) где А ( Р ) и В(р) - полиномы от Р порядков п и (п — 1) соответственно. Из (255) следует, что у(Р) = В(Р) и(Р)1А(Р), (256) Обозначим и (Р)1 А(Р) = х( Р), (257) тогда выражения (256), (257) можно записать в виде: у (Р) = В(Р) х(Р) (258) А( Р) х( Р) = и (Р) (259)
Запишем оригиналы выражений (258), (259) п-1 п-2 У = Ъп-1 х + Ъп2 х + + Ъ1 х + Ъ0 х п п-1
ап х+ ап_1 х +----- + а1 х + а0 х = и Введем переменные состояния х1 = х х2 = х
х3 = х п-2 хп-1 = х п-1 хп = х
Тогда уравнение (261) с учетом обозначений (262) можно записать в виде следующей системы уравнений первого порядка: хп-1 = хп хп = — (и - а0х1 - а1 х2-------------- ап-1 хп) а По существу первые (п -1) уравнений системы (263) являются обозначениями, а п - ое уравнение получено из уравнения (261). Вводя обозначения
получаем матричное уравнение состояния в форме (251).
описываемого следующими системами уравнений:
&1 =-(У Т1 )х1 + (К7 Т1 )и1
&3 = -(1/Т3 )х3 + ((3/Т3 )х1 х х4 =-(1/Т4 )х4 + (4 /Т4 Х2 х5 = -(1/Т5 )х5 + (5 /Т5 )х4 У1 = х2 - К6 х4 У 2 = х3 + х5 матрицы состояния, управления и выхода выглядят следующим образом:
Для перехода к дискретному уравнению состояния рассмотрим решение уравнения состояния (251) при постоянных матрицах А, В, начальном состоянии х0 и ступенчатом управлении и0 :
х(^) = еА<1 ?0)х0 + А 1 [еА(/ ?0) - Е]Ви0 Матричная экспонента еА(г ^ определяется разложением в степенной ряд А-(1 -0 ) е ( 0) * Е + А(? -10) + А2 (I- ^0)^/2! + + Ак (? - ?0)к/к! +— (266) Обозначим
_____ ,-,А •(г-10) I-/( С^ = А'1 [еА(?-?0) - Е]В = А'1 (р - Е)х Матрицы р и С называются переходными матрицами состояния и управления соответственно. Если матрица А плохо обусловлена, нахождение матрицы В вызывает определенные трудности, поэтому желательно определить матрицу С так, чтобы избежать операции обращения матрицы А . Введем в рассмотрение матрицу Ч : Ч,-0 = А ' (р-о - Е) С учетом (266), (267) выражение для матрицы Ч принимает вид: Ч,-,о = Е(? - ,о) + А(/ - 072! + ■” + А 1(, - ,о)к 1к! + •” (269) Тогда матрицы С и Р могут быть выражены через матрицу Ч следующим образом: С-,о = Ч-оВ (27о) р,-,о = -,о + Е (271) Как видим, для вычисления матрицы С по формуле (27о) не требуется обращать матрицу А . С учетом обозначений (267), (268) выражение (265) для переходной функции приобретает вид: х ^ ) = р-,о хо + С,-,о и о Положив в последнем соотношении ,о = кТ; хо = Х[кТ]; ио = и[кТ]; , = (к + 1)Т; , - ,о = Т, получаем дискретное уравнение состояния: х[(к + 1)Т ] = Р (Т) х[кТ ] + С (Т )и[кТ ] или в упрощенной форме записи: хк+1 = рхк + Сик (272) Матрицы Р(Т) и С(Т) можно найти из выражений (269) ^ (271), заменив в них (, -,о) на Т : Ч(Т) = ЕТ + АТ 2/2! + А2Т3 /3! + • • • + Ак-1Тк/к! + • • • (273) Р (Т) = АЧ (Т) + Е (274) С (Т) = У (Т) В (275) Дискретным аналогом уравнения выхода (252) является уравнение ук = Схк (276) 7.3. Синтез дискретного П-регулятора состояния Решаем задачу (250) при условии, что объект управления описывается уравнением (272). Предположим, что в процессе решения мы находимся на к -том от начала или 7 -том от конца шаге управления (к = N - ]). Обозначим минимальное значение целевого функционала на оставшихся шагах управления (функцию оптимального поведения) через 1*к : 11=т1П +1 + и1Кик) (277) икк Уравнение дискретного П - регулятора будем искать в виде: ик = Кр, Л, (278) где Кр, к - (г х п) - матрица коэффициентов передачи оптимального регулятора на к -том шаге. Последовательно выражая хк+1 через хк и ик через хк с помощью уравнений объекта (272) и регулятора (278) для к = N -1, N - ] , функцию оптимального поведения (277) можно представить в виде квадратичной * формы некоторой матрицы Рк : I* = хТкРк хк (279) или для момента времени (к +1): 1к+1 = хк+1 Рк:+1 хк+1 (280) * Рк - квадратная симметричная (п х п) - матрица. В соответствии с принципом оптимальности Беллмана, каково бы ни было состояние системы перед очередным к -тым шагом, управление ик на этом шаге выбирается так, чтобы минимизировать сумму функции в круглых скобках (250) на к -том шаге и функции оптимального поведения на оставшихся (к -1 )-м шагах, т.е. I* = т‘п + «1К«к + 4,), к или с учетом (280): 4* = т1п[^[+1 [ + Рк+1) Хк+1 + “1КЩ] (281) ик Поскольку состояние -к+, в момент к ещё неизвестно, его можно определить из уравнения объекта (272). При этом выражение (281), в котором для кратности обозначено Рк+1 = й + Р+1 , (282) принимает вид: I* = т1п1хТ'рТР1+1 р-к + 2*1рТрыС«к + ик + Г (рТРк+1С + Р)щ ] (283)
Оптимальное управление на к -том шаге находим из условия стационарности Iк: = 2[сТр+1 р [ + {вТрыс+к ) ]=о, откуда Г = ~(оТРк+1С + к)"’ СТРк+1 р-к (284) Сопоставляя (284) с (278), убеждаемся, что к„, к = -(сТР4+1С + к)-1 СТРк+.р . (285)
Для определения матрицы Рк+1 подставим (284) в (283). После
преобразований получаем
I* = х!РТРы [е - С (сТРк+,С + д}-1 СТРЫ ]рхк (286)
Сопоставляя (286) с (279), а также учитывая (282), находим:
Рк = ^ + РТРк+1 [е - с (сТРк+[ Д^ СТРк+. ]р (287) Уравнение (287) есть конечно-разностный аналог дифференциального уравнения Риккати. При бесконечном интервале управления (N ^ да) оно вырождается в алгебраическое уравнение:
р = + рТр е - с (стрс + дх-1 СТР р а выражение (285) для матрицы коэффициентов передачи регулятора принимает вид:
(289) Выражения (289), (288) позволяют рассчитать матрицу коэффициентов оптимального по точности П - регулятора состояния. Уравнение (288) является нелинейным и в общем случае его решение в явном виде получить не удается. Однако его можно рассматривать как рекуррентное соотношение:
и использовать для его решения итерационные методы. В качестве критерия останова можно использовать, например, близость евклидовых норм матриц на соседних шагах. Структурная схема многомерной дискретной системы с объектом управления (272) и оптимальным по точности П - регулятором состояния (289) приведена на рис. 79.
8.4. Синтез дискретного ПИ-регулятора состояния - выхода Поскольку система с П-регулятором, как отмечалось в разделе 2.3, характеризуется статической ошибкой, рассмотрим теперь систему с ПИ- регулятором, описываемым уравнением: к гк = К 0 X е + К1 хк (290) 1=1 где е = узад - у1 - 1 -вектор рассогласования выхода относительно его заданного значения (для простоты считаем у зад = 0); К 0 и К1- соответственно (г х 1) - и (г х п) - матрицы коэффициентов передачи И-составляющей и П-оставляющей закона регулирования. Регулятор, описываемый уравнением (290), является пропорциональным по состоянию и интегральным по выходу и называется поэтому ПИ-регулятором состояния - выхода. Для того, чтобы избавиться в (290) от суммы, запишем уравнение ПИ-регулятора в приращениях: Гк = $к-1 + К0+ К1 (хк - хк-1х (291) Будем решать задачу:
где Аик = и к - ик-1 - приращение вектора управления. (Считаем, что объект управления по-прежнему описывается уравнением (272)). Поскольку, как видно из (290), управление зависит теперь не только от состояния, как в регуляторе (278), но и от суммы рассогласований выхода, введем расширенный вектор состояния -к : 1 хр = к ~ X,, Для того, чтобы избавиться от суммы в определении расширенного вектора состояния, перейдем к его приращению: ек АХ р = Ах,,
Ах к = Хк- Хк-1 Определим теперь конечно - разностное уравнение для вектора Ахр . Учитывая, что узад = 0, приращение вектора рассогласования равно: Ае к+1 = -Аук+1 , или с учетом уравнения выхода (276) Гк+1 = Гк - САХк +1 (293) Подставляя в (293) конечно - разностное уравнение объекта (272), записанное в приращениях (294) АХ к+1 = РАХ к + САй к получаем
ек+1 = ек - СрАХк - ССАик Вводя обозначения
можем объединить уравнения (295), (294) в конечно - разностное уравнение эквивалентного объекта (расширенное уравнение состояния): Лхр+, = ЕР Ах к + СР Лщ (296) Теперь задачу (292) можно свести к задаче (250), записав её в виде: т1п 1 = Ё ((Лхк+1 ( ((+1 + М1КМк ) (297) к=0
Поскольку в исходной задаче (292) весовые коэффициенты относились только к вектору рассогласования выхода, расширенная матрица весовых коэффициентов состояния в задаче (297) определяется следующим образом
Таким образом, задача синтеза ПИ-регулятора состояния - выхода (291) сведена к задаче (297) эквивалентной задаче синтеза П-регулятора с расширенным вектором состояния и эквивалентным объектом (296). Решая эту задачу с помощью соотношений, аналогичных (289), (288), получаем г х (1 + п)- матрицу коэффициентов ПИ-регулятора КПИ , которую можно расчленить на подматрицы коэффициентов П- и И- составляющих регулятора К1 и К0 : К ПИ =| Ко м К, 8.5. Синтез дискретного наблюдателя состояния Поскольку реализация регуляторов (278) или (291) требует знания вектора состояния, возникает задача восстановления состояния по выходным переменным. Эта задача решается с помощью устройств, называемых наблюдателями состояния. Одним из возможных вариантов реализации наблюдателя является наблюдатель Люенбергера, описываемый в дискретном случае уравнением:
или
Хк+1 _ КНС^ + ОТк + Кнук , Хк- где хк - оценка вектора состояния, Кн - (п х 1) - матрица коэффициентов передачи наблюдателя, в определении которой и заключается задача синтеза наблюдателя. Уравнению (298) соответствует структурная схема на рис. 80.
Как видно из рис. 80, наблюдатель состояния представляет замкнутую систему с двумя входами ук и и к . Если эта система устойчива и обладает малой статической ошибкой, то по окончании переходного процесса Ук стремится к ук и, следовательно, &к стремится к х к . Задача определения матрицы коэффициентов наблюдателя состояния так же, как и задача синтеза ПИ-регулятора, может быть сведена к задаче, эквивалентной задаче синтеза П-регулятора (250). Рассмотрим ещё раз систему с объектом (272) и стационарным регулятором (278). Подставляя (278) в (272), получаем уравнение замкнутой системы:
или
которому соответствует следующее характеристическое уравнение:
(300) Характеристическое уравнение наблюдателя состояния (299): 4ефЕ - (Е - КНС)]= 0, или после транспонирования выражения в квадратных скобках: &ех[гЕ -(Ет - СтКТН )]= 0 Введем обозначения
Тогда характеристическое уравнение наблюдателя принимает вид:
(301) Сравнивая (300) и (301), убеждаемся, что задача синтеза наблюдателя состояния эквивалентна задаче синтеза эквивалентного П- регулятора:
для эквивалентного объекта управления
Решая эквивалентную задачу с помощью соотношений (289), (288), определяем матрицу коэффициентов передачи эквивалентного регулятора Кр3 и, следовательно, искомую матрицу коэффициентов передачи наблюдателя Кн = -Кр .
Структурная схема многомерной дискретной АСР с ПИ - регулятором состояния - выхода и наблюдателем состояния приведена на рис. 81.
Похожие статьи:
|
|