Lezione 13 Maggio Ricapitolazione del Controllo Ottimo LQ

PSC: Progettazione di sistemi di controllo III rim. 2007 Lezione 13 Maggio 16 Docente: Luca Schenato Stesori: Comin, Dal Bianco,Fabris, Parmeggiani 13.1 Ricapitolazione del Controllo Ottimo LQ Ripassiamo quanto fatto finora sul controllo ottimo LQ. Si consideri il sistema lineare: x +1 = Ax + Bu ; y = Cx ; = 0,..., del quale si desidera calcolare una successione di ingresso {u = (u 0,..., u 1 )} che minimizza un dato indice di costo quadratico, definito come segue: 1 ( ) J (x, u) = x W x + u Uu + x W x ; W 0, U 0 (13.1) =0 Vale a dire, si desidera risolvere il problema di minimo: Considerando la condizione iniziale: J (x 0 ) = min u J (x 0, u) S = W Si cerca di risolvere ricorsivamente la varianza d errore: S = A S +1 A + W A S +1 B ( B S +1 B + U ) 1 B S +1 A = Φ d (S +1 ) Il valore ottimo dei campioni di ingresso, che minimizzano la (13.1), risulta essere combinazione lineare dello stato: u = ( B S +1 B + U ) 1 B S +1 Ax = L x (13.2) Si può dunque calcolare il costo ottimo come: J (x 0 ) = x 0 S 0 x 0 13-1

PSC Lezione 13 Maggio 16 III rim. 2007 Dalle relazioni trovate si possono dedurre le seguenti proprietà: 1. Il controllo ottimo risulta una combinazione lineare degli ingressi. 2. Il costo ottimo dipende soltanto dalle condizioni iniziali. 3. Il guadagno ottimo L è tempo variante. 4. La varianza Φ d (S) risulta il duale della Φ(P ) attuando le sostituzioni: A A ; B C ; W Q; U R; S P ; Ci siamo poi posti il problema di calcolare l ingresso ottimo nel caso di orizzonte temporale infinito, vale a dire considerando. In questo caso sono sorte le seguenti domande: La successione di matrici S converge ad una matrice S? C è convergenza se e solo se la coppia (A, B) è stabilizzabile. La matrice S così calcolata è unica? Si è visto che c è unicità se la coppia (A, W 1/2 ) è rivelabile. Nel caso duale di orizzonte infinito, in cui S S, anche la matrice guadagno L converge ad un valore di regime calcolabile, considerando la (13.2), come: L K L = ( B S B + U ) 1 B S A 5. La matrice (A BL ) è strettamente stabile. Il controllo ottimo fornisce dunque una retroazione di stato stabilizzante. 6. Se il sistema è di tipo SISO il controllo ricavato fornisce un margine di fase m φ 60 7. Una possibile scelta empirica per W ed U è la forma diagonale. Nel caso di dimensione n = 2 risulta della forma: 1 x W = 1 0 1 2 1 ; U = ρ 0 x 2 u 2 2 dove x 1 2 deve avere lo stesso ordine di grandezza dell errore sulla componente x 1 che ci si aspetta. ale valore in genere ottenuto da conoscenze a priori del sistema o dall esperienza. Il parametro ρ R scelto in modo da ottenere penalizzare l ingresso se questo tende a saturare gli ingressi, cioe a ρ maggiori corrisponde un sistema piu lento ma con ingressi u di controllo piu piccoli. 13-2

PSC Lezione 13 Maggio 16 III rim. 2007 8. Il controllo ottimo non da alcun indice sul transitorio oppure sulla capacità di reiezione dei disturbi del sistema retroazionato. NOA:La tecnica di controllo LQ viene anche detta controllo ottimo (H 2 ). Questo metodo, diffuso fino agli anni 60-70, sebbene fornisca in modo rapido dei controllori con buone prestazione nella maggior parte dei casi, risulta essere robusto variazioni parametriche. Successivamente negli anni 80-90 e stato sviluppato il controllo (H ) che risulta essere piu performante ed efficiente. 13.2 Controllo Ottimo LQG Si desidera ora calcolare la sequenza di ingressi ottimi per un sistema dinamico lineare non più deterministico, bensì stocastico: x +1 = Ax + Bu + w y = Cx + v = 0,..., dove le variabili aleatorie w e v sono Gaussiane a media nulla: w N (0, Q), Q 0 v N (0, R), R 0 (13.3) Esattamente come nel caso deterministico, si ricerca la sequenza di ingressi {u = (u 0,..., u 1 )} che minimizzano l indice di costo quadratico: 1 ( ) J (x, u) = E x W x + u Uu + x W x, W, U 0 (13.4) =0 Vale a dire, si desidera calcolare u = f (u 0,..., u 1, y 0,..., y ), = 0,..., tale da risolvere il problema di minimo: min u J (u 0,..., u 1, x 0 ) È da notare che nella definizione della funzione costo (13.4) si è fatto uso dell operatore di aspettazione. Infatti questa volta la traiettoria di stato {x } è un processo aleatorio, e di conseguenza non ne possiamo conoscere le particolari realizzazioni. 13-3

PSC Lezione 13 Maggio 16 III rim. 2007 13.2.1 Filtro di Kalman con ingressi In questo caso l espressione del filtro tiene conto anche dei segnali di ingresso u: ˆx = E x y,..., y 0, u,..., u 0 Ricordando che c è scorrelazione tra e e ˆx, si calcola la predizione Calcolando l errore di predizione: ˆx +1 = E x +1 y,..., y 0, u,..., u 0 = E Ax + Bu + w y,..., y 0, u,..., u 0 = AE x y,..., y 0, u 1,..., u 0 + Bu = Aˆx + B e +1 = x +1 ˆx +1 = Ax + Bu + w (Aˆx + Bu ) = Ax Aˆx + w Si nota che l errore è indipendente dall ingresso. La varianza d errore diviene: P +1 = AP A + Q Per quanto riguarda l aggiornamento d errore di stima: mentre la varianza dell errrore di predizione ˆx +1 +1 = ˆx +1 + K +1 +1 (y +1 C ˆx +1 ) P +1 +1 = P +1 P +1 C (CP +1 C + R) 1 CP +1 Se ne deduce che: 1. Le equazioni varianza d errore e il guadagno K sono indipendenti dall ingresso u; 2. L unica differenza rispetto al filtro senza ingressi è l aggiunta di u nell equazione di predizione della stima. 3. Come conseguenza della 1. si trova che e ˆx cioè la stima ottima è scorrelata dal suo errore E e ˆx y,..., y 0, u 1,..., u 0 = 0 13-4

PSC Lezione 13 Maggio 16 III rim. 2007 Adesso ci si pone il problema di trovare degli ingressi u tali da minimizzare una funzione costo ottimo V dal passo a e si calcola ricorsivamente per =, 1,..., 0: (x ) min u K dove sono stati definiti gli spazi Ed il costo ottimo all istante finale E x W x + u Uu }{{} + +1(x +1 ) Y, U 1 (13.5) costo attuale C(x,u ) Y = (y 0,..., y ), U = (u 0,..., u ) 0 (x 0 ) = J (x 0 ) (13.6) Per il calcolo esplicito dei costi (13.5) sarà utile dimostrare il seguente teorema. eorema 13.1. La funzione costo ottimo per ogni passo = 0,..., è pari a (x ) = E x S x Y, U 1 + c (13.7) dove S è una matrice (n n) semidefinita positiva e c uno scalare non negativo, c R, c 0. Dimostrazione: La dimostrazione si esegue per induzione su. 1. (caso base) =. S = W, c = 0 per definizione (13.6). 2. (passo induttivo) supponiamo che (13.7) sia vera per + 1, dimostreremo che vale anche per. Per ipotesi si puó dunque scrivere V (x ) = min E x u W x + u Uu + E x +1S +1 x +1 Y +1, U + +c +1 Y, U 1 Ma, considerando che Y +1 = y +1 Y U = u U 1 e per le proprietà dell aspettazione, si può scrivere V (x ) = min E x W x u + u Uu + x +1S +1 x +1 + c +1 Y, U 1 (13.8) 13-5

PSC Lezione 13 Maggio 16 III rim. 2007 Usando ora le (13.3), V (x ) = min E x u W x + u Uu + (Ax + Bu + w ) S +1 (Ax + Bu + w ) + +c +1 Y, U 1 = min E x u W x + u Uu + x A S +1 Ax + 2x A S +1 Bu + +u S +1 u + w S +1 w + 2w S +1 (Ax + Bu ) + c +1 Y, U 1 Ma, dato che x e u sono scorrelati da w, E 2w S +1 (Ax + Bu ) = 0 e tenuto conto che gli ingressi sono una funzione del tipo u = f (U 1, Y ) risulta V (x ) = E x W x + x A S +1 Ax + c +1 Y, U 1 + E w S +1 w + ( +min u u U + B S +1 B ) u + 2u B S +1 AE x Y, U 1 Inoltre, sfruttando le proprietà dell operatore traccia: E w S +1 w }{{} = tr ( E w S ) +1w ( ) = E tr w S +1 w = è scalare = E tr ( ) S +1 w w = tr (S+1 Q) scriviamo (x ) = E x W x + x A S +1 Ax Y, U 1 + tr (S+1 Q) + ( +min (u u U + B S +1 B ) ) u + 2u B S +1 AE x Y, U 1 Ma, per definizione E x Y, U 1 = ˆx Di conseguenza l ingresso ottimo u che minimizza V vale u = ( B S +1 B + U ) 1 B S +1 Aˆx = L ˆx e risulta essere combinazione lineare della stima di stato ˆx. Si ottiene allora: (x ) = E x W x + x A S +1 Ax Y, U 1 + tr (QS+1 ) (13.9) E ˆx A S +1 B ( U + B S +1 B ) B S +1 Aˆx Y, U 1 + c+1 13-6

PSC Lezione 13 Maggio 16 III rim. 2007 Ricordando che vale sempre la proprietà E (x ) x ( ) V x Y, U 1 = E ˆx + ˆx V x ˆx + ˆx Y, U 1 (x ) ( ) = E ˆx V x ˆx Y, U 1 + (x ) +2E ˆx V ˆx Y, U 1 + E ˆx V ˆx Y, U 1 e ponendo in quest ultima la (13.9) diviene (x ) = E x = tr ( V P ) + 0 + ˆx V ˆx V = A S +1 B ( U + B S +1 B ) B S +1 A ( W + A S +1 A A S +1 B ( B S +1 B + U ) ) 1 B S +1 A x Y, U 1 + +tr (S +1 Q) + tr ( P V ) + c +1 (13.10) La dimostrazione della proposizione è così conclusa se si definiscono la matrice S S = A S +1 A + W A S +1 B ( B S +1 B + U ) 1 B S +1 A (13.11) e lo scalare c = c +1 + tr (QS +1 ) + tr ( V P ) (13.12) La dimostrazione precedente ci fornisce un metodo ricorsivo per il calcolo dell ingresso ottimo, tramite la (2), e per l aggiornamento delle matrici S e degli scalari c, tramite le equazioni (13.11) e (13.12). Si ottiene infine che il costo minimo risulta pari a J = Vo (x 0 ) = E 1 x 0 S 0 x 0 + tr ( ) QS +1 + P V dove il primo addendo dipende dallo stato iniziale, mentre il secondo è il termine dovuto al rumore. In conclusione abbiamo visto che nel controllo ottimo LQG vale il principio di separazione in particolare è la serie di un filtro di Kalman e di un controllo LQ: =1 u = L ˆx 13-7