Controllo Ottimo e Predittivo per Sistemi Dinamici a Parametri Concentrati

Похожие документы

INTRODUZIONE AL CONTROLLO OTTIMO

Esempio. Approssimazione con il criterio dei minimi quadrati. Esempio. Esempio. Risultati sperimentali. Interpolazione con spline cubica.

Capitolo 4: Ottimizzazione non lineare non vincolata parte II. E. Amaldi DEIB, Politecnico di Milano

Laboratorio Complementi di Ricerca Operativa DEI, Politecnico di Milano. Stima di parametri

GIROSCOPIO. Scopo dell esperienza: Teoria fisica. Verificare la relazione: ω p = bmg/iω

Energia e Lavoro. In pratica, si determina la dipendenza dallo spazio invece che dal tempo

Matematica 1 - Corso di Laurea in Ingegneria Meccanica

2 + (σ2 - ρσ 1 ) 2 > 0 [da -1 ρ 1] b = (σ ρσ1 σ 2 ) = (σ 1

Corso di Matematica per la Chimica

Ottimizazione vincolata

Parte 3. Rango e teorema di Rouché-Capelli

Grandezze scalari e vettoriali

APPLICAZIONI LINEARI

. Si determina quindi quale distanza viene percorsa lungo l asse y in questo intervallo di tempo: h = v 0y ( d

Richiami su norma di un vettore e distanza, intorni sferici in R n, insiemi aperti, chiusi, limitati e illimitati.

Appunti sul corso di Complementi di Matematica - prof. B.Bacchelli Equazioni differenziali lineari omogenee a coefficienti costanti.

Se x* e punto di minimo (locale) per la funzione nell insieme Ω, Ω = { x / g i (x) 0 i I, h j (x)= 0 j J } lo e anche per F(x) = f o (x) + c x x 2

PROBLEMI TRADIZIONALI SIMULAZIONE DELLA PROVA DI MATEMATICA

bensì una tendenza a ruotare quando vengono applicate in punti diversi di un corpo

Segnali e Sistemi. Dispensa integrativa per l insegnamento di Elementi di Controlli Automatici. Gianni Borghesan e Giovanni Marro

MINIMI QUADRATI. REGRESSIONE LINEARE

Massimi e minimi vincolati

FUNZIONI ELEMENTARI - ESERCIZI SVOLTI

2 Argomenti introduttivi e generali

RETTE, PIANI, SFERE, CIRCONFERENZE

Nome..Cognome.. Classe 4G 4 dicembre VERIFICA DI FISICA: lavoro ed energia

Modulo di Meccanica e Termodinamica

QUESITO 1 A FISICA. Il candidato illustri il primo principio della termodinamica. Consideri poi la seguente

CONTINUITÀ E DERIVABILITÀ Esercizi proposti. 1. Determinare lim M(sinx) (M(t) denota la mantissa di t)

Modelli matematici e realtà:

LE FIBRE DI UNA APPLICAZIONE LINEARE

Dimensione di uno Spazio vettoriale

2.1 Definizione di applicazione lineare. Siano V e W due spazi vettoriali su R. Un applicazione

Controlli Automatici T. Trasformata di Laplace e Funzione di trasferimento. Parte 3 Aggiornamento: Settembre Prof. L.

VC-dimension: Esempio

Transitori del primo ordine

LE FUNZIONI A DUE VARIABILI

Algebra Lineare e Geometria

Università degli studi di Salerno corso di studi in Ingegneria Informatica TUTORATO DI FISICA. Lezione 5 - Meccanica del punto materiale

Parte 6. Applicazioni lineari

Elettronica II Proprietà e applicazioni della trasformata di Fourier; impedenza complessa; risposta in frequenza p. 2

Esempi di funzione. Scheda Tre

Richiami sulle derivate parziali e definizione di gradiente di una funzione, sulle derivate direzionali. Regola della catena per funzioni composte.

09 - Funzioni reali di due variabili reali

Parte 2. Determinante e matrice inversa

2 R = mgr mv2 0 = E f

SVM. Veronica Piccialli. Roma 11 gennaio Università degli Studi di Roma Tor Vergata 1 / 14

analisi di sistemi retroazionati (2)

Matematica generale CTF

Sono casi particolari di MCF : SPT (cammini minimi) non vi sono vincoli di capacità superiore (solo x ij > 0) (i, j) A : c ij, costo di percorrenza

Rette e curve, piani e superfici

Tempo di risposta di un termometro a mercurio

Appunti delle esercitazioni di Ricerca Operativa

Analisi Matematica 2 per Matematica Esempi di compiti, primo semestre 2011/2012

a) Osserviamo innanzi tutto che dev essere x > 0. Pertanto il dominio è ]0, + [. b) Poniamo t = log x. Innanzi tutto si ha:

Interpolazione ed approssimazione di funzioni

FUNZIONI LINEARI. FUNZIONE VALORE ASSOLUTO. Si chiama funzione lineare (o funzione affine) una funzione del tipo = +

Indice. 1 Introduzione alle Equazioni Differenziali Esempio introduttivo Nomenclatura e Teoremi di Esistenza ed Unicità...

1 Serie di Taylor di una funzione

Basi di matematica per il corso di micro

Capitolo 13: L offerta dell impresa e il surplus del produttore

Ottimizzazione non Vincolata

Da una a più variabili: derivate

PROGRAMMAZIONE LINEARE IN DUE VARIABILI

FAM. 1. Sistema composto da quattro PM come nella tabella seguente

x (x i ) (x 1, x 2, x 3 ) dx 1 + f x 2 dx 2 + f x 3 dx i x i

LEZIONE 23. Esempio Si consideri la matrice (si veda l Esempio ) A =

Il concetto di valore medio in generale

Funzioni con dominio in R n

Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale

Docente: Anna Valeria Germinario. Università di Bari. A.V.Germinario (Università di Bari) Analisi Matematica ITPS 1 / 22

EQUAZIONI non LINEARI

Regressione non lineare con un modello neurale feedforward

Cap 3.1- Prima legge della DINAMICA o di Newton

Massimi e minimi vincolati di funzioni in due variabili

Applicazioni lineari

Approssimazione polinomiale di funzioni e dati

Modelli per la gestione delle scorte

MATEMATICA. { 2 x =12 y 3 y +8 x =0, si pone il problema di trovare, se esistono, un numero x ed un numero y che risolvano entrambe le equazioni.

Forze, leggi della dinamica, diagramma del. 28 febbraio 2009 (PIACENTINO - PREITE) Fisica per Scienze Motorie

SIMULAZIONE TEST ESAME - 1

CONI, CILINDRI, SUPERFICI DI ROTAZIONE

3 GRAFICI DI FUNZIONI

Numeri Complessi. 4. Ricordando che, se z è un numero complesso, zz è un numero reale, mettere sotto la forma. z 2 + 2z + 2 = 0. z 2 + 2z + 6 = 0.

Forze come grandezze vettoriali

I appello - 24 Marzo 2006

13. Campi vettoriali

ESERCIZI APPLICAZIONI LINEARI

1. calcolare l accelerazione del sistema e stabilire se la ruota sale o scende [6 punti];

Metodi numerici per la risoluzione di equazioni. Equazioni differenziali ordinarie

CONTINUITÀ E DERIVABILITÀ Esercizi risolti

Esercizi su lineare indipendenza e generatori

I tre concetti si possono descrivere in modo unitario dicendo che f e iniettiva, suriettiva, biiettiva se e solo se per ogni b B l equazione

Esponenziali elogaritmi

Funzione reale di variabile reale

RICERCA OPERATIVA GRUPPO B prova scritta del 22 marzo 2007

Analisi 2. Argomenti. Raffaele D. Facendola

Транскрипт:

Controllo Ottimo e Predittivo per Sistemi Dinamici a Parametri Concentrati Angelo Alessandri alessandri@diptem.unige.it Dipartimento di Ingegneria della Produzione, Termoenergetica e Modelli Matematici (DIPTEM) Università degli Studi di Genova

Controllo Ottimo e Predittivo per Sistemi Dinamici 2 Decisione e Pianificazione Decisione: problema modello del problema soluzione del problema decisione Pianificazione: prendere decisioni su un problema in anticipo risoluzione del problema decisione risoluzione del problema decisione t t+ t+t t+ +T : orizzonte di controllo T: orizzonte di predizione

Controllo Ottimo e Predittivo per Sistemi Dinamici 3 Principali argomenti Sistemi dinamici. Controllo ottimo di un sistema dinamico. Controllo in anello aperto e in anello chiuso. Soluzione di problemi di controllo ottimo per sistemi dinamici. Programmazione matematica: ottimizzazione. richiamo dei principali algoritmi di Controllo predittivo. Reti approssimanti. Approssimazione di una legge di controllo predittivo in anello chiuso.

Controllo Ottimo e Predittivo per Sistemi Dinamici 4 Sistemi dinamici a tempo continuo: esempio del pendolo Un oggetto puntiforme di massa m è vincolato a una cerniera tramite un asta di lunghezza l e massa trascurabile. Supponiamo che sulla massa m agiscano solo la forza peso e una forza di attrito proporzionale alla velocità. Indicato con θ l angolo tra l asta e la perpendicolare, la velocità e l accelerazione della massa lungo la tangente alla circonferenza sono: v tan (t) = d(lθ) dt a tan (t) = dv tan(t) dt = l θ = l θ. θ l mgsinθ mg

Controllo Ottimo e Predittivo per Sistemi Dinamici 5 Equazione differenziale di un sistema dinamico a tempo continuo Se proiettiamo la relazione di uguaglianza fornita dalla legge di Newton lungo direzione della retta tangente alla circonferenza nel punto in cui si trova la massa, si ottiene: ml θ = mgsinθ bl θ dove b è un coefficiente di attrito e g è l accelerazione di gravità. Si tratta di un equazione differenziale ordinaria non lineare del secondo ordine: θ + b m θ + g l sinθ = 0 Definiamo il vettore di stato x = ( x1 x 2 ) = ( θ θ ).

Controllo Ottimo e Predittivo per Sistemi Dinamici 6 Equazione di stato di un sistema dinamico a tempo continuo L equazione di stato del pendolo è dunque ẋ 1 = x 2 ẋ 2 = g l sinx 1 b m x 2 In generale, per modellare un sistema dinamico, autonomo (non sottoposto a ingressi esterni) e tempo invariante si può utilizzare un equazione differenziale ordinaria del tipo ẋ = f (x), t 0, x R n L esistenza della soluzione del Problema di Cauchy di tale equazione con condizioni inziali x(0) assegnate è garantita sotto ipotesi di continuità di f( ); se f( ) è Lipschitz, la soluzione è anche unica.

Controllo Ottimo e Predittivo per Sistemi Dinamici 7 Sistemi dinamici a tempo continuo con ingresso di controllo Pendolo sottoposto a ingresso di controllo (coppia): I = ml 2 è l inerzia e u è il controllo: ẋ 1 = x 2 ẋ 2 = g l sinx 1 b m x 2+ 1 I u Per modellare un sistema dinamico tempo invariante con ingressi di controllo si può utilizzare in generale l equazione differenziale: ẋ = f (x,u), t 0 u θ blω dove x R n è il vettore di stato e u R m è il vettore di controllo. mg

Controllo Ottimo e Predittivo per Sistemi Dinamici 8 Sistemi dinamici a tempo discreto Sistemi dinamici descritti da equazioni alle differenze: sistemi dinamici autonomi x k+1 = f (x k ), k = 0,1,... dove x k R n è il vettore di stato; sistemi dinamici non-autonomi x k+1 = f (x k,u k ), k = 0,1,... dove x k R n è il vettore di stato e u k R m è il vettore di controllo

Controllo Ottimo e Predittivo per Sistemi Dinamici 9 Esempio di sistema dinamico a tempo discreto Sistema di tipo inventory modellato con una coda FIFO: x k+1 = x k +u k w k, k = 0,1,... u k w k dove x k x k R rappresenta la quantità di un certo bene disponibile al tempo k (x k è lo stato del sistema); u k R è il controllo, ossia la quantità di beni che vengono prodotti o aggiunti al tempo k (u k è il controllo); w k R rappresenta la domanda di beni che fuoriescono dalla coda istantaneamente al tempo k (w k è un disturbo).

Controllo Ottimo e Predittivo per Sistemi Dinamici 10 Controllo ottimo su orizzonte finito per sistemi dinamici a tempo continuo Problema COTCOF (Controllo Ottimo a Tempo Continuo su Orizzonte Finito) per un T R+ fissato: Problema COTCOF dove inf u( ) J(x(0),u( )) = T ẋ = f (x,u), t [0,T] 0 L(x(t),u(t))dt+K(x(T)) L : R n R m R fornisce una misura del costo lungo la traiettoria seguita dal sistema per t [0,T) con stato iniziale x(0); K : R n R rappresenta il costo finale, che dipende dallo stato finale x(t).

Controllo Ottimo e Predittivo per Sistemi Dinamici 11 Controllo ottimo su orizzonte finito per sistemi dinamici a tempo discreto Problema COTDOF (Controllo Ottimo Tempo Discreto su Orizzonte Finito) per un T N+ Problema COTDOF dove inf u( ) J(x 0,u 0 ( ),...,u T 1 ( )) = T 1 L(x k,u k )+K(x T ) k=0 x k+1 = f (x k,u k ), k = 0,1,...,T 1 L : R n R m R fornisce una misura del costo per un assegnato stato e controllo lungo la traiettoria seguita dal sistema da k = 0 a k = T 1; K : R n R rappresenta il costo finale, che dipende dallo stato finale x T.

Controllo Ottimo e Predittivo per Sistemi Dinamici 12 Controllo in anello aperto Sistemi dinamici a tempo continuo: u = γ(t) con la funzione γ : [0,T] R m. u ẋ = f (x,u) x Sistemi dinamici a tempo discreto: u k R m, k = 0,1,...,T 1. x 1 x 2 x T 1 x 0 f f f f x T u 0 u 1 u 2 u T 1

Controllo Ottimo e Predittivo per Sistemi Dinamici 13 Controllo in anello chiuso: il controllo è funzione dello stato Sistemi dinamici a tempo continuo: u = γ(x) con la funzione γ : X R m, x X R n u ẋ = f (x,u) γ x Sistemi dinamici a tempo discreto: u 0 = γ 0 (x 0 ),..., u T 1 = γ T 1 (x T 1 ), x k X R n, k = 0,1,..., con le funzioni γ i : X R m, i = 0,1,...,T 1, x 0 f f f f γ 0 γ 1 γ 2 γ T 1 u 0 x 1 x 2 u 1 u 2 x T 1 u T 1 xt

Controllo Ottimo e Predittivo per Sistemi Dinamici 14 Soluzione del Problema COTCOF in anello aperto Sistemi dinamici a tempo continuo. Condizioni necessarie di ottimalità (equazioni di Eulero-Lagrange): ẋ = f (x,u) λ = Two Boundary Value Problem (TBVP) x H(x,u, λ) u H(x,u, λ) = 0 dove t [0,T] e H(x,u,λ) = L(x,u)+λ T f (x,u) Funzione Hamiltoniana condizioni iniziali su x( ) e finali su λ( ). Si tratta di equazioni differenziali ordinarie e la soluzione u( ) è una funzione del tempo (controllo in anello aperto).

Controllo Ottimo e Predittivo per Sistemi Dinamici 15 Soluzione del Problema COTDOF in anello aperto Sistemi dinamici a tempo discreto: condizioni necessarie di ottimalità. TBVP dove k = 0,1,...,T 1 e x k+1 = f (x k,u k ) λ k = x H(x k,u k,λ k+1 ) u k H(x k,u k,λ k+1 ) = 0 H(x,u,λ) = L(x,u)+λ T f (x,u) Funzione Hamiltoniana Discreta con condizioni iniziali x 0 assegnate e condizioni finali date da λ T = K(x T). x Soluzione del problema è una sequenza u k, k = 0,1,...,T 1 di vettori di R m (controllo in anello aperto).

Controllo Ottimo e Predittivo per Sistemi Dinamici 16 Soluzione del Problema COTCOF in anello chiuso Teorema di verifica. Dato un Problema COTCOF, supponiamo che esista una funzione valore V : R+ R n R di classe C 1 tale che t V(t,x)+ x V(t,x)f(x,u)+L(x,u) 0 per t [0,T], x R n, u U R p (U è l insieme di ammissibilità, cioè insieme in cui la soluzione dell equazione differenziale è ben definita) 1 ; inoltre V(T,x(T)) = K(x(T)). Se esiste una funzione ū( ) tale che t V(t, x)+ x V(t, x)f( x,ū)+l( x,ū) = 0 dove V(T, x(t)) = K( x(t)) e x(t) è la soluzione dell equazione differenziale per t [0,T] con x(0) = x 0 e u = ū( ), allora ū( ) è soluzione del Problema COTCOF. 1 V x è un vettore riga.

Controllo Ottimo e Predittivo per Sistemi Dinamici 17 Equazione di Hamilton-Jacobi-Bellman (HJB) La funzione valore è il costo ottimo: V(t,x) = inf J(t,x(t),u( )), t [0,T] u( ) La soluzione del Problema COTCOF si ottiene risolvendo l equazione differenziale alle derivate parziali (equazione di Hamilton-Jacobi-Bellman) V(t,x)+ inf t u U [ ] x V(t,x)f(x,u)+L(x,u) con la condizione finale V(T,x(T)) = K(x(T)). = 0, t [0,T] È in generale difficile trovare la soluzione esatta dell equazione HJB. Tale equazione, inoltre, ammette soluzioni che possono non essere di classe C 1.

Controllo Ottimo e Predittivo per Sistemi Dinamici 18 Esempio di un Problema COTCOF: problema di controllo ottimo LQ a tempo continuo Modello del sistema (lineare): ẋ = Ax+Bu, x X R n,u U R m con A R n n e B R m n. Funzione costo (quadratica): J = T 0 x(t) T P x(t)+u(t) T Qu(t)dt+x(T) T Rx(T) con Q R m m simmetrica e definita positiva, P R n n e R R n n simmetriche e semidefinite positive.

Controllo Ottimo e Predittivo per Sistemi Dinamici 19 Soluzione del problema di controllo ottimo LQ a tempo continuo mediante l equazione di HJB (anello chiuso) V(t,x)+ inf t u U [ x V(t,x)f(x,u)+L(x,u) ] = 0, t [0,T] dove f(x,u) = Ax + Bu e L(x,u) = x T P x + u T Qu con V(T,x(T)) = x(t) T Rx(T). Quindi, si ottiene inf u U [ ] x V(t,x)f(x,u)+L(x,u) + x T P x+u T Qu ] = inf u U [ = inf u U [ x V(t,x)(Ax+Bu) x V(t,x)(Bu)+uT Qu Essendo il funzionale quadratico in u, la soluzione del problema di minimo è facilmente ricavabile: u = 1 ( ) T 2 Q 1 B T x V(t,x) ]

Controllo Ottimo e Predittivo per Sistemi Dinamici 20 Soluzione... mediante l equazione di HJB (anello chiuso) Supponiamo V(t,x) = x T Σ(t)x, con Σ(t) R n n, simmetrica e definita positiva, t [0, T]. L equazione HJB ci fornisce l uguaglianza quindi x T Σx+x T Px+x T( ΣA+A T Σ ) x+x T ΣBQ 1 B T Σx = 0, x T( Σ+P ) +ΣA+A T Σ+ΣBQ 1 B T Σ x = 0, che è sempre verificata se Σ(t) soddisfa l equazione differenziale di Riccati (matriciale): Σ(t) = P Σ(t)A A T Σ(t) Σ(t)BQ 1 B T Σ(t) da risolvere per t [0,T] con condizioni finali Σ(T) = R.

Controllo Ottimo e Predittivo per Sistemi Dinamici 21 Soluzione... mediante l equazione di HJB (anello chiuso) Risolta l equazione differenziale di Riccati, la relazione u = 1 ( ) T 2 Q 1 B T x V(t,x) fornisce la legge di controllo ottimo con retroazione sullo stato (state feedback) che minimizza il costo quadratico del problema LQ: u(t) = Q 1 B T Σ(t)x(t). u ẋ = Ax+Bu Q 1 B T Σ(t) Equazione differenziale di Riccati x

Controllo Ottimo e Predittivo per Sistemi Dinamici 22 Soluzione del Problema COTDOF in anello chiuso mediante la programmazione dinamica (PD) Supponiamo che la soluzione del Problema COTDOF esista. Si ottengono le seguenti uguaglianze: min J(x 0,u 0 ( ),...,u T 1 ( )) = u 0 ( ),...,u T 1 ( ) = min u 0 ( ),...,u T 2 ( ) = min u 0 ( ),...,u T 2 ( ) { min u T 1 ( ) { T 2 k=0 [ T 2 k=0 min u 0 ( ),...,u T 1 ( ) [ T 1 k=0 L(x k,u k )+K(x T ) L(x k,u k )+L(x T 1,u T 1 )+K(x T ) ]} [ L(x k,u k )+ min L(xT 1,u T 1 )+K(x T ) ]} u T 1 ( ) ]

Controllo Ottimo e Predittivo per Sistemi Dinamici 23 Soluzione... mediante la programmazione dinamica (PD) Allo stadio T 1, la legge di controllo ottimo con retroazione sullo stato è la soluzione del problema [ min L(xT 1,u u T 1 )+K(x T ) ] T 1,x T con vincolo x T = f ( x T 1,u T 1 ). La soluzione è una funzione γ T 1 : R n R m tale che [ min L(xT 1,u u T 1,x T 1 )+K(x T ) ] = L(x T 1,u T 1)+K ( f(x T 1,u T 1) ) T dove u T 1 = γ T 1 (x T 1). Si procede a ritroso (backward), dopo aver definito il cost-to-go: J k(x k ) = min u k [L(x k,u k )+K(f(x k,u k ))], k = T 1,T 2,...,0

Controllo Ottimo e Predittivo per Sistemi Dinamici 24 Soluzione... mediante la programmazione dinamica (PD) La sucessione dei cost-to-go a ciascun stadio è data dall equazione di Bellman: J T (x T) = K(x T ) J k (x k) = min u k R m : x k+1 =f(x k,u k ) [ L(xk,u k )+J k+1(x k+1 ) ], k = T 1,T 2,...,0 La determinazione della legge di controllo ottimo in anello chiuso richiede la soluzione analitica dell equazione di Bellman.

Controllo Ottimo e Predittivo per Sistemi Dinamici 25 Soluzione di un Problema COTDOF: problema di controllo ottimo LQ a tempo discreto Modello del sistema (lineare): x k+1 = Ax k +Bu k, x X R n,u U R m con A R n n e B R m n. Funzione costo (quadratica): J = T 1 k=0 x T kp x k +u T kqu k +x T TRx T con Q R m m simmetrica e definita positiva, P R n n e R R n n simmetriche e semidefinite positive.

Controllo Ottimo e Predittivo per Sistemi Dinamici 26 Esempio di un Problema COTDOF: problema di controllo ottimo LQ a tempo discreto Equazione di Bellman: JT (x T) = x T T Rx T J k (x k) = min u k R m : x k+1 =Ax k +Bu k [ x T k P x k +u T kqu k +J k+1(x k+1 ) ], k = T 1,T 2,...,0 Stadio k = T 1: J T 1(x T 1 ) = min u T 1 R m : x T =Ax T 1 +Bu T 1 [ x T T 1 P x T 1 +u T T 1Qu T 1 +J T(x T ) ] [ min x T T 1P x u T 1 R m T 1 +u T T 1Qu T 1 + ( ) TR ( ) ] Ax T 1 +Bu T 1 AxT 1 +Bu T 1

Controllo Ottimo e Predittivo per Sistemi Dinamici 27 Soluzione del problema di controllo ottimo LQ a tempo discreto mediante la PD (anello chiuso) La soluzione del problema di minimizzazione è data da u T 1 = L T 1x T 1 con L T 1 = ( Q+B T RB ) B T RA; il costo ottimo è J T 1(x T 1 ) = x T T 1Σ T 1 x T 1 dove Σ T 1 = P +L T T 1 QL T 1 +(A BL T 1 ) T R(A BL T 1 ). Al generico stadio k = T 2,T 3,...,0, la legge di controllo ottimo è u k = L kx k con L k = ( Q+B T Σ k+1 B ) B T RA, dove la sequenza delle matrici Σ k si calcola mediante l equazione di Riccati alle differenze: Σ k 1 = A T[ Σ k Σ k B ( Q+B T Σ k B ) 1 B T Σ k ]A, k = T,T 1,...,0 con Σ T = R.

Controllo Ottimo e Predittivo per Sistemi Dinamici 28 Difficoltà nella soluzione di problemi di controllo ottimo La soluzione di problemi di controllo ottimo in anello chiuso è più difficile rispetto ai corrispondenti problemi in anello aperto. Se non sono valide le ipotesi LQ, la soluzione del problema di controllo ottimo in anello chiuso (ottenibile dall equazione di HJB o attraverso la PD) non è in genere facilmente calcolabile in forma analitica. Se si usa un appproccio basato su HJB e PD, è difficile tener conto di vincoli sullo stato o sui controlli. Le metodologie di soluzione numerica dell equazioni HJB e della PD soffrono di problemi di maledizione della dimensionalità: il numero di calcoli cresce in maniera non polinomiale (NP) con la dimensione del vettore di stato. Le metodologie numeriche sviluppate per risolvere questi problemi cercano di mitigare gli effetti della maledizione della dimensionalità.

Controllo Ottimo e Predittivo per Sistemi Dinamici 29 Programmazione matematica a numeri reali Programmazione matematica in R n : non vincolata (libera) dove f : R n R. vincolata min x R nf(x) min x R nf(x) tale che g(x) = 0 h(x) 0 dove f : R n R, g : R n R m e h : R n R m.

Controllo Ottimo e Predittivo per Sistemi Dinamici 30 Programmazione matematica a numeri interi Programmazione matematica in Z n : non vincolata (libera) dove f : R n R. vincolata min x Z nf(x) min x Z nf(x) tale che g(x) = 0 h(x) 0 dove f : R n R, g : R n R m e h : R n R m.

Controllo Ottimo e Predittivo per Sistemi Dinamici 31 Programmazione matematica mista Programmazione matematica in R n e Z n : non vincolata (libera) dove f : R n 1+n 2 R. vincolata tale che min f(x,y) x R n 1,y Z n 2 min f(x,y) x R n 1,y Z n 2 g(x,y) = 0 h(x,y) 0 dove f : R n 1+n 2 R, g : R n 1+n 2 R m e h : R n 1+n 2 R m.

Controllo Ottimo e Predittivo per Sistemi Dinamici 32 Programmazione matematica lineare Programmazione matematica lineare reale: dove A R m n, b R m e c R n. minc T x Ax = b x 0, x R n Programmazione matematica lineare intera: dove A R m n, b R m e c R n. minc T x Ax = b x 0, x Z n

Controllo Ottimo e Predittivo per Sistemi Dinamici 33 Algoritmi di programmazione matematica lineare Programmazione matematica a numeri reali: metodo del simplesso; metodi del punto interno. Programmazione matematica a numeri interi: metodo dei piani di taglio (cut); metodi branch-and-bound.

Controllo Ottimo e Predittivo per Sistemi Dinamici 34 Algoritmi di programmazione matematica non lineare Problemi non vincolati: metodi non derivativi; metodo del gradiente; metodo di Newton; metodi quasi Newton. Problemi vincolati: metodo dei moltiplicatori; metodi del punto interno; metodi basati sulla penalizzazione esatta; metodi basati sul rilassamento lagrangiano.

Controllo Ottimo e Predittivo per Sistemi Dinamici 35 Controllo predittivo per sistemi a tempo discreto Model Predictive Control (MPC): risoluzione ad ogni istante temporale t = 0,1,... di un problema di controllo ottimo su orizzonte finito e attuazione della prima azione di controllo. Problema P t,t+t : determinare il minimo di J t = t+t 1 k=t L(x k,u k )+K(x t+t ) con i vincoli x k+1 = f (x k,u k ), k = t,t+1,...,t+t 1 x k X R n, k = t+1,t+2,...,t+t u k U R m, k = t,t+1,...,t+t 1. Il Problema P t,t+t è un problema di programmazione matematica, in generale non lineare. La sua soluzione è il vettore dei controlli ottimi u t,t+t 1, di cui si considera la prima azione di controllo u t

Controllo Ottimo e Predittivo per Sistemi Dinamici 36 Controllo predittivo per sistemi a tempo discreto T t x t Risoluzione del problema P t,t+t t+1 t+t t+1+t x t+1 Risoluzione del problema P t+1,t+1+t x t+2 u t,t+t 1 u t+1,t+t Applico Applico u t u t+1

Controllo Ottimo e Predittivo per Sistemi Dinamici 37 Controllo predittivo: anello aperto o anello chiuso? Il Problema P t,t+t fornisce una soluzione di controllo in anello aperto che viene applicata istantaneamente in anello chiuso. Le prime idee sul controllo predittivo nascono agli inizi degli anni settanta con il cosidetto Open-Loop Feedback Control (OLFC) (si veda, per esempio, D.P. Bertsekas, Dynamic Programming and Stochastic Control, Academic Press, New York, 1976). La soluzione del Problema P t,t+t viene ottenuta risolvendo un problema di programmazione matematica, in generale non lineare. È necessario verificare la stabilità in anello chiuso della legge di controllo che risulta dalla soluzione del Problema P t,t+t.

Controllo Ottimo e Predittivo per Sistemi Dinamici 38 Approssimazione delle leggi di controllo predittivo Supponiamodi essere in grado risolvere il Problema P t,t+t di programmazione matematica per un dato stato iniziale x(k) e sia u t,t+t 1 (k) la sua soluzione, con k = 0,1,...,K. Usando questi dati, si può pensare di approssimare la legge di controllo predittivo x u t (x). x Risoluzione del problema P t,t+t u t La legge di controllo ottimo può essere approssimata mediante una rete approssimante (per esempio, feedforward, RBF o SVR).

Controllo Ottimo e Predittivo per Sistemi Dinamici 39 Reti neurali feedforward multi-strato Le reti neurali feedforward multi-strato sono stutture composte da L strati con ν s unità neurali nello strato s (s = 1,...,L). La funzione ingresso/uscita q-esima dello strato s-esimo è y q (s) = g s ν s 1 w pq (s)y p (s 1)+w 0q (s), s = 1,...,L, q = 1,...,ν s p=1 dove g s : R R è la funzione di attivazione dello strato s-esimo. La scelta più comune consiste nel prendere le stesse funzioni di attivazione per tutti gli strati nascosti, come, ad esempio, g(x) = 1/[1 + exp( x)] o g(x) = tanh(x). Spesso si sceglie come funzione di attivazione per l uscita g(x) = x.

{ Controllo Ottimo e Predittivo per Sistemi Dinamici 40 Reti neurali feedforward multi-strato y(0) { g 1 g 1 g 2 g 2 w 1 w 2 w 3 g 2 g 3 g 3 y(3) g 1 g 3 g 2 I coefficienti w pq (s) e i cosiddetti bias w 0q (s) sono raggruppati nel vettore dei pesi dello strato s-esimo, indicato con w s. Il vettore di tutti i pesi è L w = col (w 1, w 2,..., w L ) W R n, dove n = ν s+1 (ν s +1) indica il numero totale dei pesi. L ingresso y(0) e l uscita y(l) della rete hanno dimensioni fissate pari a ν 0 a ν L, rispettivamente. s=0

Controllo Ottimo e Predittivo per Sistemi Dinamici 41 Reti neurali radial basis function (RBF) Le reti RBF sono reti feedforward a due livelli (solo uno strato nascosto) con funzioni di base radiali. L ingresso y(0) e l uscita y(2) della rete RBF sono legate dalla relazione ν 1 y q (2) = h w pq (2)g( y(0) c p Rp )+w 0q (2), q = 1,...,ν 2 p=1 dove g : R R è una funzione di base radiale e h : R R è una funzione non decrescente. Le matrici R p R ν 0 ν 0, p = 1,...,ν 1, sono simmetriche e definite positive. I vettori c p, p = 1,...,ν 1, sono i centri. La notazione R indica la norma euclidea pesata: x R = x T Rx, con R matrice simmetrica e definita positiva.

{ Controllo Ottimo e Predittivo per Sistemi Dinamici 42 Reti neurali radial basis function (RBF) Il vettore di tutti i pesi è w = col ( w 2, c 1,..., c ν1 ) W R n, dove n = ν 0 ν 1 + ν 1 (ν 2 0 + ν 0 )/2+(ν 1 +1)ν 2, p = 1,...,ν 1. y(0) { g g g h h y(2) Le scelte più comuni sono g(x) = exp( x) e h(x) = x. g h g

Controllo Ottimo e Predittivo per Sistemi Dinamici 43 Support Vector Machine (SVM) Le SVM sono state sviluppate per la soluzione di problemi di classificazione di pattern. Successivamente sono state applicate anche alla soluzione di problemi di approssimazione di funzioni (SVR, support vector regression). Noto l insieme dei dati (x 1,y 1 ),(x 1,y 1 ),...,(x N,y N ) in R n R, la funzione approssimante f : R n R di una SVM con ingresso x R n e uscita scalare in R è N f(x) = α i k(x,x i )+β dove: i=1 k : R n R n R è la funzione del kernel (nucleo); α 1,α 2,...,α N e β sono i parametri della SVM.

Controllo Ottimo e Predittivo per Sistemi Dinamici 44 Tipologie di SVM La funzione kernel k(x, z) può essere scelta in maniera arbitraria purchè soddisfi la condizione di Mercer: k(x,z)g(x)g(z)dxdz 0 con qualunque funzione g L 2 (quadrato integrabile). Esempi di funzioni kernel: Kernel k(x, z) ) Parametri scalari gaussiano (RBF) exp a multiquadratico inverso ( x z 2 a polinomiale (x T z +a) b a, b sigmoidale tanh(ax T z +b) a, b 1 x z 2 +a a

X X X X X X X X X X Controllo Ottimo e Predittivo per Sistemi Dinamici 45 Approssimazione della legge di controllo predittivo mediante reti approssimanti Date le coppie {x(k),u t(k)}, k = 0,1,...,K, e una rete approssimante γ : R ν R n R m, ilproblemaèquellodiinterpolareidatirisolvendounproblema di minimi quadrati (in generale non lineare se le funzioni rappresentate dalle reti approssimanti dipendono non linearmente dai parametri): min w R ν K u t(k) γ(w,x(k)) 2 k=0 u t X X X X X x La legge di controllo ottimo approssimata è di tipo feedback. In generale occorre verificare le proprietà di stabilità di tale legge in anello chiuso.

Controllo Ottimo e Predittivo per Sistemi Dinamici 46 Approssimazione della legge di controllo predittivo: scelta dei parametri delle reti approssimanti Fissato il tipo di rete approssimante, la soluzione dei problemi di minimi quadrati non lineari consiste nel determinare i parametri ottimi della rete approssimante. La determinazione dei pesi ottimi è effettuata mediante tecniche di discesa che possono richiedere il calcolo del gradiente del costo di interpolazione rispetto ai pesi. Per le reti feedforward il gradiente può essere efficientemente calcolato mediante la backpropagation. Per reti RBF a centri fissi o SVR, la dipendenza lineare dai parametri rende la determinazione dei pesi ottimi particolarmente semplice mediante la soluzione di problemi di programmazione quadratica.