Ottimizazione vincolata

Ottimizazione vincolata Ricordiamo alcuni risultati provati nella scheda sulla Teoria di Dini per una funzione F : R N+M R M di classe C 1 con (x 0, y 0 ) F 1 (a), a = (a 1,, a M ), punto in cui vale l ipotesi di rango pieno per JF i Lo spazio tangente a F 1 (a) in (x 0, y 0 ) è dato da ker JF (x 0, y 0 ) = F 1 (x 0, y 0 ),, F M (x 0, y 0 ) = graph Jf(x 0 ) dove f è la funzione implicita il cui grafico coincide localmente in (x 0, y 0 ) con l insieme di livello ii un vettore tangente (v, w) è caratterizzato da d F 1 (a)(v, w) = o(t) dove d F 1 (a) indica la funzione distanza. Proposition 0.1. Sia F : R N+M R M una funzione di classe C 1 e (x 0, y 0 ) un punto con F (x 0, y 0 ) = a in cui valga l ipotesi di rango pieno per JF, allora (v, w) ker JF (x 0, y 0 )) se e solo se esiste una curva (ξ, η) definita in ( ε, ε), per un opportuno ε, il cui suppporto è contenuto in F 1 (a) tale che (ξ(0), η(0)) = (x 0, y 0 ) ( ξ(0), η(0)) = (v, w). Proof. Se una tale curva esiste, allora dato che (v, w) è vettore tangente alla curva in (ξ(0), η(0)) = (x 0, y 0 ) si ha (ξ(t), η(t)) (x 0 + t v, y 0 + t w) = o(t) il che implica, dato che (ξ(t), η(t)) F 1 (0) d F 1 (0)(x 0 + t v, y 0 + t w) (ξ(t), η(t)) (x 0 + t v, y 0 + t w) = o(t) e per ii si conclude (v, w) ker JF (x 0, y 0 ) come volevasi dimostrare. Viceversa, consideriamo un vettore in ker JF (x 0, y 0 ), allora per i tale vettore è della forma (v, w) = (v, Jf(x 0 ) v) con v generico vettore di R N. Definiamo una curva tramite (ξ(t), η(t)) = (x 0 + t v, f(x 0 + t v)) (1) 1

dove f è la funzione implicita. Per il Teorema della Funzione Implicita, il sostegno di tale curva è contenuto in F 1 (a) per t piccolo, diciamo t ( ε, ε) per un opportuno ε. Inoltre ( ξ(t), η(t)) = (v, Jf(x 0 + t v) v) il che prova che la curva è regolare dato che v 0, inoltre Questo completa la dimostrazione. ( ξ(0), η(0)) = (v, Jf(x 0 ) v) = (v, w). Remark 0.2. Vale un osservazione simile a quella fatta dopo il risultato su spazio tangente e distanza dall insieme di livello sulla scheda su Dini. Le due implicazioni mostrate sopra hanno valenza diversa. Che una curva ξ(t) il cui supporto è contenuto nell insieme di livello debba avere vettori tangenti in ker JF (ξ(t)) non dipende dalla regolarità dell insieme di livello. Invece per costruire una curva contenuta in F 1 (a) che passi per (x 0, y 0 ) avendo come vettore tangente un qualsiasi vettore selezionato in ker F (x 0, y 0 ), la regolarità viene sfruttata in maniera essenziali, si veda la formula (1) che è cruciale. Siccome da ora in poi non avremo più bisogno di distinguere esplicitamente tra le variabili della F quelle esplicitabili ( y) e le altre (x), cambiamo per semplicità notazioni. La funzione F sarà definita da R N a R M con N > M (prima era da R N+M a R M ) e la relativa variabile indipendente sarà indicata con x (prima era (x, y)), similmente un vettore tangente ad un insieme di livello sarà indicato con v (prima era (v, w)). Affronteremo ora problemi di ottimizzazione vincolata, cioè inerenti alla determinazione di massimi e minimi (relativi o assoluti) su vincoli dati da M uguaglianze, del tipo F = costante o da disuguaglianze, F <> costante. La funzione da ottimizzare, naturalmente a valori reali, sarà chiamata funzione obiettivo. Definition 0.3. Dato un vincolo F 1 (a) R N ed una funzione obiettivo g definita in un insieme di R N che contiene il vincolo, un punto x 0 F 1 (0) si dice di massimo (minimo) relativo (o locale) vincolato se esiste un raggio positivo r con g(x) ( ) g(x 0 ) per x B(x 0, r) F 1 (a). La dizione estremo relativo vincolato sta per massimo o minimo relativo vincolato. 2

Proposition 0.4. Sia g una funzione obiettivo di classe C 1 definita in un aperto contenente un insieme di livello (vincolo) F 1 (a) e suuponiamo. Sia x 0 F 1 (a) un punto regolare (valga l ipotesi di rango pieno per JF ). Se x 0 è estremo relativo vincolato rispetto a F 1 (a), allora esistono degli scalari λ 1,, λ M per cui g(x 0 ) = M λ j F j (x 0 ). (2) j=1 Proof. Sia v un qualsiasi vettore tangente al vincolo in x 0, cioè v ker JF (x 0 ), allora per il risultato precedente esiste una curva ξ con supporto contenuto nel vincolo tale ξ(0) = x 0, ξ(0) = v. Allora t = 0 è un estremo locale di t f(ξ(t)), per cui questa funzione deve avere derivata nulla, e dato che si ha ponendo t = 0 d g(ξ(t)) = g(ξ(t)) ξ(t) dt g(x 0 ) v = 0. Siccome questo vale per ogni v ker JF (x 0 ), allora per i g(x 0 ) ker JF (x 0 ) = F 1 (x 0 ),, F 1 (x 0 ). In altri termini g(x 0 ) è dato da una combinazione lineare di F 1 (x 0 ),, F 1 (x 0 ), che è quello che si voleva provare. I punti che soddisfano la condizione (2) sono detti punti critici vincolati di g rispetto al vincolo F 1 (a). In contrapposizione gli usuali punti critici di g, cioè quelli dove il gradiente si annulla, saranno chaimati punti critici liberi. Usando questa terminologia, il risultato precedente può essere riformulato come segue: Proposition 0.5. Sia x 0 un punto regolare del vincolo. Condizione necessaria affinchè x 0 sia un estremo relativo vincolato su F 1 (a) è che sia un punto critico vincolato. I coefficienti λ 1,, λ M sono detti moltiplicatori di Lagrange. I risultati stabiliti forniscono una modalità costruttiva, almeno in linea di principio, per la determinazione di estremi vincolati sotto le ipotesi di regolarità enunciate sopra. Si tratta di imporre le condizioni (2) piu le condizioni di appartenenza al vincolo. Si arriva a scrivere il sistema { g(x) M j=1 λ j F j (x 0 ) = 0 N equazioni (3) F (x) = a M equazioni 3

con (N + M) equazioni nelle (N + M) incognite (x, λ), λ = (λ 1,, λ M ). Queste condizioni possono essere espresse sinteticamente introducendo la funzione Lagrangiana L(x, λ) = g(x) + M λ j (F j (x 0 ) a j ) = g(x) + λ (F (x) a) j=1 allora il sistema (3) equivale a L(x, λ) = 0. In altri termini un punto critico vincolato è semplicemente un punto critico della corrispondente Lagrangiana. Si noti che la Lagrangiana è definita in R N+M, o quantomeno in un suo sottinsieme. Le nuove variabili λ, corrispondenti ai moltiplicatori, si chiamano variabili aggiunte. Ci si potrebbe ragionevolmente chiedere se, cosi come è stato fatto per i punti critici liberi, se esistono delle condizioni del secondo ordine per individuare la natura dei punti critici vincolati. la risposta è positiva ma il loro studio è al di fuori dai limiti di questa trattazione. Un caso particolare è quando la funzione F, che esprime il vincolo, è valori scalari, cioeè il vincolo è dato da una singola uguaglianza o disuguaglianza. Vi è allora un solo moltiplicatore di lagrange λ, e la condizione (2) si riduce a La Lagrangiana è data da g(x 0 ) = λ F (x 0 ). L(x, λ) = g(x) + λ F (x). Sempre nel caso F a valori scalari, diamo una ricetta per determinare massimi o minimi assoluti di una funzione obiettivo g su insiemi del tipo {x F (x) a} con a R, (4) ammesso che tali punti esistano. Possiamo assumere, ad esempio che l insieme in questione sia compatto, per cui l esistenza di estremi assoluti è garantita dal Teorema di Weierstrass. Assumiamo inoltre che a sia regolare per F. Cercare punti critici liberi nell insieme aperto {x F (x) < a} risolvendo l equazione g(x) = 0 cercare i punti critici vincolati sull insieme chiuso {x F (x) = a} risolvendo l equazione L(x, λ) = 0 se i passi precedenti hanno selezionato un numero finito di punti, allora, in base alla teoria sviluppata, il valore massimo raggiunto da g su tali punti è il massimo assoluto sul vincolo (4) e i punti corrispondenti sono i punti di massimo assoluto. Similmente mutatis mutandis per i minimi assoluti. 4

Si possono anche applicare le condizioni del secondo ordine ai punti critici liberi per stabilire la loro natura. Infine se il vincolo F = a non è regolare si dovrebbe aggiungere un analisi specifica sui punti di non regolarità, ad esempio si potrebbe verificare se essi siano un numero finito oppure corrispondano a valori specifici della funzione obiettivo. Similmente, Se g o F non sono differenziabili in alcuni punti, i punti di non differenziabilità andrebbero analizzati a parte. Antonio Siconolfi, Dipartimento di Matematica, Università di Roma La Sapienza. siconolf@mat.uniroma1.it 5