Funzioni a più variabili Studiamo ora le funzioni f : A R m dove A R n, m, n 1. Visto: caso in cui f è lineare e A = R n. In tal caso abbiamo studiato in special modo: il codominio; l insieme degli zeri. Non abbiamo parlato di massimi e minimi perché in tal caso: se m > 1 non si parla di max perché R m non è totalmente ordinato; se anche m = 1 allora salvo casi degeneri max e min non esistono e sup e inf sono entrambi infiniti.
Studiamo ora il caso generale. Ci occupiamo principalmente del caso m = 1 cioè f : A R, A R n perché in tal caso possiamo parlare di max e min. In alcuni casi tratteremo anche il caso m > 1 che ha interessanti applicazioni. A volte tratteremo il caso n = 1, m 1, cioè le curve. f : A R m, A R
Ripetiamo lo stesso cammino fatto per le funzioni di una variabile. Definizioni basilari Le seguenti definizioni hanno lo stesso significato che nel caso m = n = 1. dominio A R n legge CE di una legge CE R n codominio f(a) R m grafico G f R n R m G f = {(x, y) R n R m : y = f(x)}
Rappresentazione di insiemi di R 2 esempi: A = { x R 2 } : x 1 < x 2
B = { x R 2 : x 2 1 x } 2
C = { x R 2 : x 1 x 2 } 2
D = { } x R 2 : x 2 1, x 2 < x 1 1
E = x R2 : x1 0, x2 0, x1 + x2 2,
Proprietà topologiche di sottoinsiemi di R n Intorni (palle). Dato un punto x R n e un numero δ > 0 si dice intorno circolare (sferico) di x di raggio δ l insieme { } I (x,δ) : = y R 2 : d (x, y) < δ { } = y R 2 : x y < δ = {y R 2 : x y, x y < δ 2} A volte indichiamo con I (x) un generico intorno di x.
Punti interni, esterni, di frontiera. x A si dice interno se un intorno I (x,δ) A x A si dice esterno se un intorno I (x,δ) A C x A si dice di frontiera se intorno I (x,δ) si ha I (x,δ) A e I (x,δ) A C
Insieme chiuso, aperto. A R n è chiuso se contiene tutta la sua frontiera A R n è aperto se non contiene alcun punto della sua frontiera
insieme limitato A è limitato se I(0) A insieme convesso A è convesso se dati due punti qualsiasi x, y A, il segmento che li unisce sta tutto dentro A insieme compatto A è limitato se è chiuso e limitato
Grafico di funzioni f : A R dove A R 2, (m = 1, n = 2). E un oggetto geometrico contenuto in R 3
Curve di livello Definizione 0.1 Data f : A R con A R n si dice curva di livello k di f l insieme C k (f) = {x R n : f (x) = k} Esempi f (x) = x 1 + x 2
f (x) = x1x2
f (x) = ln (x1 + x2) + ex1x2 + x2
Restrizioni e sezioni: idea grafica. Noi considereremo solo le restrizioni parallele agli assi, ma non sono le uniche possibili
Funzioni elementari sono il risultato di operazioni sulle funzioni elementari nelle varie variabili.
Operazioni tra funzioni. somma, differenza, prodotto e quoziente. Come nel caso di una variabile.
e Composizione di funzioni come nel caso di una variabile. Date f : A R, con A R n g : B R h, con B R k per definire la composizione occorre che f (A) B. In particolare occorre che m = k. (ricordiamo il caso delle funzioni lineari)
Esempio f (x) = ( ) x 1 x 2, x 2 x 3 1 g (y) = y 3 1 + y4 2 (g f) (x) = (x 1 x 2 ) 3 + ( ) x 2 x 3 4 1 f (t) = (t 1, t + 2) g (x) = x 2 1 x3 2 (g f) (t) = (t 1) 2 (t + 2) 3
Funzione inversa sostanzialmente solo con m = n
Proprietà delle funzioni Limitatezza f è limitata se il codominio è limitato
Monotonia (solo lungo le direzioni) f è monotona lungo una direzione data se lo è la sua restrizione
Convessità e concavità f è convessa se il suo epigrafico è convesso f è concava se il suo ipografico è convesso
Punti estremali e valori estremali, estremo superiore e inferiore Data f : A R massimo e minimo di f su A sono il massimo e il minimo del codominio f(a), se esistono. I punti in cui si realizzano tali valori si dicono punti di massimo o minimo sup e inf di f su A sono sup f(a) e inf f(a).
proprietà locali
Calcolo infinitesimale Limiti. La nozione di limite è la stessa significa lim y x f (y) = L I (L) I (x) t.c. y I (x) f (y) I (L)
Continuità La nozione di continuità è la stessa: f è continua in x A se lim f (y) = f (x) y x Valgono i TC Delle proprietà ricordiamo il Teorema di Weierstrass Teorema 0.2 f : A R, f continua, A compatto. Allora f ha massimo e minimo su A.
Derivate parziali e differenziabilità Derivata parziale come velocità di variazione lungo una direzione. Idea: le derivate parziali di una funzione in più variabili si calcolano facendo muovere una sola variabile per volta e
Differenziale come approssimazione di una funzione tramite una funzione affine (piano o iperpiano tangente).
Funzione derivabile parzialmente rispetto ad una componente e sua derivata parziale. Definizione 0.3 Una funzione f : A R, con A R n si dice derivabile parzialmente rispetto a x i nel punto a int A se la f, considerata come sola funzione di x i (tenendo le altre componenti costanti e uguali a quelle di a) è derivabile in a i. In tal caso la derivata ottenuta è la derivata parziale rispetto a x i di f in a e si indica col simbolo f(a) x oppure i D xi f(a) Valgono i TD Inoltre: ogni derivata parziale è essa stessa una funzione di n variabili.
Osservazione 0.4 Il calcolo della derivata parziale i esima risulta molto semplice: si effettua con le stesse regole di calcolo della derivata di una funzione in una variabile applicate alla variabile x i facendo finta che tutte le altre variabili siano delle costanti (dei parametri!). Calcolo di derivate parziali.
Ad una funzione definita su R n si associano n derivate parziali, una per ogni incognita. Il vettore di R n che le raccoglie si chiama gradiente: ( f(x 0 f ) = (x 0 ), f (x 0 ),..., f ) (x 0 ) x 1 x 2 x n esempio. f(x) = x 1 ln x 2 + e x 1x 2 f x 1 (x) = ln x 2 + x 2 e x 1x 2 ; f 1 (x) = x x 1 + x 2 x 1 e x 1x 2. 2 = ( f(x 0 f ) = (x 0 ), f ) (x 0 ) x 1 x 2 ( ) ln x 2 + x 2 e x 1x 2 1, x 1 + x x 1 e x 1x 2. 2
Rappresentazione grafica e proprietà del gradiente f(x) = x 1 + x 2 f(x) = x 1 x 2
Proprietà del gradiente (massima crescita e ortogonale alle curve di livello)
Funzione differenziabile e suo differenziale. Informalmente: Una funzione è differenziabile in un punto se è approssimabile nelle vicinanze di esso con una funzione affine. Il differenziale è la parte lineare di tale funzione affine
Formalmente: Definizione 0.5 La funzione f : A R, con A R n si dice differenziabile in a int A se esiste un m R n tale che f(x) f(a) = m (x a) + o( x a ). In tal caso si dice che il termine m (x a) è il differenziale di f in a e si indica con df(a). Osservazione 0.6 Si dimostra che se f è differenziabile in un punto a allora è ivi derivabile parzialmente e m = f(a) Non vale il viceversa in generale. Vale se aggiungiamo l ipotesi che le derivate parziali siano continue (teorema del differenziale totale).
Piano e iperpiano tangente Definizione 0.7 Se la funzione f : A R, con A R 2 è differenziabile in a int A allora il piano di equazione z = f(a) + m (x a). si dice piano tangente al grafico di f in a. Se la dimensione di A è n > 2 si parla di iperpiano tangente.
Esempio grafico
Legame tra derivata e monotonia sulle direzioni Non si può parlare di monotonia per funzioni a più variabili. Si può parlare di monotonia per le restrizioni che sono funzioni di una variabile. Per esse valgono i teoremi visti a una variabile ricordando che le loro derivate sono le derivate parziali.
Derivate parziali seconde Ogni derivata parziale è una funzione di n variabili. Quindi se essa è derivabile parzialmente in ogni componente ad essa associo n derivate parziali seconde. In totale posso definire n 2 derivate parziali seconde. Nel caso n = ( 2 ho f f(x) = (x), f ) (x). x 1 x 2 Ora se derivo la prima ottengo ( ) ( ) f f f f (x) e (x) x 1 x 1 x 2 x 1 Se derivo la seconda ottengo ( ) ( ) f f f f (x) e (x) x 1 x 2 x 2 x 2 Ho ottenuto così quattro (n 2 ) derivate seconde che posso scrivere su una matrice (chiamata Hessiano o matrice Hessiana).
H f (x) = f (x) x 1 x 1 f (x) x 1 x 2 f (x) x 2 x 1 f (x) x 2 x 2 Teorema 0.8 (Schwarz) Sotto opportune ipotesi (derivate seconde continue) la matrice Hessiana è sempre una matrice simmetrica cioè per ogni i, j = 1,..., n f x i x j (x) = f x j x i (x)
esempi
esempi
Segno di forme quadratiche e matrici simmetriche
Forme quadratiche Definizione 0.9 Una forma quadratica di n variabili è un polinomio omogeneo di grado 2 in n variabili. Si tratta quindi di una funzione f : R n R somma di monomi di grado 2 nelle n variabili. esempi
Matrici simmetriche Definizione 0.10 Una matrice quadrata A M(n, n) si dice simmetrica se che significa esempi A = A T a i,j = a j,i, i j.
Forme quadratiche e matrici simmetriche Si può stabilire una corrispondenza biunivoca tra matrici simmetriche n n e forme quadratiche in n variabili (analogamente a quanto si è visto per matrici e applicazioni lineari). Data una matrice simmetrica A M(n, n) si associa ad essa un unica forma quadratica in n variabili come segue esempi g A (x) = x T Ax = x, Ax n = a ij x i x j i,j=1
esempi
Viceversa data una forma quadratica g in n variabili si associa ad essa un unica matrice simmetrica A M(n, n) tale che n g(x) = x T Ax = a ij x i x j i,j=1 Tale matrice si sceglie prendendo come a ii il coefficiente di x 2 i e come a ij il coefficiente di x i x j diviso per due. Osservazione 0.11 Notare che tale matrice è esattamente la matrice Hessiana di g con tutti gli elementi divisi per 2. esempi
esempi
Segno di forme quadratiche e matrici simmetriche Definiamo il segno di una forma quadratica in modo naturale. Definizione 0.12 Una forma quadratica g : R n R si dice definita positiva se g(x) > 0 per ogni x R n con x 0; definita negativa se g(x) < 0 per ogni x R n con x 0; semidefinita positiva se g(x) 0 per ogni x R n ; semidefinita negativa se g(x) 0 per ogni x R n ; indefinita se esistono x 1, x 2 R n per cui g(x 1 ) > 0 g(x 2 ) < 0.
Ricordando che la forma quadratica associata ad una matrice simmetrica è g A (x) = x, Ax si definisce il segno di una matrice simmetrica. Definizione 0.13 Una matrice simmetrica A M(n, n) si dice definita positiva se g A (x) > 0 per ogni x R n con x 0; definita negativa se g A (x) < 0 per ogni x R n con x 0; semidefinita positiva se g A (x) 0 per ogni x R n ; semidefinita negativa se g A (x) 0 per ogni x R n ; indefinita se esistono x 1, x 2 R n per cui g A (x 1 ) > 0 g A (x 2 ) < 0.
D ora in poi quando diremo: determinare il segno di una matrice simmetrica A, intenderemo: dire se la matrice simmetrica A è definita positiva, definita negativa, semidefinita positiva, semidefinita negativa, indefinita. esempi A = ( ) 1 0 0 1 g A (x) = x 2 1 + x2 2 A = ( ) 1 0 0 2 g A (x) = x 2 1 2x2 2
A = ( ) 1 0 0 1 g A (x) = x 2 1 x2 2 A = ( ) 2 0 0 0 g A (x) = 2x 2 1 A = ( ) 0 0 0 1 g A (x) = x 2 2
Come si determina il segno di una matrice simmetrica?. Autovalori Definizione 0.14 Si dice autovalore di una matrice A uno zero del polinomio caratteristico: p A (λ) = det(a λi) Tale polinomio ha sempre grado n e le sue soluzioni sono al massimo n (esattamente n se vengono contate con la loro molteplicità). L insieme di tali zeri viene chiamato spettro di A e si indica con σ(a). esempio
caso diagonale e triangolare: gli autovalori sono gli elementi lungo la diagonale principale. esempi
Osservazione 0.15 Gli autovalori si possono definire per matrici quadrate qualsiasi. Nel caso di matrici simmetriche gli autovalori sono tutti numeri reali. In generale sono numeri complessi (cioè stanno nell insieme C). Inoltre λ è un autovalore se e solo se esiste almeno un vettore non nullo v tale che Av = λv Tale v si dice autovettore di A relativo all autovalore λ. Si tratta di una nozione molto utile per determinare i cosiddetti sentieri di crescita bilanciata o i punti di equilibrio di un sistema economico.
Segno di una matrice simmetrica e autovalori Per determinare il segno di una matrice ci basta conoscere gli autovalori, infatti: Teorema 0.16 Una matrice simmetrica A M(n, n) è definita positiva se e solo se tutti i suoi autovalori sono > 0; definita negativa se e solo se tutti i suoi autovalori sono < 0; semidefinita positiva se e solo se tutti i suoi autovalori sono 0; semidefinita negativa se e solo se tutti i suoi autovalori sono 0; indefinita se e solo se esistono due autovalori di segno opposto.
esempi
Dato che ci interessa solo il segno degli autovalori vi sono dei metodi che permettono di indagare il segno di una matrice lavorando sui coefficienti di essa. Caso 2 2 Si dimostra che: il determinante è il prodotto degli autovalori; la traccia (somma degli elementi sulla diagonale principale) è la somma degli autovalori. esempi
Di conseguenza, data una matrice A 2 2 si ha Teorema 0.17 Una matrice A M(2, 2) è definita positiva se e solo se det A > 0 e a 1,1 > 0; definita negativa se e solo se det A > 0 e a 1,1 < 0; semidefinita positiva se e solo se det A = 0 e a 1,1 + a 2,2 0; semidefinita negativa se e solo se det A = 0 e a 1,1 + a 2,2 0; indefinita se e solo se. det A < 0 Questo teorema può essere utile quando si indaga il segno di matrici 2 2 poiché permette di abbreviare alcuni calcoli. Per usarlo conviene di solito partire cal-
esempi
Caso n n Definizione 0.18 Sia A M(n, n) una matrice quadrata simmetrica. Fissato k N con 1 k n si chiama sottomatrice principale una qualsiasi sottomatrice di ordine k ricavata scegliendo gli stessi indici di riga e di colonna; il suo determinante si chiama minore principale di ordine k; sottomatrice principale di guida o di testa la sottomatrice A k di ordine k ricavata scegliendo le prime k righe e le prime k colonne; il suo determinante si chiama minore principale di guida (o di testa) di ordine k, e lo indicheremo con M k. Utilizzando questa definizione siamo in grado di caratterizzare il segno delle matrici simmetriche.
Teorema 0.19 (Criterio di Sylvester) Una matrice simmetrica A M(n, n) è definita positiva se e solo se tutti i suoi minori principali di guida sono > 0; definita negativa se e solo se tutti i suoi minori principali di guida sono < 0 quando di ordine dispari, > 0 quando di ordine pari; indefinita se det A 0 e non vale nessuna delle due sopra. Vale un criterio analogo per le matrici semidefinite positive in cui si usano le sottomatrici principali invece di quelle principali di guida. esempi
esempi
Ricordiamo il legame tra convessità (concavità) e matrice Hessiana. Teorema 0.20 Sia f : A R derivabile due volte sull insieme A R n aperto e convesso; allora f è convessa su A se e solo se, per ogni x A, H f (x) è semidefinito positivo, f è concava su A se e solo se, per ogni x A, H f (x) è semidefinito negativo.
Pericolo 0.21 Attenzione: il Teorema 0.20 permette di ricavare la concavità o la convessità di una funzione f se l insieme A è aperto e convesso. Se poi f è convessa (concava) su un aperto convesso A e continua su B = A fr A (o B = A C con C fr A) allora f risulta convessa (concava) su B. Su insiemi diversi (ad esempio una retta o una sua porzione in R 2, o il piano R 2 privato degli assi) non abbiamo a disposizione risultati 1.
esempi f(x 1, x 2 ) = x 1 ln x 2 CE = {x R 2 : x 2 > 0} f(x) = ( ln x 2, x ) 1 x 2 H f (x) = 1 0 x 2 1 x 1 x 2 x 2 2 trh f (x) = x 1 x 2 2 det H f (x) = 1 x 2 2
caso Hessiano costante
caso Hessiano variabile
Problemi di massimo e minimo libero Il problema è quello di trovare massimi e/o minimi locali (relativi) e/o globali (assoluti) di una funzione f : A R dove A R n. Puntualizziamo alcune cose. (i) Ci limitiamo ad analizzare casi in cui f sia derivabile due volte su A e quindi, rispetto al caso di una variabile, lasciamo da parte i problemi legati alla non continuità ed alla non derivabilità.
(ii) Se A è aperto (nei nostri esercizi ciò accade spesso quando A è il CE) parliamo di problemi di estremo libero (o interno); Se A non è aperto (nei nostri esercizi ciò accade spesso quando A è definito da alcuni vincoli di uguaglianza o diseguaglianza ed è più piccolo del CE) parliamo di problemi di estremo vincolato. La differenza di fatto viene dalla presenza di punti di frontiera. Per indagare la presenza, fra essi, di punti di massimo e minimo occorrono tecniche diverse che rendono più difficili i problemi di estremo vincolato.
Problemi di estremo libero. Iniziamo spiegando come si determinano punti di massimo e minimo locale e poi vediamo sotto quali condizioni i punti di estremo locale possono essere o non essere globali. Strumenti a disposizione per trovare i punti di massimo o minimo locale Abbiamo a disposizione tre teoremi analoghi al caso di una variabile condizione necessaria del primo ordine condizione necessaria del secondo ordine condizione sufficiente del secondo ordine
Condizione necessaria del primo ordine Teorema 0.22 (Fermat) Consideriamo f : A R con A R n. Se a int A è un punto di minimo (o massimo) locale per f e f è derivabile in a allora f(a) = 0. (1)
Il Teorema di Fermat afferma che gli unici punti interni candidati ad essere punti di minimo o massimo locale per funzioni derivabili sono quelli che annullano la derivata. Tali punti si dicono punti stazionari (o punti critici). Restano fuori i punti di frontiera che stanno anche in A e i punti di non derivabilità. Anche essi devono essere messi fra i candidati per l ultima fase di ricerca.
Condizione necessaria del secondo ordine Teorema 0.23 Sia f : A R continua su A R n. Sia a int A un punto stazionario in cui esiste H f (a). Se a è un punto di minimo (massimo) locale allora H f (a) è semidefinito positivo ( Hf (a) è semidefinito negativo ).
Condizione sufficiente del secondo ordine Teorema 0.24 Sia f : A R continua su A R n. Sia a int A un punto stazionario in cui esiste H f (a). Se allora H f (a) è definito positivo ( Hf (a) è definito negativo ) allora a è un punto di minimo (massimo) locale
Metodi Problemi di estremo libero locale La ricerca dei punti di estremo libero locale si effettua (in grandi linee) nella seguente maniera. 1. Si determinano i punti stazionari (detti anche punti critici), cioè quei punti x 0 R n, interni al CE, per cui f(x 0 ) = 0. Tali punti saranno i candidati ad essere punti di massimo e minimo.
2 0 2. Si calcola l Hessiano H f (x) e lo si valuta nei punti stazionari: (condizione necessaria): se x 0 è punto di minimo allora H f (x 0 ) è semidefinita positiva; (condizione necessaria): se x 0 è punto di massimo allora H f (x 0 ) è semidefinita negativa; (condizione sufficiente): se H f (x 0 ) è definita positiva allora x 0 è punto di minimo; (condizione sufficiente): se H f (x 0 ) è definita negativa allora x 0 è punto di massimo; (condizione sufficiente): se H f (x 0 ) è indefinita allora x 0 non è né punto di minimo né punto di massimo, e prende il nome di punto di sella 2.
Quindi, se l Hessiano è definito o indefinito abbiamo una informazione completa: ad esempio se è definito positivo sappiamo che x 0 è punto di minimo; se l Hessiano è semidefinito ma non nullo abbiamo una informazione parziale: ad esempio se è semidefinito positivo sappiamo che x 0 non è punto di massimo; resta da decidere se è punto di minimo o di sella; se l Hessiano è nullo non abbiamo alcuna informazione.
esempi
Punti critici liberi e loro natura Vediamo alcune idee per stabilire se un punto critico è estremale locale o globale. Abbiamo già parlato delle condizioni necessarie e sufficienti del secondo ordine che servono per vedere se un punto critico è estremale locale. Ne vediamo altri (anche per estremali globali). Non vi sono metodi sicuri.
1. Verificare la definizione di punto di massimo/minimo locale tramite la soluzione di una disequazione. Esempio. f(x) = x 4 1 + x4 2
2. Studiare le restrizioni di f rispetto a delle rette passanti per il punto stazionario. Tale metodo serve solamente per far vedere che x 0 è punto di sella e si basa sul seguente risultato. Teorema 0.25 (sulla restrizione locale) Se f ha un punto di massimo/minimo locale in x 0 allora ogni restrizione di f a rette passanti per x 0, ha in x 0 un massimo/minimo locale. Esempio. f(x) = x 4 1 + (x 2 1) 3
3. Usando la convessità/concavità come riportato dal seguente risultato. Teorema 0.26 Sia f : A R convessa (rispettivamente concava) su A convesso e sia x 0 punto stazionario. Allora x 0 è punto di minimo (rispettivamente massimo) globale su A. Se invece f è convessa (rispettivamente concava) solo in I(x 0, r) A (dove I(x 0, r) è un fissato intorno di x 0 ) allora x 0 è punto di minimo (rispettivamente massimo) locale su A. Utilizzando tale risultato assieme al Teorema 0.20, possiamo dedurre che un punto stazionario è di minimo o massimo locale e/o globale su A studiando il segno dell Hessiano.
Esempio.
Problemi di massimo e minimo vincolato esempi
In questo caso la teoria è ancora più delicata rispetto al caso non vincolato. La forma standard di scrittura di tali problemi sarà min / max f(x) g 1 (x) 0. g m (x) 0 (2) h 1 (x) = 0. h p (x) = 0. La f si dice spesso funzione obbiettivo mentre le g i e h j con i = 1,..., m e j = 1,..., p si dicono funzioni vincolari.
esempi
Strumenti a disposizione L analogo del teorema di Fermat qui è il Teorema dei moltiplicatori di Lagrange (Condizioni di Kuhn-Tucker). esempio con un vincolo di uguaglianza
esempio con un vincolo di disuguaglianza
esempio con più vincoli di disuguaglianza
Caso generale La condizione necessaria f(x) = 0 diventa più complessa. Essa dice che se un punto è di massimo o minimo locale allora esistono dei moltiplicatori λ 1,..., λ m, µ 1,..., µ p tali che x, λ i (i = 1,..., m) e µ j (j = 1,..., p) risolvono il sistema: m f(x) + λ i g i (x) + i=1 p µ j h j (x) = 0 j=1 λ i g i (x) = 0, i, (3) g i (x) 0, i, h j (x) = 0, j. Inoltre si deve avere λ i 0 se x è punto di minimo, λ i 0 se x è punto di massimo.
Il sistema visto sopra si dice sistema di Kuhn Tucker associato al problema (2). I punti x tali che esistono dei moltiplicatori che soddisfano il sistema (3) si dicono punti stazionari vincolati. Attenzione: quanto detto vale sotto opportune ipotesi di regolarità che nei problemi proposti saranno sempre verificate. Le variabili λ i e µ j prendono il nome di moltiplicatori di Lagrange o di Kuhn Tucker. La seconda equazione del sistema prende il nome di condizione di complementarietà.
Operativamente il teorema di Kuhn- Tucker si usa come il Teorema di Fermat: occorre innanzitutto scrivere il problema nella forma standard, scrivere poi il sistema di Kuhn-Tucker associato e trovare i punti che lo risolvono: essi saranno i candidati ad essere punti di massimo e minimo. Notate che nella parte interna della regione il sistema si riduce a chiedere f(x) = 0.
esempi nei casi visti in precedenza: un vincolo di uguaglianza
esempi nei casi visti in precedenza: un vincolo di disuguaglianza
esempi nei casi visti in precedenza: più vincoli di disuguaglianza
Natura dei punti stazionari vincolati Purtroppo non abbiamo un buon metodo generale per indagare la natura dei punti stazionari vincolati (cioè per dire se sono effettivamente punti di massimo o minimo locale o globale). Esistono delle condizioni necessarie e sufficienti del secondo ordine per estremali locali (Hessiano orlato) che non consideriamo.
Problemi di estremo globale Una volta trovati i punti che soddisfano le condizioni necessarie di Kuhn Tucker possiamo comunque indagare la loro natura utilizzando i seguenti strumenti (in parte già visti in precedenza) Uso della definizione (studiando opportune disuguaglianze). Uso di restrizioni opportune per negare che il punto sia estremale. Teorema di esistenza di Weierstrass. Teorema su ottimalità e convessità nel caso vincolato: Teorema 0.27 Sia f : A R convessa (rispettivamente concava) su A convesso e sia x 0 punto stazionario vincolato con moltiplicatori λ 0 (rispettivamente 0). Allora x 0 è punto di minimo (rispettivamente massimo) globale su A.
esempi dell uso dei primi due strumenti
esempi
esempi
Esercizio 0.1 Trovare massimi e minimi globali (se esistono) della funzione f(x 1, x 2 ) = x 2 1 2x 1 x 2 sull insieme { } A = x R 2 : x 1 0, x 2 0, x 1 + x 2 8 Soluzione. Disegnamo la regione ammissibile A. x 2 (0, 8) x 1 0 x 1 + x 2 8 x 2 0 (8, 0) x 1 Figure 1: regione ammissibile
Scriviamo ora il problema nella forma standard max / min x 2 1 2x 1 x 2 x 1 0 x 2 0 x 1 + x 2 8 0. Siamo in presenza di n = 2 variabili e m = 3 vincoli: g 1 (x) = x 1, g 2 (x) = x 2, g 3 (x) = x 1 +x 2 8. Osserviamo che A è chiuso e limitato (compatto) e f è continua su A. Dunque, per il Teorema di Weierstrass, esistono massimo e minimo. Per trovarli si risolve il sistema di Kuhn Tucker (3) trovando tutti i punti stazionari e poi confrontiamo i valori assunti da f su essi. In tal modo non siamo in grado di sapere se ci sono altri punti di massimo o min-
Il gradiente della funzione obiettivo risulta ( ) 2x1 2 f(x) = 1 mentre quelli dei tre vincoli sono ( ) ( ) 1 0 g 1 (x) =, g 0 2 (x) =, 1 ( ) 1 g 3 (x) =. 1 A questo punto il sistema di Kuhn Tucker risulta 2x 1 2 λ 1 + λ 3 = 0 1 λ 2 + λ 3 = 0 λ 1 x 1 = 0 λ 2 x 2 = 0 (4) λ 3 (x 1 + x 2 8) = 0 x 1 0 x 2 0 x 1 + x 2 8 0 con l ulteriore vincolo sul segno dei moltiplicatori λ i che dovranno essere 0 per la ricerca dei punti di minimo e 0 per la ricerca dei punti di massimo.
1. Consideriamo il caso in cui i tre vincoli g i (x) 0 siano verificati con il segno di minore stretto (<). Dal punto di vista geometrico significa che ricerchiamo i punti stazionari interni alla regione ammissibile. Tuttavia l equazione f(x) = 0 risulta impossibile, poiché la seconda componente è costantemente 1 0. Ciò vuol dire che i punti di massimo e di minimo non saranno interni alla regione ma dovranno trovarsi sulla frontiera.
2. Ricerchiamo il punto stazionario su un lato della regione ammissibile. Questo significa che uno dei tre vincoli deve essere verificato con il segno di uguaglianza mentre gli altri due con il segno di disuaglianza stretta. Dobbiamo vedere perciò tre casi
Caso g 1 (x) = 0. Essendo g 2 (x) < 0 e g 3 (x) < 0, dalla condizione di complementarietà si ricava λ 2 = λ 3 = 0 ed il sistema diventa 2x 1 2 λ 1 = 0 1 = 0 x 1 = 0 x 2 < 0 x 1 + x 2 8 < 0 che risulta impossibile (la seconda equazione risulta un po difficile da risolvere!). Quindi non esistono punti stazionari sul primo lato.
Caso g 2 (x) = 0. Essendo g 1 (x) < 0 e g 3 (x) < 0, dalla condizione di complementarietà si ricava λ 1 = λ 3 = 0 ed il sistema diventa 2x 1 2 = 0 1 λ 2 = 0 x 1 < 0 x 2 = 0 x + x 2 8 < 0 che implica la soluzione x 1 = 1 x 2 = 0 λ 1 = 0 λ 2 = 1 λ 3 = 0. Quindi l unico punto stazionario è x 1 = (1, 0) che può essere punto di massimo (in quanto tutti e tre i moltiplicatori sono non positivi).
Caso g 3 (x) = 0. Essendo g 1 (x) < 0 e g 2 (x) < 0, dalla condizione di complementarietà si ricava λ 1 = λ 2 = 0 ed il sistema diventa 2x 1 2 + λ 3 = 0 1 + λ 3 = 0 x 1 > 0 x 2 > 0 x 1 + x 2 = 8 che implica la soluzione x 1 = 1 2 x 2 = 15 2 λ 1 = 0 λ 2 = 0 λ 3 = 1. Quindi ( l unico ) punto stazionario è x 2 = 12, 15 che può essere punto 2 di minimo (in quanto tutti e tre i moltiplicatori sono non negativi).
3. A questo punto dobbiamo (teoricamente) analizzare il caso in cui due vincoli siano verificati sottoforma di uguaglianza ed il terzo invece con la disuguaglianza stretta. Questo equivale a considerare quei punti che risultano dall intersezione di due dei tre vincoli. Nel nostro caso i tre vertici del triangolo che sono P 1 = (0, 0), P 2 = (0, 8), P 3 = (8, 0). Potremmo anche per questi verificare se valgono le condizioni di Kuhn-Tucker, tuttavia è più conveniente inserirli subito tra i punti candidati (tanto sono un numero finito) e andare avanti.
Abbiamo quindi determinato cinque punti candidati. Passiamo ad esaminare (e confrontare tra loro) i valori assunti dalla funzione obiettivo in tali punti: f(1, 0) = 1, f ( 1 2, 15 2 ) = 33 4, f(0, 0) = 0, f(0, 8) = 8, f(8, 0) = 48. Quindi il punto x 2 = ( 2 1, 15 2 ) è di minimo globale mentre P 3 = (8, 0) è di massimo globale.