Massimi e minimi relativi in R n Si consideri una funzione f : A R, con A R n, e sia x A un punto interno ad A. Definizione: si dice che x è un punto di massimo relativo per f se B(x, r) A tale che f(y) f(x) y B(x, r). Si dice invece che x è un punto di minimo relativo per f se B(x, r) A tale che f(y) f(x) y B(x, r). Data una funzione, per trovare i punti di massimo e/o minimo relativo si può sfruttare il seguente Teorema. Teorema: se f : A R, con A R n aperto, è derivabile in un punto x A interno ad A e x è un punto di massimo o minimo relativo, allora f(x) = (0, 0,..., 0) Dunque in prima battuta, per cercare gli eventuali punti di massimo e minimo relativo di f, si calcolano le derivate parziali e risolve il sistema in cui tutte tali derivate si azzerano x 1 (x 1, x,..., x n ) = 0 x (x 1, x,..., x n ) = 0. x n (x 1, x,..., x n ) = 0 Esempio: calcolare massimi e minimi relativi delle seguenti funzioni R R così definite f(x, y) = x + y g(x, y) = 1 x y h(x, y) = y x f(x, y) = (x, y) f(x, y) = (0, 0) = x = y = 0 g(x, y) = x, y) g(x, y) = (0, 0) = x = y = 0 h(x, y) = ( x, y) h(x, y) = (0, 0) = x = y = 0 Quindi (0, 0) è un punto critico per le tre funzioni. f(x, y) = x + y 0 (x, y) R Perciò (0, 0) è un punto di minimo assoluto (quindi anche relativo) per f. g(x, y) = 1 (x + y ) 1 (x, y) R Dato che g(0, 0) = 1, allora (0, 0) è un punto di massimo assoluto (quindi anche relativo) per g. Per quanto riguarda h, la restrizione h(x, 0) = x equivale ad una parabola concava con vertice nell origine, per questo il punto (0, 0), relativamente a questa restrizione, rappresenterebbe un 1
massimo. Invece la restrizione h(0, y) = y rappresenta una parabola convessa con vertice nell origine, pertanto, relativamente a questa restrizione, il punto (0, 0) rappresenterebbe un minimo. Pertanto (0, 0) per h non è né un punto di massimo né un punto di minimo, ma è un punto di sella. Teorema di Fermat: sia f : A R, con A R n aperto e f C 1 (A), sia x A un punto interno ad A, e supponiamo inoltre che x sia un punto di massimo o minimo relativo. Allora f(x) = O, dove con O si intende il vettore nullo di R n. Definizione: i punti in cui il gradiente si annulla sono detti punti critici. Sia f definita come sopra, allora l insieme dei punti critici è dato da {x A : f(x) = O} Definizione: un punto critico che non è né un massimo né un minimo è un punto di sella. Più precisamente, se x è un punto critico, e in ogni intorno di x esistono due punti y e z tali che f(y) > f(x) e f(z) < f(x) allora x è un punto di sella. Quindi per capire se un punto critico x di f è un punto di massimo, di minimo o di sella si deve studiare la disequazione f(y) f(x) 0 per y appartenente ad un intorno di x. Esempio: trovare massimi e minimi relativi di f : R R : (x, y) x + y xy Dato che f C 1 ( R ) per il Teorema di Fermat i suoi eventuali punti di massimo e minimo relativo sono punti critici. (x, y) = x y x y (x, y) = y x f(x, y) = (x y, y x) { x y = 0 y x = 0 = { x = y 6y y = 0 = { x = y y(6y 1) = 0 Le soluzioni del sistema sono (x, y) = (0, 0) e (x, y) = ( 1 1, 1 6). Se (0, 0) fosse un punto di minimo, allora, per ogni (x, y) in un intorno di (0, 0), risulterebbe (osservando che f(0, 0) = 0) f(x, y) f(0, 0) 0 = x + y xy 0 Osserviamo come si comporta la f lungo la retta x = 0, studiamo cioè la restrizione f(0, y) = y, rappresentata in Figura 1. Tale restrizione è positiva per y > 0, negativa per f(0, y) < 0, così come evidenziato in Figura. Comunque si comporti ogni altra restrizione di f, esisteranno punti appartenenti all intorno di (0, 0) per cui f(x, y) > f(0, 0), altri appartenenti allo stesso intorno per cui f(x, y) < f(0, 0). Di conseguenza (0, 0) è un punto di sella. Consideriamo ora il punto ( 1 disequazione 1, 1 6 f(x, y) f ) (, osservando che f 1 1, 1 6 ) ( 1 1, 1 6 0 = x + y xy + 1 4 0 ) = 1 4. Rimane ora da studiare la Come si può vedere, in questo caso il calcolo di massimo e minimo mediante l uso della definizione non è agevole. In generale, cerchiamo di studiare f(y) f(x) 0 nel caso in cui 1. f : A R, con A R n aperto e f C (A). x è un punto critico di f
Figura 1: Restrizione della f alla retta x = 0 Figura : Positività della restrizione f(0, y) Lo sviluppo di Taylor arrestato al ordine di f intorno x è f(y) = f(x) + f(x), (y x) + 1 (y x) Hf(x) (y x)t + o( y x ) Dato che x è un punto critico si osserva che f(x) = (0, 0,..., 0), pertanto lo sviluppo equivale a f(y) f(x) = 1 (y x)hf(x)(y x)t + o( y x ) Il segno di f(y) f(x), che poi è quello a cui siamo interessati, è intuibile dal segno di (y x)hf(x)(y x) T
cioè dal segno di una quantità del tipo vhv T, con H matrice simmetrica n n, e v vettore appartenente a R n. Conviene a questo punto richiamare alcuni concetti di Algebra Lineare. Data una matrice M quadrata n n a coefficienti in K (che può essere R o C), dato un vettore v K n, indichiamo con O il vettore nullo di K n. Definizione: M si dice semidefinita positiva se vhv T 0 M si dice semidefinita negativa se vhv T 0 v K n v K n M si dice definita positiva se vhv T > 0 M si dice definita negativa se vhv T < 0 v K n \ {O} e vhv T = 0 v = O v K n \ {O} e vhv T = 0 v = O M si dice indefinita se esistono v 1, v K n tali che v 1 Hv T 1 < 0 e v Hv T > 0 Richiamiamo anche un altro concetto di Algebra Lineare. Definizione: data una matrice M quadrata a coefficienti in un dato campo K, si dice che λ K è un autovalore di M se e solo se det(m λi) = 0, dove I indica la matrice identità dello stesso ordine di M. Da questo si capisce che gli autovalori sono le radici in K del polinomio caratteristico della matrice. Le matrici Hessiane che considereremo sono tutte simmetriche a coefficienti reali. Si può dimostrare che una matrice simmetrica a coefficieni reali ha tutti gli autovalori reali. Per determinare se una matrice Hessiana considerata è definita positiva, definita negativa o indefinita, può essere utile considerare questo teorema. Teorema: sia H una matrice quadrata simmetrica a coefficienti reali. se H ha tutti gli autovalori positivi allora è definita positiva se H ha tutti gli autovalori negativi allora è definita negativa se H ha due autovalori di segno opposto allora è indefinita Per determinare la natura di un punto critico è importante sapere di che tipo è la matrice Hessiana, vale infatti il seguente Teorema. Teorema: sia f : A R, con A R n aperto, e supponiamo che f C (A). un punto critico per f (ovvero f(x) = (0, 0,..., 0)). Allora Sia x A 1. se Hf(x) è definita positiva allora x è un punto di minimo relativo. se Hf(x) è definita negativa allora x è un punto di massimo relativo. se Hf(x) è indefinita allora x è un punto di sella Non sono contemplati da questo teorema i casi in cui gli autovalori siano 0 o 0, in cui effettivamente qualcuno è nullo. In questi casi l Hessiano non può dare informazioni circa la natura del punto critico, ed è quindi necessario ricorrere alla definizione. Esempio: riprendiamo in considerazione l esempio precedente f : R R : (x, y) x + y xy 4
e determiniamo la natura del punto ( 1 1, 1 6). Le derivate prime parziali erano già state calcolate, calcoliamo ora le derivate seconde (x, y) = x f xy (x, y) = f (x, y) = 1 yx f (x, y) = 6y y Quindi la matrice Hessiana è pertanto ( ) 1 Hf(x, y) = 1 6y Hf ( 1 1, 1 ) ( 1 = 6 1 1 Calcoliamo ora gli autovalori indicando, per semplicità notazionale, con H quest ultima matrice ( ) ( ) ( ) 1 1 0 λ 1 H λi = λ = 1 1 0 1 1 1 λ Il determinante di questa matrice, ovvero il polinomio caratteristico di H, vale p(λ) = λ λ + λ 1 = λ λ + 1 Risolvendo l equazione di secondo grado p(λ) = 0 si trovano queste due soluzioni, che poi sono gli autovalori di H λ 1 = 5 ) > 0 λ = + 5 Entrambi gli autovalori sono positivi (strettamente), quindi H è una matrice definita positiva, pertanto ( 1 1, 6) 1 è un punto di minimo relativo per f. Verifichiamo ora che (0, 0) è un punto di sella per f ( ) 1 Hf(0, 0) = 1 0 Sempre per semplicità notazionale, d ora in poi indichiamo questa matrice semplicemente con H. ( ) λ 1 H λi = 1 λ Il determinante di questa matrice vale p(λ) = λ λ 1, pertanto le radici di p(λ) sono > 0 λ 1 = 1 < 0 λ = 1 + > 0 dato che sono di segno opposto la matrice è indefinita e (0, 0) è un punto di sella per f. Regola di Cartesio Per determinare la natura dell Hessiano non è necessario determinare i suoi autovalori, ma è sufficiente conoscerne il segno. Per questo scopo può essere utile la regola di Cartesio, che permette di conoscere il segno delle radici di un polinomio osservando solo il segno dei coefficienti. Consideriamo questi due polinomi, ordinati dalla potenza maggiore alla potenza minore p(λ) = 10λ 4 7λ + 4λ + 6λ 1 q(λ) = 10λ 1 + λ 5 + 5λ 4 + λ Il polinomio p( ) è completo, invece q( ) no, perché ha dei coefficienti nulli. Se il polinomio considerato è completo, dopo averlo scritto con le potenze dalla maggiore alla 5
minore, si scrive la successione dei segni dei coefficienti, ad esempio, considerando il polinomio p( ) si ottiene + + + V V P V Coppie successive di segni opposti sono variazioni, coppie successive di segno uguale sono permanenze. Ogni variazione corrisponde al fatto che il polinomio ha una radice positiva, ogni permanenza invece corrisponde al fatto che il polinomio ha una radice negativa. p( ) presenta tre variazioni e una permanenza, pertanto, se ha 4 radici reali, allora sono positive e una è negativa. Se invece il polinomio considerato non è completo, come q( ), si procede come segue: si raccoglie, se si può, una potenza di λ comune a tutti i termini, nel caso di q( ) q(λ) = λ ( 10λ 18 + λ + 5λ + 1) = λ r(λ) Quindi q( ) ammette una radice pari a 0 di molteplicità. ammette 0 come radice (il termine noto infatti non è nullo). Allo stesso tempo r( ) non A questo punto si passa ad analizzare r( ). Se r( ) è completo si procede come prima, altrimenti, se non è completo, ha almeno due radici di segno opposto. Esempio: trovare i massimi e minimi di f : R R : (x, y, z) x + y 4 + y + z xz Dato che f è un polinomio, allora f C ( R ), pertanto, per il Teorema di Fermat, i punti di massimo e minimo vanno cercati fra i punti critici. (x, y, z) = x z x y (x, y, z) = 4y + y z (x, y, z) = z x Risolvendo il sistema (i passaggi algebrici sono lasciati al lettore) si trovano queste due soluzioni ( (x, y, z) = (0, 0, 0) (x, y, z) =, 0, ) Calcoliamo le derivate seconde (per il Teorema di Schwarz le derivate seconde miste sono uguali, pertanto è sufficiente calcolare sei derivate, anziché nove) (x, y, z) = x f y (x, y, z) = 1y + (x, y, z) = 6z z Quindi la matrice Hessiana è xy (x, y, z) = f (x, y, z) = 0 yx xz (x, y, z) = f (x, y, z) = zx yz (x, y, z) = f (x, y, z) = 0 zy Hf(x, y, z) = 0 0 1y + 0 0 6z da cui Hf(0, 0, 0) = 0 0 0 0 0 6
Hf(0, 0, 0) λi = λ 0 0 λ 0 0 λ Calcolandone il determinante (usando lo sviluppo di Sarrus, visto che la matrice è di ordine ) si trova questo polinomio det (Hf(0, 0, 0) λi) = λ( λ) 4( λ) = λ + 4λ 4λ 8 + 4λ = λ + 4λ 8 Dato che la matrice Hessiana è simmetrica e a coefficienti reali allora tutti i suoi autovalori sono positivi, pertanto il polinomio caratteristico ha tutte le radici reali. Osservando che questo polinomio ha termine noto diverso da zero e non è completo si deduce che ha due radici di segno opposto, quindi Hf(0, 0, 0) è indefinita, pertanto (0, 0, 0) è un punto di sella. Considerando l altro punto critico si ottiene Hf Hf (, 0, ) = (, 0, ) λi = 0 0 0 0 0 λ 0 0 λ 0 0 λ Sviluppando secondo la regola di Sarrus si ottiene ( ( det Hf, 0, ) ) λi = ( λ) (4 λ) 4( λ) = ( λ)(8 6λ+λ 4) = ( λ)(λ 6λ+4) Un autovalore è, gli altri due, osservando i segni dei coefficienti del polinomio di secondo grado e sfruttando la regola di Cartesio, sono di sicuro positivi. Dato che tutti gli autovalori sono positivi allora la matrice Hessiana considerata è definita positiva, e (, 0, ) è un punto di minimo relativo. Esempio: calcolare massimi e minimi della funzione f : R R : (x, y) y x y Dato che f C ( R ) i massimi e minimi vanno cercati fra i punti critici. (x, y) = xy x (x, y) = y x y Risolvendo il sistema in cui si pongono le derivate parziali uguali a zero si nota facilmente che l unica soluzione è (x, y) = (0, 0). Le derivate seconde valgono (x, y) = y x Dunque l Hessiano è ovvero f (x, y) = y ( ) y x Hf(x, y) = x ( ) 0 0 Hf(0, 0) = 0 f xy (x, y) = f (x, y) = x yx La matrice in questione è diagonale, pertanto i suoi autovalori coincidono con gli elementi sulla diagonale principale, e sono 0 e. Un autovalore è nullo, pertanto l Hessiano non può dare informazioni circa la natura di questo punto critico. L unica cosa che si può fare è ricorrere alla definizione, ovvero studiare il segno di f(x, y) f(0, 0) per (x, y) in un intorno dell origine. Consideriamo la disequazione f(x, y) f(0, 0) 0, che equivale a Segno di y: y 0, mostrato in Figura y x y 0 = y(y x ) 0 7
Figura : Segno di y Segno di y x : y x, mostrato in Figura 4 Figura 4: Segno di y x Da questo si capisce che il segno di y(y x ) è quello rappresentato in Figura 5 8
Figura 5: Segno di y(y x ) Il punto critico in questione è il vertice della parabola. In ogni intorno dell origine cascano punti che soddisfano la disequazione f(x, y) f(0, 0) < 0, ovvero f(x, y) < f(0, 0), sia altri che soddisfano f(x, y) f(0, 0) > 0, ovvero f(x, y) > f(0, 0). Pertanto (0, 0) non è un massimo né un minimo, ma un punto di sella. Questo articolo è stato realizzato grazie alla supervisione di Luca Lussardi. 9