Lezione Diagonalizzazione ortogonale per matrici simmetriche

Lezione 22 22. Diagonalizzazione ortogonale per matrici simmetriche La Proposizione 2. afferma che ogni matrice simmetrica reale è diagonalizzabile su R: ilrisultatoprincipalediquestasezioneèchelamatricechediagonalizzapuò essere scelta ortogonale, cioè tale che P = t P. Sia A 2 Sim n (R) esiano,..., h 2 R isuoiautovaloriadueaduedistinti. In ciascuno degli autospazi E A ( j ) fissiamo una base, diciamo B j =(P j,,...,p j,mj ), dove m j = m a ( j,a)=m g ( j,a). Per la Proposizione 2.4, B j può essere supposta ortonormale rispetto al prodotto scalare standard di R n. Osserviamo che autovettori di A relativi ad autovalori distinti sono fra loro ortogonali. Infatti, se P i 2 E A ( i ) e P j 2 E A ( j ) con i 6= j,allora j t P i P j = t P i ( j P j )= t P i (AP j )= t P i AP j = t P i t AP j = t (AP i )P j = i t P i P j, quindi ( j i ) t P i P j =. Poiché j 6= i,segue j i 6=,dunquedevevalere t P i P j =. Queste considerazioni ci permettono di affermare che è sempre possibile trovare una base ortonormale di autovettori di A, ovverounamatriceortogonalep 2 R n,n tale che P AP sia diagonale. Proposizione 22.. Sia A 2 Sim n (R) una matrice simmetrica reale. Allora esiste una matrice ortogonale P 2 R n,n tale che P AP = t P AP sia diagonale. La matrice P può essere scelta speciale. Illustriamo quanto detto con un esempio. Esempio 22.2. Si consideri la matrice A = @ A. Come già visto nell Esempio 2., gli autovalori di A sono E A ( ) = L((,, ), (,, )), E A (2) = L((,, )). 22 e 2, conautospazi

224 Per ottenere una matrice ortogonale P che diagonalizzi A ènecessariodeterminare tre autovettori P,P 2,P ortonormali. A tale scopo basta determinare basi ortonormali in E A ( ) e E A (2). Per quanto riguarda E A (2), èsufficientescegliereinesso un versore, ad esempio consideriamo P = p (,, ). Per l autospazio E A ( ) invece il discorso è un po più complicato. Iniziamo a determinare un versore, per esempio P 2 = p 2 (,, ). Per determinare P cerchiamo 2 R tale che i vettori P 2 e X =(,, ) + (,, ) siano ortogonali. Si ha che hp 2,X i =(2+ )/ p 2. Affiché hp 2,X i =si deve avere che = 2, dunquepossiamoscegliere P = p 6 (,, 2). Si noti che questo procedimento è, in realtà, equivalente a trovare una base qualsiasi di E A ( ) ed applicare l algoritmo di ortonormalizzazione di Gram-Schmidt visto nella Proposizione 2.4. Quindi la matrice ortogonale cercata è B P = @ p p2 p6 p p2 p6 p 2 p6 C A. P ènonspecialeerisulta 2 P AP = t P AP = @ A. Per esercizio si verifichi invece che P B = @ p p2 p6 p p2 p6 p 2 p6 C A èspecialeecheancorarisulta 2 P AP = t P AP = @ A.

225 22.2 Forme quadratiche reali Nella Lezione 2 abbiamo visto due esempi di prodotto scalare h, i su R n ein entrambi i casi abbiamo verificato l esistenza di una matrice A =(a i,j ) 6i,j6n 2 R n,n simmetrica tale che hx, yi = t xay (22.2.) per ogni x, y 2 R n. Viceversa, data una matrice simmetrica A 2 R n,n,siconsideril applicazione h, i: R n R n! R definita dalla formula (22.2.): per le proprietà dei prodotti di matrici le proprietà (PS2) e (PS) della Definizione 2. sono banalmente soddisfatte. Per quanto riguarda (PS) si noti che, poiché t xay 2 R ed A èsimmetrica,segue hx, yi = t xay= t ( t xay)= t y t Ax= t yax= hy, xi. L unica condizione di non immediata verifica è (PS4), cioè che vale t xax > per ogni x 2 R n \{ R n }. Si noti che t xax èunpolinomiodigrado2 omogeneo nelle entrate di x =(x,...,x n ) della forma x x 2... x n a, x + + a,n x n a 2, x + + a 2,n x n B C @. A = a n, x + + a n,n x n = a, x 2 + + a,n x x n + a 2, x 2 x + + a 2,n x 2 x n + + a n,n x 2 n. Poiché a i,j = a j,i e x i x j = x j x i per i, j =,...,n,segueche t xax = a, x 2 +2a,2 x x 2 + +2a,n x x n + a 2,2 x 2 2 +2a 2, x 2 x + + a n,n x 2 n. Quindi determinare se l applicazione (x, y) 7! t xay èunprodottoscalareequivalea studiare il segno del polinomio q(x) = t xax al variare di x 2 R n. Definizione 22. (Forme quadratiche reali). Una forma quadratica reale q nelle variabili x,...,x n èunpolinomioq(x,...,x n ) 2 R[x,...,x n ] omogeneo di grado due. Possiamo riformulare quanto abbiamo visto sopra dicendo che ogni matrice simmetrica A 2 R n,n definisce una forma quadratica reale q(x) = t xax in n variabili. Vale anche il viceversa: infatti, data la forma quadratica q(x,...,x n )=q, x 2 + q,2 x x 2 + + q,n x x n + q 2,2 x 2 2 + q 2, x 2 x + + q n,n x 2 n, consideriamo la matrice A =(a i,j ) 6i,j6n 2 R n,n definita da

226 8 >< q i,i se i = j, a i,j = q i,j /2 se i<j, >: q j,i /2 se i>j. (22.2.2) Ovviamente A èsimmetricaedèimmediatoverificarechexa t x = q(x): inoltrea è l unica matrice simmetrica con tale proprietà. Definizione 22.4 (Matrice associata ad una forma quadratica reale). Sia q una forma quadratica reale nelle variabili x,...,x n. La matrice simmetrica A 2 Sim n (R) definita dalla formula (22.2.2) viene detta la matrice associata a q. Esempio 22.5. Si consideri la forma quadratica q(t, x, y, z) =2t 2 y 2 +tx + tz xy +2xz +9yz. La matrice associata a q è 2 /2 /2 A = B/2 /2 C @ /2 9/2A. /2 9/2 22. Forme quadratiche definite Definizione 22.6 (Forme quadratiche definite). Sia q una forma quadratica reale in n variabili e sia A 2 Sim n (R) la sua matrice associata. Allora: (DP) q ed A si dicono definite positive se q(x) = t xax > per ogni x 2 R n \{ R n}; (SDP) q ed A si dicono semidefinite positive se q(x) = t xax > per ogni x 2 R n ; (DN) q ed A si dicono definite negative se q(x) = t xax < per ogni x 2 R n \{ R n}; (SDN) q ed A si dicono semidefinite negative se q(x) = t xax 6 per ogni x 2 R n ; (ID) q ed A si dicono indefinite nei rimanenti casi, cioè se esistono x,x 2 R n tali che q(x )= t x Ax > e q(x )= t x Ax <. Èchiarochelaformaquadraticaq elasuamatricea sono definite o semidefinite negative se e solo se q elasuamatrice A sono definite o semidefinite positive rispettivamente. Osserviamo che alla luce della Definizione 22.6 il problema di stabilire se l applicazione (x, y) 7! t xay èunprodottoscalareèequivalenteaquellodistabiliresea èdefinitapositivaomeno. Esempio 22.7. In R 2,2 si considerino le matrici I 2 =, E, =, E 2,2 =, E, E 2,2 =.

227 Si ha che I 2 èdefinitapositiva,e, èsemidefinitapositiva, E, èsemidefinita negativa, E, E 2,2 è indefinita. L affermazione per I 2 èovvia. Perquantoriguarda E, si ha che q(x) = xe t, x = x 2 : dunque q(, ) =. In maniera simile si procede per E 2,2. Infine q(x) =x(e, E 2,2 ) t x = x 2 x 2 2:dunqueq(, ) > e q(, ) <. Più in generale si ha il seguente ovvio risultato. Proposizione 22.8. Sia data la matrice diagonale D 2 R n,n con entrate diagonali,..., n. Allora: (i) D èdefinitapositivaseesolose i > per ogni i =,...,n; (ii) D èsemidefinitapositivaseesolose i > per ogni i =,...,n; (iii) D èdefinitanegativaseesolose i < per ogni i =,...,n; (iv) D èsemidefinitanegativaseesolose i 6 per ogni i =,...,n; (v) D èindefinitaseesoloseesistonoi, j =,...,n tali che i > e j <. B Per una matrice simmetrica qualsiasi non è possibile determinare il segno a partire dal segno dei suoi coefficienti come nel caso delle matrici diagonali. Per esempio, vedremo in seguito che la matrice 2 2 èdefinitapositiva,mentre 2 2 èindefinita. Per determinare il segno di una matrice simmetrica A procediamo con cambiamenti di variabili. Più in dettaglio, sia P 2 R n,n una matrice invertibile e si consideri la trasformazione in R n definita da o, equivalentemente, x = P x x = P x. Definiamo la nuova forma quadratica q(x) =q(p x) nella variabile x. Il segno delle forme quadratiche q e q èlostesso: infattix 2 R n soddisfa q(x) > se e solo se x = P x soddisfa q(x) >, poichéperdefinizione q(x) =q(p x) =q(x). Un ragionamento simile si può fare per dimostrare che q(x) =(rispettivamente q(x) < ) se e solo se q(x) =(rispettivamente q(x) < ). Studiamo l azione di un tale cambiamento di variabili sulla matrice A di q. Dal momento che x = P x e, quindi, t x = t x t P,siha

228 t xax = t (P x)a(p x) = t x t P AP x = t x ( t P AP ) x. La matrice t P AP èsimmetrica:infatti t ( t P AP )= t P t AP= t PAP, in forza della simmetria di A. Concludiamo, quindi, che la matrice di q è A = t P AP. Definizione 22.9 (Matrici congruenti). Siano A, A 2 Sim n (R). Le matrici A e A si dicono congruenti, esiscrivea A, seesistep 2 R n,n invertibile tale che A = t P AP. Esempio 22.. Si consideri la forma quadratica La sua matrice associata è q(x, y, z) =2xy +2xz +2yz. A = @ A. Per capire se q e A sono o meno definite, si consideri la matrice /2 P = @ /2 A. ÈfacileverificarecheP èinvertibile:inoltre /2 2 A = t P AP = @ /2 /2 A @ A @ /2 A = @ /2 A. 2 In particolare q ed A non sono definite perché per la Proposizione 22.8 A non è definita. L esempio precedente mostra quanto sia semplice stabilire il segno di una matrice A 2 Sim n (R) se si è in grado di determinare una matrice P 2 R n,n invertibile tale che t P AP sia diagonale. Sono vari gli algoritmi che si possono utilizzare a tale scopo. Uno di essi si basa sulla Proposizione 22.. Infatti sappiamo che ogni matrice simmetrica reale A èdiagonalizzabilemediante una matrice ortogonale P : poiché, per una tale matrice P = t P,seguechele matrici A e A = P AP = t P AP sono congruenti. In particolare A ècongruentead una matrice diagonale avente sulla diagonale gli autovalori di A ciascuno ripetuto con la sua molteplicità algebrica. Quindi il problema della determinazione del segno di A si può ridurre alla determinazione del segno dei suoi autovalori. Esempio 22.. Consideriamo la matrice 2 A =. 2

229 Il suo polinomio caratteristico è p A (t) = 2 t 2 t = t2 4t +=(t )(t ), quindi A ha autovalori e : inparticolare,inbaseaquantoosservatosopra,a èdefinitapositiva. Se invece consideriamo la matrice essa ha polinomio caratteristico A 2 = 2, 2 p A2 (t) = t 2 2 t = t2 2t =(t )(t +), quindi autovalori indefinita. e. In particolare, in base a quanto osservato sopra, A 2 è Abbiamo avuto modo di osservare che il calcolo degli autovalori di una matrice può essere particolarmente complicato poiché non vi sono modi semplici per calcolare le radici di un polinomio generale di grado n. Inrealtà,però,perdeterminareseuna matrice simmetrica reale è definita o meno a noi non interessa il valore numerico degli autovalori ma solo il loro segno e questo può essere facilmente determinato utilizzando la cosiddetta regola dei segni di Cartesio. Per illustrare tale metodo dobbiamo introdurre la nozione di variazione di una successione di numeri reali. Definizione 22.2. Sia (a,a,...,a n,a n ) una successione di numeri reali. Il numero di variazioni v(a,a,...,a n,a n ) èilnumerodellecoppiediinteri (i, i + k) con k > tali che. a i a i+k < ; 2. a i+h =per h =,k. Per ogni polinomio a coefficienti reali p(t) =a t n + a t n + + a n t + a n 2 R[t] poniamo v(p(t)) = v(a,a,...,a n,a n ). Esempio 22.. Per esempio, v( t 6 +t 5 t 2 +t+) = v(,,,,,, ) =. Siamo pronti per enunciare la regola dei segni di Cartesio, di cui omettiamo la dimostrazione. Proposizione 22.4 (Regola dei segni di Cartesio). Se tutte le radici di un polinomio p(t) =a t n + a t n + + a n t + a n 2 R[t] sono reali, allora v(p(t)) è il numero delle sue radici positive contate con la loro molteplicità.

2 Si osservi che tale proposizione non ci permette di dire nulla sul segno delle radici del polinomio dell Esempio 22., perchè non sappiamo a priori che le sue radici sono tutte reali. Se però consideriamo il polinomio caratteristico di una matrice simmetrica reale, sappiamo che esso ha tutte le radici in R, grazie alla Proposizione 2.. Esempio 22.5. Riprendiamo la matrice A dell Esempio 22. A = @ A. Il suo polinomio caratteristico è p A (t) = t +t +2,dunqueilnumerodiradici positive di p A (t) è v(,,, 2) = : poiché p A (t) non ha la radice nulla ed ha tre radici reali (perché è polinomio caratteristico di una matrice simmetrica che è diagonalizzabile!), segue che p A (t) ha =2radici negative: infatti gli autovalori di A sono 2 e con m a (2,A)=e m a (,A)=2(si veda l Esempio 2.).