Capitolo 8 Matrici delle differenze finite Si riportano in questo capitolo alcuni risultati e proprietà delle matrici delle differenze finite ovvero delle matrici che intervengono nel metodo delle differenze finite per la risoluzione di problemi differenziali. In modo particolare si introducono le matrici irriducibili e le M matrici. 8.1 Matrici a diagonale dominante Si riporta la definizione di matrice a diagonale dominante per righe o per colonne. Una matrice A, m n, a coefficienti reali o complessi, si dice diagonale dominante per righe se: n a ii a ij i = 1,..., m j=1 j i per colonne se: m a jj a ij j = 1,..., n i=1i j Si dice strettamente diagonale dominante per righe o per colonne se la disuguaglianza nella definizione vale con il segno di >. 8.2 Matrici definite positive Una matrice A R n n si dice simmetrica e definita positiva se è simmetrica e se per ogni vettore x R n, con x 0, si ha x T Ax > 0 Se x T Ax 0 per ogni vettore x 0, allora la matrice A si dice simmetrica semidefinita positiva. In modo analogo si definiscono matrice definite e semidefinite negative. È possibile fornire una definizione di matrice definita (o semidefinita) positiva (o negativa) anche se la matrice non è simmetrica. Si fornisce innanzitutto la definizione di matrice antisimmetrica. Una matrice A a coefficienti reali si definisce antisimmetrica se A = A T 111
112 CAPITOLO 8. MATRICI DELLE DIFFERENZE FINITE Si può provare che una matrice antisimmetrica ha autovalori nulli o puramente immaginari. Si definiscono con A s e A a la parte simmetrica e la parte antisimmetrica di una matrice A rispettivamente: A s = 1 2 (A + AT ) A a = 1 2 (A AT ) allora, ogni matrice A equivale alla somma della sua parte simmetrica e della sua parte antisimmetrica A = A s + A a Possiamo ora dare la seguente definizione. Una matrice, non necessariamente simmetrica, è definita positiva se lo è la sua parte simmetrica. 1 In modo analogo una matrice non simmetrica è definita negativa o semidefinita (positiva o negativa) se tale è la sua parte simmetrica. Se A R n n è una matrice definita positiva (negativa) allora: gli elementi diagonali di A sono positivi (negativi), i.e., a ii > 0 (a ii < 0), i = 1,..., n. Per quanto concerne gli autovalori di una matrice definita o semidefinita A R n n si hanno i risultati: Se A è definita positiva (negativa), allora i suoi autovalori sono positivi (negativi); Se A è semidefinita positiva (negativa), allora i suoi autovalori sono non negativi (non positivi). Inoltre se A R n n è una matrice simmetrica vale che: A è una matrice definita positiva (negativa) se e solo se i suoi autovalori sono positivi (negativi); 2 A è una matrice semidefinita positiva (negativa) se e solo se i suoi autovalori sono non negativi (non positivi). 8.3 Matrici irriducibili Definizione Si riporta ora la definizione di riducibilità di una matrice a coefficienti reali o complessi. 1 Infatti: x T Ax = x T A s x + x T A a x = x T A s x + 1 2 ( ) x T (A A T )x = x T A sx + 1 2 xt (Ax) 1 2 (Ax)T x = x T A sx 2 Si prova il caso di definita positività. Se ogni autovalore λ i, i = 1,..., n, della matrice simmetrica A R n n è positivo e Q T ΛQ = A è la diagonalizzazione di A (Q è una matrice ortogonale avente per colonne gli autovettori di A e Λ è la matrice diagonale con elementi diagonali uguali agli autovalori di A) si ha per ogni vettore x non nullo: dove y = Qx. n x T Ax = x T Q T ΛQx = y T Λy = λ i yi 2 > 0 i=1
8.3. MATRICI IRRIDUCIBILI 113 Una matrice A, n n, si dice riducibile se esiste una matrice P di permutazione tale che ( ) P AP T B11 B = 12 0 B 22 con B 11 e B 22 sottomatrici quadrate. Una matrice A, n n, si dice irriducibile se non è riducibile. Come si vede dalla definizione non è immediato comprendere se una matrice è irriducibile o meno. Chiaramente se una matrice ha tutti i suoi elementi diversi da zero allora è irriducibile. Per fornire una caratterizzazione delle matrici irriducibili è utile introdurre una interpretazione geometrica del concetto di irriducibilità per mezzo della teoria dei grafi. Si richiamano brevemente alcune elementari nozioni della teoria dei grafi (König, 1936). Teoria dei grafi e matrici irriducibili Definizione. Un grafo è una struttura matematica G = (V, E) costituita da un insieme finito V di n (n 1) vertici o nodi e da un insieme finito E di m (m 0) lati o archi. Due vertici si dicono adiacenti se esiste un lato {u, v} in G, altrimenti u e v si dicono indipendenti. I lati {u, u} si chiamano anelli. Se nella definizione di grafo si considera che i lati siano costituiti da coppie non ordinate, ovvero {u, v} e {v, u} indicano la stessa coppia, il grafo si dice non orientato, altrimenti se il grafo è costituito da coppie ordinate, il grafo si dice orientato. È possibile associare un peso, in particolare un numero reale, ad ogni lato di un grafo, orientato o non orientato, in tal caso il grafo si dice pesato. Definizione. Un cammino in un grafo, orientato o non orientato, G = (V, E) da un vertice u 1 a un vertice u k è una successione finita di vertici (u 1, u 2,..., u k ) con la proprietà che (u i, u i+1 ) E per ogni i, 1 i k 1. Se nessun vertice (e quindi nessun lato) appare più di una volta in tale successione, il cammino si dice semplice. Un ciclo è un cammino con u k = u 1 e con u 1, u 2,..., u k 1 distinti tra loro. Definizione. Un grafo, orientato o non orientato, G = (V, E) si dice connesso se per ogni coppia di vertici u (origine) e v (destinazione) di G esiste un cammino da u a v che li unisce; diversamente il grafo si dice non connesso. Un grafo G = (V, E) con vertici v 1, v 2,..., v n si rappresenta con la matrice n n di adiacenza A = (a ij ) n i,j=1 dove { a ij = 1 se v i e v j sono adiacenti a ij = 0 se v i e v j non sono adiacenti se il grafo non è orientato, altrimenti { aij = 1 se esiste il lato (v i, v j ) a ij = 0 se non esiste il lato (v i, v j ) se il grafo è orientato. Se il grafo è pesato, nella definizione si sostituisce a ij = 1 con a ij = c ij, dove il numero c ij è il peso associato al lato (v i, v j ). Si nota che se il grafo non è orientato la matrice di adiacenza è simmetrica. Elementi non nulli sulla diagonale di A indicano la presenza di anelli, ovvero di archi che collegano un nodo con se stesso.
114 CAPITOLO 8. MATRICI DELLE DIFFERENZE FINITE Si osserva che, se consideriamo grafi non pesati, un elemento di coordinate (i, j) della matrice di adiacenza A uguale a uno, evidenzia che c è un lato, ovvero un cammino di lunghezza uno, che unisce il nodo i al nodo j, i j. Allora, la matrice A 2 = A A ha l elemento (i, j) uguale al numero dei cammini di lunghezza 2 tra i vertici i e j; ad esempio se a ij = 3, allora esistono tre cammini, formati ciascuno da due lati, con nodo origine i e nodo destinazione j. La matrice A 3 ha elementi uguali al numero dei cammini di lunghezza 3; A 4 ha per elementi il numero dei cammini di lunghezza 4, e così A 5,... La matrice A + A 2 + A 3 ha dunque elementi uguali al numero dei cammini di lunghezza al più 3. Se n è il numero dei vertici di un grafo, la matrice B = A + A 2 + A 3 +... + A n 1 ha elementi uguali al numero dei cammini di lunghezza al più n 1. Se la matrice B ha elementi tutti diversi da zero, allora il grafo è connesso. 3 Dunque, ad ogni matrice A, n n a coefficienti reali a ij si può associare un grafo orientato e pesato di n vertici. Vale allora il seguente risultato che relaziona matrici irriducibili e grafi connessi: 4 una matrice è irriducibile se e solo se il suo grafo orientato è connesso. Come immediata conseguenza del risultato si ha che una matrice A tridiagonale con elementi a ii 1 e a i 1i, i = 2,..., n diversi da zero è irriducibile. Matrici irriducibilmente diagonale dominante Una importante classe di matrici irriducibili è quella delle matrici irriducibilmente diagonale dominante. Una matrice A, n n, si dice irriducibilmente diagonale dominante se: è irriducibile; è diagonale dominante (per righe) ed esiste almeno un indice (di riga) per cui vale la dominanza diagonale in senso stretto. 3 Si è fatto uso del seguente teorema: Un grafo, orientato o non orientato, con n vertici, se due vertici sono connessi, ovvero esiste un cammino tra di essi, allora, esiste un cammino di lunghezza non superiore a n 1 tra essi. Dimostrazione. Supponiamo che esista un cammino tra i vertici v 1 e v k. Sia (v 1, v 2,..., v k ) la successione dei vertici che costituisce il cammino tra v 1 e v k. Se la lunghezza del cammino è l, allora esistono l + 1 vertici della successione. Per l > n 1, deve esistere un vertice v j che appare più di una volta nella successione; si ha cioè (v 1,..., v j,..., v j,..., v k ). Eliminando i lati che portano da v j a v j, si ha un cammino da v 1 e v k (con v j una volta sola) di lunghezza inferiore a quello originario. Questo procedimento si ripete finchè non si ha un cammino tra v 1 e v k di lunghezza inferiore a n 1. 4 Si veda p. 20 in Varga R.S.: Matrix Iterative Analysis, Prentice Hall, Englewood Cliffs NJ, 1962 (ripubblicato in una seconda edizione da Springer, Berlin 2000). nel seguito del capitolo riferito come Varga (1962).
8.4. TEOREMI DI LOCALIZZAZIONE DEGLI AUTOVALORI 115 8.4 Teoremi di localizzazione degli autovalori In questo paragrafo si richiamano tre importanti teoremi di localizzazione degli autovalori. 5 Sia A C n n ; si definiscono i cerchi nel piano complesso (cerchi di Gerschgorin) di centro a ii e raggio r i = n j=1 j i a ij : K i = {z C : z a ii r i } Si hanno i seguenti risultati (Gerschgorin, 1931). 1. Primo teorema di Gerschgorin Gli autovalori di A sono tutti contenuti nell unione dei K i, i = 1,...n. 2. Secondo teorema di Gerschgorin Se l unione M 1 di k cerchi di Gerschgorin è disgiunta dall unione M 2 dei rimanenti n k cerchi, allora, k autovalori appartengono a M 1 e n k autovalori appartengono a M 2. Per matrici irriducibili si ha il seguente risultato (Taussky, 1948). 3. Se A è irriducibile ed un autovalore λ di A appartiene alla frontiera dell unione dei cerchi di Gerschgorin, allora ogni cerchio di Gerschgorin contiene l autovalore λ sulla sua frontiera. Ne discende che: Se A è una matrice simmetrica, allora i cerchi di Gerschgorin si riducono ad intervalli dell asse reale. Se A è una matrice a diagonale strettamente dominante, allora ha autovalori diversi da zero (A è non singolare); 6 se inoltre A ha elementi diagonali positivi, allora i suoi autovalori hanno parte reale positiva. Se A è una matrice irriducibilmente diagonale dominante, allora ha autovalori diversi da zero (A è non singolare); 7 se inoltre A ha elementi diagonali positivi, allora i suoi autovalori hanno parte reale positiva. 8.5 M matrici Nella classe delle matrici ad inversa non negativa (A 1 (Ostrowski, 1937) come segue. 8 0) si definiscono le M matrici 5 Per le dimostrazioni di questi teoremi si veda, ad esempio, 6.1 e 6.2 in Horn R.A., Johnson C.R.: Matrix Analysis, Cambridge University Press, Cambridge, 1985. 6 I cerchi di Gerschgorin, o un unione di essi, per una matrice strettamente diagonale dominante non contengono l origine del piano complesso. 7 Per una matrice a dominanza diagonale la frontiera dei cerchi di Gerschgorin contiene l origine del piano complesso e dunque la matrice potrebbe avere un autovalore nullo; se la matrice è anche irriducibile, un autovalore λ appartenente alla frontiera di un cerchio di Gerschgorin deve appartenere anche alle frontiere di tutti gli altri cerchi, ovvero λ è un punto di intersezione delle frontiere. Se per la matrice A, irriducibile, vale che a ii = n j=1 a j i ij per ogni indice i, i = 1,..., n, allora A può essere singolare in quanto l origine appartiene alla frontiera di tutti i cerchi di Gerschgorin e dunque può essere un autovalore; se la matrice A è irriducibilmente diagonale dominante, esiste un indice r per cui a rr > n j=1 a j r rj, allora il cerchio di Gerschgorin K r non include l origine. L origine non può essere un autovalore. 8 Per le dimostrazioni dei risultati sulle M-matrici si veda 3.5 in Varga (1962) oppure 6.2 in Ortega J.M.: Numerical Analysis: A Second Course, Academic Press, New York, 1972 (ripubblicato da SIAM, Philadelphia, 1990). denotato con Ortega (1972).
116 CAPITOLO 8. MATRICI DELLE DIFFERENZE FINITE Una matrice A a coefficienti reali è una M matrice se A 1 0 e a ij 0 per i j. Poiché l inversa di una matrice non è esplicitamente nota, si richiamano alcune condizioni sufficienti perchè una matrice sia una M matrice (p. 110 in Ortega (1972)). Sia A R n n una matrice strettamente diagonale dominante con a ij 0, i j e a ii > 0, allora, A è una M matrice. Sia A R n n una matrice irriducibilmente diagonale dominante con a ij 0, i j e a ii > 0, allora, A è una M matrice. Infine si ha che (p. 109 in Ortega (1972)): 9 Una M matrice simmetrica A R n n positiva. è una matrice simmetrica e definita Si osserva che le M matrici sono particolari matrici a inversa non negativa che soddisfano una proprietà di monotonia. Infatti se si indica con x la soluzione di un sistema lineare Ax = b e con y la soluzione di un sistema lineare Ay = d con A M matrice e b d, allora b d 0 = A(x y) 0 = A 1 A(x y) 0 = x y 9 Altri importanti risultati sulle M matrici sono (pp. 108-109 in Ortega (1972)): Se A R n n soddisfa a ij 0, i j, allora A è una M matrice se e solo se a ii > 0, per i = 1,..., n; Sia A R n n una M matrice e D R n n una matrice diagonale non negativa; allora A + D è una M matrice e (A + D) 1 A 1.