Scheda n. 7: primi elementi sui legami tra più variabili

Documenti analoghi
Probablità, Statistica e Processi Stocastici

Probablità, Statistica e Processi Stocastici

Probablità, Statistica e Processi Stocastici

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

Corso di Geometria Meccanica, Elettrotecnica Esercizi 11: soluzioni

Sequenze (Sistemi) di Variabili Aleatorie Se consideriamo un numero di variabili aleatorie, generalmente dipendenti si parla equivalentemente di:

Scheda n. 9: PCA - parte prima

Computazione per l interazione naturale: fondamenti probabilistici (2)

Vettore (o matrice) casuale (o aleatorio): vettore (o matrice) i cui elementi sono variabili aleatorie

Analisi Statistica Multivariata Modulo Modelli Statistici

Università degli Studi di Bergamo Modulo di Geometria e Algebra Lineare (vecchio programma) 2 settembre 2013 Tema A

Distribuzione normale multidimensionale

Classificazione delle coniche.

con distribuzione gaussiana standard e si ponga

Esercizi sulle coniche (prof.ssa C. Carrara)

Algebra lineare e geometria AA Appunti sul cambio di base in uno spazio vettoriale

Scheda n.3: densità gaussiana e Beta

Isometrie e cambiamenti di riferimento

Esercizi sulle coniche (prof.ssa C. Carrara)

I VETTORI GAUSSIANI E. DI NARDO

1 Il polinomio minimo.

Esercizi per Geometria II Geometria euclidea e proiettiva

Variabili casuali multidimensionali

LEZIONE 23. ax 2 + bxy + cy 2 + dx + ey + f

11 settembre Soluzione esame di geometria - Ingegneria gestionale - a.a COGNOME... NOME... N. MATRICOLA...

ESERCIZI DI ALGEBRA LINEARE (II PARTE) In ogni sezione gli esercizi sono tendenzialmente ordinati per difficoltà crescente.

24.1 Coniche e loro riduzione a forma canonica

Parte 12b. Riduzione a forma canonica

Prodotto scalare e matrici < PX,PY >=< X,Y >

(P x) (P y) = x P t (P y) = x (P t P )y = x y.

Variabile aleatoria vettoriale

Geometria BAER Canale A-K Esercizi 11

1 Cambiamenti di coordinate nel piano.

Analisi Multivariata Prova intermedia del 20 aprile 2011

1 Serie temporali. 1.1 Processi MA

X = x + 1. X = x + 1

1 Distanza di un punto da una retta (nel piano)

Esercizi di Geometria - 1

LEZIONE 16 A = Verifichiamo se qualcuna fra le entrate a di A è suo autovalore. determinare per quale entrata a di A risulta rk(a ai 2 ) 1.

LEZIONE 27. C = { P = (x, y) x 2 /a 2 y 2 /b 2 = 1 }. C si dice iperbole di semiassi a e b (in forma canonica). L equazione

1 Alcuni risultati sulle variabili Gaussiane multivariate

Geometria A. Università degli Studi di Trento Corso di laurea in Matematica A.A. 2017/ Maggio 2018 Prova Intermedia

1 Coniche. s (x, y, t ) (1) 1 (x, y, t )F r 2

APPUNTI SULLA DIAGONALIZZAZIONE Corso Prof. F.Podestà, a.a

Prodotto scalare e prodotto vettoriale. Elisabetta Colombo

Analisi delle corrispondenze

DIAGONALIZZAZIONE E FORME QUADRATICHE / ESERCIZI PROPOSTI

Geometria analitica: curve e superfici

Esercizi per Geometria II Geometria euclidea e proiettiva

Soluzioni dello scritto di Geometria del 28 Maggio 2009

Esercizi 2. Soluzioni. 1. Siano dati i vettori 1 1, 1 R 3.

Prova scritta di Geometria 18/01/2016, Soluzioni Ing. Meccanica a.a

Analisi delle corrispondenze

Università degli Studi Roma Tre - Corso di Laurea in Matematica Tutorato di Geometria 1

0.1 Condizione sufficiente di diagonalizzabilità

P z. OP x, OP y, OP z sono le proiezioni ortogonali di v sugli assi x, y, z, per cui: OP x = ( v i) i. k j. P x. OP z = ( v k) k

Parte 12a. Trasformazioni del piano. Forme quadratiche

MATRICI ORTOGONALI. MATRICI SIMMETRICHE E FORME QUADRATICHE

Vettori applicati. Capitolo Richiami teorici. Definizione 1.1 Un sistema di vettori applicati Σ è un insieme

Prodotto scalare. Piani nello spazio Federico Lastaria, Analisi e Geometria 1. Politecnico di Milano Corso di Analisi e Geometria 1

Prodotto scalare e ortogonalità

Proposizione 2 Il polinomio minimo di t corrisponde all annullatore minimale di M V.

x + hy + z = 1. 1 [10 punti] Dimostrare che, per ogni numeri naturale n 0, si ha 2 n+2 2n

MMMPG 2008/09 Registro delle lezioni

Stabilire se il punto di coordinate (1,1) appartiene alla circonferenza centrata nell origine e di raggio 1.

Autovalori e autovettori di una matrice quadrata

Lezione 2: Descrizione dei Da0. h2p://

Trapani. Dispensa di Geometria,

Esercizi su leggi Gaussiane

H precedente. Procedendo come sopra, si costruisce la matrice del cambiamento di base

Probabilità e Statistica

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3

Autovalori, Autovettori, Diagonalizzazione.

Corso di Laurea in Fisica. Geometria. a.a Prof. P. Piazza Diagonalizzazione delle forme bilineari simmetriche

II Università degli Studi di Roma

CLASSIFICAZIONE DELLE CONICHE AFFINI

ATTENZIONE: : giustificate le vostre argomentazioni! Geometria Canale 3. Lettere J-PE (Prof P. Piazza) Esame scritto del 12/02/2014. Compito A.

Scheda n. 13: modelli lineari

Fattorizzazione QR e matrici di Householder

F x 1 = x 1 + x 2. 2x 1 x 2 Determinare la matrice C associata a F rispetto alla base canonica (equivalentemente,

Il Teorema Spettrale. 0.1 Applicazioni lineari simmetriche ed hermitiane

SPAZI EUCLIDEI, APPLICAZIONI SIMMETRICHE, FORME QUADRATICHE

10 luglio Soluzione esame di geometria - Ingegneria gestionale - a.a COGNOME... NOME... N. MATRICOLA...

11 luglio Soluzione esame di geometria - Ing. gestionale - a.a COGNOME... NOME... N. MATRICOLA... ISTRUZIONI

LEZIONE 12. Y = f(x) = f( x j,1 f(e j ) = x j,1 A j = AX = µ A (X),

Esame scritto di Geometria 2

Figura 1: Esercizio 1

Esercitazioni di Geometria II

Università degli Studi di Bergamo Corso integrato di Analisi 1 (Geometria e Algebra Lineare) 3 settembre 2009 Tema A

Esercizio geometria delle aree

(E) : 2x 43 mod 5. (2 + h)x + y = 0

5 Un applicazione: le matrici di rotazione

11 Piccole oscillazioni attorno a posizioni stabili

Statistical Process Control

EQUAZIONE DELLA RETTA

Fissiamo nel piano un sistema di riferimento cartesiano ortogonale O, x, y, u.

Transcript:

Scheda n. 7: primi elementi sui legami tra più variabili October 27, 2008 Matrice di covarianza e di correlazione Supponiamo di esaminare n variabili X,..., X n, ad esempio X = reddito medio, X 2 = tasso di disoccupazione, X 3 = numero di posti letto in ospedali e X 4 = spese medie per alimenti, nelle diverse regioni italiane. In analogia con quanto visto per due variabili, siamo interessati innanzi tutto alla covariaanza ed al coefficiente di correlazione tra ogni coppia di esse: ad esempio vogliamo capire se X e X 3 sono correlate. Poniamo q ij = Cov (X i, X j ρ ij = ρ (X i, X j e chiamiamo matrice di covarianza e matrice di correlazione le matrici (q ij e (ρ ij rispettivamente. La matrice di covarianza viene in genere indicata con Q, mentre non c è un simbolo privilegiato per la matrice di correlazione. Per concretezza, ecco la scrittura esplicita di una matrice di covarianza e di correlazione per n=3: Q = V ar [X ] Cov (X, X 2 Cov (X, X 3 Cov (X, X 2 V ar [X 2 ] Cov (X 2, X 3 Cov (X, X 3 Cov (X 2, X 3 V ar [X 3 ] matrice di correlazione: ρ (X, X 2 ρ (X, X 3 ρ (X, X 2 ρ (X 2, X 3 ρ (X, X 3 ρ (X 2, X 3.

Si noti che sono matrici simmetriche e si notino le componenti lungo la diagonale. Se calcoliamo la matrice di correlazione sperimentale a partire da una tabella di dati, possiamo farci una prima idea dei legami esistenti tra le variabili della tabella.. Diagonalizzazione di Q Ogni matrice simmetrica, quindi anche Q si può diagonalizzare. Esiste una base ortonormale dello spazio R n, chiamiamola fatta di autovettori di Q, ovvero e,..., e n Qe i = λ i e i per opportuni numeri λ i detti autovalori di Q, tale che la matrice Q letta in tale base ha la forma diagonale λ 0... 0 Q = 0 λ 2... 0............. 0 0... λ n Supporremo sempre di aver ordinato gli autovalori in modo che sia λ λ 2... λ n. Che significato hanno questi autovettori ed autovalori per il vettore aleatorio X = (X,..., X n? Pensiamo al caso n = 2, bidimensionale, in quanto dovremo fare un certo sforzo immaginativo. Per capire l idea, immaginiamo di estrarre dei punti a caso secondo il vettore aleatorio (X, X 2. Estraiamo 000 punti; saranno 000 punti sparpagliati nel piano, però magari più addensati in una certa zona e lungo certe direzioni. La figura mostra un esempio, ottenuto con i seguenti comandi di R: z <- rnorm(000,0, z2 <- rnorm(000,0, x <- 4*z+z2 x2 <- z-z2 2

Figure : Nuvola di punti casuali plot(x,x2 Se guardiamo questi punti con l ottica degli assi x ed x2, lungo l asse x essi hanno un certo livello di sparpagliamento (diciamo che mediamente vanno da -5 a 5, ad occhio, e similmente hanno uno sparpagliamento lungo l asse delle x2 (da -2 a 2, ad occhio. La dispersione lungo l asse x è catturata dalla deviazione standard σ X, e da σ X2 lungo l asse x2. Nella matrice di covarianza, scritta rispetto alla base canonica, σx 2, e σx 2 2 si trovano sulla diagonale (Q però non è diagonale, in quella base. E un po presto per spiegare come, ma la matrice di covarianza Q di questo esempio, scritta nella base canonica, è quindi Q = ( 4 ( 4 = ( 8 3 3 2 σ X = 8 = 4. 24, σ X2 = 2 =. 4. Tuttavia è chiaro dalla figura che c è un altra base significativa, composta da vettori obliqui rispetto alla base canonica. Si può parlare della dispersione rispetto ai vettori di tale nuova base. Ebbene, essi sono gli autovettori e, e 2 e le deviazioni standard lungo tali vettori sono pari a λ, λ 2. 3

Figure 2: Grafico della densità gaussiana standard f(x, y = (2π 2 exp ( 2 (x2 + y 2 2 Gaussiane multidimensionali Ricordiamo che in una dimensione ogni gaussiana si ottiene da quella standard tramite una dilatazione ed una traslazione. Nel caso unidimensionale questa era una proprietà, non la definizione. In più dimensioni usiamo questa idea come definizione. Cominciamo con l introdurre il concetto di gaussiana standard in n dimensioni e poi applichiamo ad essa dilatazioni e traslazioni. Un vettore aleatorio Z = (Z,..., Z n si dice gaussiano standard se le sue componenti Z i sono gaussiane standard indipendenti. Per il teorema della scheda n. 6 sulla densità congiunta di v.a. indipendenti, la densità congiunta del vettore Z è ( f Z (z,..., z n = exp z 2 (2π n i 2 dovendo essere il prodotto delle densità marginali f Z (z = 2π exp ( 2 z2,..., f Zn (z n = 2π exp ( 2 n z2. La figura 2 mostra il grafico di quest funzione nel caso n = 2. Nel caso multidimensionale usiamo un concetto generalizzato di dilatazione: la composizione con una generica matrice A. Poi trasliamo di un generico vettore µ. i= 4

Definition Chiamiamo vettore gaussiano m-dimensionale ogni vettore aleatorio X della forma X = AZ + µ dove Z = (Z,..., Z n è un vettore gaussiano standard, A è una matrice n m, µ = (µ,..., µ m è un vettore di R m. Per componenti, X i = A ij Z j + µ i, i =,..., m. j= Non è necessario che la matrice A sia quadrata, la definizione è del tutto generale. Ovviamente µ è il vettore dei valori medi: E [X i ] = µ i in quanto le v.a. Z j hanno media nulla. Quindi la gaussiana X è centrata nel punto multidimensionale µ. Meno ovvio è capire la sua dispersione, sicuramente legata alla matrice A, ma di struttura più complessa (ad esempio, ci potremmo aspettare che ci siano livelli diversi di dispersione lungo le diverse direzioni dello spazio, e così infatti può essere. Essa verrà chiarita tramite la matrice di covarianza nel prossimo paragrafo. Vediamo un esempio di dilatazione non eguale lungo gli assi. Nella figura 3 si vede la gaussiana, per n = m = 2, ottenuta applicando la matrice ( 2 0 A = 0 e traslando del vettore µ = ( 0 5 Per componenti, si tratta della gaussiana. X = 2Z X 2 = Z 2 + 5. L idea intuitiva è che i valori tipici della X siano il doppio di quelli standard, mentre i valori tipici della X 2 siano come quelli standard ma traslati di 5. 5

Figure 3: Densità della gaussiana X = 2Z, X 2 = Z 2 + 5 In questo esempio abbiamo preso A diagonale, ma ovviamente A può incorporare delle rotazioni. Però è più difficile vederle con chiarezza a livello grafico sulla densità; ne riparleremo a proposito degli insiemi di livello. Come abbiamo fatto a disegnare la densità della figura 3? C è una formula per la densità di una gaussiana del tipo X = AZ +µ nel caso in cui la matrice simmetrica Q = AA T sia invertibile (A T è la trasposta di A ed è una matrice m n, per cui Q è una matrice m m. La formula è (non la dimostriamo f X (x = ( (2π m det Q exp 2 (x µt Q (x µ dove x = (x,..., x n. Nell esempio della figura, ( 4 0 Q = 0 quindi det Q = 4, e quindi f (X,X 2 (x, x 2 = Q = ( /4 0 0 ( exp ( x 2 (2π 2 2 4 + (x 2 5 2. 4 6

2. Matrice di covarianza di un vettore gaussiano E un facile esercizio calcolare le componenti della matrice di covarianza del vettore gaussiano X = AZ + µ: ( Cov (X i, X l = Cov A ij Z j + µ i, A lk Z k + µ l = = j= k= j= k= A ij A lk Cov (Z j, Z k A ij A lj j= dove, nella prima uguaglianza, abbiamo applicato le proprietà di linearità della covarianza in entrambi gli argomenti, mentre nell ultima uguaglianza abbiamo usato il fatto che Cov (Z j, Z j = mentre Cov (Z j, Z k = 0 se j k (le Z j sono v.a. standard e indipendenti. D altra parte la componente di posto il della matrice AA T è Abbiamo quindi dimostrato: ( AA T = A il ij A lj. Theorem 2 La matrice di covarianza della gaussiana X = AZ + µ è Q = AA T. E la matrice che compare nella formula per la densità. La matrice di covarianza. j= 3 Insiemi di livello di una gaussiana multidimensionale Abbiamo tracciato alcuni grafici di densità gaussiane, a titolo di esempio, ma è chiaro che tali disegni sono difficili da interpretare. Molto più semplice ed illuminante è la forma degli insiemi di livello di una densità gaussiana. Dovendo lavorare con la densità, ci restringiamo al caso in cui Q è invertibile. 7

Consideriamo la densità gaussiana in R m f X (x = ( (2π m det Q exp 2 (x µt Q (x µ, x R m. Chiamiamo insieme di livello ogni insieme di R m definito da una equatione del tipo f X (x = α al variare di α > 0. Sono gli insiemi su cui f X è costante. Si pensi alle isolinee di varie carte geografiche o simili. L equazione f X (x = α equivale all equazione con ( exp r2 (2π m det Q 2 (x µ T Q (x µ = r 2 ( = α. Quindi gli insiemi di livello sono tutti quelli definiti dall equazione ( al variare di r > 0. Questi insiemi sono degli ellissoidi; delle ellissi in dimensione m = 2. Sono ellissoidi centrati nel punto µ. Vediamo di capire come mai sono ellissoidi centrati in µ e cerchiamo di individuare gli assi. Iniziamo col caso µ = 0, caso in cui la relazione che definisce il generico insieme di livello è x T Q x = r 2. Ricordiamo gli autovettori e,..., e m della matrice Q, corrispondenti agli autovalori λ λ 2... λ m. Dalla relazione Qe i = λ i e i discende Q e i = λ i e i. Quindi la matrice Q, nella base e,..., e m, è diagonale, con le componenti lungo la diagonale pari ai numeri λ i. Pertanto, dette y = (y,..., y m le coordinate del generico punto y nella base e,..., e m, la relazione x T Q x = r 2 nelle nuove coordinate y diventa y 2 λ +... + y2 m λ m = r 2. Questa è l equazione di un ellissoide (si pensi al caso m = 2 generalmente noto, centrato nell origine, avente gli assi principali come assi cartesiani, ed 8

i valori λ i come ampiezze lungo gli assi principali. Ma gli assi cartesiani di cui stiamo parlando sono i vettori e,..., e m. In conclusione, l equazione x T Q x = r 2 descrive un ellissoide centrato nell origine, con assi principali e,..., e m ed ampiezze λ,..., λ n. L equazione ( corrisponde ad una semplice traslazione lungo il vettore µ dell equazione x T Q x = r 2 (i punti x descritti dalla ( si ottengono dai punti x descritti da x T Q x = r 2 aggiungendo µ. L origine nello spazio delle x diventa il punto µ nello spazio delle x. Quindi: il luogo di punti definito dall equazione ( è un ellissoide centrato in µ, con assi principali e,..., e m ed ampiezze λ,..., λ n. Questa visione degli insiemi di livello della densità gaussiana come ellissoidi è essenziale per immaginare tantissime cose. Ad esempio, se estraiamo a caso (magari tramite generazione casuale con R 000 punti da una gaussiana di media µ e matrice di covarianza Q, dove ci aspettiamo di torvare i 000 punti e disposti come? Pressapoco, essi formeranno un ellissoide centrato in µ, con gli assi come descritto sopra; una sorta di ellissoide che va sfumando se ci allontaniamo dal centro (i punti generati a caso vanno diradandosi per il fatto che la probabilità decresce. La figura di questa scheda è stata ottenuta così: siamo partiti da una gaussiana 2-dimensionale standard, l abbiamo trasformata tramite una matrice A ed una traslazione µ, ed abbiamo trovato una nuvola ellissoidale. Se cercassimo autovettori ed autovalori di Q = AA T li potremmo riconoscere sul grafico dei 000 punti. 9