Analisi Multivariata dei Dati Regressione Multipla A M D Marcello Gallucci Milano-Bicocca Lezione: III
Effetti multipli Consideriamo ora il caso in cui la variabile dipendente possa essere spiegata da più di una variabile Parleremo di Regressione Multipla x byx.w y w byw. x
Esempio Effetti multipli Vogliamo predire il numero di sorrisi sia con il numero di birre che con il tratto estroversione del soggetto Regressione Multipla Birre byx.w Sorrisi Estrovers. byw. x
Effetti multipli La regressione multipla aggiunge termini lineari (altre VI) alla retta di regressione Legge di relazione della Regressione Multipla x y w Standardizzata yˆ z yx.w x z yw. x wz Non Standardizzata yˆ a byx.w x byw. x w
Interpretazione Il coefficiente di regressione esprime l effetto diretto di x su y, togliendo l effetto che passa indirettamente per w Effetto diretto byx.w byx byw. x bwx Effetto indiretto x bwx w byx.w byw. x y
Effetti Parziali Togliere l effetto indiretto è equivalente a bloccare la possibilità che x vada su y mediante w: Il coefficiente viene dunque detto coefficiente parziale, cioè l effetto di x parzializzando l effetto di w Effetto diretto Effetto indiretto x bwx w byx.w byw. x y
Rappresentazione geometrica yˆ a B y1 x1 B y x
Interpretazione geometrica Effetto Unico of X for X1=-10 Effetto unico di X per X1=0 Effetto unico di X per X1=10
Intercetta (o costante) L'intercetta indica il valore atteso della VD per tutte le VI uguali a 0 Y =a B y1. 0 B y.1 0 Yˆ a
Esempio Un ricercatore ha misurato la capacita di lettura e la produzione linguistica con due test in bimbi da 5 e 8 anni Si propone di studiare se la capacità di lettura è influenzata dalla produzione linguistica eta Validi 5.00 6.00 7.00 8.00 Totale Frequenza 36 7 5 3 10 Percentuale 30.0.5 0.8 6.7 100.0 Percentuale valida 30.0.5 0.8 6.7 100.0 Percentuale cumulata 30.0 5.5 73.3 100.0 Statistiche descrittive N lettura lingua Validi (listwise) 10 10 10 Minimo 1.8.0 Massimo 5.68 13.41 Media 1.869 6.3781 Deviazione std. 3.98934.9360
Esempio Incominciamo con una regressione semplice lettura byxlingua Riepilogo del modello Modello 1 R R-quadrato a.178.03 R-quadrato corretto.03 Errore std. della stima 3.9446 a. Stimatori: (Costante), lingua ANOVAb Modello 1 Varianza spiegata Coefficientia Modello 1 (Costante) lingua Coefficienti non standardizzati B Errore std. 11.316.867.4.14 a. Variabile dipendente: lettura Regressione Residuo Totale Somma dei quadrati 59.794 1834.070 1893.864 df 1 118 119 Media dei quadrati 59.794 15.543 F 3.847 a. Stimatori: (Costante), lingua b. Variabile dipendente: lettura Coefficienti standardizzati Beta.178 t 13.057 1.961 Coefficienti di regressione Sig..000.05 Sig..05a
Esempio Aggiungiamo l età lettura=b yx. w lingua b yw. x eta Riepilogo del modello Modello 1 R R-quadrato a.641.411 R-quadrato corretto.401 Errore std. della stima 3.08750 a. Stimatori: (Costante), eta, lingua ANOVAb Modello 1 Varianza spiegata Regressione Residuo Totale Somma dei quadrati 778.541 1115.33 1893.864 df 117 119 Media dei quadrati 389.71 9.533 F 40.835 a. Stimatori: (Costante), eta, lingua b. Variabile dipendente: lettura Coefficientia Modello 1 (Costante) lingua eta Coefficienti non standardizzati B Errore std. -1.003 1.573 -.077.104.9.57 Coefficienti standardizzati Beta -.056.659 t -.638 -.74 8.683 Sig..55.460.000 a. Variabile dipendente: lettura Notiamo come è cambiato l effetto della lettura Coefficienti di regressione Sig..000a
Esempio Concluderemo che la produzione linguistica è debolmente associata alla capacità di lettura Coefficientia Regressione semplice Modello 1 (Costante) lingua Coefficienti non standardizzati B Errore std. 11.316.867.4.14 Coefficienti standardizzati Beta.178 t 13.057 1.961 Sig..000.05 t -.638 -.74 8.683 Sig..55.460.000 a. Variabile dipendente: lettura Coefficientia Regressione multipla Modello 1 (Costante) lingua eta Coefficienti non standardizzati B Errore std. -1.003 1.573 -.077.104.9.57 Coefficienti standardizzati Beta -.056.659 a. Variabile dipendente: lettura Ma questa associazione dipende dalle differenze dovute all età A parità di età, non vi è una relazione tra produzione linguistica e capacità di lettura
Varianza spiegata La sostanza e la stessa che nella regressione semplice se Y Yzz Xz s reg Wz s reg s y s e = = R y. xw sy sy
Varianza non spiegata Percentuale di varianza di errore, non spiegabile mediante la regressione e e =1 R y. xw a b c X Coefficiente di alienazione W Lezione III
Calcolo di R Il calcolo pratico della varianza spiegata puo essere effettuato partendo dalle correlazioni semplici R y. xw = yx e yw r r r yx r yw r wx 1 r wx a b c X W Lezione III
Decomposizione della varianza spiegata A questo punto ci possiamo chiedere quale sia l effetto unico o il contributo unico di ogni variabile alla varianza spiegata Y Quanto ogni VI contribuisce a spiegare varianza di Y? a b c X Quanto è l effetto unico di ogni variabile sulla variabilità della Y? W Lezione III
Effetti come informazione Immaginiamo l effetto di una VI sulla VD come informazione trasferita dalla VI alla VD Informa.. Adamo Eva Informazione condivisa Eva Eva Adamo Cose che solo Eva conosce Cose che solo Adamo conosce Lezione III
Effetti come informazione Inseriamo un secondo informatore Informa Adamo Eva Serpente Informa Intendiamo sapere chi ha informato Eva e quanta parte della informazione proviene dai due informatori Lezione III
Decomposizione della informazione Come si ripartisce l informazione di Eva Cose che solo Eva conosce Cose che conoscono tutti Eva Cose che Adamo ha detto a EVA Adamo Serpente Cose che Serpente a detto a Eva Cose che Adamo e Serpente conoscono ma non Eva
Effetti unici o parziali Quale e il contributo unico di Serpente alla conoscenza ottenuta da Eva? Cose che Serpente ha detto a Eva - Cose che tutti e tre conoscono e [ a c ] c=a L effetto unico di Serpente su Eva e dato dall effetto totale di Serpente rimuovendo l effetto condiviso con Adamo a b c Adamo Serpente
Effetti unici o parziali Quale e il contributo unico di Serpente alla conoscenza ottenuta da Eva? Cose che Serpente ha detto a Eva - Cose che tutti e tre conoscono e [ a c ] c=a L effetto unico di Serpente su Eva e dato dall effetto totale di Serpente parzializzando l effetto condiviso con Adamo a b c Adamo Serpente
Parzializzazione Parzializzare significa rimuovere l effetto di una (o piu ) VI, cioe calcolare gli effetti come se quella variabile abbia nessuna variabilita e Adamo Serpente Effetto parziale (unico, diretto) di Serpente Adamo parzializzato
Parzializzazione Parzializzare significa rimuovere l effetto di una (o piu ) VI, cioe calcolare gli effetti come se quella variabile abbia nessuna variabilita e Serpente Serpente parzializzato Adamo Effetto parziale (unico, diretto) di Adamo
Effetto Congiunto Qual e l effetto totale che i due informatori hanno su Eva? Quale % della conoscenza di Eva e dovuta agli informatori? Conoscenza di Eva - Conoscenza unica di Eva e 1 e=a b c a b c Adamo Serpente
Effetto Congiunto Qual e l effetto totale che i due informatori hanno su Eva? Quale % della conoscenza di Eva e dovuta agli informatori? Cose solo Serpente ha detto a Eva + Cose solo Adamo ha detto a Eva + Cose che tutti sanno a b c L effetto combinato di A e S e dato dai loro effetti unici (parziali) e dal loro contributo comune e a b c Adamo Serpente
Entra Statistica Siamo interessati agli effetti di due (o piu ) variabili indipendenti su una variabile dipendente Siamo in grado di stimare la regressione che li lega Y =a b yx.w x b yw.x w e Vogliamo quantificare il loro contributo unico e combinato mediante degli indici che rappresentino la grandezza dei vari effetti
Varianza Decomposta Decomponiamo la varianza della varibile dipendente Varianza completamente condivisa Varianza di errore e Contributo unico di X a b c X W Contributo unico di W Varianza condivisa tra X e W
Correlazione semplice (quadrata) Ricordiamo che nella regressione semplice, la correlazione quadrata semplice e la varianza condivisa (spiegata dalla VI) Varianza di errore e r yw W Contributo W
Correlazione semplice (quadrata) La correlazione semplice Varianza completamente condivisa Varianza di errore e r yw =a c Contributo unico di X a r yx =b c b c X W Contributo unico di W Varianza condivisa tra X e W
Contributo unico di VI Il contributo unico di una VI può essere stimato grazie al quadrato della correlazione parziale Correlazione parziale Varianza spiegata pr yw.x - Varianza spiegata da x e a = a+ e a b c X w
Correlazione parziale Il quadrato della correlazione parziale indica l effetto di una VI dopo aver rimosso tutta la variabilita delle altre Correlazione parziale pr yw.x a = a e e Varianza dovuta a w calcolata sul totale dopo aver tolto la varianza di x a b c X w Varianza di x e completamente rimossa Lezione III
Calcolo di pr Pr può essere calcolato partendo dalle correlazioni semplici pr yw.x = r yw r yx r wx 1 r 1 r yx e xw a c Oppure dai coefficienti standardizzati pr yw. x = β yw. x 1 r yx b X W pr yw.x = pr yw.x pr yw.x
Contributo unico di VI () Il contributo unico di una VI può essere anche stimato grazie al quadrato della correlazione semi-parziale Correlazione semi-parziale Varianza spiegata sr yw.x - Varianza spiegata da x e a = a+ b+ c + e a b c X w
Correlazione semi-parziale Il quadrato della correlazione parziale indica l effetto di una VI dopo aver rimosso tutta la variabilita delle altre Correlazione parziale sr yw.x a = a+ b+ c + e e Varianza unica dovuta a w come proporzione di tutta la varianza di Y a b c X w Varianza di x non rimossa nel calcolo della varianza totale
Correlazione semi-parziale In altri termini.. R yxw ryw sryx.w R=.5 R=.10 e e s r=.15 r a b c x w w.5.10.15 Grazie a X, si spiega un 15% in piu
Esempio In ricerca sull anoressia sono state misurate su un campione di 85 donne la propria figura reale, la figura ideale e l autostima. Pictorial Body Image Scale
Output Coefficientia Modello 1 (Costante) Autostima Coefficienti non standardizzati B Errore std..683.06.117.048 Coefficienti standardizzati Beta.58 t 13.048.437 Sig..000.017 a. Variabile dipendente: figura_ideale Lezione: II
Regressione con SPSS Inseriamo le variabili al posto giusto Variabile Dipendente Tutte le variabili Finestra Regressione Variabili Indipendenti Lezione III
Regressione con SPSS Inseriamo le variabili al posto giusto Opzioni ulteriori Marchiamo qui per ottenere le correlazioni semplici e parziali Lezione III
OUTPUT SPSS Bontà della regressione R Significatività Lezione III
OUTPUT SPSS Coefficienti e indici Significatività (notiamo che c è un test solo per ogni VI) r pr
Fine Fine della Lezione III