Analisi della Varianza - III Analisi Multivariata della Varianza (MANOVA, Multivariate Analysis of Variance) M Q Cristina Zogmaister Milano-Bicocca 1 Lez: XXXII
Analisi Multivariata della Varianza (MANOVA) = una generalizzazione dell ANOVA a una situazione in cui c è più di una V.D. Esempio: Siamo interessati all effetto di diverse terapie sull ansia. Consideriamo tre tipi di ansia Ansia da test Ansia in risposta a piccoli stress quotidiani Ansia fluttuante (evento-aspecifica) Fattore terapia, 3 livelli (desensibilizzazione, training al rilassamento, lista d attesa) La MANOVA testa l assunzione che le differenze osservate tra i gruppi su una combinazione delle V.D. siano attribuibili al caso. 2
Analisi Multivariata della Varianza (MANOVA) Un estensione dell ANOVA, in cui gli effetti principali e le interazioni sono analizzati su una combinazione di V.D. Testa la probabilità che le differenze tra le medie di gruppi di osservazioni, relativamente a una combinazione di V.D. siano da attribuire al caso. 3
La combinazione delle V.D. Viene creata una nuova V.D. che è una combinazione lineare delle V.D. individuali. Es. V.D. = c 1 * ansia.test + c 2 * ansia.stress + c 3 * ansia.flutt È la combinazione lineare che massimizza la differenza tra i gruppi. L ANOVA viene poi eseguita su questa nuova V.D. Come nell ANOVA, le ipotesi sulle medie nella MANOVA vengono testate confrontando le varianze. 4
La combinazione delle V.D. - II Nei disegni fattoriali viene creata una differente combinazione lineare separatamente per ciascun effetto principale e per ciascun interazione: La combinazione lineare che massimizza la differenza tra i gruppi relativamente a quell effetto principale o quell interazione. Esempio : se aggiungessimo il tipo di paziente (es. Sofferente di Ansia Tipo A vs. Sofferente di Ansia Tipo B ): V.D. TERAPIA = c 11 * ansia.test + c 12 * ansia.stress + c 13 * ansia.flutt V.D. TIPO.PAZ = c 21 * ansia.test + c 22 * ansia.stress + c 23 * ansia.flutt V.D. INTERAZ = c 31 * ansia.test + c 32 * ansia.stress + c 33 * ansia.flutt 5
La combinazione delle V.D. - II Quando le V.I. (fattori) hanno più di due livelli, le V.D. possono essere ricombinate per massimizzare i confronti a coppie Se vogliamo confrontare la condizione di desensibilizzazione con la condizione di controllo: V.D. CONTROLLO.DESENSIB = c 41 * ansia.test + c 42 * ansia.stress + + c 43 * ansia.flutt 6
MANCOVA = estensione multivariata dell ANCOVA: la combinazione lineare delle V.D. è corretta per una o più covariate continue. covariata = variabile che è correlata con la V.D., non viene manipolata, della quale si vogliono rimuovere gli effetti sulla V.D. prima di stimare le differenze nella V.D. tra i livelli delle V.I. 7
Nella MANOVA abbiamo pertanto: 2 o più V.D. (almeno scala a intervalli) 1 o più fattori (scala nominale) nella MANCOVA anche una o più covariate (almeno scala a intervalli) 8
Vantaggi della MANOVA (rispetto ad ANOVA) Permette di indagare il fenomeno d interesse in modo più particolareggiato: Nell ANOVA si scommette tutto su un unica misura dipendente, nella MANOVA aumenta la possibilità di far emergere il fenomeno indagandolo per diversi aspetti. Si aumenta la probabilità di capire cosa cambia tra i diversi gruppi Esempio sugli effetti della terapia sull ansia: potremmo scoprire che la terapia della desensibilizzazione incide in particolare sull ansia da test, e la terapia del rilassamento sull ansia fluttuante Fare più ANOVA separate su più V.D. comporterebbe un inflazione del rischio di errore del 1 o tipo (rifiuto H 0 quando è vera) In certe (rare) condizioni la MANOVA può evidenziare differenze che non emergono con l ANOVA 9
In certi (rari) casi la MANOVA permette di individuare differenze che non emergerebbero con l ANOVA Disegno a una via con due livelli e due V.D. (Y 1 e Y 2 ) Considerando le due V.D. separatamente, le distribuzioni per i due livelli sono molto sovrapposte. Le ellissi che rappresentano le combinazioni delle V.D. separatamente per i due gruppi evidenziano una differenziazione più netta: in un caso come questo la MANOVA può essere più potente rispetto a due ANOVA separate. 10
Svantaggi della MANOVA (rispetto ad ANOVA) Più assunzioni da soddisfare (le vedremo dopo) Ambiguità nell interpretare gli effetti sulle singole V.D. Il disegno della MANOVA è più complesso Generalmente all aumentare della complessità dell analisi diminuisce la potenza del test; Le situazioni in cui la MANOVA è più potente dell ANOVA sono rare Anche una correlazione moderata tra le V.D. diminuisce il potere della MANOVA 11
Questioni affrontate attraverso MANOVA - I Permette di indagare perlopiù le stesse questioni dell ANOVA, ma su una cominazione lineare di V.D. anziché su una singola V.D. Ci sono effetti principali? Tenendo costanti gli altri effetti, la differenza tra i gruppi è maggiore di quella che potremmo aspettarci per effetto del caso? Tenere costante può significare Controllare altri effetti attraverso un disegno fattoriale Mantenere costanti delle variabili estranee, o controbilanciare o randomizzare i loro effetti Usare covariate per aggiustare la V.D. composita e creare uno stato di pseudo-eguaglianza 12
Questioni affrontate attraverso MANOVA - II Ci sono interazioni tra i fattori? L effetto di un fattore sulla combinazione lineare di V.D. dipende dai livelli di un altro fattore? Per esempio: dati due diverse terapie, una funziona meglio per i pazienti di tipo A e l altra per quelli di tipo B? 13
Questioni affrontate attraverso MANOVA - III Quali sono le V.D. più importanti? Se ci sono effetti principali o d interazione significativi, c è una V.D. sulla quale si incentra maggiormente l effetto dei fattori? Si possono effettuare ANOVA individuali per vedere su quali V.D. ci sono effetti grandi, medi, piccoli, o nessun effetto. E l approccio più usato Correzione di Bonferroni (più avanti) Oppure si può seguire la procedura step-down di Roy-Bargman 14
Procedura step-down di Roy-Bargman Si effettua un ANCOVA su ogni V.D. individualmente, inserendo come covariate le V.D. più importanti. I passi da seguire: 1. Si ordinano le V.D. secondo la loro importanza contestuale. 2. Se la MANOVA è statisticamente significativa si esegue un ANOVA sulla prima variabile individuata al passo 1 3. Se si riscontrano effetti significativi al passo 2, la prima variabile serve come covariata quando la seconda variabile in sequenza funge da D.V. in una nuova analisi. 4. La procedura continua per ciascuna delle V.D., con le variabili più importanti che fungono da covariate per quelle meno importanti. Risponde alla domanda: dopo aver corretto per le variabili con maggiore importanza, ci sono differenze significative tra le medie dei gruppi in variabili meno importanti? 15
Questioni affrontate attraverso MANOVA - IV Stime dei parametri Le medie marginali sono le migliori stime degli effetti principali nella popolazione e le medie nelle condizioni sono le migliori stime per le interazioni 16
Questioni affrontate attraverso MANOVA - V Quali livelli dei fattori sono significativamente diversi? Effetti principali: Se un fattore con più di due livelli ha effetti significativi, bisogna testare quali livelli si differenzino significativamaente tra di loro. Interazioni: Se ci sono interazioni è necessario effettuare la scomposizione per individuarne le specifiche cause Le procedure sono analoghe a quelle viste per l ANOVA 17
Questioni affrontate attraverso MANOVA Quanto è forte la relazione tra fattori e V.D. composita? Qual è la proporzione di variabilità nella V.D. composita che è spiegata da ciascun fattore? Eta quadrato (η 2 ) È possibile stimare anche la forza dell associazione tra i fattori e ciascuna V.D. separatamente. 18
Questioni affrontate attraverso MANCOVA L uso delle covariate porta a un aggiustamento significativo nel punteggio della V.D. composita? Analogamente al caso dell ANOVA, viene testato l effetto della covariata. 19
La scelta delle V.D. Le V.D. vanno scelte con molta attenzione. La presenza di V.D. molto correlate positivamente diminuisce molto il potere dell analisi. La MANOVA funziona al meglio con V.D. con un alta correlazione negativa Esempio: tempo per svolgere un compito e numero di errori. Funziona ragionevolmente bene con variabili moderatamente correlate ( fino a.60 ) in entrambe le direzioni. Se la correlazione è alta allora il test multivariato funziona ragionevolmente bene, ma la procedura step down fallisce: Meglio usare solo la V.D. più affidabile o creare un punteggio composito ed eseguire un ANOVA 20
La scelta delle V.D. - II Le V.D. vanno scelte con molta attenzione. Se le V.D. non sono correlate la MANOVA non è una buona scelta Esempio: punteggi fattoriali Il test multivariato ha meno potere che il test univariato e c è poca differenza tra i risultati univariati e quelli step down L unico vantaggio della MANOVA in questo caso è evitare l inflazione dell errore del I tipo. Ma questo errore può esser evitato con l approccio di Bonferroni: α = 1 (1 α c ) p dove p è il numero di V.D., α c è il valore soglia utilizzato per ogni ANOVA α è il rischio complessivo di commettere un errore del primo tipo Approssimativamente: α < α c * p 21
Ipotetiche relazioni tra 4 V.D. e una V.I. VD 1 : altamente legata con VI, condivide varianza con VD2 e VD3 V.I. VD2 : condivide varianza con VD1 e VD3, non condivide varianza unica con VI V.D. 1 V.D. 4 VD3 : condivide varianza con VI ma anche con le altre VD V.D. 2 V.D. 3 VD4 : condivide molta varianza con VI e solo un po con VD3 VD2 è completamente ridondante con le altre VD non va bene VD3 aggiunge solo poca varianza unica all insieme delle VD VD2 potrebbe avere senso come covariata, se questo fosse concettualmente sensato (ridurrebbe varianza d errore in VD1 e VD3) 22
La scelta delle V.D. - III La scelta dell ordine in cui inserire le V.D. nell analisi stepdown ha un importante impatto sull interpretazione Le variabili che (teoricamente) sono più importanti dal punto di vista causale devono avere maggiore priorità. 23
Numero di soggetti Il numero di casi in ogni cella deve essere superiore al numero di V.D. Altrimenti Alto rischio che la variabilità delle celle non sia omogenea La potenza dell analisi rischia di essere troppo bassa Ossia: bassa probabilità di trovare effetti significativi 24
Assunzioni Normalità multivariata = le medie delle V.D. in ciascuna condizione e tutte le loro combinazioni lineari sono distribuite normalmente Difficile da mostrare esplicitamente Se ci sono almeno 20 casi nella condizione meno numerosa, allora il test è robusto alla violazione di quest assunzione anche se le numerosità sono diverse nelle diverse condizioni Se le numerosità sono inferiori e il disegno è sbilanciato è richiesta la normalità multivariata 25
Assunzioni Assenza di outlier Sia nelle V.D., sia nelle covariate Vanno valutati entro le condizioni Linearità = relazioni lineari tra tutte le coppie di V.D., tutte le coppie di covariate, e tutte le coppie V.D.-covariata Le deviazioni dalla linearità riducono la potenza del test perché la combinazione lineare delle V.D. non massimizza la differenza tra i gruppi le covariate non massimizzano l aggiustamento per l errore Omogeneità della regressione = assenza di interazioni tra fattori e covariate 26
Assunzioni Le covariate e le V.D. sono affidabili (>.80) L affidabilità delle covariate è un assunzione già vista per l ANOVA Se si esegue la procedura stepdown per interpretare le V.D., anche le V.D. devono essere affidabili Assenza di multicollinearità In ogni condizione del disegno Sia tra le V.D., sia tra le Covariate, sia tra V.D. e covariate. 27
Assunzioni Omogeneità delle matrici di covarianza è l equivalente multivariato dell omogeneità delle varianze assume equivalenza tra le varianze e covarianze delle diverse condizioni e che perciò queste possano essere unite per stimare il termine d errore se le numerosità delle osservazioni nelle condizioni sono uguali, la MANOVA è robusta a violazioni di quest assunzione se le numerosità delle osservazioni nelle condizioni sono diverse, si valuta il Box s M test, con α <.001 α <.001 indica violazione e la robustezza del test è a rischio 28
Riportare i risultati: Quale dei test multivariati riportare? Generalmente viene riportato il Lamdba di Wilks Cosa fare se il test multivariato non è significativo e un test univariato sì? Riportare sia il test multivariato, sia il test univariato. Proporre il risultato univariato come guida per ricerche future. 29
Esempio di MANOVA Effetto dell identificazione di ruolo sessuale sulle V.D. Autostima Estroversione Neuroticismo Locus of control Atteggiamento verso il ruolo delle donne Ogni soggetto è classificato separatamente come alto/basso su: - dimensione di indentificazione con ruoli maschili - dimensione di identificazione con ruoli femminili Disegno: 2 (mascolinità: alta / bassa) x 2 (femmilinità: alta / bassa) 30
Esempio di MANOVA i dati 31
Esempio di MANOVA - SPSS 32
Esempio di MANOVA SPSS - 2 33
Esempio di MANOVA Test multivariato 34
Esempio di MANOVA MANOVA omnibus: entrambe le V.I. hanno effetti principali sulle V.D.; l effetto d interazione non è significativo. Vediamo ora i test univariati 35
Esempio di MANOVA test univariati Correzione di Bonferroni: uso α c =.01 36
Esempio di MANOVA test univariati 37
Esempio di MANOVA test univariati 38
Esempio di MANOVA strategia stepdown Ordine di importanza: 1. Atteggiamento verso i ruoli femminili 2. Locus of control 3. Autostima 4. Estroversione 5. Neuroticismo Indaghiamo l effetto della V.I. Mascolinità 39
Esempio di MANOVA strategia stepdown Ordine di importanza: 1. Atteggiamento verso i ruoli femminili La V.I. mascolinità ha un effetto significativo sull atteggiamento verso i ruoli femminili 40
Esempio di MANOVA strategia stepdown Ordine di importanza: 1. Atteggiamento verso i ruoli femminili 2. Locus of control Controllando per l atteggiamento verso i ruoli femminili, la V.I. ha un effetto significativo sul locus of control 41
Esempio di MANOVA strategia stepdown Ordine di importanza: 1. Atteggiamento verso i ruoli femminili 2. Locus of control 3. Autostima Controllando per atteggiamento e LoC, la V.I. mascolinità ha un effetto significativo sull autostima 42
Esempio di MANOVA strategia stepdown Ordine di importanza: 1. Atteggiamento verso i ruoli femminili 2. Locus of control 3. Autostima 4. Estroversione 43
Esempio di MANOVA strategia stepdown Ordine di importanza: 1. Atteggiamento verso i ruoli femminili 2. Locus of control 3. Autostima 4. Estroversione 5. Neuroticismo 44