Analisi della Varianza - II M Q ANOVA entro i soggetti, modelli misti, ANCOVA Marco Perugini Milano-Bicocca 1 Lez: XXIX
ANOVA a una via la VARIANZA Possiamo stimare la varianza (MQ = media dei quadrati) - Varianza totale: MQ TOT = SQ TOT (N 1) Gradi di libertà (g.l.) - Varianza entro: MQ ENTRO = SQ ENTRO (N k) - Varianza tra: MQ TRA = SQ TRA (k 1) [ quanti valori sono liberi di variare] N = numerosità complessiva; k = numero di livelli Il rapporto F F = MQ TRA MQ ENTRO F è il rapporto tra la varianza stimata a partire dalla variabilità tra i gruppi (BETWEEN) e la varianza stimata a partire dalla variabilità entro i gruppi (WITHIN). Segue la distribuzione F di Fisher. http://web.utah.edu/stat/introstats/anovaflash.html 2 Lezione: XXVIII
ANOVA fattoriale la scomposizione della varianza SQ TOT g.l.: N - 1 SQ ENTRO SQ TRA g.l.: N a*b SQ A SQ B SQ A * B g.l.: a 1 g.l.: b 1 g.l.: (a 1)*(b 1) MQ = SQ / g.l. F A = MQ A / MQ ENTRO F B = MQ B / MQ ENTRO F A*B = MQ A*B / MQ ENTRO Vantaggio dell ANOVA fattoriale: SQ ENTRO e MQ ENTRO sono tipicamente più piccole che nell ANOVA a una via perché alcune fonti di variabilità non sono più d errore. Questo aumenta la potenza del test. 3 Lezione: XXVIII
ANOVA entro i soggetti (detta anche per misure ripetute o Within) Disegni entro i soggetti (within subjects) La V.D. è rilevata più volte sugli stessi soggetti [unità osservative], nelle diverse condizioni sperimentali. Disegni per blocchi randomizzati La V.D. viene rilevata su soggetti appaiati su una determinata variabile rilevante. Nelle diverse condizioni ci sono soggetti diversi che vengono trattati come se fossero la stessa persona esposta a prove differenti. Esempio: triplette di persone equiparabili per età, sesso, ideologia politica 4
ANOVA a una via entro i soggetti Ricerca automobili di prestigio Intervista di marketing, indice di prestigio associato a tre diversi marchi: Porsche, Ferrari, Lamborghini Ogni intervistato esprime valutazioni per tutti e tre i marchi. Le osservazioni non sono indipendenti. 5
ANOVA a una via entro i soggetti medie di ciascun soggetto rispetto alle 3 condizioni permettono di isolare la parte di devianza totale dei punteggi che dipende dalle differenze tra i soggetti. medie della V.D. per ciascun livello permettono di stimare la variabilità legata al fattore 6
ANOVA a una via entro i soggetti Devianza totale Devianza tra i soggetti SQ TOTALE devianza dovuta ai livelli del fattore Devianza entro le celle SQ TRA SQ ENTRO SQ SOGGETTI SQ RESIDUA La devianza totale viene suddivisa in una parte di devianza TRA le condizioni (l effetto del marchio valutato) e una parte di devianza ENTRO le condizioni (non attribuibile al marchio). La devianza ENTRO è suddivisa in una parte dovuta alle differenze individuali tra i soggetti e una parte d errore (variabilità residua). NOTA: le differenze individuali tra i soggetti non costituiscono variabilità d errore perché rimangono costanti nelle diverse condizioni. 7
ANOVA a una via entro i soggetti SQ TOTALE g.l.: n*k - 1 g.l.: k - 1 SQ TRA SQ ENTRO g.l.: n - k SQ SOGGETTI SQ RESIDUA g.l.: n - 1 g.l.: (n 1) * (k 1) MQ = SQ / g.l. F EFFETTO = MQ TRA / MQ RESIDUA Vantaggio dei disegni entro i soggetti: riduzione della varianza d errore (disegno più potente richiede meno soggetti). Utile se la variabilità interindividuale incide molto sulla V.D. 8
ANOVA a una via entro i soggetti: esempio Effetto significativo del tipo di marchio, F(2,158) = 31.703, p <.001, η 2 =.427. I test post hoc (correzione di Bonferroni) rivelano che le valutazioni medie del marchio Porsche si discostano significativamente da quelle degli altri due marchi, che invece in media non differiscono significativamente. 9
ANOVA fattoriale entro i soggetti Ai partecipanti alla ricerca viene chiesto di valutare i marchi Porsche, Ferrari e Lamborghini prima e dopo aver visto una comunicazione commerciale (spot TV) per il marchio Ferrari. Il disegno: 3 (Marchio: Porsche, Ferrari, Lamborghini) x 2 (Misurazione: Pre, Post) entro i soggetti. Per ogni partecipante, la V.D. viene misurata relativamente a tutte le 6 condizioni sperimentali. 10
ANOVA fattoriale entro i soggetti Il disegno: 3 (Marchio: Porsche, Ferrari, Lamborghini) x 2 (Tempo: Pre, Post) entro i soggetti. Scomposizione della devianza (con i relativi g.l.): SQ TOTALE n*a*b - 1 SQ TRA SQ ENTRO SQ MARCHIO a - 1 SQ INTERA- ZIONE (a 1) * (b 1) SQ TEMPO b - 1 SQ ERR MARCHIO (a 1) * (n 1) SQ ERR TEMPO SQ SOGGETTI n 1 (b 1) * (n 1) SQ ERR INTERAZIONE (a 1) * (b 1) * (n 1) 11 Dove: a = nr. livelli fattore marchio, b = nr. livelli fattore tempo, n = nr. soggetti
ANOVA fattoriale entro i soggetti SQ TOTALE SQ TRA SQ ENTRO SQ MARCHIO SQ TEMPO SQ SOGGETTI SQ INTERA- ZIONE SQ ERR MARCHIO SQ ERR TEMPO Scomposizione della devianza SQ totale: (xabn x ) a b n SQ ERR INTERAZIONE SQ effetto principale A: a b n(x a x ) 2 SQ effetto principale B: a b n(x b x ) 2 SQ interazione A*B: a b n(x ab x a x b + x) 2 2 SQ entro: a b n(xabn x ab ) 2 SQ soggetti: a b n(x n x ) 2 SQ err A: a b n(x an x a ) 2 SQ soggetti SQ err B: a b n(x bn x b ) 2 SQ soggetti SQ err interazione: SQ entro SQ soggetti SQ err A SQ err B
ANOVA fattoriale entro i soggetti esempio Esempio fattore tempo: F = MQ TEMPO / MQ ERR. TEMPO = 50.70 / 4.02 = 12.60 Interazione. Può essere approfondita con effetti semplici 13
ANOVA fattoriale entro i soggetti esempio L esposizione al messaggio causa un cambiamento significativo per tutti e tre i marchi, ma un incremento per i marchi Porsche e Ferrari, un decremento per il marchio Lamborghini. 14
ANOVA fattoriale entro i soggetti esempio Secondo una prospettiva diversa: Prima della visione dello spot la percezione dei marchi Ferrari e Lamborghini non era significativamente diversa. Anche dopo la visione dello spot è così. 15
ANOVA fattoriale mista Almeno un fattore è tra i soggetti, almeno un fattore è entro i soggetti. Esempio: Sesso Maschi Femmine I soggetti sono esposti a tutti i livelli del fattore entro, solo a un livello del fattore tra. SQ TOTALE n*a*b - 1 SQ TRA SQ ENTRO SQ Fatt Tra a - 1 SQ Err. Fatt. Tra a * (n 1) SQ Fatt Entro b 1 SQ Interazio ne (a 1) * (b 1) SQ Err. Entro a * (b 1) * (n 1) 16 Dove: a = nr. livelli fattore tra, b = nr. livelli fattore entro, n = numero totale di soggetti.
ANOVA fattoriale mista esempio le statistiche descrittive 17
ANOVA fattoriale mista esempio effetti tra i soggetti 18
ANOVA fattoriale mista esempio effetti entro i soggetti Test post hoc sulle medie marginali relative al fattore corso : Le valutazioni del corso intensivo in sede (2) si differenziano significativamente da quelle degli altri due corsi. Le valutazioni di questi ultimi non si differenziano invece significativamente. 19
ANOVA fattoriale mista esempio riportiamo i risultati In media, le donne esprimono valutazioni leggermente inferiori agli uomini relativamente ai corsi di formazione, M = 26.45, SD = 3.94 e M = 27.55, SD = 4.08 rispettivamente per le donne e gli uomini. Questa differenza è statisticamente significativa, F (1,76) = 6.23, p =.02, η 2 p =.07. L ANOVA evidenzia inoltre un effetto statisticamente significativo del tipo di corso, F (2,156) = 9.12, p <.01, η 2 p =.10 con M = 25.40, SD = 5.43 per il corso residenziale, M = 28.82, SD = 5.22 per il corso in sede intensivo e M = 27.00, SD = 4.02 per il corso in sede diluito. L effetto dell interazione non è significativo, F (2,156) =0.81, p =.45. I test post hoc sulle medie marginali relative al fattore corso (eseguiti con la correzione di Bonferroni) evidenziano differenze significative tra la valutazione del corso intensivo in sede e le valutazioni di entrambi gli altri corsi, in entrambi i casi p <.03. Evidenziano inoltre che la valutazione media del corso residenziale non si differenzia significativamente dalla valutazione del corso diluito in sede, p =.19 20
ANOVA fattoriale disegni con 3 fattori Presenza di tre Variabili Indipendenti (fattori) Possono essere sia tra sia entro i soggetti. Esempio tre fattori tra i soggetti: una multinazionale vuole introdurre un sistema di incentivi per aumentare l efficacia dei suoi venditori. Prima testa il sistema di incentivi su un piccolo gruppo di venditori, in tre Paesi. Il disegno: - Sistema di incentivazione (2 livelli: incentivo vs. controllo) - Paese (3 livelli: Italia, Francia, Germania) - Sesso (2 livelli: maschi vs. femmine) D.V. Numero nuovi contratti in un mese, dopo l introduzione nel campione del nuovo sistema d incentivi. Attraverso l ANOVA fattoriale possiamo analizzare se l effetto dell incentivo sia differente per donne ed uomini, o nei diversi Paesi, o tra i sessi in maniera diversa a seconda del Paese. 21
ANOVA fattoriale disegni con 3 fattori Presenza di tre Variabili Indipendenti (fattori) Possono essere sia tra sia entro i soggetti. Esempio due fattori tra, uno entro i soggetti: una multinazionale vuole introdurre un sistema di incentivi per aumentare l efficacia dei suoi venditori. Prima testa il sistema di incentivi su un piccolo gruppo di venditori, in tre Paesi. Il disegno: - Sistema di incentivazione (2 livelli: incentivo vs. controllo) - Paese (3 livelli: Italia, Francia, Germania) - Momento della misura: prima e dopo l introduzione incentivo. D.V. Numero nuovi contratti in un mese 22
ANOVA fattoriale Esempio 3 fattori tra i soggetti I dati: N = 240 (n = 20 in ogni condizione) 23
ANOVA fattoriale Esempio 3 fattori tra i soggetti Le medie Incentivo Controllo 24
ANOVA fattoriale Esempio 3 fattori tra i soggetti L ANOVA 25
ANOVA fattoriale Esempio 3 fattori tra i soggetti L ANOVA Effetto principale dell incentivo, non qualificato da interazioni significative. 26
ANOVA fattoriale Esempio 3 fattori tra i soggetti l ANOVA 27
ANOVA fattoriale Esempio 3 fattori tra i soggetti l ANOVA 28
Analisi della Covarianza (ANCOVA) Cos è: tecnica per controllare statisticamente la variabilità causata da (legata a) fonti esterne al disegno. Domande principali: le stesse dell ANOVA (ossia differenze tra medie nella V.D. in condizioni diverse): Usi tipici: a) Abbassare la variabilità dell errore tenendo sotto controllo una fonte di variabilità [perciò escludendo questa varianza dalla componente d errore] Esempio: Ci sono differenze nelle competenze di chi ha seguito il corso di formazione A e chi non l ha seguito, dopo che teniamo sotto controllo le conoscenze pregresse? b) Controllare statisticamente una fonte di disturbo [uso più problematico dell ANOVA] Esempio: i partecipanti al corso di formazione A sono mediamente più giovani di quelli del corso B e l età influisce sulla V.D. Si aggiustano le medie della V.D.: come sarebbero se i soggetti dei due gruppi non differissero relativamente alla covariata? Come funziona: Gli effetti (principali e d interazione) dei fattori sono analizzati dopo che i punteggi della V.D. sono corretti per l effetto di una o più variabili (covariate). 29
ANCOVA Esempi Efficacia delle mnemotecniche Fattore mnemotecniche: 3 livelli (Controllo vs. Mnemotecniche A vs. Mnemotecniche B) V.D.: Prestazione mnestica dopo il corso Covariate: Prestazione mnestica prima del corso La domanda: I corsi di mnemotecniche sono efficaci? Ci sono differenze tra i due corsi? Teniamo sotto controllo le differenze interindividuali di memoria 30
ANCOVA Esempi - II Effetti di una pubblicità progresso sul risparmio energetico. Fattore pubblicità: 3 livelli (Controllo vs. Messaggio A vs. Messaggio B) V.D.: indice di consumo energetico Covariate: atteggiamenti ecologici; conoscenze pregresse. La domanda: Tenendo sotto controllo gli atteggiamenti e le conoscenze pregresse nei confronti dell ecologia e del risparmio energetico, qual è l effetto del messaggio sul consumo energetico? 31
ANCOVA La logica 1. La V.D. viene regredita sulla covariata (o sulle covariate). i punteggi della V.D. vengono corretti per rimuovere l effetto della covariata. Punteggi corretti della V.D. = quelli che la V.D. avrebbe se tutti le osservazioni avessero lo stesso valore nella covariata. 2. Viene eseguita l analisi della varianza per indagare gli effetti dei fattori sulla nuova variabile corretta. Indice di consumo energetico Atteggiamenti verso ecologia PRE 32
ANCOVA Esempio Qual è l effetto di Spot sul consumo energetico? Fattore Spot - 2 livelli: Visione spot vs. controllo. V.D. Indice di consumo. Covariata: atteggiamento ecologico. [attenzione: misurare la covariata prima di introdurre la manipolazione, perché non ne sia influenzata] Senza covariata: t-test per campioni indipendenti Saremmo arrivati alla stessa conclusione con l ANOVA ( F = t 2 ) L effetto dello Spot non è significativo 33
ANCOVA Esempio Importante legame tra atteggiamenti ecologici e consumi: ANCOVA: Effetto significativo dello spot, tenendo sotto controllo l atteggiamento (covariata) 34
ANCOVA Esempio Le medie marginali attese: Stima puntuale e intervallo di confidenza per le medie nelle condizioni, se la Covariata assume uno specifico valore 35
ANCOVA Esempio L analisi permette di valutare anche l effetto della covariata sul consumo energetico I test di significatività delle covariate permettono di valutare la loro utilità nell aggiustamento della V.D. Prospettiva della regressione gerarchica: 1. Le covariate sono inserite al primo passo (tutte assieme) nell interpretare valgono le considerazioni relative all analisi di regressione (il test concerne la varianza unica, nella regressione multipla, spiegata da ciascuna covariata). 2. I fattori e le interazioni tra i fattori sono inseriti al secondo passo. 36
Alcune regole sulle covariate Dovrebbero essere poche, non correlate tra loro e correlate con la V.D. Poche: ogni covariata sottrae un g.l. e questo deve essere almeno compensato dalla riduzione dell errore Se possibile, vanno misurate prima delle manipolazioni altrimenti si rischia di rimuovere parte dell effetto dei fattori sulla V.D. (quella porzione di effetto che V.D. e covariata hanno in comune) 37
ANCOVA - assunzioni (oltre alle usuali assunzioni di normalità e omogeneità della varianza dell ANOVA) Linearità delle relazioni tra le coppie di covariate (se sono più di una) Linearità delle relazioni tra le covariate le la V.D. Omoschedasticità la varianza della V.D. deve essere omogenea a diversi valori della covariata Omogeneità della regressione per le diverse condizioni (i coefficienti di regressione tra covariate e D.V. devono essere gli stessi per tutte le condizioni) Se si sospetta un interazione tra fattori e covariate, non è appropriato fare l ANCOVA 38