Tecniche statistiche di analisi del cambiamento 06-Anova per fattori indipendenti (vers. 1.2, 8 novembre 2017) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2017-18 G. Rossi (Dip. Psicologia) Tsac 2017-18 1 / 54
Analisi della varianza Analysis of variance (Anova, AOV) è una tecnica statistica che confronta due o più gruppi fra di loro È un estensione del t-test che si usa quando si hanno più di 2 gruppi La variabile dipendente dev essere quantitativa Le variabili indipendenti devono essere qualitative G. Rossi (Dip. Psicologia) Tsac 2017-18 2 / 54
Analisi della varianza Disegni a 1 via: quando c è una sola variabile indipendente (anova univariata) Disegni fattoriali: con 2 o più variabili indipendenti (anova multivariata) Disegni tra i soggetti (between subjects): quando, rispetto ad una VI, i soggetti sono misurati una sola volta (ad es. ansia misurata fra maschi e femmine) Disegni entro i soggetti (within subjects): quando, rispetto ad una VI, i soggetti sono misurati più di una volta (ad es. ansia prima e dopo un esame) G. Rossi (Dip. Psicologia) Tsac 2017-18 3 / 54
Esempio empirico In un campione di persone abbiamo misurato l autoritarismo (variabile Y) usando la scala di Karen Stenner (5 item sulle cose importanti da insegnare ad un bambino, maggiore il punteggio, maggiore l autoritarismo) e l orientamento politico (su una scala da 1 a 10, da sinistra a destra) Raccogliamo i 10 punteggi dell orientamento politico in 3 categorie (variabile X): 1-3 => SX, 4-7 => Centro, 8-10 => DX L autoritarismo è uguale nei tre gruppi? Oppure ogni sottocampione (in base all orientamento politico) ha parametri della popolazione diversi? Se usassimo il t-test (differenza delle medie, dovremmo fare 3 confronti a coppie: SX vs. Centro, SX vs. DX, Centro vs. DX) Usiamo l analisi della varianza G. Rossi (Dip. Psicologia) Tsac 2017-18 4 / 54
Esempio empirico Stenner N Media Dev. std. Err. std. Minimo Massimo SX 154 13,16 4,159 0,335 5 25 Centro 182 14,63 4,391 0,326 5 27 Dx 80 15,94 5,321 0,595 5 30 Totale 416 14,34 4,607 0,226 5 30 ANOVA univariata Somma Media quadrati df quadrati F Sig. Fra gruppi 433,245 2 216,622 10,68 0,000 Entro gruppi 8373,964 413 20,276 Totale 8807,209 415 C è almeno un gruppo che ha una media statisticamente diversa da quelle degli altri (cioè è stato estratto da una popolazione con parametri diversi) G. Rossi (Dip. Psicologia) Tsac 2017-18 5 / 54
Esempio empirico Quale? Usiamo i confronti a posteriori Test post hoc - Sottoinsiemi omogenei Stenner Student-Newman-Keuls N Sottoinsieme per alfa =.05 1 2 3 SX 154 13,1623 Centro 182 14,6319 Dx 80 15,9375 Sig. 1,000 1,000 1,000 Le tre medie sono tutte diverse fra di loro, ovvero i campioni su cui sono state calcolate sono stati estratti da popolazioni con parametri statistici diversi G. Rossi (Dip. Psicologia) Tsac 2017-18 6 / 54
Esempio empirico G. Rossi (Dip. Psicologia) Tsac 2017-18 7 / 54
La logica dell anova Possiamo pensare all autoritarismo (Y) come ad una variabile casuale il cui valore atteso è la sua media E(Y ) = μ y Tuttavia l orientamento politico (X) può influenzare l autoritarismo aggiungendo un certo valore Y sx = μ y + μ sx Y dx = μ y + μ dx e infine si aggiunge un possibile errore casuale (ε) che dipende da ogni singolo soggetto G. Rossi (Dip. Psicologia) Tsac 2017-18 8 / 54
La logica dell anova quindi il punteggio di ogni soggetto i appartenente al gruppo politico j è y ij = μ + α i + ε ij cioè dipende dalla media della variabile nella popolazione ^μ = y da un fattore di correzione dovuto all influenza della variabile indipendente (fattore del trattamento) ^α 1 = (^y i. ^y.. ) e ad un errore dovuto al caso statistico (fattore di correzione) ^ε ij = (y ij ^y i. ) G. Rossi (Dip. Psicologia) Tsac 2017-18 9 / 54
La logica dell anova per l Anova assumiamo (fra l altro) che 1 normalità: la variabile dipendente (autoritarismo) sia quantitativa e che si distribuisca normalmente 2 omogeneità della varianza: i diversi campioni (in base alla v. indipendente) siano estratti dalla stessa popolazione e abbiano quindi varianza uguale fra loro e con quella della popolazione e quindi σ 2 1 = σ 2 2 = = σ 2 k σ 2 1 = s 2 1 3 indipendenza dei soggetti: le osservazioni siano fra loro indipendenti e quindi le differenze individuali siano casuali G. Rossi (Dip. Psicologia) Tsac 2017-18 10 / 54
La logica dell anova Ipotizziamo che tutti i gruppi abbiano la stessa media H 0 : μ 1 = μ 2 L ipotesi alternativa sarà che almeno un gruppo ha media diversa dagli altri H 1 : μ i μ j per semplicità usiamo campioni di uguale numerosità G. Rossi (Dip. Psicologia) Tsac 2017-18 11 / 54
Una logica alternativa Between Totale Within trattamento punteggio errore Seguendo un altro ragionamento, possiamo considerare il punteggio Y di un soggetto come formato da un punteggio vero (dovuto al trattamento) e da una componente d errore (dovuta ai singoli soggetti) Noi conosciamo solo il valore misurato (Y ) e la sua varianza totale L anova ipotizza che il punteggio vero sia uguale alla media dei singoli campioni (Ȳ ) e che l errore sia Y Ȳ F è calcolato con la varianza del punteggio vero divisa la varianza dell errore G. Rossi (Dip. Psicologia) Tsac 2017-18 12 / 54
La logica dell anova Se sono veri i primi due assunti, i gruppi formati dall indipendente sono uguali, hanno la stessa forma e la stessa varianza Se hanno la stessa varianza, possiamo calcolare la stima della varianza della popolazione come media delle varianze dei singoli campioni ^σ 2 1 = s2 1 ^σ2 e = s 2 i k = n i=1 k j=1 (y ij ȳ i. ) 2 k(n 1) con y ij = il punteggio di un individuo in un certo gruppo, ȳ i. = la media di quel gruppo, n=l ampiezza del singolo gruppo e k=numero dei gruppi G. Rossi (Dip. Psicologia) Tsac 2017-18 13 / 54
La logica dell anova Se H 0 è vera, allora la varianza della popolazione è stimabile anche tramite la distribuzione campionaria delle medie σ 2 Ȳ = σ2 n Le medie dei singoli gruppi sono utilizzate per stimare la varianza, quindi con ^σ t 2 = n^σ ȳ 2 = n k j=1 (ȳ i. ȳ.. ) 2 k 1 dove n è l ampiezza, ȳ i. è la media calcolata su ogni gruppo e ȳ.. è la media delle medie G. Rossi (Dip. Psicologia) Tsac 2017-18 14 / 54
La logica dell anova La varianza totale (y ij ȳ) considera tutti i casi statistici come un solo gruppo e viene quindi scomposta in due diverse stime della varianza della popolazione y ij ȳ i. : La prima è calcolata entro i gruppi (chiamata anche within o varianza d errore = MS e ) perché si basa sulle differenze individuali rispetto alla media dei singoli gruppi ȳ i ȳ.. : La seconda fra i gruppi (chiamata anche between o varianza di trattamento = MS t ) perché considera uguali gli individui di un gruppo e imputa le differenze al trattamento (la variabile categoriale usata per suddividere il campione in gruppi) G. Rossi (Dip. Psicologia) Tsac 2017-18 15 / 54
La logica dell anova il loro rapporto si distribuisce secondo la curva di probabilità di F F = MS t MS e con k 1 e k(n 1) gradi di libertà Se il rapporto è piccolo (e non significativo) le due stime sono uguali e quindi non vi è differenza fra i gruppi Se il rapporto è grande (e significativo), le due stime sono diverse e vi è differenza fra i gruppi G. Rossi (Dip. Psicologia) Tsac 2017-18 16 / 54
Esempio di calcolo della varianza Gruppo (X X) 2 X 2 ( X) 2 1 9 0,4444444 81 12 5,4444444 144 8 2,7777778 64 29 8,6666667 289 841 X = 29 /3 = 9, 667 29 2 = 841 289 841 /3 3 1 Per i calcoli ricordiamo che (Xi var = X) 2 x 2 ( x) 2 N = = N 1 N 1 X 2 ( X) 2 /N N 1 e che il numeratore si chiama anche somma dei quadrati, il denominatore può essere pensato come un gdl G. Rossi (Dip. Psicologia) Tsac 2017-18 17 / 54
Esempio di calcolo: fase 1-var. totale EsempioAov1.sav Gruppo 1 Gruppo 2 Gruppo 3 Quadrati 9 4 3 81 16 9 12 2 6 144 4 36 8 5 3 64 25 9 29 11 12 289 45 54 M 9,667 3,667 4,000 ( X ij ) 2 = (29 + 11 + 12) 2 = 2704 X 2 ij = 289 + 45 + 54 = 388 SS tot = X 2 ij ( X ij ) 2 /N = 388 2704/9 = 87.556 gdl = N 1 = 8 MS tot = var(x) = SS tot /gdl = 10.944 G. Rossi (Dip. Psicologia) Tsac 2017-18 18 / 54
Esempio di calcolo: fase 1-var. totale EsempioAov1.sav Gruppo 1 Gruppo 2 Gruppo 3 Quadrati 9 4 3 81 16 9 12 2 6 144 4 36 8 5 3 64 25 9 29 11 12 289 45 54 M 9,667 3,667 4,000 ( X ij ) 2 = (29 + 11 + 12) 2 = 2704 X 2 ij = 289 + 45 + 54 = 388 SS tot = X 2 ij ( X ij ) 2 /N = 388 2704/9 = 87.556 gdl = N 1 = 8 MS tot = var(x) = SS tot /gdl = 10.944 G. Rossi (Dip. Psicologia) Tsac 2017-18 18 / 54
Esempio di calcolo: fase 1-var. totale EsempioAov1.sav Gruppo 1 Gruppo 2 Gruppo 3 Quadrati 9 4 3 81 16 9 12 2 6 144 4 36 8 5 3 64 25 9 29 11 12 289 45 54 M 9,667 3,667 4,000 ( X ij ) 2 = (29 + 11 + 12) 2 = 2704 X 2 ij = 289 + 45 + 54 = 388 SS tot = X 2 ij ( X ij ) 2 /N = 388 2704/9 = 87.556 gdl = N 1 = 8 MS tot = var(x) = SS tot /gdl = 10.944 G. Rossi (Dip. Psicologia) Tsac 2017-18 18 / 54
Esempio di calcolo: fase 2-var. fra i gruppi Sostituisco i valori con le medie dei gruppi Gruppo 1 Gruppo 2 Gruppo 3 Quadrati 9,667 3,667 4,000 93,451 13,447 16,000 9,667 3,667 4,000 93,451 13,447 16,000 9,667 3,667 4,000 93,451 13,447 16,000 29,000 11,000 12,000 280,353 40,341 48,000 ( x) 2 = (29 + 11 + 12) 2 = 2704 x 2 = 280, 353 + 40, 341 + 48 = 368.694 SS t = x 2 ( x) 2 /N = 368.694 2704/9 = 68.25 gdl = k 1 = 2 MS t = SS t /gdl = 34.125 G. Rossi (Dip. Psicologia) Tsac 2017-18 19 / 54
Esempio di calcolo: fase 3-var. entro i gruppi Sostituisco i valori con gli scarti dalla media: X i X Gruppo 1 Gruppo 2 Gruppo 3 Quadrati -0,667 0,333-1,000 0,444 0,111 1,000 2,333-1,667 2,000 5,444 2,778 4,000-1,667 1,333-1,000 2,778 1,778 1,000 0,000 0,000 0,000 8,667 4,667 6,000 ( x) 2 = (0 + 0 + 0) 2 = 0 x 2 = 8, 667 + 4, 667 + 6 = 19.334 SS e = x 2 ( x) 2 /N = 19.334 0/9 = 19.334 gdl = k(n 1) = 6 MS e = SS e /gdl = 3.222 G. Rossi (Dip. Psicologia) Tsac 2017-18 20 / 54
Esempio di calcolo: fase finale Risultati da calcoli a mano SS gl MS F Sig Trattamento 68,222 2 34,111 10,586 Errore 19,334 6 3,222 Totale 87,556 8 10,944 Risultati da SPSS Somma dei Media dei quadrati gl quadrati F Sig. Fra gruppi 68,222 2 34,111 10,586 0,011 Entro gruppi 19,333 6 3,222 Totale 87,556 8 G. Rossi (Dip. Psicologia) Tsac 2017-18 21 / 54
Formule di calcolo SQ (SS) df MQ (MS) Somme gdl Media F Fonte quadrati quadrati Trattamento Errore Totale ( X.j X.. ) 2 k 1 SQ t /gl MQ t /MQ e (Xij X.j ) 2 k(n 1) SQ e /gl (X ij X.. ) 2 N 1 ij G. Rossi (Dip. Psicologia) Tsac 2017-18 22 / 54
In SPSS: univariata 1 fattore Analizza Confronta medie ANOVA univariata... trascinate almeno una variabile quantitativa (Intervallo o a rapporto) nel riquadro Variabili dipendenti se indicate più dipendenti, verrà calcolata una Anova per ogni variabile indicata trascinate una variabile qualitativa (Nominale o Ordinale) nel riquadro Fattore: Date l OK G. Rossi (Dip. Psicologia) Tsac 2017-18 23 / 54
In SPSS: univariata, Risultati Usando il file EsempioAov1.sav G. Rossi (Dip. Psicologia) Tsac 2017-18 24 / 54
Analisi della varianza 2-fattori between L analisi della varianza si può usare anche con più variabili indipendenti categoriali Ipotizzando due variabili indipendenti (ad es. genere e fasce d età), il modello generale dell anova diventerà X = μ + α + β + φ + ε ovvero il punteggio X è scomponibile come: una parte dovuta alla variabile dipendente (μ = X... ) G. Rossi (Dip. Psicologia) Tsac 2017-18 25 / 54
Analisi della varianza 2-fattori between L analisi della varianza si può usare anche con più variabili indipendenti categoriali Ipotizzando due variabili indipendenti (ad es. genere e fasce d età), il modello generale dell anova diventerà X = μ + α + β + φ + ε ovvero il punteggio X è scomponibile come: una parte dovuta alla variabile dipendente (μ = X... ) una parte dovuta alla prima indipendente (α = ( X i.. X... )) G. Rossi (Dip. Psicologia) Tsac 2017-18 25 / 54
Analisi della varianza 2-fattori between L analisi della varianza si può usare anche con più variabili indipendenti categoriali Ipotizzando due variabili indipendenti (ad es. genere e fasce d età), il modello generale dell anova diventerà X = μ + α + β + φ + ε ovvero il punteggio X è scomponibile come: una parte dovuta alla variabile dipendente (μ = X... ) una parte dovuta alla prima indipendente (α = ( X i.. X... )) una alla seconda indipendente (β = ( X.j. X... )) G. Rossi (Dip. Psicologia) Tsac 2017-18 25 / 54
Analisi della varianza 2-fattori between L analisi della varianza si può usare anche con più variabili indipendenti categoriali Ipotizzando due variabili indipendenti (ad es. genere e fasce d età), il modello generale dell anova diventerà X = μ + α + β + φ + ε ovvero il punteggio X è scomponibile come: una parte dovuta alla variabile dipendente (μ = X... ) una parte dovuta alla prima indipendente (α = ( X i.. X... )) una alla seconda indipendente (β = ( X.j. X... )) una alla loro interazione (φ = μ ij μ (α + β)) G. Rossi (Dip. Psicologia) Tsac 2017-18 25 / 54
Analisi della varianza 2-fattori between L analisi della varianza si può usare anche con più variabili indipendenti categoriali Ipotizzando due variabili indipendenti (ad es. genere e fasce d età), il modello generale dell anova diventerà X = μ + α + β + φ + ε ovvero il punteggio X è scomponibile come: una parte dovuta alla variabile dipendente (μ = X... ) una parte dovuta alla prima indipendente (α = ( X i.. X... )) una alla seconda indipendente (β = ( X.j. X... )) una alla loro interazione (φ = μ ij μ (α + β)) e alle differenze individuali (o errori ε = ( X ijk X ij. )) G. Rossi (Dip. Psicologia) Tsac 2017-18 25 / 54
Scomposizione della varianza Totale Within (Errore) Between (Trattamento) A B AxB La varianza totale è quindi scomponibile in una parte dovuta alle differenze individuali (within=errore) e una parte dovuta ai trattamenti (che in questo caso sono 2 diversi) La varianza dovuta ai trattamenti (Between) è scomponibile in una parte dovuta solo al primo trattamento (A), una dovuta solo al secondo trattamento (B) e una parte dovuta alla loro interazione (AxB) G. Rossi (Dip. Psicologia) Tsac 2017-18 26 / 54
Esempio concreto Var. dipendente: Errori ad un test Var. indipendenti: Alcool; Deprivazione di sonno EsempioAov2.sav Deprivazione sonno 4h 12h 24h Alcool 16 18 22 12 16 24 17 25 32 No Alc. 11 13 12 9 8 14 12 11 12 1 Questi dati possono essere considerati come un solo campione (media totale) 2 Ignorando la variabile alcool (quindi usando i 3 gruppi della deprivazione di sonno) 3 Ignorando la variabile deprivazione di sonno (quindi usando i 2 gruppi di alcool) 4 Considerando i 6 sottogruppi G. Rossi (Dip. Psicologia) Tsac 2017-18 27 / 54
Esempio concreto Var. dipendente: Errori ad un test Var. indipendenti: Alcool; Deprivazione di sonno EsempioAov2.sav Deprivazione sonno 4h 12h 24h Alcool 16 18 22 12 16 24 17 25 32 No Alc. 11 13 12 9 8 14 12 11 12 1 Questi dati possono essere considerati come un solo campione (media totale) 2 Ignorando la variabile alcool (quindi usando i 3 gruppi della deprivazione di sonno) 3 Ignorando la variabile deprivazione di sonno (quindi usando i 2 gruppi di alcool) 4 Considerando i 6 sottogruppi G. Rossi (Dip. Psicologia) Tsac 2017-18 27 / 54
Esempio concreto Var. dipendente: Errori ad un test Var. indipendenti: Alcool; Deprivazione di sonno EsempioAov2.sav Deprivazione sonno 4h 12h 24h Alcool 16 18 22 12 16 24 17 25 32 No Alc. 11 13 12 9 8 14 12 11 12 1 Questi dati possono essere considerati come un solo campione (media totale) 2 Ignorando la variabile alcool (quindi usando i 3 gruppi della deprivazione di sonno) 3 Ignorando la variabile deprivazione di sonno (quindi usando i 2 gruppi di alcool) 4 Considerando i 6 sottogruppi G. Rossi (Dip. Psicologia) Tsac 2017-18 27 / 54
Esempio concreto Var. dipendente: Errori ad un test Var. indipendenti: Alcool; Deprivazione di sonno EsempioAov2.sav Deprivazione sonno 4h 12h 24h Alcool 16 18 22 12 16 24 17 25 32 No Alc. 11 13 12 9 8 14 12 11 12 1 Questi dati possono essere considerati come un solo campione (media totale) 2 Ignorando la variabile alcool (quindi usando i 3 gruppi della deprivazione di sonno) 3 Ignorando la variabile deprivazione di sonno (quindi usando i 2 gruppi di alcool) 4 Considerando i 6 sottogruppi G. Rossi (Dip. Psicologia) Tsac 2017-18 27 / 54
Varianza totale (18 punteggi) Depriv. sonno 4h 12h 24h Quadrati Alcohol 16 18 22 256 324 484 12 16 24 144 256 576 17 25 32 289 625 1024 No Alc. 11 13 12 121 169 144 9 8 14 81 64 196 12 11 12 144 121 144 Somma 77 91 116 1035 1559 2568 ( x) 2 = (77 + 91 + 116) 2 = (284) 2 = 80656 X 2 = 1035 + 1559 + 2568 = 5162 SQ tot = 5162 80656/18 = 681.111 gdl = N 1 = 18 1 = 17 G. Rossi (Dip. Psicologia) Tsac 2017-18 28 / 54
Varianza dell errore (18 scarti dalle relative medie) Depriv. sonno 4h 12h 24h Quadrati Alcohol 1,000-1,667-4,000 1 2,778 16-3,000-3,667-2,000 9 13,444 4 2,000 5,333 6,000 4 28,444 36 No Alc. 0,333 2,333-0,667 0,111 5,444 0,444-1,667-2,667 1,333 2,778 7,111 1,778 1,333 0,333-0,667 1,778 0,111 0,444 Somma 0,000 0,000 0,000 18,667 57,333 58,667 ( x) 2 = (0 + 0 + 0) 2 = (0) 2 = 0 X 2 = 18, 667 + 57, 333 + 58, 667 = 134, 667 SQ tot = 134, 667 0/18 = 134, 667 gdl = N k A * k B = 18 3 * 2 = 12 G. Rossi (Dip. Psicologia) Tsac 2017-18 29 / 54
Varianza sonno (3 medie del fattore A) Depriv. sonno 4h 12h 24h Quadrati Alcohol 12,833 15,167 19,333 164,694 230,028 373,778 12,833 15,167 19,333 164,694 230,028 373,778 12,833 15,167 19,333 164,694 230,028 373,778 No Alc. 12,833 15,167 19,333 164,694 230,028 373,778 12,833 15,167 19,333 164,694 230,028 373,778 12,833 15,167 19,333 164,694 230,028 373,778 Somma 77 91 116 988,167 1380,167 2242,667 ( x) 2 = (77 + 91 + 116) 2 = (284) 2 = 80656 X 2 = 988, 167 + 1380, 167 + 2242, 667 = 4611 SQ A = 4611 80656/18 = 130.045 gdl = k A 1 = 3 1 = 2 G. Rossi (Dip. Psicologia) Tsac 2017-18 30 / 54
Varianza alcool (2 medie del fattore B) Depriv. sonno 4h 12h 24h Quadrati Alcohol 20,222 20,222 20,222 408,938 408,938 408,938 20,222 20,222 20,222 408,938 408,938 408,938 20,222 20,222 20,222 408,938 408,938 408,938 No Alc. 11,333 11,333 11,333 128,444 128,444 128,444 11,333 11,333 11,333 128,444 128,444 128,444 11,333 11,333 11,333 128,444 128,444 128,444 Somma 94,667 94,667 94,667 1612,148 1612,148 1612,148 ( x) 2 = (77 + 91 + 116) 2 = (284) 2 = 80656 X 2 = 1612, 148 + 1612, 148 + 1612, 148 = 4836, 444 SQ B = 4836, 444 80656/18 = 355.405 gdl = k B 1 = 2 1 = 1 G. Rossi (Dip. Psicologia) Tsac 2017-18 31 / 54
Varianza interazione (fattore AxB) Deprivazione sonno 4h 12h 24h Alcohol 15,00 19,67 26,00 20,22 No Alc. 10,67 10,67 12,67 11,33 Il calcolo dei punteggi necessari per calcolare la varianza dell interazione sono un poco più complessi Si parte dalle medie dei singoli gruppi a cui si sottrae la media di una delle variabili categoriali (A o B): 15 20.222 = 5.222 e 10.667 11.333 = 0.666 si calcola la media di colonna: (3 * ( 5.222) + 3 * ( 0.666))/6 = 2.944 che si sottrae ai singoli valori di quella colonna: 5.222 ( 2.944) = 2.278 e 0.666 ( 2.944) = 2.278 G. Rossi (Dip. Psicologia) Tsac 2017-18 32 / 54
Varianza interazione (fattore AxB) Deprivazione sonno 4h 12h 24h Alcohol 15,00 19,67 26,00 20,22 No Alc. 10,67 10,67 12,67 11,33 Il calcolo dei punteggi necessari per calcolare la varianza dell interazione sono un poco più complessi Si parte dalle medie dei singoli gruppi a cui si sottrae la media di una delle variabili categoriali (A o B): 15 20.222 = 5.222 e 10.667 11.333 = 0.666 si calcola la media di colonna: (3 * ( 5.222) + 3 * ( 0.666))/6 = 2.944 che si sottrae ai singoli valori di quella colonna: 5.222 ( 2.944) = 2.278 e 0.666 ( 2.944) = 2.278 G. Rossi (Dip. Psicologia) Tsac 2017-18 32 / 54
Varianza interazione (fattore AxB) Deprivazione sonno 4h 12h 24h Alcohol 15,00 19,67 26,00 20,22 No Alc. 10,67 10,67 12,67 11,33 Il calcolo dei punteggi necessari per calcolare la varianza dell interazione sono un poco più complessi Si parte dalle medie dei singoli gruppi a cui si sottrae la media di una delle variabili categoriali (A o B): 15 20.222 = 5.222 e 10.667 11.333 = 0.666 si calcola la media di colonna: (3 * ( 5.222) + 3 * ( 0.666))/6 = 2.944 che si sottrae ai singoli valori di quella colonna: 5.222 ( 2.944) = 2.278 e 0.666 ( 2.944) = 2.278 G. Rossi (Dip. Psicologia) Tsac 2017-18 32 / 54
Varianza interazione (fattore AxB) Deprivazione sonno 4h 12h 24h Alcohol 15,00 19,67 26,00 20,22 No Alc. 10,67 10,67 12,67 11,33 Il calcolo dei punteggi necessari per calcolare la varianza dell interazione sono un poco più complessi Si parte dalle medie dei singoli gruppi a cui si sottrae la media di una delle variabili categoriali (A o B): 15 20.222 = 5.222 e 10.667 11.333 = 0.666 si calcola la media di colonna: (3 * ( 5.222) + 3 * ( 0.666))/6 = 2.944 che si sottrae ai singoli valori di quella colonna: 5.222 ( 2.944) = 2.278 e 0.666 ( 2.944) = 2.278 G. Rossi (Dip. Psicologia) Tsac 2017-18 32 / 54
Varianza interazione (6 medie del fattore AxB) Depriv. sonno 4h 12h 24h Quadrati Alcohol -2,278 0,056 2,222 5,188 0,003 4,938-2,278 0,056 2,222 5,188 0,003 4,938-2,278 0,056 2,222 5,188 0,003 4,938 No Alc. 2,278-0,056-2,222 5,188 0,003 4,938 2,278-0,056-2,222 5,188 0,003 4,938 2,278-0,056-2,222 5,188 0,003 4,938 Somma 0 0 0 31,130 0,019 29,630 ( x) 2 = (0 + 0 + 0) 2 = (0) 2 = 0 X 2 = 31, 130 + 0, 019 + 29, 630 = 60.778 SQ AxB = 60.778 0/18 = 60.778 gdl = (k A 1)(k B 1) = 2x1 = 2 G. Rossi (Dip. Psicologia) Tsac 2017-18 33 / 54
Riepilogo: calcolato e SPSS Sorgente SQ gdl MQ F Effetti principali Sonno 130,111 2 65,056 5,80 Alcohol 355,556 1 355,556 31,68 Interazioni SxA 60,778 2 30,389 2,71 Errore 134,667 12 11,222 Totale 681,111 17 40,065 Test degli effetti fra soggetti Variabile dipendente: errori Sorgente SQ df MQ F Sig. Modello corretto 546,444 (a) 5 109,289 9,739 0,001 Intercetta 4.480,889 1 4.480,889 399,287 0,000 alcool 355,556 1 355,556 31,683 0,000 sonno 130,111 2 65,056 5,797 0,017 alcool * sonno 60,778 2 30,389 2,708 0,107 Errore 134,667 12 11,222 Totale 5.162,000 18 Totale corretto 681,111 17 (a). R quadrato =,802 (R quadrato corretto =,720) G. Rossi (Dip. Psicologia) Tsac 2017-18 34 / 54
Per capire i risultati Per capire e interpretare i risultati dobbiamo guardare le medie (marginali stimate) degli effetti significativi (con soli fattori between, coincidono con quelle calcolate, salvo missing) Variabile dipendente: errori alcool Media Errore std. Intervallo di confidenza 95% Limite inferiore Limite superiore Alcool 20,222 1,117 17,789 22,655 No alcool 11,333 1,117 8,900 13,766 sonno Media Errore std. Intervallo di confidenza 95% Limite inferiore Limite superiore 4h 12,833 1,368 9,854 15,813 12h 15,167 1,368 12,187 18,146 24h 19,333 1,368 16,354 22,313 G. Rossi (Dip. Psicologia) Tsac 2017-18 35 / 54
In Spss: univariata 2 fattori Analizza Modello lineare generalizzato Univariata... Inserite la variabile da studiare in Variabile dipendente Inserite le variabili categoriali in Fattori fissi Scegliete i contrasti o post-hoc se li volete Nel pulsante Opzioni, selezionare le Medie marginali stimate (se volete) Date l OK G. Rossi (Dip. Psicologia) Tsac 2017-18 36 / 54
Possibili esempi di interazione ipotizzando 2 INDIP (3x2) e unendo i valori medi di una indipendente suddivisi e separatamente per l altra, otteniamo due linee La forma di interazione più comune è quando le linee si incrociano (fig 1 e 2) Ma anche quando in corrispondenza di un valore c è una differenza particolarmente diversa (fig 3) G. Rossi (Dip. Psicologia) Tsac 2017-18 37 / 54
Anova 1 fattore: Opzioni Si possono chiedere le descrittive (medie, dev.st.) e 3 test di omogeneità della varianza Se il primo è significativo, si può chiedere una versione corretta di F si può chiedere la rappresentazione grafica delle medie G. Rossi (Dip. Psicologia) Tsac 2017-18 38 / 54
Anova 1 fattore: Opzioni G. Rossi (Dip. Psicologia) Tsac 2017-18 39 / 54
Univariata: Opzioni G. Rossi (Dip. Psicologia) Tsac 2017-18 40 / 54
Confronti post-hoc Sono confronti che si fanno a posteriori, se l Anova è significativa e se ci sono più di 2 gruppi in una variabile indipendente La logica è quella di tenere sotto controllo i problemi di significatività legati ai confronti multipli. In Spss, premete il bottone Post Hoc... e selezionate tutti i test che volete gli output sono di due tipi: confronti multipli completi oppure gruppi omogenei Vi sono diverse procedure che effettuano confronti post-hoc G. Rossi (Dip. Psicologia) Tsac 2017-18 41 / 54
Anova 1 fattore: Post-hoc G. Rossi (Dip. Psicologia) Tsac 2017-18 42 / 54
Confronti post-hoc: confronti multipli Usando il file EsempioAov1.sav G. Rossi (Dip. Psicologia) Tsac 2017-18 43 / 54
Confronti post-hoc: confronti multipli HSD di Tukey - Variabile dipendente: ABA Differenza Intervallo di fra medie Err. std. Sig. confidenza 95% Lim. sup. Lim. inf. SX Cent. 2,796 2,2137 0,4168-2,409 8,002 Dx 7,859 2,7597 0,0128 1,369 14,349 Centro SX -2,796 2,2137 0,4168-8,002 2,409 Dx 5,063 2,6940 0,1459-1,273 11,398 Dx SX -7,859 2,7597 0,0128-14,349-1,369 Cent. -5,063 2,6940 0,1459-11,398 1,273 Viene fornita la differenza delle medie (ma non le medie), la sig. e l intervallo di confidenza (se include 0, non significativo) Ogni gruppo viene confrontato con tutti gli altri Non è significativa: le medie dei 2 gruppi sono simili È significativa: le medie dei 2 gruppi sono diverse G. Rossi (Dip. Psicologia) Tsac 2017-18 44 / 54
Confronti post-hoc: confronti multipli HSD di Tukey - Variabile dipendente: ABA Differenza Intervallo di fra medie Err. std. Sig. confidenza 95% Lim. sup. Lim. inf. SX Cent. 2,796 2,2137 0,4168-2,409 8,002 Dx 7,859 2,7597 0,0128 1,369 14,349 Centro SX -2,796 2,2137 0,4168-8,002 2,409 Dx 5,063 2,6940 0,1459-1,273 11,398 Dx SX -7,859 2,7597 0,0128-14,349-1,369 Cent. -5,063 2,6940 0,1459-11,398 1,273 Viene fornita la differenza delle medie (ma non le medie), la sig. e l intervallo di confidenza (se include 0, non significativo) Ogni gruppo viene confrontato con tutti gli altri Non è significativa: le medie dei 2 gruppi sono simili È significativa: le medie dei 2 gruppi sono diverse G. Rossi (Dip. Psicologia) Tsac 2017-18 44 / 54
Confronti post-hoc: confronti multipli HSD di Tukey - Variabile dipendente: ABA Differenza Intervallo di fra medie Err. std. Sig. confidenza 95% Lim. sup. Lim. inf. SX Cent. 2,796 2,2137 0,4168-2,409 8,002 Dx 7,859 2,7597 0,0128 1,369 14,349 Centro SX -2,796 2,2137 0,4168-8,002 2,409 Dx 5,063 2,6940 0,1459-1,273 11,398 Dx SX -7,859 2,7597 0,0128-14,349-1,369 Cent. -5,063 2,6940 0,1459-11,398 1,273 Viene fornita la differenza delle medie (ma non le medie), la sig. e l intervallo di confidenza (se include 0, non significativo) Ogni gruppo viene confrontato con tutti gli altri Non è significativa: le medie dei 2 gruppi sono simili È significativa: le medie dei 2 gruppi sono diverse G. Rossi (Dip. Psicologia) Tsac 2017-18 44 / 54
Confronti post-hoc: gruppi omogenei Usando il file EsempioAov1.sav ogni colonna numerata riporta le medie dei i gruppi omogenei fra loro in questo esempio, 2 e 3 sono omogenei fra loro in fondo alle colonne numerate compare la probabilità rispetto ad H 0 ovvero se dico che i gruppi indicati non sono omogenei, corro il rischio di sbagliare indicato G. Rossi (Dip. Psicologia) Tsac 2017-18 45 / 54
Confronti post-hoc: gruppi omogenei HSD di Tukey trepol N Sottoinsieme per alfa =.05 2 1 Dx 87 33,580 Centro 191 38,643 38,643 SX 165 41,439 Sig. 0,120 0,521 Sono visualizzate le medie per i gruppi di sottoinsiemi omogenei. Le medie di Centro e DX sono omogenee fra loro (si assomigliano) e la sig. di questa scelta è 12% Le medie di Centro e SX sono omogenee fra loro (si assomigliano) e la sig. di questa scelta è 52,1% Le medie di DX e SX non sono omogenee fra loro (vengono da due popolazioni diverse) G. Rossi (Dip. Psicologia) Tsac 2017-18 46 / 54
Confronti post-hoc: gruppi omogenei HSD di Tukey trepol N Sottoinsieme per alfa =.05 2 1 Dx 87 33,580 Centro 191 38,643 38,643 SX 165 41,439 Sig. 0,120 0,521 Sono visualizzate le medie per i gruppi di sottoinsiemi omogenei. Le medie di Centro e DX sono omogenee fra loro (si assomigliano) e la sig. di questa scelta è 12% Le medie di Centro e SX sono omogenee fra loro (si assomigliano) e la sig. di questa scelta è 52,1% Le medie di DX e SX non sono omogenee fra loro (vengono da due popolazioni diverse) G. Rossi (Dip. Psicologia) Tsac 2017-18 46 / 54
Confronti post-hoc: gruppi omogenei HSD di Tukey trepol N Sottoinsieme per alfa =.05 2 1 Dx 87 33,580 Centro 191 38,643 38,643 SX 165 41,439 Sig. 0,120 0,521 Sono visualizzate le medie per i gruppi di sottoinsiemi omogenei. Le medie di Centro e DX sono omogenee fra loro (si assomigliano) e la sig. di questa scelta è 12% Le medie di Centro e SX sono omogenee fra loro (si assomigliano) e la sig. di questa scelta è 52,1% Le medie di DX e SX non sono omogenee fra loro (vengono da due popolazioni diverse) G. Rossi (Dip. Psicologia) Tsac 2017-18 46 / 54
Univariata: Post hoc Con + VI, bisogna prima indicare la variabile da usare Non ha senso indicare una VI con 2 sole categorie G. Rossi (Dip. Psicologia) Tsac 2017-18 47 / 54
Confronti post-hoc: metodi alcuni presumono che le varianze fra i gruppi siano uguali: LSD (Least Significant Difference), Bonferroni, Sidak, Scheffé, SNK (Studentized-Neumann-Kouls), Tukey HSD (Honesty Significant Difference), Duncan, Hochberg, Gabriel, Waller-Duncan, Dunnett altre no: Tamhane, Dunnett, Games-Howell, C di Dunnett richiedono che le N dei gruppi siano = o di poco : LSD, HSD, F-H (LSD modificata), REGWQ (Ryan, Einot, riel e Welsch Q), Gabriel accettano gruppi con N : Hoch GT2, Games-Howell, Gabriel, Tamhane T2, Dunnett T3, Dunnett C N piccoli: Games-Howell è molto potente ed accurato Meglio con solo 3 gruppi: LSD Meglio 4 o più gruppi: HSD, F-H, Bonferroni, Tukey, REGWQ Tukey è conservativo, quindi adatto a molti confronti G. Rossi (Dip. Psicologia) Tsac 2017-18 48 / 54
Confronti post-hoc Bonferroni è adatto alle ricerche esplorative, è molto potente con poche medie da confrontare REGWD è quello che viene suggerito perché è potente e tiene sotto controllo l errore di tipo I meglio di tutti gli altri (però richiede ampiezze uguali) Per concludere gruppi con stessa numerosità e varianza uguale: REGWD o Tukey (potenti e controllo Tipo I); Bonferrori per pochi confronti ampiezze leggermente diverse: Gabriel (molto potente) ampiezze molto diverse: Hoch GT2 se ci sono dubbi sull omogeneità delle varianze: Games-Howell Field(2003) suggerisce di usare sempre Games-Howell in aggiunta G. Rossi (Dip. Psicologia) Tsac 2017-18 49 / 54
Confronti a priori Oltre ai post hoc si possono effettuare dei confronti a priori ovvero decisi prima ancora di effettuare l anova, sulla base di una teoria Questi confronti si chiamano anche contrasti perché contrastano la media di uno o più gruppi con quella di altri Anche in questo caso ci sono due possibilità: contrasti predefiniti: lineare, quadratico, Helmert... contrasti decisi da noi, tramite t-test Ovviamente, si usano quando si ha una teoria di partenza I post-hoc si usano quando invece non c è una teoria di partenza È possibile quindi che dopo i post-hoc si decisa di usare i confronti G. Rossi (Dip. Psicologia) Tsac 2017-18 50 / 54
Confronti a priori Contrasti... In Spss, premete il bottone se selezionate Polinomiale, poi potete scegliere fra Lineare: ipotizzo che le medie aumentano o diminuiscono nelle varie categorie in modo lineare Quadratico: in forma di U o U rovesciata (1 punto di cambiamento della direzione) Cubico: 2 punti di cambiamento della direzione altrimenti dovrete inserire dei coefficienti (uno alla volta e poi premere Aggiungi ). Dovete inserire tanti coefficienti quanti sono i gruppi previsti dalla variabile indipendente la somma dei coefficienti dev essere 0. dopo aver inserito un contrasto è possibile inserirne un secondo tramite il pulsante Successivo G. Rossi (Dip. Psicologia) Tsac 2017-18 51 / 54
Confronti a priori: contrasti a scelta Vengono contrastati (confronti) i gruppi che hanno lo stesso peso I pesi vanno inseriti nell ordine dei gruppi da contrastare Uno alla volta, poi Aggiungi La somma dei pesi dev essere 0 (zero) Non è necessario che vengano usati tutti i gruppi. Usando Avanti possiamo inserire altri contrasti G. Rossi (Dip. Psicologia) Tsac 2017-18 52 / 54
Confronti a priori: contrasti a scelta Se ho 4 gruppi, i coefficienti -1 0.5.5 (oppure -2 0 1 1) confrontano il primo con la somma del terzo e quarto, ignorando il secondo Si devono confrontare sempre e soltanto 2 raggruppamenti. 1 confronto fra SX e DX Contrasto trepol SX Centro Dx 1 1 0-1 Risultato di Test di contrasto Contrasto Valore di Sig. contrasto Err. std. t df (2-code) Assumi var. = 2,775 0,621 4,472 413 0,000 Assumi var. 2,775 0,683 4,064 130,333 0,000 G. Rossi (Dip. Psicologia) Tsac 2017-18 53 / 54
Confronti a priori: Lineare Stenner ANOVA univariata Somma dei Media dei quadrati df quadrati F Sig. Fra gruppi Combinato 433,245 2 216,622 10,684 0,000 Termine Non pesato 405,482 1 405,482 19,998 0,000 lineare Pesato 432,589 1 432,589 21,335 0,000 Deviazione 0,656 1 0,656 0,032 0,857 Entro gruppi 8.373,964 413 20,276 Totale 8.807,209 415 G. Rossi (Dip. Psicologia) Tsac 2017-18 54 / 54