Tecniche statistiche di analisi del cambiamento

Documenti analoghi
Tecniche statistiche di analisi del cambiamento

Elementi di Psicometria con Laboratorio di SPSS 1

Tecniche statistiche di analisi del cambiamento

Analisi della varianza

Argomenti della lezione:

L analisi della Varianza (ANOVA): i disegni fattoriali tra i soggetti

Analisi della varianza

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Analisi della Varianza - II

Elementi di Psicometria con Laboratorio di SPSS 1

Analisi della varianza

Elementi di Psicometria con Laboratorio di SPSS 1

Esercizi di statistica

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1

Tecniche statistiche di analisi del cambiamento

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

ESERCIZIO 1. Di seguito vengono riportati i risultati di un modello fattoriale di analisi della varianza con 3 fattori tra i soggetti.

Test F per la significatività del modello

Casa dello Studente. Casa dello Studente

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Strumenti di indagine per la valutazione psicologica

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1

Regressione lineare semplice

Inferenza statistica Donata Rodi 04/10/2016

Elementi di Psicometria

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

Dispensa di Statistica

Confronto tra due popolazioni Lezione 6

Statistica economica

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Statistica multivariata Donata Rodi 08/11/2016

Analisi della varianza a una via

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Analisi della Varianza - II

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

ANALISI DELLA VARIANZA A DUE VIE CON INTERAZIONE Prof. Antonio Lanzotti

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Elementi di Psicometria con Laboratorio di SPSS 1

Strumenti informatici Realizzare l analisi della varianza con Excel e SPSS

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Modelli Log-lineari Bivariati

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017

Statistica Applicata all edilizia: il modello di regressione

Elementi di Psicometria con Laboratorio di SPSS 1

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Analisi della regressione multipla

Strumenti informatici Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS

ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti

Contrasti e confronti multipli

Elementi di Psicometria con Laboratorio di SPSS 1

Cognome e Nome:... Matricola e corso di laurea:...

Tecniche statistiche di analisi del cambiamento

Contenuti: Capitolo 14 del libro di testo

Analisi della Varianza Fattoriale

Ulteriori Conoscenze di Informatica e Statistica

Corso di Psicometria Progredito

Elementi di Psicometria con Laboratorio di SPSS 1

Esercitazione del

Introduzione all Analisi della Varianza (ANOVA)

Quanti soggetti devono essere selezionati?

Elementi di Psicometria

Esercizi di Probabilità e Statistica

Corso di Psicometria Progredito

Test delle Ipotesi Parte I

STATISTICA A K (60 ore)

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Note sulla probabilità

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

LEZIONI DI STATISTICA MEDICA

Proprietà della varianza

Tecniche statistiche di analisi del cambiamento

Ulteriori conoscenze di informatica Elementi di statistica Esercitazione3

Cognome e Nome:... Corso di laurea:...

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II

Premessa: la dipendenza in media

Test per una media - varianza nota

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

VARIETÀ. zona geografica A B C D

Fasi del modello di regressione

Regressione Lineare Semplice e Correlazione

STATISTICA ESERCITAZIONE 13

Analisi della varianza

Transcript:

Tecniche statistiche di analisi del cambiamento 06-Anova per fattori indipendenti (vers. 1.2, 8 novembre 2017) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2017-18 G. Rossi (Dip. Psicologia) Tsac 2017-18 1 / 54

Analisi della varianza Analysis of variance (Anova, AOV) è una tecnica statistica che confronta due o più gruppi fra di loro È un estensione del t-test che si usa quando si hanno più di 2 gruppi La variabile dipendente dev essere quantitativa Le variabili indipendenti devono essere qualitative G. Rossi (Dip. Psicologia) Tsac 2017-18 2 / 54

Analisi della varianza Disegni a 1 via: quando c è una sola variabile indipendente (anova univariata) Disegni fattoriali: con 2 o più variabili indipendenti (anova multivariata) Disegni tra i soggetti (between subjects): quando, rispetto ad una VI, i soggetti sono misurati una sola volta (ad es. ansia misurata fra maschi e femmine) Disegni entro i soggetti (within subjects): quando, rispetto ad una VI, i soggetti sono misurati più di una volta (ad es. ansia prima e dopo un esame) G. Rossi (Dip. Psicologia) Tsac 2017-18 3 / 54

Esempio empirico In un campione di persone abbiamo misurato l autoritarismo (variabile Y) usando la scala di Karen Stenner (5 item sulle cose importanti da insegnare ad un bambino, maggiore il punteggio, maggiore l autoritarismo) e l orientamento politico (su una scala da 1 a 10, da sinistra a destra) Raccogliamo i 10 punteggi dell orientamento politico in 3 categorie (variabile X): 1-3 => SX, 4-7 => Centro, 8-10 => DX L autoritarismo è uguale nei tre gruppi? Oppure ogni sottocampione (in base all orientamento politico) ha parametri della popolazione diversi? Se usassimo il t-test (differenza delle medie, dovremmo fare 3 confronti a coppie: SX vs. Centro, SX vs. DX, Centro vs. DX) Usiamo l analisi della varianza G. Rossi (Dip. Psicologia) Tsac 2017-18 4 / 54

Esempio empirico Stenner N Media Dev. std. Err. std. Minimo Massimo SX 154 13,16 4,159 0,335 5 25 Centro 182 14,63 4,391 0,326 5 27 Dx 80 15,94 5,321 0,595 5 30 Totale 416 14,34 4,607 0,226 5 30 ANOVA univariata Somma Media quadrati df quadrati F Sig. Fra gruppi 433,245 2 216,622 10,68 0,000 Entro gruppi 8373,964 413 20,276 Totale 8807,209 415 C è almeno un gruppo che ha una media statisticamente diversa da quelle degli altri (cioè è stato estratto da una popolazione con parametri diversi) G. Rossi (Dip. Psicologia) Tsac 2017-18 5 / 54

Esempio empirico Quale? Usiamo i confronti a posteriori Test post hoc - Sottoinsiemi omogenei Stenner Student-Newman-Keuls N Sottoinsieme per alfa =.05 1 2 3 SX 154 13,1623 Centro 182 14,6319 Dx 80 15,9375 Sig. 1,000 1,000 1,000 Le tre medie sono tutte diverse fra di loro, ovvero i campioni su cui sono state calcolate sono stati estratti da popolazioni con parametri statistici diversi G. Rossi (Dip. Psicologia) Tsac 2017-18 6 / 54

Esempio empirico G. Rossi (Dip. Psicologia) Tsac 2017-18 7 / 54

La logica dell anova Possiamo pensare all autoritarismo (Y) come ad una variabile casuale il cui valore atteso è la sua media E(Y ) = μ y Tuttavia l orientamento politico (X) può influenzare l autoritarismo aggiungendo un certo valore Y sx = μ y + μ sx Y dx = μ y + μ dx e infine si aggiunge un possibile errore casuale (ε) che dipende da ogni singolo soggetto G. Rossi (Dip. Psicologia) Tsac 2017-18 8 / 54

La logica dell anova quindi il punteggio di ogni soggetto i appartenente al gruppo politico j è y ij = μ + α i + ε ij cioè dipende dalla media della variabile nella popolazione ^μ = y da un fattore di correzione dovuto all influenza della variabile indipendente (fattore del trattamento) ^α 1 = (^y i. ^y.. ) e ad un errore dovuto al caso statistico (fattore di correzione) ^ε ij = (y ij ^y i. ) G. Rossi (Dip. Psicologia) Tsac 2017-18 9 / 54

La logica dell anova per l Anova assumiamo (fra l altro) che 1 normalità: la variabile dipendente (autoritarismo) sia quantitativa e che si distribuisca normalmente 2 omogeneità della varianza: i diversi campioni (in base alla v. indipendente) siano estratti dalla stessa popolazione e abbiano quindi varianza uguale fra loro e con quella della popolazione e quindi σ 2 1 = σ 2 2 = = σ 2 k σ 2 1 = s 2 1 3 indipendenza dei soggetti: le osservazioni siano fra loro indipendenti e quindi le differenze individuali siano casuali G. Rossi (Dip. Psicologia) Tsac 2017-18 10 / 54

La logica dell anova Ipotizziamo che tutti i gruppi abbiano la stessa media H 0 : μ 1 = μ 2 L ipotesi alternativa sarà che almeno un gruppo ha media diversa dagli altri H 1 : μ i μ j per semplicità usiamo campioni di uguale numerosità G. Rossi (Dip. Psicologia) Tsac 2017-18 11 / 54

Una logica alternativa Between Totale Within trattamento punteggio errore Seguendo un altro ragionamento, possiamo considerare il punteggio Y di un soggetto come formato da un punteggio vero (dovuto al trattamento) e da una componente d errore (dovuta ai singoli soggetti) Noi conosciamo solo il valore misurato (Y ) e la sua varianza totale L anova ipotizza che il punteggio vero sia uguale alla media dei singoli campioni (Ȳ ) e che l errore sia Y Ȳ F è calcolato con la varianza del punteggio vero divisa la varianza dell errore G. Rossi (Dip. Psicologia) Tsac 2017-18 12 / 54

La logica dell anova Se sono veri i primi due assunti, i gruppi formati dall indipendente sono uguali, hanno la stessa forma e la stessa varianza Se hanno la stessa varianza, possiamo calcolare la stima della varianza della popolazione come media delle varianze dei singoli campioni ^σ 2 1 = s2 1 ^σ2 e = s 2 i k = n i=1 k j=1 (y ij ȳ i. ) 2 k(n 1) con y ij = il punteggio di un individuo in un certo gruppo, ȳ i. = la media di quel gruppo, n=l ampiezza del singolo gruppo e k=numero dei gruppi G. Rossi (Dip. Psicologia) Tsac 2017-18 13 / 54

La logica dell anova Se H 0 è vera, allora la varianza della popolazione è stimabile anche tramite la distribuzione campionaria delle medie σ 2 Ȳ = σ2 n Le medie dei singoli gruppi sono utilizzate per stimare la varianza, quindi con ^σ t 2 = n^σ ȳ 2 = n k j=1 (ȳ i. ȳ.. ) 2 k 1 dove n è l ampiezza, ȳ i. è la media calcolata su ogni gruppo e ȳ.. è la media delle medie G. Rossi (Dip. Psicologia) Tsac 2017-18 14 / 54

La logica dell anova La varianza totale (y ij ȳ) considera tutti i casi statistici come un solo gruppo e viene quindi scomposta in due diverse stime della varianza della popolazione y ij ȳ i. : La prima è calcolata entro i gruppi (chiamata anche within o varianza d errore = MS e ) perché si basa sulle differenze individuali rispetto alla media dei singoli gruppi ȳ i ȳ.. : La seconda fra i gruppi (chiamata anche between o varianza di trattamento = MS t ) perché considera uguali gli individui di un gruppo e imputa le differenze al trattamento (la variabile categoriale usata per suddividere il campione in gruppi) G. Rossi (Dip. Psicologia) Tsac 2017-18 15 / 54

La logica dell anova il loro rapporto si distribuisce secondo la curva di probabilità di F F = MS t MS e con k 1 e k(n 1) gradi di libertà Se il rapporto è piccolo (e non significativo) le due stime sono uguali e quindi non vi è differenza fra i gruppi Se il rapporto è grande (e significativo), le due stime sono diverse e vi è differenza fra i gruppi G. Rossi (Dip. Psicologia) Tsac 2017-18 16 / 54

Esempio di calcolo della varianza Gruppo (X X) 2 X 2 ( X) 2 1 9 0,4444444 81 12 5,4444444 144 8 2,7777778 64 29 8,6666667 289 841 X = 29 /3 = 9, 667 29 2 = 841 289 841 /3 3 1 Per i calcoli ricordiamo che (Xi var = X) 2 x 2 ( x) 2 N = = N 1 N 1 X 2 ( X) 2 /N N 1 e che il numeratore si chiama anche somma dei quadrati, il denominatore può essere pensato come un gdl G. Rossi (Dip. Psicologia) Tsac 2017-18 17 / 54

Esempio di calcolo: fase 1-var. totale EsempioAov1.sav Gruppo 1 Gruppo 2 Gruppo 3 Quadrati 9 4 3 81 16 9 12 2 6 144 4 36 8 5 3 64 25 9 29 11 12 289 45 54 M 9,667 3,667 4,000 ( X ij ) 2 = (29 + 11 + 12) 2 = 2704 X 2 ij = 289 + 45 + 54 = 388 SS tot = X 2 ij ( X ij ) 2 /N = 388 2704/9 = 87.556 gdl = N 1 = 8 MS tot = var(x) = SS tot /gdl = 10.944 G. Rossi (Dip. Psicologia) Tsac 2017-18 18 / 54

Esempio di calcolo: fase 1-var. totale EsempioAov1.sav Gruppo 1 Gruppo 2 Gruppo 3 Quadrati 9 4 3 81 16 9 12 2 6 144 4 36 8 5 3 64 25 9 29 11 12 289 45 54 M 9,667 3,667 4,000 ( X ij ) 2 = (29 + 11 + 12) 2 = 2704 X 2 ij = 289 + 45 + 54 = 388 SS tot = X 2 ij ( X ij ) 2 /N = 388 2704/9 = 87.556 gdl = N 1 = 8 MS tot = var(x) = SS tot /gdl = 10.944 G. Rossi (Dip. Psicologia) Tsac 2017-18 18 / 54

Esempio di calcolo: fase 1-var. totale EsempioAov1.sav Gruppo 1 Gruppo 2 Gruppo 3 Quadrati 9 4 3 81 16 9 12 2 6 144 4 36 8 5 3 64 25 9 29 11 12 289 45 54 M 9,667 3,667 4,000 ( X ij ) 2 = (29 + 11 + 12) 2 = 2704 X 2 ij = 289 + 45 + 54 = 388 SS tot = X 2 ij ( X ij ) 2 /N = 388 2704/9 = 87.556 gdl = N 1 = 8 MS tot = var(x) = SS tot /gdl = 10.944 G. Rossi (Dip. Psicologia) Tsac 2017-18 18 / 54

Esempio di calcolo: fase 2-var. fra i gruppi Sostituisco i valori con le medie dei gruppi Gruppo 1 Gruppo 2 Gruppo 3 Quadrati 9,667 3,667 4,000 93,451 13,447 16,000 9,667 3,667 4,000 93,451 13,447 16,000 9,667 3,667 4,000 93,451 13,447 16,000 29,000 11,000 12,000 280,353 40,341 48,000 ( x) 2 = (29 + 11 + 12) 2 = 2704 x 2 = 280, 353 + 40, 341 + 48 = 368.694 SS t = x 2 ( x) 2 /N = 368.694 2704/9 = 68.25 gdl = k 1 = 2 MS t = SS t /gdl = 34.125 G. Rossi (Dip. Psicologia) Tsac 2017-18 19 / 54

Esempio di calcolo: fase 3-var. entro i gruppi Sostituisco i valori con gli scarti dalla media: X i X Gruppo 1 Gruppo 2 Gruppo 3 Quadrati -0,667 0,333-1,000 0,444 0,111 1,000 2,333-1,667 2,000 5,444 2,778 4,000-1,667 1,333-1,000 2,778 1,778 1,000 0,000 0,000 0,000 8,667 4,667 6,000 ( x) 2 = (0 + 0 + 0) 2 = 0 x 2 = 8, 667 + 4, 667 + 6 = 19.334 SS e = x 2 ( x) 2 /N = 19.334 0/9 = 19.334 gdl = k(n 1) = 6 MS e = SS e /gdl = 3.222 G. Rossi (Dip. Psicologia) Tsac 2017-18 20 / 54

Esempio di calcolo: fase finale Risultati da calcoli a mano SS gl MS F Sig Trattamento 68,222 2 34,111 10,586 Errore 19,334 6 3,222 Totale 87,556 8 10,944 Risultati da SPSS Somma dei Media dei quadrati gl quadrati F Sig. Fra gruppi 68,222 2 34,111 10,586 0,011 Entro gruppi 19,333 6 3,222 Totale 87,556 8 G. Rossi (Dip. Psicologia) Tsac 2017-18 21 / 54

Formule di calcolo SQ (SS) df MQ (MS) Somme gdl Media F Fonte quadrati quadrati Trattamento Errore Totale ( X.j X.. ) 2 k 1 SQ t /gl MQ t /MQ e (Xij X.j ) 2 k(n 1) SQ e /gl (X ij X.. ) 2 N 1 ij G. Rossi (Dip. Psicologia) Tsac 2017-18 22 / 54

In SPSS: univariata 1 fattore Analizza Confronta medie ANOVA univariata... trascinate almeno una variabile quantitativa (Intervallo o a rapporto) nel riquadro Variabili dipendenti se indicate più dipendenti, verrà calcolata una Anova per ogni variabile indicata trascinate una variabile qualitativa (Nominale o Ordinale) nel riquadro Fattore: Date l OK G. Rossi (Dip. Psicologia) Tsac 2017-18 23 / 54

In SPSS: univariata, Risultati Usando il file EsempioAov1.sav G. Rossi (Dip. Psicologia) Tsac 2017-18 24 / 54

Analisi della varianza 2-fattori between L analisi della varianza si può usare anche con più variabili indipendenti categoriali Ipotizzando due variabili indipendenti (ad es. genere e fasce d età), il modello generale dell anova diventerà X = μ + α + β + φ + ε ovvero il punteggio X è scomponibile come: una parte dovuta alla variabile dipendente (μ = X... ) G. Rossi (Dip. Psicologia) Tsac 2017-18 25 / 54

Analisi della varianza 2-fattori between L analisi della varianza si può usare anche con più variabili indipendenti categoriali Ipotizzando due variabili indipendenti (ad es. genere e fasce d età), il modello generale dell anova diventerà X = μ + α + β + φ + ε ovvero il punteggio X è scomponibile come: una parte dovuta alla variabile dipendente (μ = X... ) una parte dovuta alla prima indipendente (α = ( X i.. X... )) G. Rossi (Dip. Psicologia) Tsac 2017-18 25 / 54

Analisi della varianza 2-fattori between L analisi della varianza si può usare anche con più variabili indipendenti categoriali Ipotizzando due variabili indipendenti (ad es. genere e fasce d età), il modello generale dell anova diventerà X = μ + α + β + φ + ε ovvero il punteggio X è scomponibile come: una parte dovuta alla variabile dipendente (μ = X... ) una parte dovuta alla prima indipendente (α = ( X i.. X... )) una alla seconda indipendente (β = ( X.j. X... )) G. Rossi (Dip. Psicologia) Tsac 2017-18 25 / 54

Analisi della varianza 2-fattori between L analisi della varianza si può usare anche con più variabili indipendenti categoriali Ipotizzando due variabili indipendenti (ad es. genere e fasce d età), il modello generale dell anova diventerà X = μ + α + β + φ + ε ovvero il punteggio X è scomponibile come: una parte dovuta alla variabile dipendente (μ = X... ) una parte dovuta alla prima indipendente (α = ( X i.. X... )) una alla seconda indipendente (β = ( X.j. X... )) una alla loro interazione (φ = μ ij μ (α + β)) G. Rossi (Dip. Psicologia) Tsac 2017-18 25 / 54

Analisi della varianza 2-fattori between L analisi della varianza si può usare anche con più variabili indipendenti categoriali Ipotizzando due variabili indipendenti (ad es. genere e fasce d età), il modello generale dell anova diventerà X = μ + α + β + φ + ε ovvero il punteggio X è scomponibile come: una parte dovuta alla variabile dipendente (μ = X... ) una parte dovuta alla prima indipendente (α = ( X i.. X... )) una alla seconda indipendente (β = ( X.j. X... )) una alla loro interazione (φ = μ ij μ (α + β)) e alle differenze individuali (o errori ε = ( X ijk X ij. )) G. Rossi (Dip. Psicologia) Tsac 2017-18 25 / 54

Scomposizione della varianza Totale Within (Errore) Between (Trattamento) A B AxB La varianza totale è quindi scomponibile in una parte dovuta alle differenze individuali (within=errore) e una parte dovuta ai trattamenti (che in questo caso sono 2 diversi) La varianza dovuta ai trattamenti (Between) è scomponibile in una parte dovuta solo al primo trattamento (A), una dovuta solo al secondo trattamento (B) e una parte dovuta alla loro interazione (AxB) G. Rossi (Dip. Psicologia) Tsac 2017-18 26 / 54

Esempio concreto Var. dipendente: Errori ad un test Var. indipendenti: Alcool; Deprivazione di sonno EsempioAov2.sav Deprivazione sonno 4h 12h 24h Alcool 16 18 22 12 16 24 17 25 32 No Alc. 11 13 12 9 8 14 12 11 12 1 Questi dati possono essere considerati come un solo campione (media totale) 2 Ignorando la variabile alcool (quindi usando i 3 gruppi della deprivazione di sonno) 3 Ignorando la variabile deprivazione di sonno (quindi usando i 2 gruppi di alcool) 4 Considerando i 6 sottogruppi G. Rossi (Dip. Psicologia) Tsac 2017-18 27 / 54

Esempio concreto Var. dipendente: Errori ad un test Var. indipendenti: Alcool; Deprivazione di sonno EsempioAov2.sav Deprivazione sonno 4h 12h 24h Alcool 16 18 22 12 16 24 17 25 32 No Alc. 11 13 12 9 8 14 12 11 12 1 Questi dati possono essere considerati come un solo campione (media totale) 2 Ignorando la variabile alcool (quindi usando i 3 gruppi della deprivazione di sonno) 3 Ignorando la variabile deprivazione di sonno (quindi usando i 2 gruppi di alcool) 4 Considerando i 6 sottogruppi G. Rossi (Dip. Psicologia) Tsac 2017-18 27 / 54

Esempio concreto Var. dipendente: Errori ad un test Var. indipendenti: Alcool; Deprivazione di sonno EsempioAov2.sav Deprivazione sonno 4h 12h 24h Alcool 16 18 22 12 16 24 17 25 32 No Alc. 11 13 12 9 8 14 12 11 12 1 Questi dati possono essere considerati come un solo campione (media totale) 2 Ignorando la variabile alcool (quindi usando i 3 gruppi della deprivazione di sonno) 3 Ignorando la variabile deprivazione di sonno (quindi usando i 2 gruppi di alcool) 4 Considerando i 6 sottogruppi G. Rossi (Dip. Psicologia) Tsac 2017-18 27 / 54

Esempio concreto Var. dipendente: Errori ad un test Var. indipendenti: Alcool; Deprivazione di sonno EsempioAov2.sav Deprivazione sonno 4h 12h 24h Alcool 16 18 22 12 16 24 17 25 32 No Alc. 11 13 12 9 8 14 12 11 12 1 Questi dati possono essere considerati come un solo campione (media totale) 2 Ignorando la variabile alcool (quindi usando i 3 gruppi della deprivazione di sonno) 3 Ignorando la variabile deprivazione di sonno (quindi usando i 2 gruppi di alcool) 4 Considerando i 6 sottogruppi G. Rossi (Dip. Psicologia) Tsac 2017-18 27 / 54

Varianza totale (18 punteggi) Depriv. sonno 4h 12h 24h Quadrati Alcohol 16 18 22 256 324 484 12 16 24 144 256 576 17 25 32 289 625 1024 No Alc. 11 13 12 121 169 144 9 8 14 81 64 196 12 11 12 144 121 144 Somma 77 91 116 1035 1559 2568 ( x) 2 = (77 + 91 + 116) 2 = (284) 2 = 80656 X 2 = 1035 + 1559 + 2568 = 5162 SQ tot = 5162 80656/18 = 681.111 gdl = N 1 = 18 1 = 17 G. Rossi (Dip. Psicologia) Tsac 2017-18 28 / 54

Varianza dell errore (18 scarti dalle relative medie) Depriv. sonno 4h 12h 24h Quadrati Alcohol 1,000-1,667-4,000 1 2,778 16-3,000-3,667-2,000 9 13,444 4 2,000 5,333 6,000 4 28,444 36 No Alc. 0,333 2,333-0,667 0,111 5,444 0,444-1,667-2,667 1,333 2,778 7,111 1,778 1,333 0,333-0,667 1,778 0,111 0,444 Somma 0,000 0,000 0,000 18,667 57,333 58,667 ( x) 2 = (0 + 0 + 0) 2 = (0) 2 = 0 X 2 = 18, 667 + 57, 333 + 58, 667 = 134, 667 SQ tot = 134, 667 0/18 = 134, 667 gdl = N k A * k B = 18 3 * 2 = 12 G. Rossi (Dip. Psicologia) Tsac 2017-18 29 / 54

Varianza sonno (3 medie del fattore A) Depriv. sonno 4h 12h 24h Quadrati Alcohol 12,833 15,167 19,333 164,694 230,028 373,778 12,833 15,167 19,333 164,694 230,028 373,778 12,833 15,167 19,333 164,694 230,028 373,778 No Alc. 12,833 15,167 19,333 164,694 230,028 373,778 12,833 15,167 19,333 164,694 230,028 373,778 12,833 15,167 19,333 164,694 230,028 373,778 Somma 77 91 116 988,167 1380,167 2242,667 ( x) 2 = (77 + 91 + 116) 2 = (284) 2 = 80656 X 2 = 988, 167 + 1380, 167 + 2242, 667 = 4611 SQ A = 4611 80656/18 = 130.045 gdl = k A 1 = 3 1 = 2 G. Rossi (Dip. Psicologia) Tsac 2017-18 30 / 54

Varianza alcool (2 medie del fattore B) Depriv. sonno 4h 12h 24h Quadrati Alcohol 20,222 20,222 20,222 408,938 408,938 408,938 20,222 20,222 20,222 408,938 408,938 408,938 20,222 20,222 20,222 408,938 408,938 408,938 No Alc. 11,333 11,333 11,333 128,444 128,444 128,444 11,333 11,333 11,333 128,444 128,444 128,444 11,333 11,333 11,333 128,444 128,444 128,444 Somma 94,667 94,667 94,667 1612,148 1612,148 1612,148 ( x) 2 = (77 + 91 + 116) 2 = (284) 2 = 80656 X 2 = 1612, 148 + 1612, 148 + 1612, 148 = 4836, 444 SQ B = 4836, 444 80656/18 = 355.405 gdl = k B 1 = 2 1 = 1 G. Rossi (Dip. Psicologia) Tsac 2017-18 31 / 54

Varianza interazione (fattore AxB) Deprivazione sonno 4h 12h 24h Alcohol 15,00 19,67 26,00 20,22 No Alc. 10,67 10,67 12,67 11,33 Il calcolo dei punteggi necessari per calcolare la varianza dell interazione sono un poco più complessi Si parte dalle medie dei singoli gruppi a cui si sottrae la media di una delle variabili categoriali (A o B): 15 20.222 = 5.222 e 10.667 11.333 = 0.666 si calcola la media di colonna: (3 * ( 5.222) + 3 * ( 0.666))/6 = 2.944 che si sottrae ai singoli valori di quella colonna: 5.222 ( 2.944) = 2.278 e 0.666 ( 2.944) = 2.278 G. Rossi (Dip. Psicologia) Tsac 2017-18 32 / 54

Varianza interazione (fattore AxB) Deprivazione sonno 4h 12h 24h Alcohol 15,00 19,67 26,00 20,22 No Alc. 10,67 10,67 12,67 11,33 Il calcolo dei punteggi necessari per calcolare la varianza dell interazione sono un poco più complessi Si parte dalle medie dei singoli gruppi a cui si sottrae la media di una delle variabili categoriali (A o B): 15 20.222 = 5.222 e 10.667 11.333 = 0.666 si calcola la media di colonna: (3 * ( 5.222) + 3 * ( 0.666))/6 = 2.944 che si sottrae ai singoli valori di quella colonna: 5.222 ( 2.944) = 2.278 e 0.666 ( 2.944) = 2.278 G. Rossi (Dip. Psicologia) Tsac 2017-18 32 / 54

Varianza interazione (fattore AxB) Deprivazione sonno 4h 12h 24h Alcohol 15,00 19,67 26,00 20,22 No Alc. 10,67 10,67 12,67 11,33 Il calcolo dei punteggi necessari per calcolare la varianza dell interazione sono un poco più complessi Si parte dalle medie dei singoli gruppi a cui si sottrae la media di una delle variabili categoriali (A o B): 15 20.222 = 5.222 e 10.667 11.333 = 0.666 si calcola la media di colonna: (3 * ( 5.222) + 3 * ( 0.666))/6 = 2.944 che si sottrae ai singoli valori di quella colonna: 5.222 ( 2.944) = 2.278 e 0.666 ( 2.944) = 2.278 G. Rossi (Dip. Psicologia) Tsac 2017-18 32 / 54

Varianza interazione (fattore AxB) Deprivazione sonno 4h 12h 24h Alcohol 15,00 19,67 26,00 20,22 No Alc. 10,67 10,67 12,67 11,33 Il calcolo dei punteggi necessari per calcolare la varianza dell interazione sono un poco più complessi Si parte dalle medie dei singoli gruppi a cui si sottrae la media di una delle variabili categoriali (A o B): 15 20.222 = 5.222 e 10.667 11.333 = 0.666 si calcola la media di colonna: (3 * ( 5.222) + 3 * ( 0.666))/6 = 2.944 che si sottrae ai singoli valori di quella colonna: 5.222 ( 2.944) = 2.278 e 0.666 ( 2.944) = 2.278 G. Rossi (Dip. Psicologia) Tsac 2017-18 32 / 54

Varianza interazione (6 medie del fattore AxB) Depriv. sonno 4h 12h 24h Quadrati Alcohol -2,278 0,056 2,222 5,188 0,003 4,938-2,278 0,056 2,222 5,188 0,003 4,938-2,278 0,056 2,222 5,188 0,003 4,938 No Alc. 2,278-0,056-2,222 5,188 0,003 4,938 2,278-0,056-2,222 5,188 0,003 4,938 2,278-0,056-2,222 5,188 0,003 4,938 Somma 0 0 0 31,130 0,019 29,630 ( x) 2 = (0 + 0 + 0) 2 = (0) 2 = 0 X 2 = 31, 130 + 0, 019 + 29, 630 = 60.778 SQ AxB = 60.778 0/18 = 60.778 gdl = (k A 1)(k B 1) = 2x1 = 2 G. Rossi (Dip. Psicologia) Tsac 2017-18 33 / 54

Riepilogo: calcolato e SPSS Sorgente SQ gdl MQ F Effetti principali Sonno 130,111 2 65,056 5,80 Alcohol 355,556 1 355,556 31,68 Interazioni SxA 60,778 2 30,389 2,71 Errore 134,667 12 11,222 Totale 681,111 17 40,065 Test degli effetti fra soggetti Variabile dipendente: errori Sorgente SQ df MQ F Sig. Modello corretto 546,444 (a) 5 109,289 9,739 0,001 Intercetta 4.480,889 1 4.480,889 399,287 0,000 alcool 355,556 1 355,556 31,683 0,000 sonno 130,111 2 65,056 5,797 0,017 alcool * sonno 60,778 2 30,389 2,708 0,107 Errore 134,667 12 11,222 Totale 5.162,000 18 Totale corretto 681,111 17 (a). R quadrato =,802 (R quadrato corretto =,720) G. Rossi (Dip. Psicologia) Tsac 2017-18 34 / 54

Per capire i risultati Per capire e interpretare i risultati dobbiamo guardare le medie (marginali stimate) degli effetti significativi (con soli fattori between, coincidono con quelle calcolate, salvo missing) Variabile dipendente: errori alcool Media Errore std. Intervallo di confidenza 95% Limite inferiore Limite superiore Alcool 20,222 1,117 17,789 22,655 No alcool 11,333 1,117 8,900 13,766 sonno Media Errore std. Intervallo di confidenza 95% Limite inferiore Limite superiore 4h 12,833 1,368 9,854 15,813 12h 15,167 1,368 12,187 18,146 24h 19,333 1,368 16,354 22,313 G. Rossi (Dip. Psicologia) Tsac 2017-18 35 / 54

In Spss: univariata 2 fattori Analizza Modello lineare generalizzato Univariata... Inserite la variabile da studiare in Variabile dipendente Inserite le variabili categoriali in Fattori fissi Scegliete i contrasti o post-hoc se li volete Nel pulsante Opzioni, selezionare le Medie marginali stimate (se volete) Date l OK G. Rossi (Dip. Psicologia) Tsac 2017-18 36 / 54

Possibili esempi di interazione ipotizzando 2 INDIP (3x2) e unendo i valori medi di una indipendente suddivisi e separatamente per l altra, otteniamo due linee La forma di interazione più comune è quando le linee si incrociano (fig 1 e 2) Ma anche quando in corrispondenza di un valore c è una differenza particolarmente diversa (fig 3) G. Rossi (Dip. Psicologia) Tsac 2017-18 37 / 54

Anova 1 fattore: Opzioni Si possono chiedere le descrittive (medie, dev.st.) e 3 test di omogeneità della varianza Se il primo è significativo, si può chiedere una versione corretta di F si può chiedere la rappresentazione grafica delle medie G. Rossi (Dip. Psicologia) Tsac 2017-18 38 / 54

Anova 1 fattore: Opzioni G. Rossi (Dip. Psicologia) Tsac 2017-18 39 / 54

Univariata: Opzioni G. Rossi (Dip. Psicologia) Tsac 2017-18 40 / 54

Confronti post-hoc Sono confronti che si fanno a posteriori, se l Anova è significativa e se ci sono più di 2 gruppi in una variabile indipendente La logica è quella di tenere sotto controllo i problemi di significatività legati ai confronti multipli. In Spss, premete il bottone Post Hoc... e selezionate tutti i test che volete gli output sono di due tipi: confronti multipli completi oppure gruppi omogenei Vi sono diverse procedure che effettuano confronti post-hoc G. Rossi (Dip. Psicologia) Tsac 2017-18 41 / 54

Anova 1 fattore: Post-hoc G. Rossi (Dip. Psicologia) Tsac 2017-18 42 / 54

Confronti post-hoc: confronti multipli Usando il file EsempioAov1.sav G. Rossi (Dip. Psicologia) Tsac 2017-18 43 / 54

Confronti post-hoc: confronti multipli HSD di Tukey - Variabile dipendente: ABA Differenza Intervallo di fra medie Err. std. Sig. confidenza 95% Lim. sup. Lim. inf. SX Cent. 2,796 2,2137 0,4168-2,409 8,002 Dx 7,859 2,7597 0,0128 1,369 14,349 Centro SX -2,796 2,2137 0,4168-8,002 2,409 Dx 5,063 2,6940 0,1459-1,273 11,398 Dx SX -7,859 2,7597 0,0128-14,349-1,369 Cent. -5,063 2,6940 0,1459-11,398 1,273 Viene fornita la differenza delle medie (ma non le medie), la sig. e l intervallo di confidenza (se include 0, non significativo) Ogni gruppo viene confrontato con tutti gli altri Non è significativa: le medie dei 2 gruppi sono simili È significativa: le medie dei 2 gruppi sono diverse G. Rossi (Dip. Psicologia) Tsac 2017-18 44 / 54

Confronti post-hoc: confronti multipli HSD di Tukey - Variabile dipendente: ABA Differenza Intervallo di fra medie Err. std. Sig. confidenza 95% Lim. sup. Lim. inf. SX Cent. 2,796 2,2137 0,4168-2,409 8,002 Dx 7,859 2,7597 0,0128 1,369 14,349 Centro SX -2,796 2,2137 0,4168-8,002 2,409 Dx 5,063 2,6940 0,1459-1,273 11,398 Dx SX -7,859 2,7597 0,0128-14,349-1,369 Cent. -5,063 2,6940 0,1459-11,398 1,273 Viene fornita la differenza delle medie (ma non le medie), la sig. e l intervallo di confidenza (se include 0, non significativo) Ogni gruppo viene confrontato con tutti gli altri Non è significativa: le medie dei 2 gruppi sono simili È significativa: le medie dei 2 gruppi sono diverse G. Rossi (Dip. Psicologia) Tsac 2017-18 44 / 54

Confronti post-hoc: confronti multipli HSD di Tukey - Variabile dipendente: ABA Differenza Intervallo di fra medie Err. std. Sig. confidenza 95% Lim. sup. Lim. inf. SX Cent. 2,796 2,2137 0,4168-2,409 8,002 Dx 7,859 2,7597 0,0128 1,369 14,349 Centro SX -2,796 2,2137 0,4168-8,002 2,409 Dx 5,063 2,6940 0,1459-1,273 11,398 Dx SX -7,859 2,7597 0,0128-14,349-1,369 Cent. -5,063 2,6940 0,1459-11,398 1,273 Viene fornita la differenza delle medie (ma non le medie), la sig. e l intervallo di confidenza (se include 0, non significativo) Ogni gruppo viene confrontato con tutti gli altri Non è significativa: le medie dei 2 gruppi sono simili È significativa: le medie dei 2 gruppi sono diverse G. Rossi (Dip. Psicologia) Tsac 2017-18 44 / 54

Confronti post-hoc: gruppi omogenei Usando il file EsempioAov1.sav ogni colonna numerata riporta le medie dei i gruppi omogenei fra loro in questo esempio, 2 e 3 sono omogenei fra loro in fondo alle colonne numerate compare la probabilità rispetto ad H 0 ovvero se dico che i gruppi indicati non sono omogenei, corro il rischio di sbagliare indicato G. Rossi (Dip. Psicologia) Tsac 2017-18 45 / 54

Confronti post-hoc: gruppi omogenei HSD di Tukey trepol N Sottoinsieme per alfa =.05 2 1 Dx 87 33,580 Centro 191 38,643 38,643 SX 165 41,439 Sig. 0,120 0,521 Sono visualizzate le medie per i gruppi di sottoinsiemi omogenei. Le medie di Centro e DX sono omogenee fra loro (si assomigliano) e la sig. di questa scelta è 12% Le medie di Centro e SX sono omogenee fra loro (si assomigliano) e la sig. di questa scelta è 52,1% Le medie di DX e SX non sono omogenee fra loro (vengono da due popolazioni diverse) G. Rossi (Dip. Psicologia) Tsac 2017-18 46 / 54

Confronti post-hoc: gruppi omogenei HSD di Tukey trepol N Sottoinsieme per alfa =.05 2 1 Dx 87 33,580 Centro 191 38,643 38,643 SX 165 41,439 Sig. 0,120 0,521 Sono visualizzate le medie per i gruppi di sottoinsiemi omogenei. Le medie di Centro e DX sono omogenee fra loro (si assomigliano) e la sig. di questa scelta è 12% Le medie di Centro e SX sono omogenee fra loro (si assomigliano) e la sig. di questa scelta è 52,1% Le medie di DX e SX non sono omogenee fra loro (vengono da due popolazioni diverse) G. Rossi (Dip. Psicologia) Tsac 2017-18 46 / 54

Confronti post-hoc: gruppi omogenei HSD di Tukey trepol N Sottoinsieme per alfa =.05 2 1 Dx 87 33,580 Centro 191 38,643 38,643 SX 165 41,439 Sig. 0,120 0,521 Sono visualizzate le medie per i gruppi di sottoinsiemi omogenei. Le medie di Centro e DX sono omogenee fra loro (si assomigliano) e la sig. di questa scelta è 12% Le medie di Centro e SX sono omogenee fra loro (si assomigliano) e la sig. di questa scelta è 52,1% Le medie di DX e SX non sono omogenee fra loro (vengono da due popolazioni diverse) G. Rossi (Dip. Psicologia) Tsac 2017-18 46 / 54

Univariata: Post hoc Con + VI, bisogna prima indicare la variabile da usare Non ha senso indicare una VI con 2 sole categorie G. Rossi (Dip. Psicologia) Tsac 2017-18 47 / 54

Confronti post-hoc: metodi alcuni presumono che le varianze fra i gruppi siano uguali: LSD (Least Significant Difference), Bonferroni, Sidak, Scheffé, SNK (Studentized-Neumann-Kouls), Tukey HSD (Honesty Significant Difference), Duncan, Hochberg, Gabriel, Waller-Duncan, Dunnett altre no: Tamhane, Dunnett, Games-Howell, C di Dunnett richiedono che le N dei gruppi siano = o di poco : LSD, HSD, F-H (LSD modificata), REGWQ (Ryan, Einot, riel e Welsch Q), Gabriel accettano gruppi con N : Hoch GT2, Games-Howell, Gabriel, Tamhane T2, Dunnett T3, Dunnett C N piccoli: Games-Howell è molto potente ed accurato Meglio con solo 3 gruppi: LSD Meglio 4 o più gruppi: HSD, F-H, Bonferroni, Tukey, REGWQ Tukey è conservativo, quindi adatto a molti confronti G. Rossi (Dip. Psicologia) Tsac 2017-18 48 / 54

Confronti post-hoc Bonferroni è adatto alle ricerche esplorative, è molto potente con poche medie da confrontare REGWD è quello che viene suggerito perché è potente e tiene sotto controllo l errore di tipo I meglio di tutti gli altri (però richiede ampiezze uguali) Per concludere gruppi con stessa numerosità e varianza uguale: REGWD o Tukey (potenti e controllo Tipo I); Bonferrori per pochi confronti ampiezze leggermente diverse: Gabriel (molto potente) ampiezze molto diverse: Hoch GT2 se ci sono dubbi sull omogeneità delle varianze: Games-Howell Field(2003) suggerisce di usare sempre Games-Howell in aggiunta G. Rossi (Dip. Psicologia) Tsac 2017-18 49 / 54

Confronti a priori Oltre ai post hoc si possono effettuare dei confronti a priori ovvero decisi prima ancora di effettuare l anova, sulla base di una teoria Questi confronti si chiamano anche contrasti perché contrastano la media di uno o più gruppi con quella di altri Anche in questo caso ci sono due possibilità: contrasti predefiniti: lineare, quadratico, Helmert... contrasti decisi da noi, tramite t-test Ovviamente, si usano quando si ha una teoria di partenza I post-hoc si usano quando invece non c è una teoria di partenza È possibile quindi che dopo i post-hoc si decisa di usare i confronti G. Rossi (Dip. Psicologia) Tsac 2017-18 50 / 54

Confronti a priori Contrasti... In Spss, premete il bottone se selezionate Polinomiale, poi potete scegliere fra Lineare: ipotizzo che le medie aumentano o diminuiscono nelle varie categorie in modo lineare Quadratico: in forma di U o U rovesciata (1 punto di cambiamento della direzione) Cubico: 2 punti di cambiamento della direzione altrimenti dovrete inserire dei coefficienti (uno alla volta e poi premere Aggiungi ). Dovete inserire tanti coefficienti quanti sono i gruppi previsti dalla variabile indipendente la somma dei coefficienti dev essere 0. dopo aver inserito un contrasto è possibile inserirne un secondo tramite il pulsante Successivo G. Rossi (Dip. Psicologia) Tsac 2017-18 51 / 54

Confronti a priori: contrasti a scelta Vengono contrastati (confronti) i gruppi che hanno lo stesso peso I pesi vanno inseriti nell ordine dei gruppi da contrastare Uno alla volta, poi Aggiungi La somma dei pesi dev essere 0 (zero) Non è necessario che vengano usati tutti i gruppi. Usando Avanti possiamo inserire altri contrasti G. Rossi (Dip. Psicologia) Tsac 2017-18 52 / 54

Confronti a priori: contrasti a scelta Se ho 4 gruppi, i coefficienti -1 0.5.5 (oppure -2 0 1 1) confrontano il primo con la somma del terzo e quarto, ignorando il secondo Si devono confrontare sempre e soltanto 2 raggruppamenti. 1 confronto fra SX e DX Contrasto trepol SX Centro Dx 1 1 0-1 Risultato di Test di contrasto Contrasto Valore di Sig. contrasto Err. std. t df (2-code) Assumi var. = 2,775 0,621 4,472 413 0,000 Assumi var. 2,775 0,683 4,064 130,333 0,000 G. Rossi (Dip. Psicologia) Tsac 2017-18 53 / 54

Confronti a priori: Lineare Stenner ANOVA univariata Somma dei Media dei quadrati df quadrati F Sig. Fra gruppi Combinato 433,245 2 216,622 10,684 0,000 Termine Non pesato 405,482 1 405,482 19,998 0,000 lineare Pesato 432,589 1 432,589 21,335 0,000 Deviazione 0,656 1 0,656 0,032 0,857 Entro gruppi 8.373,964 413 20,276 Totale 8.807,209 415 G. Rossi (Dip. Psicologia) Tsac 2017-18 54 / 54