Analisi della varianza

Documenti analoghi
Analisi della varianza

ESERCIZIO 1. Di seguito vengono riportati i risultati di un modello fattoriale di analisi della varianza con 3 fattori tra i soggetti.

Tecniche statistiche di analisi del cambiamento

L analisi della Varianza (ANOVA): i disegni fattoriali tra i soggetti

Analisi della varianza a una via

Analisi della varianza

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Premessa: la dipendenza in media

Analisi della Varianza - II

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Inferenza statistica II parte

Misure Ripetute. Partizione della Varianza. Marcello Gallucci

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

Analisi della Varianza Fattoriale

ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti

Statistica multivariata Donata Rodi 17/10/2016

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Analisi della varianza: I contrasti e il metodo di Bonferroni

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Elementi di Psicometria con Laboratorio di SPSS 1

Tecniche statistiche di analisi del cambiamento

R 2 1 j /n j] 3(n+1)

I TEST STATISTICI. dott.ssa Gabriella Agrusti

Test F per la significatività del modello

Inferenza statistica

Gestione ed Analisi Statistica dei dati

Misure Ripetute. Analisi dei dati in disegni di ricerca con misure ripetute. Marcello Gallucci

Statistica. Alfonso Iodice D Enza

Test d ipotesi. Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona. Ipotesi alternativa (H 1 )

X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica

Il confronto fra medie

Introduzione all Analisi della Varianza (ANOVA)

Strumenti informatici Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS

Distribuzioni e inferenza statistica

viii Indice generale

Esercizi riassuntivi di Inferenza

Approssimazione normale alla distribuzione binomiale

Statistica Applicata all edilizia: il modello di regressione

TEST NON PARAMETRICO DI MANN-WHITNEY

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

L'ANALISI DELLA VARIANZA (ANOVA, Analysis of Variance)

Corso di Psicometria Progredito

Intervalli di confidenza

STATISTICA AZIENDALE Modulo Controllo di Qualità

errore I = numero soggetti (I = 4) K = numero livelli tratt. (K = 3) popolazione varianza dovuta ai soggetti trattamento

8. ANALISI DELLA COVARIANZA (ANCOVA)

Ringraziamenti dell Editore

Statistica. Alfonso Iodice D Enza

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Esercizi di Probabilità e Statistica

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Casa dello Studente. Casa dello Studente

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

ANALISI DELLA VARIANZA A DUE VIE CON INTERAZIONE Prof. Antonio Lanzotti

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Statistica di base per l analisi socio-economica

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Il campionamento e l inferenza. Il campionamento e l inferenza

Facoltà di Economia - Università di Pavia Simulazione Prova Scritta di Statistica Sociale 19 dicembre 2012

Distribuzioni campionarie

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 1. Analisi Discriminante. 1.1 Introduzione. 1.2 Un analisi discriminante Descrizione del dataset

Applicazioni statistiche e utilizzo del package statistico Spss - 7

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

Analisi della Varianza - III

Esercitazione 8 del corso di Statistica 2

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

Corso di Psicometria Progredito

Note sulla probabilità

Teoria e tecniche dei test

La matrice delle correlazioni è la seguente:

A proposito di valutazione scolastica

Ulteriori Conoscenze di Informatica e Statistica

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Teoria e tecniche dei test. Concetti di base

Z-test, T-test, χ 2 -test

Parte 1 : Inferenza. *(richiami), **(parte 2), ***(cenni) ! Test d'ipotesi* ! Intervalli di confidenza* ! Test parametrici* ! Calcoli di potenza**

1. Introduzione ai disegni sperimentali. 5. Analisi della regressione lineare. 6. Confronto tra proporzioni di due o più campioni indipendenti

MISURAZIONE. Sistema empirico (SE): ciò che si vuole misurare; costituito da elementi legati tra loro da relazioni

ANALISI DELLA VARIANZA

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Gli errori nella verifica delle ipotesi

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Transcript:

Analisi della varianza

Analisi della varianza L analisi della varianza (ANOVA, ANalysis Of VAriance) è una tecnica di analisi dei dati che consente di verificare ipotesi relative a differenze tra le medie di due o più popolazioni. L analisi della varianza è una tecnica statistica di tipo parametrico: si assume che la variabile di interesse si distribuisca normalmente nella popolazione e che i due campioni siano estratti in maniera casuale dalla popolazione; la numerosità campionaria è rilevante nel confronto tra più campioni le varianze devono essere omogenee.

Analisi della varianza È possibile classificare i diversi modelli di ANOVA in base al numero di variabili indipendenti e dipendenti: i modelli che prevedono una sola variabile indipendente vengono definiti disegni a una via; i modelli che prevedono due o più variabili indipendenti vengono definiti disegni fattoriali; i modelli che prevedono una sola variabile dipendente definiscono un analisi della varianza univariata; i modelli che prevedono due o più variabili dipendenti definiscono un analisi della varianza multivariata (o MANOVA, Multivariate Analysis of Variance)

Analisi della varianza univariata: disegni tra soggetti ad un solo fattore Vengono definiti tra soggetti, oppure per gruppi indipendenti, i disegni in cui ad ogni trattamento o condizione sperimentale corrisponde un diverso gruppo di soggetti. In ogni condizione ci sono soggetti diversi: un soggetto esposto ad una condizione non viene esposto a nessun altra condizione. A B S 1 S 11 S 2 S 12 S 10 S n

Il modello teorico dell ANOVA Nel modello teorico dell ANOVA tra i soggetti il punteggio y ij di un soggetto j nel gruppo i è così scomponibile: Dove: y ij = µ +α i +ε ij µ è la media generale dei punteggi sul campione totale; α i è l effetto dovuto al trattamento (livello i della variabile indipendente), ed è costante all interno del trattamento; ε ij è una componente residua, o di errore causale, specifica per ogni soggetto

Il modello teorico dell ANOVA La devianza rappresenta la somma dei quadrati degli scostamenti tra ogni punteggio e la media. I diversi tipi di devianza: SCOMPOSIZIONE DELLA DEVIANZA devianza totale (SS T ): è la somma dei quadrati (sum of squares) degli scarti (differenza tra i singoli punteggi e la media generale della variabile); devianza tra i gruppi (o between, SS B ): è la somma dei quadrati degli scarti (differenza tra i punteggi medi di gruppo e la media generale), ovvero la variabilità tra i diversi gruppi; devianza entro i gruppi (o within, SS W ): è la somma dei quadrati degli scarti tra i punteggi di ogni soggetto e la relativa media di gruppo, ovvero alla variabilità dei soggetti all interno di ogni gruppo.

Il modello teorico dell ANOVA Gradi di libertà (gdl) per ognuna delle componenti della variabilità: devianza totale (SS T ): della media totale); GRADI DI LIBERTA E VARIANZE ( y y ) 2 i j ij.. devianza tra i gruppi (o between, SS B ): perso è quello della media totale); devianza entro i gruppi (o within, SS W ): perde un gdl per ogni media di gruppo)., n 1 gdl (il gdl perso è quello ( y y ) 2 i j i.. ( y y ) 2 i j ij i., k 1 gdl (il gdl, n k gdl (si Dividendo le devianze per i rispettivi gradi di libertà si ottengono le varianze: Varianza totale (MS T ) = devianza totale / n 1; Varianza tra i gruppi (MS B ) = devianza tra i gruppi / k 1; Varianza entro i gruppi (MS W ) = devianza entro i gruppi / n k.

Il modello teorico dell ANOVA IL RAPPORTO «F» Il rapporto tra le varianze MS B / MS W segue la distribuzione F, quindi può essere utilizzato per esaminare ipotesi sulla significatività della differenza tra la variabilità dovuta al trattamento e quella residua La F esamina le seguenti ipotesi: H 0 : µ 1 = µ 2 = = µ k H 1 : almeno due µ diverse

Il modello teorico dell ANOVA ASSUNZIONI Ci sono delle assunzioni che devono essere soddisfatte affinché i risultati dell ANOVA possano essere interpretati in maniera affidabile: gli errori (ε ij ) devono seguire la distribuzione normale ed avere media uguale a 0; la varianza degli errori (σ ε ) deve essere uguale in ogni gruppo (condizione di omoschedasticità); gli errori (ε ij ) devono essere indipendenti; gli effetti hanno una natura additiva: la variabile sperimentale «aggiunge» qualcosa alla condizione-base e lo fa in maniera «identica» per tutti i soggetti.

Analisi della varianza univariata: disegni fattoriali Vengono definiti fattoriali (o più vie) i disegni di analisi della varianza in cui vi sono due o più variabili indipendenti. Nei disegni fattoriali vengono esaminati gli effetti di due o più variabili indipendenti sulla variabile dipendente. Il più semplice disegno è il «2 x 2», dove abbiamo due fattori ciascuno dei quali ha due differenti livelli. Vantaggi dei disegni fattoriali: consentono lo studio dell interazione. Cioè l effetto congiunto delle VI sulla VD aumentano la potenza del test, cioè la probabilità di rilevare la presenza di un effetto, quindi la probabilità di rifiutare l ipotesi nulla quando essa è falsa consentono una maggiore economia nel numero dei soggetti da esaminare, mantenendo la stessa potenza del test.

Analisi della varianza univariata: disegni fattoriali EFFETTI PRINCIPALI E INTERAZIONI Nei disegni fattoriali abbiamo due tipi di effetti: gli effetti principali e le interazioni. L effetto principale rappresenta l effetto medio di una variabile indipendente sulla variabile dipendente, indipendentemente dai valori delle altre variabili indipendenti. L interazione rappresenta l effetto di una variabile indipendente sulla variabile dipendente non è lo stesso per tutti i livelli delle altre variabili indipendenti.

Analisi della varianza univariata: disegni fattoriali DISEGNI FATTORIALI «TRA SOGGETTI» (BETWEEN SUBJECTS) Nei disegni fattoriali «tra i soggetti» tutti i fattori sono fattori between subjects, ovvero i soggetti vengono assegnati ad ognuna delle singole celle, quindi ogni soggetto è esposto solamente ad una particolare combinazione delle condizioni sperimentali. A 1 A 2 B 1 S 1 S 2 B 2 S 11 S 12 S 6 S 7 S 16 S 17

Analisi della varianza univariata: disegni entro i soggetti ad un solo fattore I disegni entro i soggetti (o within subjects) sono disegni in cui si utilizzano gli stessi soggetti nelle diverse condizioni sperimentali. Nel caso di disegni entro i soggetti l analisi della varianza viene anche detta per prove (o misure) ripetute. A B S 1 S 1 S 2 S 2 S n S n

Analisi della varianza univariata: disegni entro i soggetti ad un solo fattore SCOMPOSIZIONE DELLA DEVIANZA TOTALE devianza totale (SS T ): devianza tra le prove (SS k ): devianza entro i gruppi (o within, SS W ): devianza tra i soggetti (SS S ): ( y y ) 2 ij.., [nk 1 gdl]; i j ( y y ) 2. j.., [k 1 gdl]; i j 2 ( y y ) i j ij. j 2 i... i j ( y y ) devianza residua (SS res ): SS W SS s, [(n 1)(k 1) gdl];, [n 1 gdl];, [k(n 1) gdl]

Analisi della varianza univariata: disegni entro i soggetti ad un solo fattore ASSUNZIONI Ci sono delle assunzioni che devono essere soddisfatte affinché i risultati possano essere interpretati in maniera affidabile: gli errori (ε ij ) devono essere indipendenti; gli errori (ε ij ) devono seguire la distribuzione normale ed avere media uguale a 0; la varianza delle differenze tra tutte le coppie delle misure ripetute deve essere uguale (sfericità o circolarità); gli effetti hanno una natura additiva: la variabile sperimentale «aggiunge» qualcosa alla condizione-base e lo fa in maniera «identica» per tutti i soggetti.

Analisi della varianza disegni fattoriali «Misti» Nei disegni fattoriali «misti», almeno un fattore è tra i soggetti ed almeno un fattore è entro i soggetti. I soggetti vengono esposti a tutte le condizioni sperimentali della variabile entro, e soltanto ad un livello della variabile tra. A 1 A 2 B 1 S 1 S 2 B 2 S 6 S 7 S 1 S 2 S 6 S 7

Analisi della varianza - Le variabili - La o le variabili dipendenti sono di tipo quantitativo (scala intervalli o rapporto). Le variabili indipendenti possono essere di due tipi: categoriale o qualitativo a loro volta distinte in variabili: - tra soggetti o fattori beetween - entro soggetti o fattori within quantitativo note anche come covariate.

Analisi della varianza Univariata OBIETTIVO ANALISI DELLA VARIANZA UNIVARIATA BETWEEN Il caso più semplice di analisi della varianza univariata è il t-test per campioni indipendenti. In quel caso l obiettivo è quello di confrontare, per una fissata variabile dipendente, le medie di due gruppi indipendenti di soggetti (fattore between a 2 livelli). L analisi della varianza univariata può essere vista come un estensione del t-test per campioni indipendenti nei casi in cui: - il fattore between ha più di due livelli (aov a una via); - esiste più di un fattore between (aov a due o più vie, o aov fattoriale).

Analisi della varianza Univariata ESEMPI DI APPLICAZIONE AOV AD UNA VIA Si supponga di aver somministrato un test di logica ad un campione di soggetti provenienti da tre tipi differenti di scuole superiori (liceo classico, liceo scientifico, liceo artistico); e di voler valutare se esiste un effetto scuola di provenienza sul numero di risposte corrette al test. Il modello da adottare sarà quello di analisi della varianza ad una via con: variabile dipendente: il numero di risposte corrette al test variablie indipendente un fattore beetween a 3 livelli: scuola di provenienza (classico, scientifico, artistico)

Analisi della varianza Univariata ESEMPI DI APPLICAZIONE AOV FATTORIALE Riprendendo l esempio precedente si supponga di disporre anche della classe di provenienza dei soggetti, e di voler valutare i seguenti aspetti: Complessivamente i soggetti rispondono in maniera diversa a seconda della scuola di provenienza? Complessivamente i soggetti rispondo in maniera diversa a seconda della classe frequentata? Esiste un interazione tra il tipo di scuola di provenienza e la classe frequentata? (le differenze tra i tipi di scuola sono costanti per ogni livello di classe frequentata? ) Il modello da adattare ai dati sarà di analisi della varianza 3x5 con: variabile dipendente: il numero di risposte corrette; un fattore between a 3 livelli: scuola di provenienza (classico, scientifico, artistico); un fattore between a 5 livelli: classe (I a, II a, III a, IV a, V a )

Analisi della varianza Univariata ASSUNZIONI Le osservazioni seguono una distribuzione normale sulla variabile dipendente in ciascun gruppo. Le varianze dei gruppi sono uguali (omogenietà della varianza). Le osservazioni sono indipendenti.

Analisi della varianza Univariata ad una via L APPROCCIO STATISTICO LA FORMULAZIONE DEL PROBLEMA H 0 µ 1 = µ 2 = µ 3 =.. = µ k H 1 almeno una media è diversa dalle altre Nota: K è il numero di livelli del fattore between

Analisi della varianza Univariata ad una via L APPROCCIO STATISTICO LA SCOMPOSIZIONE DELLA DEVIANZA Devianza totale (N-1) Devianza tra i gruppi (k-1) Devianza entro i gruppi (N-k) Nota: N è il numero di oservazioni K è il numero di livelli del fattore between

Analisi della varianza Univariata ad una via L APPROCCIO STATISTICO IL RAPPORTO: (VARIANZA TRA SOGG.) / (VARIANZA ENTRO SOGG.) Dividendo le devianze (SS) per i rispettivi gradi di libertà si ottengono le varianze (MS). Sotto H 0 il rapporto tra le varianze ha una distribuzione nota: MS F = Tra Oss MS Entro F ( df, df ) Se la probabilità associata (p-value) al valore di F osservato è minore di un valore critico fissato a priori (ad esempio 0.05), si rifiuta H 0. Tra Entro In questo caso si può conludere che il fattore between, ha un effetto statisticamente significativo sulla variabile dipendente.

Analisi della varianza Univariata ad una via L ANALISI POST-HOC Se l analisi della varianza è risultata significativa, si potrebbe essere interessati a capire quali tra le medie dei livelli del fattore between differiscono tra loro. La tentazione potrebbe essere quella di applicare una serie di t-test per confrontare tutte le medie tra loro. ERRORE

Analisi della varianza Univariata ad una via L ANALISI POST-HOC Infatti, aumentando il numero di test effettuati, aumenta la probabilità di errore di I tipo: se testiamo un ipotesi nulla che in effetti è vera, utilizzando α come valore critico, la probabilità di ottenere un risultato non significativo (corretto) è 1-α; se testiamo 2 ipotesi indipendenti la probabilità che nessuno dei 2 test sia significativo è data, per un teorema del calcolo delle probabilità, dal prodotto delle probabilità (1-α)*(1-α); più generalmente se testiamo K ipotesi indipendenti la probabilità che i test siano congiuntamente non significativi è data da (1-α) K ; ne consegue che la probabilità di avere almeno un test significativo sarà 1-(1-α) K. Esemplificando, se vengono testate 20 ipotesi indipendenti al livello di significatività α = 0,05, la probabilità che nessuna sia significativa è 0,95 20 = 0,36. La probabilità che almeno una sia significativa per errore sarà 1-(1-0,05) 20 = 0,64, ben superiore al valore nominale prescelto del 5%.

Analisi della varianza Univariata ad una via L ANALISI POST-HOC Per mantenere sotto controllo la probabilità di errore globale esistono delle tecniche dette di analisi post-hoc che mirano a correggere la probabilità di errore dei singoli confronti tra le medie, in modo da ottenere dei risultati statisticamente corretti.

Analisi della varianza Univariata 1. Identificazione della variabile dipendente e del fattore between (o dei fattori between). 2. Definizione del modello di analisi. 3. Analisi descrittiva dei dati. 4. Verifica delle assunzioni teoriche. 5. Adattamento del modello ai dati. 6. Verifica della significatività degli effetti. 7. Eventuale analisi post-hoc I PASSI FONDAMENTALI

Analisi della varianza Univariata ad una via in SPSS 1. Selezionare il menù Analizza. 2. Selezionare l opzione Confronta Medie. 3. Selezionare l opzione Anova Univariata. 4. Selezionare la variabili dipendente e il fattore between. 5. Selezionare l opzione opzioni per statistiche descrittive e test dell omogeneità delle varianza fra i gruppi. 6. Nel caso di analisi post-hoc, selezionare l opzione Post-Hoc e la/le tecnica/che di analisi post-hoc desiderata/e. 7. Cliccare OK!

Analisi della varianza Univariata fattoriale in SPSS 1. Selezionare il menù Analizza. 2. Selezionare l opzione Modello Lineare Generalizzato. 3. Selezionare l opzione Univariata. 4. Selezionare la variabile dipendente, i fattori between e le eventuali variabili indipendenti covariate. 5. Selezionare l opzione opzioni per statistiche descrittive e test dell omogeneità delle varianza fra i gruppi. 6. Nel caso di analisi post-hoc, selezionare l opzione Post-Hoc e la/le tecnica/che di analisi post-hoc desiderata/e. 7. Cliccare OK!

Analisi della varianza Univariata ad una via ESEMPIO PRATICO (I) Si supponga di aver somministrato un test sulla memoria ad un campione di soggetti appartenenti a tre fasce d età (20-29 anni, 30-49 anni, 50 anni e oltre). Si vuole valutare se l età ha un effetto sulla memoria. Nota: i dati sono contenuti nel file memoria.sav

Analisi della varianza Univariata ad una via IL MODELLO DI ANALISI Per valutare l effetto dell età sulla memoria si adotterà un modello di analisi della varianza univariata ad una via con: variabili dipendente: il numero di risposte corrette al test un fattore tra soggetti a 3 livelli: Età (20-29 anni, 30-49 anni, 50 e oltre)

Analisi della varianza Univariata ad una via ANALISI DESCRITTIVA DEI DATI

Analisi della varianza Univariata ad una via VERIFICA DELL IPOTESI DI NORMALITA

Analisi della varianza Univariata ad una via VERIFICA DELL IPOTESI DI OMOGENEITA DELLE VARIANZE Test di omogeneità delle varianze numero di rispote corrette Statistica di Levene df1 df2 Sig. 1.407 2 42.256 Osservando il valore di significatività del test di Levene si può concludere che le varianze dei tre gruppi di soggetti sono omogenee.

Analisi della varianza Univariata ad una via I RISULTATI DELL ANALISI DELLA VARIANZA ANOVA univariata numero di rispote corrette Somma dei quadrati df Media dei quadrati F Sig. Fra gruppi 1086.711 2 543.356 4.481.017 Entro gruppi 5093.200 42 121.267 Totale 6179.911 44 Osservando il valore di significatività (p-value) del test F si può concludere che l età ha un effetto significativo sulla memoria.

Analisi della varianza Univariata ad una via I RISULTATI DEL POST-HOC Variabile dipendente: numero di rispote corrette Bonferroni (I) età 20-29 anni 30-49 anni 50 anni e oltre *. (J) età 30-49 anni 50 anni e oltre 20-29 anni 50 anni e oltre 20-29 anni 30-49 anni La differenza tra le medie è significativa al livello.05. Confronti multipli Intervallo di confidenza 95% Differenza fra Limite Limite medie (I-J) Errore std. Sig. inferiore superiore 3.26667 4.02106 1.000-6.7605 13.2938 11.66667* 4.02106.018 1.6395 21.6938-3.26667 4.02106 1.000-13.2938 6.7605 8.40000 4.02106.128-1.6272 18.4272-11.66667* 4.02106.018-21.6938-1.6395-8.40000 4.02106.128-18.4272 1.6272 Dall analisi post-hoc con il metodo di Bonferroni emerge che l unica differenza significativa è quella tra la prima e la terza fascia d età.

Analisi della varianza Univariata ad una via CONCLUSIONI L analisi ha riscontrato un effetto significativo dell età sulla capacità di memoria dei soggetti (F 2,42 =4,481 ; p<0.05). In particolare si può notare, in seguito all applicazione dell analisi post-hoc con il metodo di Bonferroni, che i soggetti può giovani manifestano una capacità di memoria significativamente maggiore di quella dei soggetti più anziani (p=0.018).

Analisi della varianza Univariata fattoriale ESEMPIO PRATICO (II) Si supponga di voler studiare gli effetti del fumo da sigaretta su alcuni tipi di prestazione. A tale scopo è stato selezionato un campione i cui soggetti sono stati suddivisi in tre gruppi rispetto al fumo: non fumatori (NS), fumatori ma non prima-durante la prova (DS), fumatori attivi prima-durante la prova (AS). In maniera casuale all interno di ciascun gruppo un terzo dei soggetti ha fatto un compito di pattern recognition, un terzo un compito di tipo cognitivo e un terzo una simulazione di guida con un video game. In ogni caso la variabile dipendente è il numero di errori commessi. Le domande di ricerca riguardano la valutazione dell effetto del fumo, dell effetto del tipo di compito, e dell eventuale interazione tra fumo e compito sulle perfomance dei soggetti. Nota: i dati sono contenuti nel file smoking.sav

Analisi della varianza Univariata fattoriale IL MODELLO DI ANALISI Per rispondere alle domande di ricerca si adotterà un modello di analisi della varianza univariata fattoriale 3 3 con: variabili dipendente: il numero di errori commessi un fattore tra soggetti a 3 livelli: Fumo (Non Fumatori, Fumatori ma non prima e durante la prova, Fumatori prima e durante la prova) un fattore tra soggetti a 3 livelli: Compito (Pattern Recognition, Cognitivo, Simulazione di Guida)

Analisi della varianza Univariata fattoriale RISULTATI DELL ANALISI DELLA VARIANZA Osservando i risultati dell analisi della varianza si può affermare che: il fumo complessivamente non ha un effetto significativo sulla performance il tipo di compito ha un effetto significativo sulla performace esiste un effetto significativo dell interazione fumo-tipo di compito sulla performance

Analisi della varianza Univariata fattoriale INTERPRETAZIONE GRAFICA DEI RISULTATI medie marginali attese 50,00 40,00 30,00 20,00 10,00 smokegr No Smoker D elay Smoker Active Smoker 0,00 pattern re co gnition cogn itive task d riving simula tio n task

Analisi della varianza Univariata fattoriale CONCLUSIONI L analisi ha riscontrato un effetto significativo del tipo di compito (F 2,81 =73.865 ; p<0.05) e un effetto significativo dell interazione fumo-tipo di compito (F 4,81 =3.261 ; p<0.05) sulle performance dei soggetti. L effetto principale del fattore fumo non è invece risultato significativo. Si può quindi concludere che; il fumo complessivamente non incide sulla performace; il tipo di compito complessivamente ha influenza sulla performance; esiste un effetto interattivo fumo-tipo di compito sulle performance (le differenze di performance tra i tre gruppi di fumatori non sono costanti nei tre diversi tipi di compito).

Analisi della varianza Multivariata (MANOVA) L OBIETTIVO DELL ANALISI DELLA VARIANZA MULTIVARIATA L obiettivo dell analisi della varianza multivariata è quello di studiare gli effetti di uno o più fattori tra soggetti su un insieme di variabili dipendenti. (Mentre nell Anova Univariata la variabile dipendente è una, nella Manova le variabili dipendenti sono più di una) Esempio: Si vuole studiare se i maschi differiscono complessivamente dalle femmine sui punteggi totali di tre questionari che rilevano tre diversi aspetti dell ansia. In questo caso si adotterà un disegno di analisi della varianza multivariata (Manova) con: - 3 variabili dipendenti (i 3 aspetti dell ansia); - 1 fattore tra soggetti (sesso).

Analisi della varianza Multivariata (MANOVA) ASSUNZIONI NELL ANALISI DELLA VARIANZA MULTIVARIATA Le osservazioni seguono una distribuzione normale multivariata sulle variabili dipendenti in ciascun gruppo. Le matrici di covarianza sulle variabili dipendenti di ciascun gruppo sono uguali. Le osservazioni sono indipendenti.

Analisi della varianza Multivariata (MANOVA) in SPSS 1. Selezionare il menù Analizza. 2. Selezionare l opzione Modello lineare generalizzato. 3. Selezionare l opzione Multivariato. 4. Selezionare le variabili dipendenti, i fattori between e le eventuali covariate in modo appropriato. 5. Selezionare l opzione opzioni per statistiche descrittive e test dell omogeneità delle varianza fra i gruppi. 6. Nel caso di analisi post-hoc, selezionare l opzione Post-Hoc e la/le tecnica/che di analisi post-hoc desiderata/e. 7. Cliccare OK!

Analisi della varianza Multivariata (MANOVA) in SPSS ESEMPIO PRATICO (III) Per capire se un nuovo approccio didattico nell insegnamento del clarinetto è efficace, si vogliono confrontare due gruppi di alunni delle scuole elementari: - Gruppo Sperimentale (alunni che hanno seguito le lezioni con il metodo innovativo); - Gruppo di Controllo (alunni che hanno seguito le lezioni con il metodo tradizionale). I dati raccolti riguardano le perfomance degli alunni valutate sui seguenti 6 aspetti: interpretazione, tono, ritmo, intonazione, tempo, articolazione. (Ambrose, 1985) Nota: i dati sono contenuti nel file clarinetto.sav

Analisi della varianza Multivariata (MANOVA) in SPSS IL MODELLO DI ANALISI Per valutare l efficacia del nuovo approccio si adotterà un modello di analisi della varianza multivariata (MANOVA) con: sei variabili dipendenti: Interpretazione, Tono, Ritmo, Intonazione, Tempo, Articolazione; un fattore tra soggetti a 2 livelli: Gruppo (Sperimentale vs. Controllo).

Analisi della varianza Multivariata (MANOVA) in SPSS ANALISI DESCRITTIVA DEI DATI Confronto tra il Gruppo Sperimentale e il Gruppo di Controllo 4.00 3.50 sperimentale controllo 3.00 media dei punteggi 2.50 2.00 1.50 1.00 0.50 0.00 interpretazione tono ritmo intonazione tempo articolazione aspetti valutati

Analisi della varianza Multivariata (MANOVA) in SPSS RISULTATI DELLA MANOVA Test multivariati b Effetto Intercetta gruppo Gradi di libertà Valore F Ipotesi df dell'errore Sig. Traccia di Pillai.991 278.492 a 6.000 16.000.000 Lambda di Wilks.009 278.492 a 6.000 16.000.000 Traccia di Hotellin 104.434 278.492 a 6.000 16.000.000 Radice di Roy 104.434 278.492 a 6.000 16.000.000 Traccia di Pillai.584 3.749 a 6.000 16.000.016 Lambda di Wilks.416 3.749 a 6.000 16.000.016 Traccia di Hotellin 1.406 3.749 a 6.000 16.000.016 Radice di Roy 1.406 3.749 a 6.000 16.000.016 a. Statistica esatta b. Disegno: Intercept+gruppo Il fattore gruppo ha un effetto significativo

Analisi della varianza Multivariata (MANOVA) in SPSS CONCLUSIONI Il Gruppo Sperimentale differisce significativamente dal Gruppo di Controllo sui 6 aspetti valutati (F 6,16 = 3.749 ; p<0.05). Si può quindi concludere che il nuovo approccio didattico è efficace.

Analisi della varianza a misure ripetute L OBIETTIVO DELL ANALISI DELLA VARIANZA A MISURE RIPETUTE Il caso più semplice di analisi della varianza a misure ripetute è il t-test per dati appaiati. In quel caso i soggetti vengono misurati due volte, ad esempio prima e dopo un trattamento, e si vuole verificare l effetto del trattamento (fattore within). L analisi della varianza a misure ripetute può essere vista come un estensione del test-t per dati appaiati nei casi in cui: - il fattore within ha più di due livelli; - esiste più di un fattore within.

Analisi della varianza a misure ripetute ESEMPI DI APPLICAZIONE DELL AOV A MISURE RIPETUTE Valutazione dell effetto del tempo. Esempio: valutare se esistono variazioni dell umore materno nel primo anno post-gravidanza. Valutazione dell effetto di più trattamenti. Esempio: Valutare come incidono la lunghezza e la tipologia di un testo sulla comprensione.

Analisi della varianza a misure ripetute I VANTAGGI DELL AOV A MISURE RIPETUTE Controllo della variabilità entro soggetto Le differenze tra Gruppo Sperimentale e Gruppo di controllo possono dipendere sia dall effetto del trattamento sia dalla diversa composizione dei due gruppi. In un disegno a misure ripetute invece i soggetti fungono da controllo di se stessi. Minor numerosità campionaria richiesta rispetto all analisi della varianza between. Se in un disegno di analisi della varianza between per valutare l effetto di 3 diversi trattamenti sono richiesti 45 soggetti (15 per trattamento), in un disegno a misure ripetute ne bastano 15! Nota: non sempre si può utilizzare un disegno a misure ripetute (ad. esempio: valutazione dell effetto genere)

Analisi della varianza a misure ripetute ASSUNZIONI NELL ANALISI DELLA VARIANZA A MISURE RIPETUTE Le osservazioni sono indipendenti. Le osservazioni seguono una distribuzione normale multivariata sui livelli del fattore entro soggetti. Le osservazioni soddisfano l ipotesi di sfericità. Nota: Le prime due assunzioni sono richieste anche per l analisi della varianza multivariata (MANOVA), mentre l ipotesi di sfericità non lo è.

Analisi della varianza a misure ripetute CHE COSA IMPLICA L IPOTESI DI SFERICITA? L ipotesi di sfericità implica che la matrice di covarianza sulle misure ripetute rispetti una forma particolare (varianze e covarianze pressoché costanti). In poche parole, l idea è che le varianze delle differenze tra le misure ripetute devono essere pressoché uguali.

Analisi della varianza a misure ripetute CHE COSA IMPLICA L IPOTESI DI SFERICITA? Esempio: Si supponga di voler valutare la variazione di peso nel tempo in bambini neonati. Il peso dei neonati viene misurato ogni giorno per un periodo critico di 3 giorni. Il modello da adattare potrebbe essere quello di un AOV a misure ripetute con v.d. il peso dei bambini e fattore entro soggetti il tempo (3 livelli pari ai 3 giorni). Osservando i dati si nota che: - in media i bambini sono aumentati di 100 grammi tra il giorno 1 e 2 e di 150 grammi tra il giorno 2 e 3. - la varianza degli aumenti tra il giorno 1 e 2 è di 20, mentre quella tra il giorno 2 e 3 è di 100. In questo caso l ipotesi di sfericità che presuppone che la varianza degli aumenti tra i giorni 1 e 2 e quella tra i giorni 2 e 3 ( e anche quella tra 1 e 3) siano uguali non è soddisfatta. Il modello di AOV a misure ripetute potrebbe produrre una stima distorta della significatività dell effetto del tempo.

Analisi della varianza a misure ripetute VALUTAZIONE DELL IPOTESI DI SFERICITA Per valutare se i dati soddisfano l ipotesi di sfericità si può utilizzare il test di Mauchly Il test di Mauchly è significativo (p<0.05)? No Sì I dati soddisfano l assunzione di sfercità. La stima degli effetti non è distorta. I dati non soddisfano l ipotesi di sfericità. Per ottenere una stima non distorta degli effetti si deve ricorrere a dei criteri di correzione (ad es. Greenhouse-Geisser)

Analisi della varianza a misure ripetute in SPSS 1. Selezionare il menù Analizza. 2. Selezionare l opzione Modello lineare generalizzato. 3. Selezionare l opzione Misure Ripetute. 4. Nella finestra Definisci Fattori inserire i nomi dei fattori within ed il rispettivo numero di livelli. Cliccare Definisci. 5. Inserire le variabili within in modo appropriato rispetto le definizioni dei fattori fatte al punto 4. 6. Cliccare OK!

Analisi della varianza a misure ripetute in SPSS ESEMPIO PRATICO (IV) Si supponga di voler studiare l effetto di 4 diversi tipi di vino sui tempi di reazione ad una particolare prova di abilità. Nella conduzione dell esperimento un tempo sufficiente viene fatto trascorrere tra una prova e l altra, in modo da minimizzare gli effetti della somministrazione di un tipo di vino sui tempi di reazione legati alla successiva somministrazione (Winer, 1971). Nota: i dati sono contenuti nel file vini.sav

Analisi della varianza a misure ripetute in SPSS IL MODELLO DI ANLISI Per valutare se il tipo di vino ha un effetto sui tempi di reazione dei soggetti si adotterà un modello di analisi della varianza a misure ripetute con: - variabile dipendente: il Tempo di Reazione dei soggetti; - un fattore entro-soggetti a 4 livelli: Tipo di Vino (Chianti, Merlot, Prosecco, Zibibbo).

Analisi della varianza a misure ripetute in SPSS ANALISI DESCRITTIVA DEI DATI Confronto dei tempi di reazione medi ottenuti per tipo di vino 45 40 35 media dei tempi di reazione 30 25 20 15 10 5 0 chianti merlot prosecco zibibbo tipo di vino

Analisi della varianza a misure ripetute in SPSS Misura: MEASURE_1 CONTROLLO DELL IPOTESI DI SFERICITA Test di sfericità di Mauchly b Effetto entro soggetti tipo_v Approssimaz Epsilon a ione Greenhous Limite W di Mauchly chi-quadrato df Sig. e-geisser Huynh-Feldt inferiore.186 4.572 5.495.605 1.000.333 Verifica l'ipotesi nulla per la quale la matrice di covarianza dell'errore della variabile dipendente trasformata ortonormalizzata è proporzionale a una matrice identità. a. È possibile utilizzarlo per regolare i gradi di libertà per i test di significatività mediati. I test corretti vengono visualizzati nella tabella dei test sugli effetti entro soggetti. b. Disegno: Intercept Disegno entro soggetti: tipo_v L ipotesi di sfericità è soddisfatta.

Analisi della varianza a misure ripetute in SPSS RISULTATI DELL ANALISI DELLA VARIANZA A MISURE RIPETUTE Test degli effetti entro soggetti Misura: MEASURE_1 Sorgente tipo_v Errore(tipo_v) Assumendo la sfericità Greenhouse-Geisser Huynh-Feldt Limite inferiore Assumendo la sfericità Greenhouse-Geisser Huynh-Feldt Limite inferiore Somma dei quadrati Media dei Tipo III df quadrati F Sig. 698.200 3 232.733 24.759.000 698.200 1.815 384.763 24.759.001 698.200 3.000 232.733 24.759.000 698.200 1.000 698.200 24.759.008 112.800 12 9.400 112.800 7.258 15.540 112.800 12.000 9.400 112.800 4.000 28.200 Il fattore within Tipo di Vino ha un effetto statisticamente significativo.

Analisi della varianza a misure ripetute in SPSS CONCLUSIONI Il fattore Tipo di Vino ha un effetto statisticamente significativo sui tempi di reazione dei soggetti (F 3,12 = 24.759 ; p<0.05). Si può quindi concludere che a seconda del tipo di vino somministrato i tempi di reazione dei soggetti variano.

Analisi della varianza con Disegno Misto COSA SI INTENDE PER ANALISI DELLA VARIANZA CON DISEGNO MISTO? Un modello analisi della varianza con disegno misto è un modello che comprende sia fattori between che fattori within.

Analisi della varianza con Disegno Misto ESEMPIO DI UN PROBLEMA RISOLVIBILE ATTRAVERSO UN AOV CON DISEGNO MISTO Si supponga di voler misurare l effetto di tre diversi trattamenti somministrati ad un campione comprendente maschi e femmine. La situazione può essere così rappresentata: Maschi Femmine TRATTAMENTI A B C

Analisi della varianza con Disegno Misto LE DOMANDE DI RICERCA Effetto principale del fattore within Esiste un effetto trattamento? Complessivamente i soggetti rispondono in maniera diversa a seconda del trattamento? Effetto principale del fattore between Esiste un effetto genere? Complessivamente i maschi rispondono in maniera diversa rispetto alle femmine? Interazione tra fattore within e between Esistono dei legami tra il tipo di trattamento e il genere dei soggetti? Le differenze tra i maschi e le femmine sono costanti o variano a seconda del tipo di trattamento?

Analisi della varianza con Disegno Misto IL MODELLO DI ANALISI Il modello da adattare ai dati sarà un modello di analisi della varianza a disegno misto 3 2 con: variabile dipendente: le risposte dei soggetti un fattore within a 3 livelli: trattamento (A, B, C) un fattore between a 2 livelli: sesso (Maschi vs. Femmine)

Analisi della varianza con Disegno Misto in SPSS 1. Selezionare il menù Analizza. 2. Selezionare l opzione Modello lineare generalizzato. 3. Selezionare l opzione Misure Ripetute. 4. Nella finestra Definisci Fattori inserire i nomi dei fattori within ed il rispettivo numero di livelli. Cliccare Definisci. 5. Inserire le variabili within in modo appropriato rispetto le definizioni dei fattori fatte al punto 4. 6. Selezionare i fattori between e le eventuali covariate. 7. Cliccare OK!

Analisi della varianza con Disegno Misto in SPSS A due gruppi, uno sottoposto a una condizione stressante (gruppo sperimentale) ed uno sottoposto ad una condizione neutra (gruppo di controllo), vengono letti tre brani di crescente difficoltà. Dopo la lettura di ciascun brano vengono poste ai soggetti 10 domande di comprensione del testo e viene rilevato il numero di risposte corrette. Si vogliono studiare i seguenti aspetti: ESEMPIO PRATICO (V) la difficoltà dei brani ha un effetto sul numero di risposte corrette? il gruppo sottoposto ad una condizione di stress risponde complessivamente in maniera diversa rispetto al gruppo di controllo? esiste un interazione tra la difficoltà dei brani ed il livello di stress (le differenze tra i due gruppi sono costanti per i tre livelli di difficoltà dei brani)? Nota: i dati sono contenuti nel file stress.sav

Analisi della varianza con Disegno Misto in SPSS IL MODELLO DI ANLISI Il modello da applicare sarà un modello di analisi della varianza a disegno misto 3 2 con: variabile dipendente: il numero di risposte corrette un fattore within a 3 livelli: difficoltà del brano (1,2,3) un fattore between a 2 livelli: gruppo (sperimentale vs. controllo)

Analisi della varianza con Disegno Misto in SPSS Misura: MEASURE_1 CONTROLLO DELL IPOTESI DI SFERICITA Test di sfericità di Mauchly b Effetto entro soggetti difficol Approssima zione W di Mauchly chi-quadrato df Sig..673 6.733 2.035 La sfericità non è soddisfatta. Bisognerà adottare un criterio correttivo.

Analisi della varianza con Disegno Misto in SPSS RISULTATI DELL ANALISI DELLA VARIANZA CON DISEGNO MISTO Effetto siginificativo fattore within. del Effetto siginificativo dell interazione tra il fattore within e quello between

Analisi della varianza con Disegno Misto in SPSS RISULTATI DELL ANALISI DELLA VARIANZA CON DISEGNO MISTO Effetto significativo del fattore between.

Analisi della varianza con Disegno Misto in SPSS INTERPRETAZIONE GRAFICA DEI RISULTATI

Analisi della varianza con Disegno Misto in SPSS L analisi condotta ha messo in evidenza i seguenti aspetti: emerge un effetto significativo del fattore within difficoltà (F 1.507,27.129 =20.028 ; p<0.05); emerge un effetto significativo del fattore between gruppo (F 1.507,27.129 =5.861 ; p<0.05); emerge un effetto significativo dell interazione tra il fattore within e il fattore within (F 1,18 =9.227 ; p<0.05). Si può quindi concludere che: CONCLUSIONI la difficoltà del brano influenza il numero di risposte corrette; i due gruppi differiscono sulla base del numero di riposte corrette; le differenze tra i due gruppi non sono costanti per i tre livelli di difficoltà dei brani; in particolare si può notare che nella condizione alta difficoltà dei brani, la differenza tra i due gruppi è molto maggiore rispetto a quelle che si registrano nelle condizioni media e bassa difficoltà.

Analisi della varianza COSA FARE QUANDO LE ASSUNZIONI PER L ANALISI DELLA VARIANZA NON SONO SODDISFATTE? Se le assunzioni per l analisi della varianza non sono soddisfatte, cioè ad esempio: la variabile dipendente non è quantitativa ma è su scala ordinale; la variabile dipendente non è distribuita normalmente; la numerosità campionaria è ridotta. E POSSIBILE ADOTTARE UN APPROCCIO NON PARAMETRICO

I vantaggi dell approccio Nonparametrico Le tecniche non-parametriche, che si basano sui ranghi e non sui valori originali come le tecniche parametriche, presentano i seguenti principali vantaggi: sono distribution-free, cioè indipendenti dalla distribuzione campionaria della variabile dipendente; sono particolarmente indicate nei casi di ridotta numerosità campionaria.

Alternative Non-parametriche all analisi della varianza con fattore between NUMERO DI LIVELLI DEL FATTORE BETWEEN due due o più di due ANALISI PARAMETRICA test t per campioni indipendenti analisi della varianza ad un fattore between ANALISI NON- PARAMETRICA test di Mann-Whitney test di Kruskal-Wallis

Alternative Non-parametriche all analisi della varianza a misure ripetute con fattore within NUMERO DI LIVELLI DEL FATTORE WITHIN due ANALISI PARAMETRICA test t per campioni appaiati ANALISI NON- PARAMETRICA test di Wilcoxon due o più di due analisi della varianza a misure ripetute test di Friedman

Alternative Non-parametriche all analisi della varianza a misure ripetute con fattore within (variabile dipendente dicotomica) NUMERO DI LIVELLI DEL FATTORE WITHIN ANALISI PARAMETRICA ANALISI NON- PARAMETRICA due - test di McNemar due o più di due - test di Cochran

L approccio Non-parametrico in SPSS 1. Selezionare il menù Analizza. 2. Selezionare l opzione Test non parametrici. 3. Selezionare l opzione che si intende utilizzare. 4. Selezionare le variabili di interesse in modo appropriato. 5. Cliccare OK!

Mi conviene usare le tecniche parametriche o quelle non parametriche? Quando le assunzioni per l analisi della varianza sono soddisfatte, l approccio parametrico è più potente (migliore) di quello non-parametrico. Nel caso in cui le assunzioni per l analisi della varianza sono dubbie, è conveniente utilizzare sia l approccio parametrico che quello nonparametrico e confrontare i risultati.

Per approfondimenti Per approfondire le tecniche di Analisi della Varianza si consigliano i seguenti testi: Using Multivariate Statistics (5th edition) Barbara G. Tabachnick & Linda S. Fidell, 2007 Pearson Education Applied Multivariate Statistics For The Social Sciences, Fourth Edition James P. Stevens, 2002 LEA, Publishers