Analisi della Varianza - II

Documenti analoghi
Analisi della Varianza - II

Tecniche statistiche di analisi del cambiamento

Analisi della varianza a una via

Analisi della varianza

Analisi della Varianza - III

Il modello lineare e l analisi della varianza con

Analisi della varianza

Tecniche statistiche di analisi del cambiamento

Statistica multivariata Donata Rodi 17/10/2016

Argomenti della lezione:

8. ANALISI DELLA COVARIANZA (ANCOVA)

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

Premessa: la dipendenza in media

Tecniche statistiche di analisi del cambiamento

Misure Ripetute. Analisi dei dati in disegni di ricerca con misure ripetute. Marcello Gallucci

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

L analisi della Varianza (ANOVA): i disegni fattoriali tra i soggetti

Analisi della varianza

Introduzione all Analisi della Varianza (ANOVA)

viii Indice generale

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

ESERCIZIO 1. Di seguito vengono riportati i risultati di un modello fattoriale di analisi della varianza con 3 fattori tra i soggetti.

Inferenza statistica Donata Rodi 04/10/2016

Inferenza statistica II parte

I TEST STATISTICI. dott.ssa Gabriella Agrusti

Efficacia dei Trattamenti

Indice. Prefazione all edizione italiana. Gli Autori e i Curatori dell edizione italiana PARTE PRIMA ASPETTI GENERALI

Statistica Applicata all edilizia: il modello di regressione

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

Confronto tra due popolazioni Lezione 6

Statistica Inferenziale

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

Analisi della Varianza Fattoriale

Assunzioni (Parte I)

Tecniche statistiche di analisi del cambiamento

Elementi di Psicometria con Laboratorio di SPSS 1

Analisi della varianza

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

Test F per la significatività del modello

LEZIONE N. 11 ( a cura di MADDALENA BEI)

Distribuzioni e inferenza statistica

Giorno n. clienti di attesa

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

1. Introduzione ai disegni sperimentali. 5. Analisi della regressione lineare. 6. Confronto tra proporzioni di due o più campioni indipendenti

CAPITOLO 4 Blocchi casualizzati, quadrati latini e piani collegati

TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi

Regressione lineare semplice

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

Modelli a effetti misti

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

Tecniche statistiche di analisi del cambiamento

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010

Misure Ripetute. Partizione della Varianza. Marcello Gallucci

Regressione Lineare Semplice e Correlazione

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

VARIETÀ. zona geografica A B C D

ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti

Prova Pratica di Statistica I+II - Prof. M. Romanazzi

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Tipi di variabili. Indici di tendenza centrale e di dispersione

Strumenti di indagine per la valutazione psicologica

Esercitazione del

Corso di Psicometria Progredito

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Metodo epidemiologici per la clinica _efficacia / 1. L analisi statistica

ANALISI MULTIVARIATA

LEZIONI DI STATISTICA MEDICA

11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici

X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica

Statistica per le ricerche di mercato

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson

Esercitazione II Statistica e Calcolo delle Probabilità (con soluzioni)

Statistica multivariata

b) Calcolare la devianza tra i gruppi (devianza esterna), la devianza entro i gruppi (devianza interna) e la devianza totale

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

CORSO INTEGRATO DI STATISTICA E INFORMATICA MEDICA

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Laboratorio di Statistica Aziendale Modello di regressione lineare semplice

Distribuzioni campionarie

Disegno dello studio

Franco Ferraris Marco Parvis Generalità sulle Misure di Grandezze Fisiche. Prof. Franco Ferraris - Politecnico di Torino

Esercizi di statistica

Analisi Multivariata dei Dati. Regressione Multipla

I disegni sperimentali e il controllo

Incertezza di misura concetti di base. Roberto Olmi IFAC-CNR

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A

Transcript:

Analisi della Varianza - II M Q ANOVA entro i soggetti, modelli misti, ANCOVA Marco Perugini Milano-Bicocca 1 Lez: XXIX

ANOVA a una via la VARIANZA Possiamo stimare la varianza (MQ = media dei quadrati) - Varianza totale: MQ TOT = SQ TOT (N 1) Gradi di libertà (g.l.) - Varianza entro: MQ ENTRO = SQ ENTRO (N k) - Varianza tra: MQ TRA = SQ TRA (k 1) [ quanti valori sono liberi di variare] N = numerosità complessiva; k = numero di livelli Il rapporto F F = MQ TRA MQ ENTRO F è il rapporto tra la varianza stimata a partire dalla variabilità tra i gruppi (BETWEEN) e la varianza stimata a partire dalla variabilità entro i gruppi (WITHIN). Segue la distribuzione F di Fisher. http://web.utah.edu/stat/introstats/anovaflash.html 2 Lezione: XXVIII

ANOVA fattoriale la scomposizione della varianza SQ TOT g.l.: N - 1 SQ ENTRO SQ TRA g.l.: N a*b SQ A SQ B SQ A * B g.l.: a 1 g.l.: b 1 g.l.: (a 1)*(b 1) MQ = SQ / g.l. F A = MQ A / MQ ENTRO F B = MQ B / MQ ENTRO F A*B = MQ A*B / MQ ENTRO Vantaggio dell ANOVA fattoriale: SQ ENTRO e MQ ENTRO sono tipicamente più piccole che nell ANOVA a una via perché alcune fonti di variabilità non sono più d errore. Questo aumenta la potenza del test. 3 Lezione: XXVIII

ANOVA entro i soggetti (detta anche per misure ripetute o Within) Disegni entro i soggetti (within subjects) La V.D. è rilevata più volte sugli stessi soggetti [unità osservative], nelle diverse condizioni sperimentali. Disegni per blocchi randomizzati La V.D. viene rilevata su soggetti appaiati su una determinata variabile rilevante. Nelle diverse condizioni ci sono soggetti diversi che vengono trattati come se fossero la stessa persona esposta a prove differenti. Esempio: triplette di persone equiparabili per età, sesso, ideologia politica 4

ANOVA a una via entro i soggetti Ricerca automobili di prestigio Intervista di marketing, indice di prestigio associato a tre diversi marchi: Porsche, Ferrari, Lamborghini Ogni intervistato esprime valutazioni per tutti e tre i marchi. Le osservazioni non sono indipendenti. 5

ANOVA a una via entro i soggetti medie di ciascun soggetto rispetto alle 3 condizioni permettono di isolare la parte di devianza totale dei punteggi che dipende dalle differenze tra i soggetti. medie della V.D. per ciascun livello permettono di stimare la variabilità legata al fattore 6

ANOVA a una via entro i soggetti Devianza totale Devianza tra i soggetti SQ TOTALE devianza dovuta ai livelli del fattore Devianza entro le celle SQ TRA SQ ENTRO SQ SOGGETTI SQ RESIDUA La devianza totale viene suddivisa in una parte di devianza TRA le condizioni (l effetto del marchio valutato) e una parte di devianza ENTRO le condizioni (non attribuibile al marchio). La devianza ENTRO è suddivisa in una parte dovuta alle differenze individuali tra i soggetti e una parte d errore (variabilità residua). NOTA: le differenze individuali tra i soggetti non costituiscono variabilità d errore perché rimangono costanti nelle diverse condizioni. 7

ANOVA a una via entro i soggetti SQ TOTALE g.l.: n*k - 1 g.l.: k - 1 SQ TRA SQ ENTRO g.l.: n - k SQ SOGGETTI SQ RESIDUA g.l.: n - 1 g.l.: (n 1) * (k 1) MQ = SQ / g.l. F EFFETTO = MQ TRA / MQ RESIDUA Vantaggio dei disegni entro i soggetti: riduzione della varianza d errore (disegno più potente richiede meno soggetti). Utile se la variabilità interindividuale incide molto sulla V.D. 8

ANOVA a una via entro i soggetti: esempio Effetto significativo del tipo di marchio, F(2,158) = 31.703, p <.001, η 2 =.427. I test post hoc (correzione di Bonferroni) rivelano che le valutazioni medie del marchio Porsche si discostano significativamente da quelle degli altri due marchi, che invece in media non differiscono significativamente. 9

ANOVA fattoriale entro i soggetti Ai partecipanti alla ricerca viene chiesto di valutare i marchi Porsche, Ferrari e Lamborghini prima e dopo aver visto una comunicazione commerciale (spot TV) per il marchio Ferrari. Il disegno: 3 (Marchio: Porsche, Ferrari, Lamborghini) x 2 (Misurazione: Pre, Post) entro i soggetti. Per ogni partecipante, la V.D. viene misurata relativamente a tutte le 6 condizioni sperimentali. 10

ANOVA fattoriale entro i soggetti Il disegno: 3 (Marchio: Porsche, Ferrari, Lamborghini) x 2 (Tempo: Pre, Post) entro i soggetti. Scomposizione della devianza (con i relativi g.l.): SQ TOTALE n*a*b - 1 SQ TRA SQ ENTRO SQ MARCHIO a - 1 SQ INTERA- ZIONE (a 1) * (b 1) SQ TEMPO b - 1 SQ ERR MARCHIO (a 1) * (n 1) SQ ERR TEMPO SQ SOGGETTI n 1 (b 1) * (n 1) SQ ERR INTERAZIONE (a 1) * (b 1) * (n 1) 11 Dove: a = nr. livelli fattore marchio, b = nr. livelli fattore tempo, n = nr. soggetti

ANOVA fattoriale entro i soggetti SQ TOTALE SQ TRA SQ ENTRO SQ MARCHIO SQ TEMPO SQ SOGGETTI SQ INTERA- ZIONE SQ ERR MARCHIO SQ ERR TEMPO Scomposizione della devianza SQ totale: (xabn x ) a b n SQ ERR INTERAZIONE SQ effetto principale A: a b n(x a x ) 2 SQ effetto principale B: a b n(x b x ) 2 SQ interazione A*B: a b n(x ab x a x b + x) 2 2 SQ entro: a b n(xabn x ab ) 2 SQ soggetti: a b n(x n x ) 2 SQ err A: a b n(x an x a ) 2 SQ soggetti SQ err B: a b n(x bn x b ) 2 SQ soggetti SQ err interazione: SQ entro SQ soggetti SQ err A SQ err B

ANOVA fattoriale entro i soggetti esempio Esempio fattore tempo: F = MQ TEMPO / MQ ERR. TEMPO = 50.70 / 4.02 = 12.60 Interazione. Può essere approfondita con effetti semplici 13

ANOVA fattoriale entro i soggetti esempio L esposizione al messaggio causa un cambiamento significativo per tutti e tre i marchi, ma un incremento per i marchi Porsche e Ferrari, un decremento per il marchio Lamborghini. 14

ANOVA fattoriale entro i soggetti esempio Secondo una prospettiva diversa: Prima della visione dello spot la percezione dei marchi Ferrari e Lamborghini non era significativamente diversa. Anche dopo la visione dello spot è così. 15

ANOVA fattoriale mista Almeno un fattore è tra i soggetti, almeno un fattore è entro i soggetti. Esempio: Sesso Maschi Femmine I soggetti sono esposti a tutti i livelli del fattore entro, solo a un livello del fattore tra. SQ TOTALE n*a*b - 1 SQ TRA SQ ENTRO SQ Fatt Tra a - 1 SQ Err. Fatt. Tra a * (n 1) SQ Fatt Entro b 1 SQ Interazio ne (a 1) * (b 1) SQ Err. Entro a * (b 1) * (n 1) 16 Dove: a = nr. livelli fattore tra, b = nr. livelli fattore entro, n = numero totale di soggetti.

ANOVA fattoriale mista esempio le statistiche descrittive 17

ANOVA fattoriale mista esempio effetti tra i soggetti 18

ANOVA fattoriale mista esempio effetti entro i soggetti Test post hoc sulle medie marginali relative al fattore corso : Le valutazioni del corso intensivo in sede (2) si differenziano significativamente da quelle degli altri due corsi. Le valutazioni di questi ultimi non si differenziano invece significativamente. 19

ANOVA fattoriale mista esempio riportiamo i risultati In media, le donne esprimono valutazioni leggermente inferiori agli uomini relativamente ai corsi di formazione, M = 26.45, SD = 3.94 e M = 27.55, SD = 4.08 rispettivamente per le donne e gli uomini. Questa differenza è statisticamente significativa, F (1,76) = 6.23, p =.02, η 2 p =.07. L ANOVA evidenzia inoltre un effetto statisticamente significativo del tipo di corso, F (2,156) = 9.12, p <.01, η 2 p =.10 con M = 25.40, SD = 5.43 per il corso residenziale, M = 28.82, SD = 5.22 per il corso in sede intensivo e M = 27.00, SD = 4.02 per il corso in sede diluito. L effetto dell interazione non è significativo, F (2,156) =0.81, p =.45. I test post hoc sulle medie marginali relative al fattore corso (eseguiti con la correzione di Bonferroni) evidenziano differenze significative tra la valutazione del corso intensivo in sede e le valutazioni di entrambi gli altri corsi, in entrambi i casi p <.03. Evidenziano inoltre che la valutazione media del corso residenziale non si differenzia significativamente dalla valutazione del corso diluito in sede, p =.19 20

ANOVA fattoriale disegni con 3 fattori Presenza di tre Variabili Indipendenti (fattori) Possono essere sia tra sia entro i soggetti. Esempio tre fattori tra i soggetti: una multinazionale vuole introdurre un sistema di incentivi per aumentare l efficacia dei suoi venditori. Prima testa il sistema di incentivi su un piccolo gruppo di venditori, in tre Paesi. Il disegno: - Sistema di incentivazione (2 livelli: incentivo vs. controllo) - Paese (3 livelli: Italia, Francia, Germania) - Sesso (2 livelli: maschi vs. femmine) D.V. Numero nuovi contratti in un mese, dopo l introduzione nel campione del nuovo sistema d incentivi. Attraverso l ANOVA fattoriale possiamo analizzare se l effetto dell incentivo sia differente per donne ed uomini, o nei diversi Paesi, o tra i sessi in maniera diversa a seconda del Paese. 21

ANOVA fattoriale disegni con 3 fattori Presenza di tre Variabili Indipendenti (fattori) Possono essere sia tra sia entro i soggetti. Esempio due fattori tra, uno entro i soggetti: una multinazionale vuole introdurre un sistema di incentivi per aumentare l efficacia dei suoi venditori. Prima testa il sistema di incentivi su un piccolo gruppo di venditori, in tre Paesi. Il disegno: - Sistema di incentivazione (2 livelli: incentivo vs. controllo) - Paese (3 livelli: Italia, Francia, Germania) - Momento della misura: prima e dopo l introduzione incentivo. D.V. Numero nuovi contratti in un mese 22

ANOVA fattoriale Esempio 3 fattori tra i soggetti I dati: N = 240 (n = 20 in ogni condizione) 23

ANOVA fattoriale Esempio 3 fattori tra i soggetti Le medie Incentivo Controllo 24

ANOVA fattoriale Esempio 3 fattori tra i soggetti L ANOVA 25

ANOVA fattoriale Esempio 3 fattori tra i soggetti L ANOVA Effetto principale dell incentivo, non qualificato da interazioni significative. 26

ANOVA fattoriale Esempio 3 fattori tra i soggetti l ANOVA 27

ANOVA fattoriale Esempio 3 fattori tra i soggetti l ANOVA 28

Analisi della Covarianza (ANCOVA) Cos è: tecnica per controllare statisticamente la variabilità causata da (legata a) fonti esterne al disegno. Domande principali: le stesse dell ANOVA (ossia differenze tra medie nella V.D. in condizioni diverse): Usi tipici: a) Abbassare la variabilità dell errore tenendo sotto controllo una fonte di variabilità [perciò escludendo questa varianza dalla componente d errore] Esempio: Ci sono differenze nelle competenze di chi ha seguito il corso di formazione A e chi non l ha seguito, dopo che teniamo sotto controllo le conoscenze pregresse? b) Controllare statisticamente una fonte di disturbo [uso più problematico dell ANOVA] Esempio: i partecipanti al corso di formazione A sono mediamente più giovani di quelli del corso B e l età influisce sulla V.D. Si aggiustano le medie della V.D.: come sarebbero se i soggetti dei due gruppi non differissero relativamente alla covariata? Come funziona: Gli effetti (principali e d interazione) dei fattori sono analizzati dopo che i punteggi della V.D. sono corretti per l effetto di una o più variabili (covariate). 29

ANCOVA Esempi Efficacia delle mnemotecniche Fattore mnemotecniche: 3 livelli (Controllo vs. Mnemotecniche A vs. Mnemotecniche B) V.D.: Prestazione mnestica dopo il corso Covariate: Prestazione mnestica prima del corso La domanda: I corsi di mnemotecniche sono efficaci? Ci sono differenze tra i due corsi? Teniamo sotto controllo le differenze interindividuali di memoria 30

ANCOVA Esempi - II Effetti di una pubblicità progresso sul risparmio energetico. Fattore pubblicità: 3 livelli (Controllo vs. Messaggio A vs. Messaggio B) V.D.: indice di consumo energetico Covariate: atteggiamenti ecologici; conoscenze pregresse. La domanda: Tenendo sotto controllo gli atteggiamenti e le conoscenze pregresse nei confronti dell ecologia e del risparmio energetico, qual è l effetto del messaggio sul consumo energetico? 31

ANCOVA La logica 1. La V.D. viene regredita sulla covariata (o sulle covariate). i punteggi della V.D. vengono corretti per rimuovere l effetto della covariata. Punteggi corretti della V.D. = quelli che la V.D. avrebbe se tutti le osservazioni avessero lo stesso valore nella covariata. 2. Viene eseguita l analisi della varianza per indagare gli effetti dei fattori sulla nuova variabile corretta. Indice di consumo energetico Atteggiamenti verso ecologia PRE 32

ANCOVA Esempio Qual è l effetto di Spot sul consumo energetico? Fattore Spot - 2 livelli: Visione spot vs. controllo. V.D. Indice di consumo. Covariata: atteggiamento ecologico. [attenzione: misurare la covariata prima di introdurre la manipolazione, perché non ne sia influenzata] Senza covariata: t-test per campioni indipendenti Saremmo arrivati alla stessa conclusione con l ANOVA ( F = t 2 ) L effetto dello Spot non è significativo 33

ANCOVA Esempio Importante legame tra atteggiamenti ecologici e consumi: ANCOVA: Effetto significativo dello spot, tenendo sotto controllo l atteggiamento (covariata) 34

ANCOVA Esempio Le medie marginali attese: Stima puntuale e intervallo di confidenza per le medie nelle condizioni, se la Covariata assume uno specifico valore 35

ANCOVA Esempio L analisi permette di valutare anche l effetto della covariata sul consumo energetico I test di significatività delle covariate permettono di valutare la loro utilità nell aggiustamento della V.D. Prospettiva della regressione gerarchica: 1. Le covariate sono inserite al primo passo (tutte assieme) nell interpretare valgono le considerazioni relative all analisi di regressione (il test concerne la varianza unica, nella regressione multipla, spiegata da ciascuna covariata). 2. I fattori e le interazioni tra i fattori sono inseriti al secondo passo. 36

Alcune regole sulle covariate Dovrebbero essere poche, non correlate tra loro e correlate con la V.D. Poche: ogni covariata sottrae un g.l. e questo deve essere almeno compensato dalla riduzione dell errore Se possibile, vanno misurate prima delle manipolazioni altrimenti si rischia di rimuovere parte dell effetto dei fattori sulla V.D. (quella porzione di effetto che V.D. e covariata hanno in comune) 37

ANCOVA - assunzioni (oltre alle usuali assunzioni di normalità e omogeneità della varianza dell ANOVA) Linearità delle relazioni tra le coppie di covariate (se sono più di una) Linearità delle relazioni tra le covariate le la V.D. Omoschedasticità la varianza della V.D. deve essere omogenea a diversi valori della covariata Omogeneità della regressione per le diverse condizioni (i coefficienti di regressione tra covariate e D.V. devono essere gli stessi per tutte le condizioni) Se si sospetta un interazione tra fattori e covariate, non è appropriato fare l ANCOVA 38