Introduzione all Analisi della Varianza (ANOVA)

Documenti analoghi
Introduzione all Analisi della Varianza (ANOVA)

Il modello di regressione

Il modello di regressione

Analisi Multivariata dei Dati. Regressione Multipla

Metodologie Quantitative

Assunzioni (Parte I)

Analisi della Varianza Fattoriale. (Cap. 8)

Regressione Lineare Semplice e Correlazione

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

Analisi Multivariata dei Dati

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

Analisi delle medie post ANOVA. (cap. 4 e 8)

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

Psicometria con Laboratorio di SPSS 2

Corso in Statistica Medica

Analisi della Varianza Fattoriale

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Regressione lineare semplice

PROBABILITÀ ELEMENTARE

1. variabili dicotomiche: 2 sole categorie A e B

Verifica delle ipotesi

INDICE PARTE METODOLOGICA

Correlazione tra due variabili

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value

Misure Ripetute. Analisi dei dati in disegni di ricerca con misure ripetute. Marcello Gallucci

lezione 4 AA Paolo Brunori

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Analisi della Varianza Fattoriale

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

Statistica descrittiva: analisi di regressione

Elementi di Psicometria con Laboratorio di SPSS 1

Esercitazione del

STATISTICA. Regressione-4 ovvero Macron!

Test F per la significatività del modello

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

Metodi statistici per le ricerche di mercato

Capitolo 12 La regressione lineare semplice

Regressione & Correlazione

Test delle Ipotesi Parte I

Statistica multivariata Donata Rodi 17/10/2016

Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi

Analisi delle medie (post ANOVA)

Argomenti della lezione:

Esercizi di statistica

ESERCITAZIONI N. 3 corso di statistica

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello

Analisi di Regressione Multipla

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

STATISTICA A K (60 ore)

Analisi della varianza

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

La regressione lineare semplice

Analisi della varianza a una via

Prefazione Ringraziamenti

Assunzioni (cap. 6) Marcello Gallucci

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Teoria e tecniche dei test. Concetti di base

Misure Ripetute. Partizione della Varianza. Marcello Gallucci

Dispensa di Statistica

viii Indice generale

Fasi del modello di regressione

Tecniche statistiche di analisi del cambiamento

STATISTICA. Regressione-2

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Statistica economica

Analisi Fattoriale Concetti introduttivi Marcello Gallucci Milano-Bicocca

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

ESERCITAZIONE REGRESSIONE MULTIPLA

Esercitazione del 16 maggio 2014

Matematica Lezione 22

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

Analisi avanzate basate sulla regressione (Cap. 7)

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.

Elementi di Psicometria (con laboratorio software 1)

Rappresentazioni grafiche di distribuzioni doppie

Tecniche statistiche di analisi del cambiamento

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

ESERCIZIO 1. Di seguito vengono riportati i risultati di una regressione multipla effettuata secondo il metodo standard (o per blocchi )

Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione

ANALISI MULTIVARIATA

Metodi statistici per la ricerca sociale Capitolo 13. Combinare regressione e ANOVA: predittori categoriali e quantitativi Esercitazione

Facoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B

Between / TRA Soggetti Le medie dei due trattamenti sono diverse? Gruppo 2. Media 1. Media 2

Ulteriori Conoscenze di Informatica e Statistica

Statistica multivariata Donata Rodi 08/11/2016

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Statistica inferenziale

Transcript:

Introduzione all Analisi della Varianza (ANOVA) Marcello Gallucci P S I C O M E T R I A marcello.gallucci@unimib.it

Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa e, per quello che abbiamo visto, anche le variabili indipendenti Variabili quantitative 9 8 7 6 ˆ y i a b x yx i 5 4 3 SORRISI - - 3 4 5 6 7 8 9 BIRRE

Regressione NS La retta di regressione rappresenta la predizione lineare (o dipendenza lineare) tra una variabile indipendente ed una dipendente, espressa nelle unità di misura originali 9 8 7 6 5 4 3 SORRISI - - 3 4 5 6 7 8 9 BIRRE

Variabili Nominali (categoriche) Nelle variabili nominali i valori indicano sono delle qualità, cioè sono equivalenti a delle etichette Punteggi N di birre Regione di Provenienza Aumentare di una unità significa solo cambiare quantità Media, varianza non hanno senso 3 nord 4 nord nord nord 3 centro 4 centro 6 centro 7 centro nord 3 nord

Variabili Nominali Esempi di variabili nominali: Sesso (Donne= Uomini=) Nazionalità (es. Francese=, Tedesco= e Italiano=3) Facoltà (es. Psicologia=, Informatica=, Medicina=3) Gruppi sperimentali (es. Trattamento=, Placebo=) In generale, le variabili nominali indicano in quale gruppo il soggetto appartiene

Variabili Nominali Nelle variabili nominali, l unità di misura non ha la stessa interpretazione ad ogni livello della scala di misura Passare da Italiano a Francese, non è la stessa cosa che passare da Francese a Tedesco Qualunque numero che distingua i gruppi rappresenta la stessa qualità In generale, i valori numerici dati ai soggetti sono arbitrari

Esperimento Variabili nominali si trovano spesso negli esperimenti Nel seguente esperimento testiamo l effetto di un ancoraggio cognitivo sulla stima delle quantità numeriche: Domanda a tutti i soggetti: Secondo te, le nazioni africane alle nazioni unite sono più o meno del X %. Domanda : Quante sono le nazioni africane in percentuale alle nazioni unite Ancora Var. Dipendente Gruppo : ancora %. Gruppo : ancora 8% Condizione sperimentale

Esperimento: Risultati 8 6 4 Quesito sperimentale: L ancoraggio ha un effetto significativo sulla stima numerica? ANSWER ANCHOR 8 Totale Report Deviazione Media N std. 7,447 85,897 44,888 85 9,68864 3,9368 7,944 ANSWER ANCHOR 4 6 8 C e un differenza significativa? Quanto spieghiamo con tale differenza?

Regressione Partiamo da ciò che sappiamo: Regressione Codifichiamo la variabile indipendente come Gruppo ancora % X= Gruppo ancora 8% X= 8 6 4 Stimiamo la regressione ANSWER - ANCHORD

Regressione Dove passerà la regressione? Quali valori di Y saranno indicati dalla regressione 8 6? ANSWER 4 -? ANCHORD

Regressione Dove passerà la regressione? Quali valori di Y saranno indicati dalla regressione Ricordiamo che la regressione è la retta che minimizza la distanza tra i punti osservati e quelli stimati 8 6 4 Ricordiamo che in una distribuzione, la media è il valore che minimizza la distanza tra i punteggi osservati e se stessa ANSWER - ANCHORD

Regressione Dove passerà la regressione? Quali valori di Y saranno indicati dalla regressione Ricordiamo che la regressione è la retta che minimizza la distanza tra i punti osservati e quelli stimati 8 6 Ricordiamo che in una distribuzione, la media è il valore che minimizza la distanza tra I punti osservati e se stessa ANSWER 4 - ANCHORD Questa non è altro che la distribuzione di Y per X=

Regressione Dove passerà la regressione? Quali valori di Y saranno indicati dalla regressione Ricordiamo che la regressione è la retta che minimizza la distanza tra i punti osservati e quelli stimati 8 6 4 Questa non è altro che la distribuzione di Y per X= Ricordiamo che in una distribuzione, la media è il valore che minimizza la distanza tra I punti osservati e se stessa ANSWER - ANCHORD Questa non è altro che la distribuzione di Y per X=

Regressione Dove passerà la regressione? Quali valori di Y saranno indicati dalla regressione Dunque la regressione passerà necessariamente per la media di Y per il gruppo X= e per la media di Y per il gruppo X= 8 6 4 Y ANSWER - Y o ANCHORD

Coefficiente di Regressione Quale valore indicherà il coefficiente di regressione? Ricordiamo che B indica il cambiamento atteso in Y al variare di X di una unità 8 6 Y Cambiamento in Y ANSWER 4 - Y o ANCHORD Aumento X di una unità

Coefficiente di Regressione Quale valore indicherà il coefficiente di regressione? Y a b X X= cioè gruppo % Y a B a Y o 8 X= cioè gruppo 8% 6 Y Y Y B Y Differenza B Y Y o ANSWER 4 - ANCHORD Y o

Coefficiente di Regressione Se la variabile indipendente è dicotomica, il coefficiente ci indica la differenza tra i gruppi Differenza tra le medie dei gruppi 8 6 Y B Y Y o ANSWER 4 - Y o ANCHORD

Inferenza statistica Se il coefficiente è significativo (possiamo rifiutare l ipotesi nulla b=), allora diremo che esiste una differenza significativa tra i gruppi Report ANSWER ANCHOR 8 Totale Deviazione Media N std. 7,447 85,897 44,888 85 9,68864 3,9368 7,944 Test inferenziale Coefficienti a Modello (Costante) ANCHOR Coefficienti non standardizzati a. Variabile dipendente: ANSWER Coefficienti standardizzati B Errore std. Beta t Sig. 7,45,697,45, 7,784,4,666,579, Significatività

Inferenza statistica ANSWER ANCHOR 8 Totale Concluderemo che esiste un effetto dell ancora sulle stime delle quantità Report Deviazione Media N std. 7,447 85,897 44,888 85 9,68864 3,9368 7,944 C è un differenza significativa tra le medie dei gruppi Test inferenziale Modello (Costante) ANCHOR Coefficienti non standardizzati a. Variabile dipendente: ANSWER Coefficienti a Coefficienti standardizzati B Errore std. Beta t Sig. 7,45,697,45, 7,784,4,666,579, Significatività

Test sulla varianza Guardiamo ora il test fatto sulla varianza spiegata Modello Modello Riepilogo del modello R-quadrato Errore std. R R-quadrato corretto della stima,666 a,444,44 5,6436 a. Stimatori: (Costante), ANCHOR Regressione Residuo Totale a. Stimatori: (Costante), ANCHOR b. Variabile dipendente: ANSWER ANOVA b Somma dei Media dei quadrati df quadrati F Sig. 388,8 388,8 34,63, a 43,33 68 44,7 739,53 69 Test inferenziale Ricordiamo il significato della F? Significatività

Test per il coefficiente R Come si ottiene la F Varianza spiegata Varianza errore F Rxy n k R k xy Gdl errore # variabili indipendenti Il rapporto fra varianza spiegata e varianza di errore (moltiplicato per il rapporto fra gradi di libertà) si distribuisce secondo una distribuzione F con k e n-k- gdl Lezione:

Test per il coefficiente R Come si ottiene la F Varianza spiegata Varianza errore f Rxy n k R k xy Gdl errore # variabili indipendenti s ez Y zz s regz X z

Rapporto varianza Se la variabile indipendente è dicotomica, la varianza di errore sarà la somma delle varianza dentro i gruppi Varianza non catturata dalla regressione 8 var gruppo ( Y ) i Yo n 6 4 Y Varianza dentro i gruppi (within groups) ANSWER - ANCHORD Y o var gruppo ( Y Y n ) i

Rapporto varianza Se la variabile indipendente è dicotomica, la varianza spiegata è la varianza tra i punteggi predetti Varianza catturata regressione Media totale di Y 8 var bet ( Y g df Varianza tra i gruppi (between groups) Y ) ANSWER 6 4 - Y Y o ANCHORD

Varianza tra i gruppi Equivalentemente, testiamo la bontà della predizione che noi facciamo dando ad ogni soggetto il punteggio medio del gruppo (variabilità dovuta ai gruppi), rispetto all errore che facciamo Per tutti i soggetti in gruppo= viene predetto lo stesso punteggio 8 Per tutti i soggetti in gruppo= viene predetto lo stesso punteggio 6 4 Y Ciò è il punteggio che otterremmo se le differenze fossero solo dovute al gruppo di appartenenza ANSWER - ANCHORD Y o

Varianze nei gruppi Equivalentemente, stimiamo la bontà della predizione che noi facciamo dando ad ogni soggetto il punteggio medio del gruppo (variabilità dovuta ai gruppi), rispetto all errore che facciamo Errore è la distanza tra il punteggio vero e la media del gruppo 8 La variabilità dentro i gruppi è l errore che commettiamo 6 4 Y ANSWER - Y o ANCHORD

Rapporto varianze Il rapporto tra le varianze, pesato per i gradi di libertà, equivale al test F var var between within ( Y ( Y g Y Y ) g ) / df / df bet. wit. F ANOVA b var between Modello Regressione Residuo Totale a. Stimatori: (Costante), ANCHOR b. Variabile dipendente: ANSWER Somma dei Media dei quadrati df quadrati F Sig. 388,8 388,8 34,63, a 43,33 68 44,7 739,53 69 df within df bet var within

Variabili Nominali Quando la variabile indipendente ha più di due gruppi, lasceremo la rappresentazione in termine di retta, ma manteniamo i concetti di varianza tra i gruppi e varianza nei gruppi Testeremo le differenze tra i gruppi in termini di F Ciò si chiama analisi della varianza (Analysis Of Variance)

Perdiamo la retta Perdiamo la rappresentazione in termini di una retta in quanto la variabile indipendente non è ordinabile in maniera univoca

Perdiamo la retta Ed un unica retta (non spezzata) non potrebbe rappresentare i dati a nostra disposizione

Manteniamo i rapporti di varianza Possiamo comunque testare le differenze tra le medie mediante il rapporto F Medie dei gruppi = punteggi predetti Distanze dalla media del gruppo di appartenenza = errore di predizione Rapporto varianza predetto/ varianza errore ci da la F

ANOVA in pratica In SPSS useremo una routine più generale della regressione, che consente di analizzare anche le variabili indipendenti nominali (modello lineare generalizzato) Modello Lineare Generalizzato: Univariato

ANOVA in pratica Variabile dipendente Variabile indipendente

Output Gradi di libertà Test F Variabilità dovuta a.. Variabile dipendente: birre Sorgente Modello corretto Intercetta nazione Errore Totale Totale corretto Test degli effetti fra soggetti Somma dei quadrati Media dei Tipo III df quadrati F Sig. 38,4 a 9,57 4,48, 897,454 897,454 66,8, 38,4 9,57 4,48, 9,74 97,338 356,398 67,854 99 a. R quadrato =,7 (R quadrato corretto =,) Concluderemo che tra i tre gruppi c è una differenza significativa Valore-p: significatività Almeno due medie sono diverse

Ricerca Anoressia In ricerca sull anoressia* sono state misurate su un campione di 85 donne la propria figura reale, la figura ideale e l autostima. Pictorial Body Image Scale Il campione era formato da donne normo-peso e donne anoressiche

Ricerca Anoressia Group Validi A C Totale Percentuale Percentuale Frequenza Percentuale valida cumulata 39 45.9 45.9 45.9 46 54. 54.. 85.. Vogliamo stabilire se ci sono delle differenze tra i due gruppi nel BIPS attuale e ideale Report Group A C Totale Media N Deviazione std. Media N Deviazione std. Media N Deviazione std. figura_reale figura_ideale 3.74.9 39 39.35.87 3.9 3.35 46 46.839.48 3.84 3.5 85 85..68

Distribuzione per gruppo BIPS reale Le medie di queste due distribuzioni sono uguali?

ANOVA Variabile dipendente: figura_reale Sorgente Modello corretto Intercetta Group Errore Totale Totale corretto Test degli effetti fra soggetti Somma dei quadrati Media dei Eta quadrato Tipo III df quadrati F Sig. parziale.66 a.66.498.483.6 37.3 37.3 5.95..94.66.66.498.483.6.88 83.8 35. 85.694 84 a. R quadrato =.6 (R quadrato corretto = -.6) Non vi sono differenze tra le medie dei due gruppi

Attenzione al grafico Il software produce un grafico delle medie che è sempre espanso e potrebbe far sembrare che vi sia una differenze Se l effetto non è significativo, il grafico non va guardato Notare la scala

BIPS ideale BIPS ideale Le medie di queste due distribuzioni sono uguali?

ANOVA Variabile dipendente: figura_ideale Sorgente Modello corretto Intercetta Group Errore Totale Totale corretto Test degli effetti fra soggetti Somma dei quadrati Media dei Eta quadrato Tipo III df quadrati F Sig. parziale 3.88 a 3.88 8.977.4.98 89.97 89.97 956.84..959 3.88 3.88 8.977.4.98 35.4 83.44 884. 85 39. 84 a. R quadrato =.98 (R quadrato corretto =.87) Vi sono differenze tra le medie dei due gruppi Che spiegano circa % della varianza

Notare la scala Grafico delle medie

Analisi della covarianza Si potrebbe dubitare che la differenza sia dovuta alla differenza tra autostima possibile nei due gruppi Testiamo prima se vi è una differenza tra i gruppi nell autostima Poi testiamo le differenze nei tra PIBS ideale al netto dell autostima

ANOVA Variabile dipendente: Autostima Sorgente Modello corretto Intercetta Group Errore Totale Totale corretto Test degli effetti fra soggetti Somma dei quadrati Media dei Eta quadrato Tipo III df quadrati F Sig. parziale 54.78 a 54.78 33.877..9 36.344 36.344 87.839..97 54.78 54.78 33.877..9 34.8 83.67 549. 85 89. 84 a. R quadrato =.9 (R quadrato corretto =.8) Group Variabile dipendente: Autostima Group A C Limite Limite Media Errore std. inferiore superiore 3.8.4.73 3.533 Intervallo di confidenzale ragazze anoressiche hanno una 95% autostima più bassa 4.739.87 4.366 5.

Dunque Le ragazze anoressiche non si percepiscono come più magre delle ragazze normopese Le ragazze anoressiche hanno una immagine ideale molto più magra delle normopeso La differenza nella immagine ideale non dipende dalla percezione della immagine reale

Fine Fine della Lezione VI