L Analisi della Varianza ANOVA (ANalysis Of VAriance)



Documenti analoghi
3. Confronto tra medie di due campioni indipendenti o appaiati

Statistica. Lezione 6

Capitolo 11 Test chi-quadro

STATISTICA IX lezione


4. Confronto tra medie di tre o più campioni indipendenti

LEZIONE n. 5 (a cura di Antonio Di Marco)

VERIFICA DELLE IPOTESI

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

Inferenza statistica. Statistica medica 1

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Verifica di ipotesi

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

Statistiche campionarie

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

Corso di Psicometria Progredito

La logica statistica della verifica (test) delle ipotesi

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Il confronto fra proporzioni

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Capitolo 12 La regressione lineare semplice

Metodi statistici per le ricerche di mercato

Tema A Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Università del Piemonte Orientale. Corsi di Specialità. Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Facoltà di Psicologia Università di Padova Anno Accademico

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

Esercitazione n.4 Inferenza su varianza

Temi di Esame a.a Statistica - CLEF

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

Elementi di Psicometria con Laboratorio di SPSS 1

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Concetto di potenza statistica

La regressione lineare multipla

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Esercitazione n.2 Inferenza su medie

T DI STUDENT Quando si vogliono confrontare solo due medie, si può utilizzare il test t di Student La formula per calcolare il t è la seguente:

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco

Pro e contro delle RNA

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

1. Distribuzioni campionarie

ANALISI DELLA VARIANZA A PIU CRITERI DI CLASSIFICAZIONE

Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Indici di Affidabilità

ANALISI DELLE FREQUENZE: IL TEST CHI 2

GESTIONE INDUSTRIALE DELLA QUALITÀ A

CAPITOLO III CONFRONTI TRA DISTRIBUZIONI

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

IL TEST CHI QUADRATO χ 2

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Istituzioni di Statistica e Statistica Economica

Il coefficiente di correlazione di Spearman per ranghi

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C

Facciamo qualche precisazione

Istituzioni di Statistica e Statistica Economica

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

Relazioni statistiche: regressione e correlazione

11. Analisi statistica degli eventi idrologici estremi

Relazioni tra variabili

E naturale chiedersi alcune cose sulla media campionaria x n

Statistica descrittiva: prime informazioni dai dati sperimentali

Corso di Psicometria Progredito

Analisi di dati di frequenza

LE ASSUNZIONI DELL'ANOVA

è decidere sulla verità o falsità

decidiamo, sulla base di un campione, se l ipotesi formulata è plausibile oppure no.

Esercitazioni di Statistica

INTRODUZIONE AL DESIGN OF EXPERIMENTS (Parte 1)

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Confronto tra gruppi (campioni indipendenti)

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

LA CORRELAZIONE LINEARE

INTRODUZIONE AL DOE come strumento di sviluppo prodotto Francesca Campana Parte 3 Piani a fattore singolo e relativi test di interpretazione

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO

Elementi di Psicometria con Laboratorio di SPSS 1

Inferenza statistica

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Statistica inferenziale

Corso di Psicometria Progredito

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

Corso di. Dott.ssa Donatella Cocca

LEZIONI DI STATISTCA APPLICATA. Parte 2. Statistica inferenziale. Variabili continue per categoriali. Alessandro Valbonesi

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

Prova di autovalutazione Prof. Roberta Siciliano

VERIFICA DELLE IPOTESI

Test non parametrici. Test non parametrici. Test non parametrici. Test non parametrici

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Elementi di Psicometria

Transcript:

L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1

CONCETTI GENERALI Finora abbiamo descritto test di ipotesi finalizzati alla verifica di ipotesi sulla differenza tra parametri di due popolazioni Spesso si presenta la necessita di prendere in considerazione esperimenti od osservazioni relative a più di due gruppi individuati sulla base di un fattore di interesse I gruppi sono quindi formati secondo i livelli assunti da un fattore, ad esempio: la temperatura di cottura di un oggetto in ceramica che assume diversi livelli numerici come 300, 350,400,450 oppure il fornitore che serve una azienda puo assumere diversi livelli qualitativi come Fornitore 1, Fornitore 2, Fornitore 3, Fornitore 4 2

L analisi della varianza e una tecnica che consente di confrontare da un punto di vista inferenziale le medie di più di due gruppi (popolazioni) Quando i gruppi sono definiti sulla base di un singolo fattore si parla di analisi della varianza a un fattore o a una via Questa procedura, basata su un test F, e una estensione a più gruppi del test t per verificare l ipotesi sulla differenza tra le medie di due popolazioni indipendenti Anche se si parla di analisi della varianza in realtà l oggetto di interesse sono le differenze tra medie nei diversi gruppi e proprio tramite l analisi della variabilità all interno dei gruppi e tra gruppi che siamo in grado di trarre delle conclusioni sulla differenza delle medie 3

La variabilità all interno dei gruppi e considerata un errore casuale, mentre la variabilita tra i gruppi e attribuibile alle differenza tra i gruppi, ed e anche chiamata effetto del trattamento Ipotizziamo che c gruppi rappresentino popolazioni con distribuzione normale, caratterizzate tutte dalla stessa varianza e che le osservazioni campionarie siano estratte casualmente ed indipendentemente dai c gruppi In questo contesto l ipotesi nulla che si e interessati a verificare e che le medie di tutti gruppi siano uguali tra loro, contro l ipotesi alternativa che almeno una sia diversa H0 : 1 2... c H1 : non tutte le medie sonouguali tra loro 4

Per verificare le due ipotesi considerate, la variabilità totale (misurata dalla somma dei quadrati totale SST) viene scomposta in due componenti: una componente attribuibile alla differenza tra i gruppi (misurata dalla somma dei quadrati tra i gruppi SSA) e una seconda componente che si riferisce alle differenze riscontrare all interno del gruppi (misurata dalla somma dei quadrati all interno dei gruppi SSW) 5

SSA SSW SST ANALISI DELLA VARIANZA c 1 1 i 1 c c x n n 1 i 1 x x 2 x variabilit à tra igruppi 2 variabilit à entro igruppi 2 x x variabilit à totale i i n Dove: c numero dei gruppi n campione esimo n numerosità complessiva generico gruppo X generica osservazione appartenente al x i media del esimo gruppo x media generale esimo gruppo

(c-1) = gradi di libertà di SSW (n-c) = gradi di libertà di SSA Dividendo ciascuna somma dei quadrati per i rispettivi gradi di liberta, si ottengono tre varianze, o medie dei quadrati MSA (la media dei quadrati tra gruppi), MSW (la media dei quadrati all interno dei gruppi) e MST (la media dei quadrati totale). Se l ipotesi nulla e vera e non ci sono differenze significative tra le medie dei gruppi, le tre medie dei quadrati MSA, MSW e MST, che sono esse stesse delle stime di varianze e rappresentano tutte stime della varianza globale della popolazione sottostante Quindi per verificare l ipotesi nulla contro l alternativa si fa riferimento alla statistica test F per l ANOVA a una via, ottenuta come rapporto tra MSA e MSW

Statistica test F per l ANOVA ad una via SSA ( n c) MSA F SSW MSW ( c 1) Se l ipotesi nulla e vera, la realizzazione della statistica F dovrebbe essere approssimativamente 1, mentre se H 0 e falsa ci aspettiamo valori significatività superiori all unita. La statistica F ha distribuzione F con (c 1) gradi di liberta al numeratore e (n c) gradi di liberta al denominatore Quindi, fissato il livello di significativita α, l ipotesi nulla dovra essere rifiutata se il valore osservato della statistica test e maggiore del valore critico F s di una distribuzione F con (c 1) e (n c) gradi di liberta 8

I risultati del test F per l ANOVA vengono solitamente riportati nella cosiddetta tabella dell ANOVA Nella tabella dell ANOVA viene solitamente riportato anche il p- value, cioè la probabilità di osservare un valore di F maggiore o uguale a quello osservato, nel caso l ipotesi nulla sia vera. Come usuale, l ipotesi nulla di uguaglianza tra le medie dei gruppi deve essere rifiutata quando il p-value e inferiore al livello di significatività scelto.

esempio

esempio Preliminarmente calcoliamo le quantità seguenti: n 1 = 6 n 2 = 6 n 3 = 6 x 1 = x 1i n 1 = 6,07 x 2 = x 2i n 2 = 2,07 x 3 = x 3i n 3 = 3,73 S 1 2 = x 1i x1 2 n 1 1 = 2,717 S 2 2 = x 2i x 2 2 n 2 1 = 0,43 S 3 2 = x 3i x 3 2 = 2,01 n 3 1 Successivamente esponiamo i calcoli per il calcolo della ANOVA Natura della Devianza Gradi di Varianze F variabilità libertà Tra le classi 48,46 2 24,23 24,23:1,72 = Entro le classi 25,75 15 1,72 14,09 Totale 74,21 17 25,95

esempio Il risultato del test (14,09) deve essere confrontato con la v.c. F di Snedecor/Fisher in corrispondenza di 2 e 15 g.d.l. a livello di significatività del 5%. Il valore teorico è 3,68. Il risultato del test cade nella zona di rifiuto che ci porta a concludere che: a)vi è una differenza significativa tra le vendite medie del prodotto ai diversi livelli di fattori; b)la scelta di locazione che sembra differire significativamente è la posizione frontale; c)il direttore dovrebbe privilegiare il posizionamento centrale del prodotto.

esempio 2 13

esempio 2 Al livello di significatività a=0,05 rifiuto l ipotesi di uguaglianza delle medie a favore dell ipotesi che non tutte le medie sono uguali (p-value = 0,041 < 0,05). Il valore della distribuzione F con 3 e 16 g.l. che lascia a destra una probabilità di 0,05 è F u =3,24<3,46. 14