ANALISI DELLA VARIANZA A PIU CRITERI DI CLASSIFICAZIONE CON REPLICHE
INTRODUZIONE Lo studio di un fenomeno non si deve limitareit alla valutazione dei singoli fattori in studio ma molto spesso è importante valutare anche come tali fattori interagiscono tra di loro; lo studio delle interazioni è fondamentale per capire i diversi effetti di un fattore a seconda della modalità degli altri fattori in studio. Nella realtà molto spesso i comportamenti dei fenomeni cambiano a seconda di quali variabili vanno ad influire contemporaneamente sul fenomeno.
ESEMPIO ESEMPIO: Valutare l effetto di un farmaco su un certo outcome a seconda dell appartenenza a classi di età diverse o a seconda del sesso. L effetto del farmaco è diverso nei giovani rispetto agli anziani? L effetto del farmaco varia a seconda del sesso? Se non c è interazione allora il farmaco avrà un effetto uguale per tuttett le classi di età. L effetto sarà mediamente uguale tra le diverse classi di età. L efficacia sarà la stessa per tutti i soggetti in studio indipendentemente dallaloroetà. Se c è l interazione allora il farmaco avrà effetti diversi a seconda Se cè linterazioneallora il farmaco avrà effetti diversi a seconda della classe di età o del sesso, quindi non si può considerare un effetto medio uguale in tutte le classi ma si dovrà fornire i diversi profili di efficacia.
GLI EFFETTI E L INTERAZIONE L analisi della varianza a più criteri di classificazione (ANOVA) è il metodo per valutare: 1. Le interazioni tra più fattori per determinare l effetto congiunto 2. Gli effetti principali dei singoli fattori Nel caso più semplice di analisi della varianza a due criteri di classificazione con repliche, e, le interazioni sono o chiamate atedi primo ood ordine e( (A*B) Le interazioni possono avere un valore: Positivo (l effetto di un fattore migliora con la presenza dell altro fattore) Negativo (l effetto di un fattore peggiora con presenza dell altro fattore ) Nullo (l effetto dato dalla presenza di entrambi i fattori è determinato Nullo (l effetto dato dalla presenza di entrambi i fattori è determinato esclusivamente dalla somma dei singoli effetti principali)
GLI EFFETTI E L INTERAZIONE indifferenza I singoli fattori hanno degli effetti che non variano a seconda del livello degli altri fattori (INTERAZIONE NULLA: additività degli effetti) sinergismo La presenza contemporanea di determinati livelli dei fattori migliora il risultato rispetto alla semplice additività (INTERAZIONE POSITIVA) antagonismo La presenza contemporanea di determinati livelli dei fattori peggiora il risultato rispetto alla semplice additività (INTERAZIONE NEGATIVA )
INTERAZIONE TRA DUE FATTORI A DUE LIVELLI 7 6 5 4 3 2 1 0 Med dia di X Effetto Basale Interazione non significativa Effetto A Effetto B A=0, B=0 A=1, B=0 A=0, B=1 A=1, B=1 B=1 B=0 8 7 6 5 4 3 2 1 0 Interazione non significativa A=0 A=1 A=0 A=1 Effetto A*B Presenza di interazione: i segmenti NON sono paralleli, l effetto di un fattore dipende dal livello dell altro B=1 B=0
INTERAZIONE TRA DUE FATTORI A DUE LIVELLI Tabella con le medie di cella: FATTORE A FATTORE B NO (1) SI (2) NO (1) 11 21 SI (2) 12 22 L effetto del fattore A è dato da μ 21 μ 11 o μ 22 μ 12. In generale esso dipende dal livello del fattore B. L effetto del fattore B è dato da μ 12 μ 11 o μ 22 μ 21. In generale esso dipende dal livello del fattore A. Se = oppure = allora si dice che non c è interazione i tra i due fattori. IL PARAMETRO DI INTERAZIONE è dunque: che nel caso di mancanza di interazione è uguale a 0.
STIME DELLE MEDIE CON I PARAMETRI DEGLI EFFETTI MODELLO ADDITIVO FATTORE A FATTORE B NO SI NO SI 11 21 12 22 SE ALLORA 2 21 11 22 12 e 2 12 11 22 21 e FATTORE A FATTORE B NO SI NO SI
STIME DELLE MEDIE CON I PARAMETRI DEGLI EFFETTI MODELLO CON INTERAZIONE FATTORE A FATTORE B NO SI NO SI 11 21 12 22 SE 22 μ 22 μ 12 μ 21 μ 11 0 22 12 21 11 ALLORA 2 21 11 22 12 e 2 12 11 22 21 FATTORE A FATTORE B NO SI NO SI
STIME DELLE MEDIE CON I PARAMETRI DEGLI EFFETTI MODELLO ADDITIVO GENERALE Date le medie di cella, si dice che non c è interazione tra i due fattori, se: 11 per i 1..n e j 1..p dove 1 11 1 1 e 1 11 1 1 NOTARE CHE RISULTA 1 e 1 uguali a 0 perciò: gli effetti di colonna sono n 1 parametri che esprimono le differenze tra la i esima colonna e la prima. gli effetti di riga sono p 1 parametri che esprimono le differnze tra la j esima riga e la prima riga.
STIME DELLE MEDIE CON I PARAMETRI DEGLI EFFETTI MODELLO GENERALE CON INTERAZIONI Date le medie di cella, si dice che c èè interazione tra i due fattori, se: 11 dove 1 11 e 1 11 allora : NOTARE CHE RISULTA 1, 1 sono uguali a 0 perciò: perciò il termine di interazione è definito da n 1 * p 1 p parametri che possono essere espresse anche come le differenze tra le medie di cella e le medie :
ESEMPIO: VALUTARE L EFFETTO DI ANTIBIOTICI E VITAMINA SULL INCREMENTO DI PESO DI MAIALINI. Antibiotici Vitamina NO 0 SI 1 NO 0 1,30 1,19 1,08 1,26 1,21 1,08 SI 1 1,05 1,00 1,05 1,52 1,56 1,55 Antibiotici Vitamina NO 0 SI 1 NO 0 1.19 1.18 Incr remento di pe eso 2 1.5 1 0.5 SI 1 1.03 1.54 0 NO (0) SI (1) Antibiotici Vitamine=NO Vitamine=SI Le differenza nella seconda riga e nella prima riga sono rispettivamente 0.51 e 0.01. La differenza tra i due effetti mi da l interazione: 22 22 μ 22 μ 21 μ 12 μ 11 1.54 1.03 1.18 1.19 0.52
INTERAZIONE TRA DUE FATTORI A PIU LIVELLI Con due ftt fattori econdati dtii riportati tiinunatabella tbll a due entrate, secondo le modalità già presentate nel caso di esperimenti a blocchi randomizzati, è possibile analizzare l interazione solo quando si dispone di più osservazioni in ognuna delle celle poste all'incrocio tra righe e colonne. NOTA: le repliche possono essere misure sia su soggetti diversi sia misure sullo stesso soggetto, tale scelta dipende dal tipo di modello sperimentale
I DATI Di seguito è riportata la tabella a doppia entrata (DUE FATTORI): i trattamenti sono indicati nelle colonne, i blocchi sono indicati nelle righe, le repliche sono riportate nelle caselle per ogni combinazione blocco trattamento è il valore della k esima replica (osservazione) nel livello i esimo del fattore A (trattamento) e nel livello j esimo del fattore B (blocco), sono rispettivamente la somma e la media dei valori (repliche) della casella, all'incrocio tra il trattamento i esimo ed il blocco j esimo
IL MODELLO Il modello additivo dell'anova diventa: Media generale Effetto del fattore A per la modalità i Effetto del fattore B per la modalità j Effetto dell interazione tra la modalità i di A e la modalità j di B DAL MODELLO ADDITIVO SI DIMOSTRA LA SCOMPOSIZIONE DELLA DEVIANZA TOTALE
LE DEVIANZE Ladevianzatotaleeledevianzetratrattamentietrablocchisono calcolate come nell anova a blocchi randomizzati La devianza d interazione è calcolata come la somma dei quadrati degli scarti tra media osservata e media stimata in ogni casella La devianza di errore SQ(e) è la somma dei quadratidegli scarti di ogni La devianza di errore SQ(e) è la somma dei quadrati degli scarti di ogni replica (osservazione) dalla sua media di casella
SCOMPOSIZIONE DELLA DEVIANZA Nell ANOVA con due fattori con misure ripetute, la devianza totale può essere calcolata come somma delle seguenti componenti di devianza: Devianza del fattore A Devianza del fattore B Devianza a dell interazione ione tra A e B Devianza d errore o residua ANCHE I GRADI DI LIBERTA SI SOMMANO
METODOLOGIA PER TESTARE La tabella riportata riporta schematicamente tutte le quantità utili al calcolo dei test che ci permettono di valutare sia la significatività delle interazioni sia la significatività dei fattori principali n è il numero di modalità (livelli) del fattore A; p è il numero di livelli del fattore B; r è il numero di repliche osservate entro ogni casella.
FORMULE La devianza totale SQ(T), è la somma dei quadrati degli scarti di ogni dato rispetto alla media generale La devianza tra trattamenti o del fattore A, SQ(A), è la somma dei quadrati degli scarti tra la media di ogni trattamento e la media generale: La devianza tra blocchi o del fattore B, SQ(B), è la somma dei quadrati degli scarti tra la media di ogni blocco e la media generale:
FORMULE La devianza dinterazione d'interazione tra i fattori A e B, SQ(AB), è la somma dei quadrati degli scarti di ogni media di casella rispetto al valore atteso : Il calcolo della devianza d'interazione e dei suoi gradi di libertà conviene farlo sottraendo alla devianza tra le medie di cella le devianze sia del fattore A che del fattore B: dove è la devianza tra le medie delle caselle che per definizione è la somma dei quadrati degli scarti di ogni media di casella dalla media generale La devianza d'errore SQ(e) è la somma dei quadrati degli scarti di ogni valore rispetto alla media della sua casella: Il calcolo della devianza d'errore può essere ottenuto più facilmente sottraendo dalla devianza totale la devianza tra le medie delle caselle:
TEST D IPOTESI L'analisi della varianza a due criteri di classificazione con repliche permette di verificare la significatività dell interazione e dei fattori principali 1. IPOTESI nulla: nessuna interazione i tra i ftt fattori ia e B ai vari livellilli Contro l ipotesi alternativa: 2. IPOTESI nulla: nessuna differenza tra le medie del fattore A Ipotesi nulla H0 di uguaglianza delle medie dei trattamenti, fattore A : Ipotesi alternativa H1 è : non tutte le medie dei trattamenti sono tra loro uguali 3. IPOTESI nulla: nessuna differenza tra le medie del fattore B ipotesi nulla H0 di uguaglianza delle medie dei blocchi o fattore secondario: ipotesi alternativa H1 : non tutte le medie dei blocchi sono tra loro uguali.
IL TEST F Per valutare le ipotesi formulate si utilizzano test F mediante il rapporto tra la varianza del fattore e la varianza d'errore. Per l ipotesi 1: Per l ipotesi i 2: Per l ipotesi 3:
REGOLE GERARCHICHE DI INTERPRETAZIONE Osservare innanzitutto la significatività dell interazione: se l effetto interattivo è significativo va considerata solo l interazione e NON E LECITA ALCUNA CONCLUSIONE SUGLI EFFETTI SEMPLICI. Infatti con interazione, l effetto di un fattore è condizionato dal livello dell altro.