CONFRONTI MULTIPLI TEST HSD DI TUKEY Nel caso in cui i risultati dell analisi della varianza ad una via sono significativi, ovvero se il R.V. è risultato avere un F maggiore dell F critico, e quindi le medie dei livelli dei trattamenti non sono tra loro tutte uguali, ci chiediamo quali sono effettivamente i trattamenti (livelli della variabile trattamento) ad essere diversi. Non è operazione opportuna quella di valutare le differenze con una serie di test t di Student confronto medie per due motivi principali: l operazione non è veloce e può risultare macchinosa quando i trattamenti ( livelli della variabile trattamento) sono numerosi, ad es. con 5 trattamenti devo effettuare 1 t di Student diversi; aumenta la probabilità di commettere un errore di prima specie, ovvero di rifiutare H quando è vera. Per il principio delle probabilità composte la probabilità finale di commettere almeno un errore di primo tipo è in funzione di alfa e del numero dei campioni che confronto ( es. per alfa =.5 e 1 campioni la probabilità di rifiutare almeno una ipotesi di nessuna differenza commettendo l errore di primo tipo è = a 1- (.95) 1 ovvero.41 ovvero maggiore del 4%). Quindi si operano confronti multipli con test specifici come i test Tukey, Bonferroni, Scheffè
Viene presentata qui di seguito la tecnica dei confronti multipli di Tukey Il test di Tuckey viene denominato test HSD da honestly significant difference e fa uso di un singolo valore HSD contro il quale tutte le differenze sono confrontate. Esso è dato da: MSW HSD= q α, k, N-k * n Alfa= livello di significatività, solitamente alfa=.5 k = numero dei trattamenti o numero medie da confrontare N= delle osservazioni-unità sperimentali e da k. n = numero di osservazioni che sono presenti nei trattamenti Ovvero da una quantità q ricavabile da apposita tabella in funzione di α, k, N-k, moltiplicata per la radice quadrata della media quadratica entro i gruppi, divisa per il numero di osservazioni che sono presenti nei trattamenti. ----------------------------------------------------------------------------- Se ad esempio MSW= 26 siano alfa=.5, k=, N= 15, n= 5; valori per i quali si ottiene un q =.67 26 quindi HSD=.267* = 2.56 5 HSD= 2.56 valore per confronto delle singole differenze tra le medie dei campioni-livelli della variabile trattamento ------------------------------------------------------------------------------
Quindi in pratica si opera come segue : si calcolano e riportano tutte le differenze tra le medie dei trattamenti, si confrontano le singole differenze con il valore di HSD definito precedentemente se la differenza tra medie ha valore assoluto maggiore di HSD è dichiarata significativa. Se i campioni, livelli della variabile trattamento non hanno la stessa numerosità il valore HSD non può essere unico ma deve essere specifico per le singole coppie di medie a confronto e nella formula sopra riportata MSW HSD= q α, k, N-k * nj Ove è necessario specificare nj come n corrispondente alla minore numerosità tra le due numerosità dei due campioni in confronto.
Esempio esercizio 1 Riprendiamo i dati dell anova 1.1 che aveva R.V. con F significativo TRATTAMENTO 1 Non trattati 2 Estrogeno Progesterone 4 Estrogeno +Progesterone 117 44 65 2664 124 264 626 278 4 221 85 584 88 16 475 154 4 184 n= 18 k= 4 TOT generale= Totale 49 161 291 1176 Media 81.8 265.25 522.75 241.2 T= 15267 Media generale = X= 848.166 calcoliamo le singole differenze tra le medie di trattamenti (livelli variabile trattamento) D.M. Differenza medie trattamenti 1 Non trattati 2 Estrogeno Progesterone 4 Estrogeno + Progesterone 1 Non trattati - 18.45 44.95 2259.4 2 Estrogeno - 275.95 Progesterone - 1818.45 4 Estrogeno + Progesterone - Otteniamo q definito da alfa=.5, k= 4, N-k= 14; q= 4.11 Si ottengono i seguenti confronti multipli con i rispettivi HSD; MSW= 19256.786 Ipotesi HSD Decisione statistica H: µ 1 = µ 2 H: µ 1 = µ H: µ 1 = µ 4 H: µ 2 = µ H: µ 2 = µ 4 H: µ = µ 4 HSD= 4.11* 19256.786 9.4 4 HSD= 4.11* 19256.786 9.4 4 HSD= 4.11* 19256.786 88.5 5 HSD= 4.11* 19256.786 9.4 4 HSD= 4.11* 19256.786 9.4 4 HSD= 4.11* 19256.786 9.4 4 In sintesi il trattamento 4 risulta diverso dagli altri che non sono diversi tra loro. 18.5< 9.4 44.95< 9.4O 2259.4> 9.4 257.5< 9.4 275.95> 9.4 1818.45> 9.4
Esempio esercizio 2 Riprendiamo i dati dell anova1.2 che aveva R.V. F significativo 1 Controlli 2 Amoxicillina Eritromicina 5 5 TRATTAMENTO 4 Temafloxacina 5 5 Ofloxacina 1 6 Ciprofloxacina 1 8.8 2.6 2.6 2.6 7. 7.86 8.6 2.6 2.6 2.6 5. 4.6 8.1 2.6 2.6 2.6 7.48 6.45 8.4 8.8 n= 2 k=6 Totale 42.7 7.8 7.8 7.8 2.8 18.91 Tot generale= T=15.9 Media Media 8.54 2.6 2.6 2.6 6.69 6. generale= X= 5.25 calcoliamo le singole differenze tra le medie di trattamenti (livelli variabile trattamento) D.M. 1 Controlli 2 Amoxicillina Eritromicina 5 5 Differenza medie trattamenti 4 Temafloxacina 5 5 Ofloxacina 1 6 Ciprofloxacina 1 4.9 1 Controlli - 4.9 4.9 22.62 2.79 2 Amoxicillina 5-12.28 11.11 Eritromicina 5-12.28 11.11 4 Temafloxacina 5-12.28 11.11 5 Ofloxacina 1-1.17 6 Ciprofloxacina 1 - Otteniamo q definito da alfa=.5, k= 6, N-k= 14; q= 4.64 Riprendiamo il valore della somma quadratica media entro i gruppi MSW= Si ottengono i seguenti confronti multipli con i rispettivi HSD
Ipotesi HSD Decisione statistica H: µ 1 = µ 2 H: µ 1 = µ H: µ 1 = µ 4 H: µ 1 = µ 5 H: µ 1 = µ 6 H: µ 2 = µ H: µ 2 = µ 4 H: µ 2 = µ 5 H: µ 2 = µ 6 H: µ = µ 4 H: µ = µ 5 H: µ = µ 6 H: µ 4 = µ 5 H: µ 4 = µ 6 H: µ 5 = µ 6 4.9 > 4.9 > 4.9 > 22.62 > 2.79> < 9.4 < 9.4 12.28> 11.11> < 9.4 12.28> 11.11> 12.28> 11.11> 1.17 < In sintesi il trattamento 1 risulta diverso da tutti gli altri; i trattamenti 2, e 4 non sono diversi tra loro ma sono diversi da 1, 5 e 6; i trattamenti 5 e 6 non sono diversi tra loro ma sono diversi da 1, 2, e 4.
Esempio esercizio Riprendiamo i dati dell anova 1.4 che aveva R.V. con F significativo TRATTAMENTO Bambini autistici Bambini normali Bambini ritardati 755 165 8 85 9 51 8 29 15 215 45 565 4 25 715 4 45 8 415 2 9 6 245 45 25 155 45 75 5 41 45 295 45 5 2 46 22 15 6 27 15 225 55 245 9 6 65 5 44 5 82 25 4 245 17 285 7 25 45 45 2 7 285 15 195 27 5 75 N=71 22 Totale 9658 165 494 Media 419.91 5. 29. n 2 15 calcoliamo le singole differenze tra le medie di trattamenti (livelli variabile trattamento) D.M.
Differenza medie trattamenti 1 Bambini 2 Bambini Bambini autistici normali ritardati 1 Controll Bambini autistici - 114.91 9.58 2 Bambini normali - 24. Bambini ritardati - Otteniamo q definito da alfa=.5, k=, N-k= 68; q=.4 (uso N-k= 6 perché N-k=68 manca nella tabella) Riprendiamo il valore della somma quadratica media entro i gruppi MSW= 18186.72 Si ottengono i seguenti confronti multipli con i rispettivi HSD Ipotesi HSD Decisione statistica H: µ 1 = µ 2 H: µ 1 = µ H: µ 2 = µ HSD=.4* 18186.72 95.6 2 HSD=.4* HSD=.4* 18186 118.8.72 15 18186 118.8.72 15 114.91> 95.6 9.58 < 118.8 24.< 118.8 In sintesi il trattamento 1 (livello 1 della variabile trattamento) risulta diverso dal trattamento 2 ma non dal, i due trattamenti 2 e non risultano diversi. In altre parole i bambini autistici sono risultati diversi per la concentrazione serica unità/ml di antigene da quelli normali, ma non sufficientemente diversi da quelli ritardati, i bambini ritardati e normali non sono risultati diversi.
Esempio esercizio 4 Riprendiamo i dati dell anova 1.4 che aveva R.V. con F significativo TRATTAMENTO area 1 ex discarica area 2 area area 4 1 2 1 9 2 2 1 5 2 2 11 1 14 1 4 2 6 2 2 1 2 1 2 11 9 1 4 11 2 2 k = 4 2 Totale 16 27 2 25 Media 9.64 2.25 2.22 2.27 n 11 12 9 11 Totale generale 178 n=4 Media generale 4.14 calcoliamo le singole differenze tra le medie di trattamenti (livelli variabile trattamento) D.M. Differenza medie trattamenti 1 area 1 2 area 2 area 4 area 4 1 area 1-7.9 7.42 7.7 2 area 2..2 area -.5 4 area 4 - Otteniamo q definito da alfa=.5, k=, N-k= 4; q=.44 Riprendiamo il valore della somma quadratica media entro i gruppi MSW=
Si ottengono i seguenti confronti multipli con i rispettivi HSD Ipotesi HSD Decisione statistica H: µ 1 = µ 2 HSD=.44* 2.1 H: µ 1 = µ H: µ 1 = µ 4 H: µ 2 = µ HSD=.44* HSD=.44* HSD=.44* 11 2.22 9 2.1 11 2.22 9 H: µ 2 = µ 4 HSD=.44* 2.1 H: µ = µ 4 HSD=.44* 11 2.22 9 7.9 > 2.1 7.42 > 2.22 7.7 > 2.1. < 2.22.2 < 2.1.5 < 2.22 In sintesi il trattamento 1 (livello 1 della variabile trattamento) risulta diverso dal trattamento 2, e 4 che non risultano diversi tra loro.