CONFRONTI MULTIPLI TEST HSD DI TUKEY



Похожие документы
R 2 1 j /n j] 3(n+1)

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Analisi della varianza

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

Il test (o i test) del Chi-quadrato ( 2 )

Analisi della varianza

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

Esercitazioni di Statistica

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

Argomenti della lezione:

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

Confronto tra due popolazioni Lezione 6

TECNICHE DI ANALISI DEI DATI

Distribuzioni campionarie. Antonello Maruotti

STIMA DELLA VARIANZA CAMPIONARIA

Esame di Statistica del 7 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Metodi statistici per le ricerche di mercato

Test delle ipotesi. Le differenze che vengono riscontrate possono essere ovviamente ricondotte a due possibilità:

Esercizi di Probabilità e Statistica

Esercizi di statistica

Tecniche statistiche di analisi del cambiamento

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

Statistica: principi e metodi. Medie

7. STATISTICA DESCRITTIVA

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

Elementi di Psicometria con Laboratorio di SPSS 1

+ 1 p = MC. Il costo marginale nel caso proposto dall esercizio è pari a zero. L equazione 6.3 può quindi essere scritta:

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica

Esercitazioni di Statistica

Analisi della varianza

Tecniche statistiche di analisi del cambiamento

Esercitazioni di statistica

Psicometria con Laboratorio di SPSS 2

TEST NON PARAMETRICO DI MANN-WHITNEY

Lezione 5 Corso di Statistica. Francesco Lagona

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

T DI STUDENT Quando si vogliono confrontare solo due medie, si può utilizzare il test t di Student La formula per calcolare il t è la seguente:

Analisi della varianza: I contrasti e il metodo di Bonferroni

Il confronto tra due campioni

Elementi di Psicometria

Indici di Dispersione

Teorema del limite centrale TCL

Concetti principale della lezione precedente

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Contrasti e confronti multipli

Calcolo di una Regressione lineare semplice con Excel

STATISTICHE DESCRITTIVE Parte II

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

STATISTICA ESERCITAZIONE 13

La statistica descrittiva seconda parte. a cura della prof.ssa Anna Rita Valente

Stesso valore medio per distribuzioni diverse

Statistica. Matematica con Elementi di Statistica a.a. 2017/18

Esercitazione 8 del corso di Statistica 2

Analisi della varianza a una via

ESAME. 9 Gennaio 2017 COMPITO B

ESAME. 9 Gennaio 2017 COMPITO A

Lezione 5 Corso di Statistica. Domenico Cucina

Statistica Un Esempio

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4

Il confronto fra medie

Транскрипт:

CONFRONTI MULTIPLI TEST HSD DI TUKEY Nel caso in cui i risultati dell analisi della varianza ad una via sono significativi, ovvero se il R.V. è risultato avere un F maggiore dell F critico, e quindi le medie dei livelli dei trattamenti non sono tra loro tutte uguali, ci chiediamo quali sono effettivamente i trattamenti (livelli della variabile trattamento) ad essere diversi. Non è operazione opportuna quella di valutare le differenze con una serie di test t di Student confronto medie per due motivi principali: l operazione non è veloce e può risultare macchinosa quando i trattamenti ( livelli della variabile trattamento) sono numerosi, ad es. con 5 trattamenti devo effettuare 1 t di Student diversi; aumenta la probabilità di commettere un errore di prima specie, ovvero di rifiutare H quando è vera. Per il principio delle probabilità composte la probabilità finale di commettere almeno un errore di primo tipo è in funzione di alfa e del numero dei campioni che confronto ( es. per alfa =.5 e 1 campioni la probabilità di rifiutare almeno una ipotesi di nessuna differenza commettendo l errore di primo tipo è = a 1- (.95) 1 ovvero.41 ovvero maggiore del 4%). Quindi si operano confronti multipli con test specifici come i test Tukey, Bonferroni, Scheffè

Viene presentata qui di seguito la tecnica dei confronti multipli di Tukey Il test di Tuckey viene denominato test HSD da honestly significant difference e fa uso di un singolo valore HSD contro il quale tutte le differenze sono confrontate. Esso è dato da: MSW HSD= q α, k, N-k * n Alfa= livello di significatività, solitamente alfa=.5 k = numero dei trattamenti o numero medie da confrontare N= delle osservazioni-unità sperimentali e da k. n = numero di osservazioni che sono presenti nei trattamenti Ovvero da una quantità q ricavabile da apposita tabella in funzione di α, k, N-k, moltiplicata per la radice quadrata della media quadratica entro i gruppi, divisa per il numero di osservazioni che sono presenti nei trattamenti. ----------------------------------------------------------------------------- Se ad esempio MSW= 26 siano alfa=.5, k=, N= 15, n= 5; valori per i quali si ottiene un q =.67 26 quindi HSD=.267* = 2.56 5 HSD= 2.56 valore per confronto delle singole differenze tra le medie dei campioni-livelli della variabile trattamento ------------------------------------------------------------------------------

Quindi in pratica si opera come segue : si calcolano e riportano tutte le differenze tra le medie dei trattamenti, si confrontano le singole differenze con il valore di HSD definito precedentemente se la differenza tra medie ha valore assoluto maggiore di HSD è dichiarata significativa. Se i campioni, livelli della variabile trattamento non hanno la stessa numerosità il valore HSD non può essere unico ma deve essere specifico per le singole coppie di medie a confronto e nella formula sopra riportata MSW HSD= q α, k, N-k * nj Ove è necessario specificare nj come n corrispondente alla minore numerosità tra le due numerosità dei due campioni in confronto.

Esempio esercizio 1 Riprendiamo i dati dell anova 1.1 che aveva R.V. con F significativo TRATTAMENTO 1 Non trattati 2 Estrogeno Progesterone 4 Estrogeno +Progesterone 117 44 65 2664 124 264 626 278 4 221 85 584 88 16 475 154 4 184 n= 18 k= 4 TOT generale= Totale 49 161 291 1176 Media 81.8 265.25 522.75 241.2 T= 15267 Media generale = X= 848.166 calcoliamo le singole differenze tra le medie di trattamenti (livelli variabile trattamento) D.M. Differenza medie trattamenti 1 Non trattati 2 Estrogeno Progesterone 4 Estrogeno + Progesterone 1 Non trattati - 18.45 44.95 2259.4 2 Estrogeno - 275.95 Progesterone - 1818.45 4 Estrogeno + Progesterone - Otteniamo q definito da alfa=.5, k= 4, N-k= 14; q= 4.11 Si ottengono i seguenti confronti multipli con i rispettivi HSD; MSW= 19256.786 Ipotesi HSD Decisione statistica H: µ 1 = µ 2 H: µ 1 = µ H: µ 1 = µ 4 H: µ 2 = µ H: µ 2 = µ 4 H: µ = µ 4 HSD= 4.11* 19256.786 9.4 4 HSD= 4.11* 19256.786 9.4 4 HSD= 4.11* 19256.786 88.5 5 HSD= 4.11* 19256.786 9.4 4 HSD= 4.11* 19256.786 9.4 4 HSD= 4.11* 19256.786 9.4 4 In sintesi il trattamento 4 risulta diverso dagli altri che non sono diversi tra loro. 18.5< 9.4 44.95< 9.4O 2259.4> 9.4 257.5< 9.4 275.95> 9.4 1818.45> 9.4

Esempio esercizio 2 Riprendiamo i dati dell anova1.2 che aveva R.V. F significativo 1 Controlli 2 Amoxicillina Eritromicina 5 5 TRATTAMENTO 4 Temafloxacina 5 5 Ofloxacina 1 6 Ciprofloxacina 1 8.8 2.6 2.6 2.6 7. 7.86 8.6 2.6 2.6 2.6 5. 4.6 8.1 2.6 2.6 2.6 7.48 6.45 8.4 8.8 n= 2 k=6 Totale 42.7 7.8 7.8 7.8 2.8 18.91 Tot generale= T=15.9 Media Media 8.54 2.6 2.6 2.6 6.69 6. generale= X= 5.25 calcoliamo le singole differenze tra le medie di trattamenti (livelli variabile trattamento) D.M. 1 Controlli 2 Amoxicillina Eritromicina 5 5 Differenza medie trattamenti 4 Temafloxacina 5 5 Ofloxacina 1 6 Ciprofloxacina 1 4.9 1 Controlli - 4.9 4.9 22.62 2.79 2 Amoxicillina 5-12.28 11.11 Eritromicina 5-12.28 11.11 4 Temafloxacina 5-12.28 11.11 5 Ofloxacina 1-1.17 6 Ciprofloxacina 1 - Otteniamo q definito da alfa=.5, k= 6, N-k= 14; q= 4.64 Riprendiamo il valore della somma quadratica media entro i gruppi MSW= Si ottengono i seguenti confronti multipli con i rispettivi HSD

Ipotesi HSD Decisione statistica H: µ 1 = µ 2 H: µ 1 = µ H: µ 1 = µ 4 H: µ 1 = µ 5 H: µ 1 = µ 6 H: µ 2 = µ H: µ 2 = µ 4 H: µ 2 = µ 5 H: µ 2 = µ 6 H: µ = µ 4 H: µ = µ 5 H: µ = µ 6 H: µ 4 = µ 5 H: µ 4 = µ 6 H: µ 5 = µ 6 4.9 > 4.9 > 4.9 > 22.62 > 2.79> < 9.4 < 9.4 12.28> 11.11> < 9.4 12.28> 11.11> 12.28> 11.11> 1.17 < In sintesi il trattamento 1 risulta diverso da tutti gli altri; i trattamenti 2, e 4 non sono diversi tra loro ma sono diversi da 1, 5 e 6; i trattamenti 5 e 6 non sono diversi tra loro ma sono diversi da 1, 2, e 4.

Esempio esercizio Riprendiamo i dati dell anova 1.4 che aveva R.V. con F significativo TRATTAMENTO Bambini autistici Bambini normali Bambini ritardati 755 165 8 85 9 51 8 29 15 215 45 565 4 25 715 4 45 8 415 2 9 6 245 45 25 155 45 75 5 41 45 295 45 5 2 46 22 15 6 27 15 225 55 245 9 6 65 5 44 5 82 25 4 245 17 285 7 25 45 45 2 7 285 15 195 27 5 75 N=71 22 Totale 9658 165 494 Media 419.91 5. 29. n 2 15 calcoliamo le singole differenze tra le medie di trattamenti (livelli variabile trattamento) D.M.

Differenza medie trattamenti 1 Bambini 2 Bambini Bambini autistici normali ritardati 1 Controll Bambini autistici - 114.91 9.58 2 Bambini normali - 24. Bambini ritardati - Otteniamo q definito da alfa=.5, k=, N-k= 68; q=.4 (uso N-k= 6 perché N-k=68 manca nella tabella) Riprendiamo il valore della somma quadratica media entro i gruppi MSW= 18186.72 Si ottengono i seguenti confronti multipli con i rispettivi HSD Ipotesi HSD Decisione statistica H: µ 1 = µ 2 H: µ 1 = µ H: µ 2 = µ HSD=.4* 18186.72 95.6 2 HSD=.4* HSD=.4* 18186 118.8.72 15 18186 118.8.72 15 114.91> 95.6 9.58 < 118.8 24.< 118.8 In sintesi il trattamento 1 (livello 1 della variabile trattamento) risulta diverso dal trattamento 2 ma non dal, i due trattamenti 2 e non risultano diversi. In altre parole i bambini autistici sono risultati diversi per la concentrazione serica unità/ml di antigene da quelli normali, ma non sufficientemente diversi da quelli ritardati, i bambini ritardati e normali non sono risultati diversi.

Esempio esercizio 4 Riprendiamo i dati dell anova 1.4 che aveva R.V. con F significativo TRATTAMENTO area 1 ex discarica area 2 area area 4 1 2 1 9 2 2 1 5 2 2 11 1 14 1 4 2 6 2 2 1 2 1 2 11 9 1 4 11 2 2 k = 4 2 Totale 16 27 2 25 Media 9.64 2.25 2.22 2.27 n 11 12 9 11 Totale generale 178 n=4 Media generale 4.14 calcoliamo le singole differenze tra le medie di trattamenti (livelli variabile trattamento) D.M. Differenza medie trattamenti 1 area 1 2 area 2 area 4 area 4 1 area 1-7.9 7.42 7.7 2 area 2..2 area -.5 4 area 4 - Otteniamo q definito da alfa=.5, k=, N-k= 4; q=.44 Riprendiamo il valore della somma quadratica media entro i gruppi MSW=

Si ottengono i seguenti confronti multipli con i rispettivi HSD Ipotesi HSD Decisione statistica H: µ 1 = µ 2 HSD=.44* 2.1 H: µ 1 = µ H: µ 1 = µ 4 H: µ 2 = µ HSD=.44* HSD=.44* HSD=.44* 11 2.22 9 2.1 11 2.22 9 H: µ 2 = µ 4 HSD=.44* 2.1 H: µ = µ 4 HSD=.44* 11 2.22 9 7.9 > 2.1 7.42 > 2.22 7.7 > 2.1. < 2.22.2 < 2.1.5 < 2.22 In sintesi il trattamento 1 (livello 1 della variabile trattamento) risulta diverso dal trattamento 2, e 4 che non risultano diversi tra loro.