Contrasti e confronti multipli

Documenti analoghi
Analisi della varianza

CONTRASTI E CONFRONTI MULTIPLI

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Analisi della varianza

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Argomenti della lezione:

VARIETÀ. zona geografica A B C D

Analisi della regressione multipla

Analisi della varianza (anova) a due vie: parcelle di diverse dimensioni

Strumenti informatici Realizzare l analisi della varianza con Excel e SPSS

ANOVA 2. Monica Marabelli. 15 Gennaio 2016

Il Test di Ipotesi Lezione 5

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson

Test F per la significatività del modello

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Corso di Psicometria Progredito

Test delle Ipotesi Parte I

I TEST STATISTICI. dott.ssa Gabriella Agrusti

Analisi della varianza: I contrasti e il metodo di Bonferroni

CAPITOLO 5 Introduzione ai piani fattoriali

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

STATISTICA ESERCITAZIONE 13

Analisi della Varianza - II

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Confronto tra due popolazioni Lezione 6

Statistica Applicata all edilizia: il modello di regressione

Analisi della varianza a una via

Elementi di Psicometria con Laboratorio di SPSS 1

8. ANALISI DELLA COVARIANZA (ANCOVA)

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Test per una media - varianza nota

Strumenti informatici Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017

Elementi di Psicometria con Laboratorio di SPSS 1

ESERCIZIO 1. Vengono riportati di seguito i risultati di un analisi discriminante.

Tecniche statistiche di analisi del cambiamento

Premessa: la dipendenza in media

LEZIONE N. 11 ( a cura di MADDALENA BEI)

Distribuzioni e inferenza statistica

Analisi della varianza

Proprietà della varianza

Esame di Istituzioni di Matematica II del 18 gennaio 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola

Introduzione all Analisi della Varianza (ANOVA)

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

CONFRONTI MULTIPLI TEST HSD DI TUKEY

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II

Tecniche statistiche di analisi del cambiamento

SOLUZIONE. a) Calcoliamo il valore medio delle 10 misure effettuate (media campionaria):

Fondamenti di Psicometria. La statistica è facile!!! VERIFICA DELLE IPOTESI

ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

Regressione multipla

ESERCIZIO 1. Di seguito vengono riportati i risultati di un modello fattoriale di analisi della varianza con 3 fattori tra i soggetti.

Gli errori nella verifica delle ipotesi

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica

PROBABILITÀ ELEMENTARE

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Il test di Student. F. Scotti. 25 febbraio Introduzione ai test statistici di significatività: ipotesi nulla e livello di significatività

Il test (o i test) del Chi-quadrato ( 2 )

ANALISI DELLA VARIANZA

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Probabilità. Lezioni : 11, 12. Docente: Alessandra Durio

Appunti su Indipendenza Lineare di Vettori

TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi

Gestione ed Analisi Statistica dei dati

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

Test d ipotesi: confronto fra medie

Test d ipotesi. Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona. Ipotesi alternativa (H 1 )

Test di autovalutazione n.1

Misure Ripetute. Analisi dei dati in disegni di ricerca con misure ripetute. Marcello Gallucci

Schema lezione 5 Intervalli di confidenza

Esercitazione 8 maggio 2014

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Test di ipotesi su due campioni

ESERCIZI sui VETTORI

Il modello lineare e l analisi della varianza con

Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:

Transcript:

Contrasti e confronti multipli Andrea Onofri 25 gennaio 2012 Indice 1 Introduzione 1 2 I contrasti pianificati 2 Test di confronto multiplo 4 4 Limitazione delle MCP 5 5 Scegliere la MCP 7 Sommario Scopo di questa lezione è illustrare la metodica del confronto multiplo, evidenziandone pregi, difetti e, soprattutto, limiti di impiego. 1 Introduzione Obiettivi Se il test F nell ANOVA è significativo l effetto del trattamento oggetto di studio (nel suo complesso) è maggiore dell errore Questo non implica una graduatoria di merito tra i diversi livelli. Chi è superiore a chi? Rimane quindi da stabilire una graduatoria ed eventualmente confrontare tra di loro i risultati ottenuti da alcuni dei livelli in prova. A questa esigenza rispondono i contrasti e i le procedure di confronto multiplo (MCP) Ammettiamo di aver effettuato una prova con un trattamento sperimentali caratterizzato da quattro livelli qualitativi (tesi di concimazione), con i risultati riportati nella tabella seguente. Ci chiediamo: quale concimazione è più efficace? Per rispondere a questa domanda, il primo step è, in genere, l esecuzione dell ANOVA, con lo scopo di stimare l errore sperimentale. L ANOVA può essere eseguita facilmente con un qualunque software statistico. 1

Esempio: una prova di concimazione ANOVA Tesi Produzione Non concimato 12 Non concimato 15 Non concimato 1 MEDIA 1. Concime minerale 20 Concime minerale 21 Concime minerale 2 MEDIA 21. Concime minerale a lento rilascio 19 Concime minerale a lento rilascio 18 Concime minerale a lento rilascio 16 MEDIA 17.67 Concime organico 22 Concime organico 19 Concime organico 20 MEDIA 20. Analysis of Variance Table Response: Prod Df Sum Sq Mean Sq F value Pr(>F) Tesi 115.000 8. 16.429 0.0008821 *** Residuals 8 18.667 2. --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 In questo caso, l analisi della varianza ed il relativo test di F ci dicono che esiste una differenza significativa tra le medie, ma rimane il problema di classificare le soluzioni concimanti in ordine di efficacia. Questo problema può essere risolto in vari modi, come vedremo in seguito. 2 I contrasti pianificati Il metodo di base è quello di eseguire dei confronti (contrasti) pianificati tra gruppi di trattamenti. Contrasti pianificati Definition 1. Si definisce CONTRASTO una combinazione lineare delle medie dei trattamenti, in modo che i coefficienti k sommati diano 0. NON E UN CONTRASTO C = 1 1. (1 21. + 1 17.67 + 1 20.) 2

E UN CONTRASTO C = 1 1. ( 1 21. + 1 17.67 + 1 ) 20. Si può osservare che in questo caso ho confrontato la media del gruppo A, con la media delle medie dei gruppi B, C e D. DEVIANZA Un contrasto ha un grado di libertà e la sua devianza, in caso di egual numero di repliche, è data da: che, nel nostro caso, equivale a SSC = Significatività del contrasto SSC = C 2 n i=1 k2 41.5 1 2 ((1/) 2 + (1/) 2 + (1/) 2 ) = 9.444 La varianza del contrasto può essere confrontata con la varianza dell errore tramite test F, per saggiarne la significatività. F = 9.444 2. = 40.05 Considerando i gradi di libertà (1 e 8), la probabilità di errore è data da (in EXCEL): = distrib.f(40.05; 1; 8) Il risultato è 0.0002. Quindi possiamo rifiutare l ipotesi nulla (P 0.05). Contrasti ortogonali I contrasti possono essere ortogonali se la somma dei prodotti dei coefficienti è pari a zero. Ad esempio: Infatti: ( 21. C = 1. + 17.67 ( 17.67 C = 21. + 20. 2 2 + 20. ) ) 1 0 + 1/ 1 1/ 1/2 1/ 1/2 Più contrasti si dicono mutualmente ortogonali se tutte le coppie di contrasti sono ortogonali. In un disegno sperimentali con p tesi esistono solo p-1 contrasti ortogonali, con l importante caratteristica che le loro devianze individuali (una per ogni contrasto) sommate ricostruiscono esattamente la devianza del trattamento.

Contrasti ortogonali - 2 L uso dei contrasti ortogonali è il modo più potente ed elegante per confrontare tra di loro diversi trattamenti sperimentali, anche se richiede un apposita pianificazione dell esperimento. Nel caso in esempio, si potrebbero ipotizzare i seguenti contrasti: 1. non concimato vs concimato 2. concime organico vs. minerali. minerale tradizionale vs lento rilascio. I coefficienti di ciascun contrasto sono abbastanza semplici da scrivere e sono lasciati per esercizio. Test di confronto multiplo Nell esempio precedente abbiamo confrontato i trattamenti a gruppi. Ovviamente, i contrasti possono anche essere utilizzati per confrontare una coppia di trattamenti. In questo caso si utilizza una formula molto più semplice. Minima Differenza Significativa (MDS) MDS(α) = t α/2,ν SED dove t α/2,ν è il valore critico della distribuzione di t per un livello di probabilità pari ad α/2 e la SED è: [ ] SED = s 1r1 2 + 1r2 2s 2 con r 1 = r 2 = r SED = r dove s 2 è la varianza dell errore con ν gradi di liberta, ed r è il numero delle repliche rispettivamente per le due tesi a confronto. Quindi: 2 2. MDS(0.05) = 2.06 = 2.876 Questa formula si presta anche per confrontare tutte le possibili coppie di trattamenti. Si parla quindi di procedure di confronto multiplo (MCP), basate sul calcolo di una differenza critica minima, da utilizzare come base per il confronto tra qualunque coppia di medie. In pratica, due medie sono significativamente diverse quando la loro differenza supera la differenza critica. Risultati Estimate Std. Error Sign 2-1 == 0 8.000 1.247 * - 1 == 0 4. 1.247 * 4-1 == 0 7.000 1.247 * - 2 == 0 -.667 1.247 * 4-2 == 0-1.000 1.247 4 - == 0 2.667 1.247 Gli asterischi indicano le differenze significative (superiori alla MDS). 4

Display a lettere Ordino le medie in senso crescente/decrescente Parto dalla prima e aggiungo la lettera A a tutte quelle che non sono significativamente diverse Passo alla seconda media e aggiungo la B a tutte quelle che non sono significativamente diverse Procedo analogamente Esempio Tesi Produzione lettera Concime minerale 21. A Concime organico 20. A B Concime minerale a lento rilascio 17.67 B Non concimato 1. C Le medie seguite dalla stessa lettera non sono significativamente diverse tra loro. 4 Limitazione delle MCP MDS e molteplicità Con la MDS ogni confronto viene eseguito con una probabilità di errore del 5% (comparisonwise error rate). Se i confronti sono molti (family of n comparisons), la probabilità di sbagliarne almeno uno (maximum experimentwise error rate) è data da: α E = 1 (1 α C ) n Il numero dei confronti è sempre abbastanza elevato e pari a k (k 1)/2 (k è il numero delle medie). Di conseguenza, la probabilità di errore per esperimento può essere molto più alta del valore α prefissato per confronto. Procedure alternative 1. Test di Duncan; 2. Test di Newman-Keuls;. Honest Significant Difference (HSD) di Tukey; 4. Test di confronto multiplo di Tukey; 5. Procedura di Scheffe; 5

6. Procedura di Bonferroni; 7. Test di Dunnet per il confronto con un testimone; RICORDA! Il problema della molteplicità si pone anche con i contrasti pianificati! Per evitare il problema della molteplicità, quando il numero di confronti è elevato (tipicamente maggiore di 10), si preferisce evitare la MDS ed utilizzare delle procedure alternative. Tra queste, la più importante è la HSD di Tukey, simile alla MDS, ma basata sull impiego di una statistica alternativa, detta Studentised range statistics, che sostituisce il t di Student e dipende dal numero delle medie k HSD HSD(k, α E ) = q α,k,ν SED 2 Il valore di q α,k,ν si trova in apposite tabelle statistiche. Nel caso specifico, la HSD è: 2 2. HSD(4, 0.05) = 4.529 =.99 2 Le tabelle statistiche per la HSD si trovano (per esempio) in http://cse.niaes.affrc.go.jp/miwa/probcalc/srange/srng tbl.html). La HSD corregge completamente il problema della molteplicità e garantisce un tasso di errore experimentwise, indipendentemente dal numero delle medie. Inoltre, come la MDS, la HSD è basata su una differenza critica unica, che risulta molto agevole da impiegare. Dunnet per confronto con un testimone Un altra procedura molto importante è quella di Dunnet, che consente di confrontare tutte le medie con un testimone (o con il migliore/peggiore dei trattamenti). Come la HSD, il test di Dunnet è basato su una particolare forma della Studentised Range Statistic, che possiamo trovare in http://biology.ucf.edu/ pascencio/classes/methods/dun D(k, α E ) = d α,k,ν SED Anche i valori della statistica d sono tabulati, e, per il test a due code portano ai seguenti risultati: 2 2. D(4, 0.05) = 2.88 =.592 Per il test ad una coda: 2 2. D(4, 0.05) = 2.42 =.018 Anche il test di Dunnet assicura un tasso d errore per esperimento, ma la differenza critica è più piccola della HSD, perchè viene effettuato un numero di confronti inferiore. 6

Se volessimo confrontare tutte le medie con la media più alta (o più bassa) potremmo utilizzare il test di Dunnet ad una coda, che utilizza appunto un valore critico tabulato leggermente inferiore (si veda: http://www.watpon. com/ table/dunnetttest.pdf). Test ad una coda significa che andiamo a verificare non solo l esistenza di una differenza, ma anche la sua direzione. In altre parole, testiamo se una media è significativamente superiore/inferiore ad un altra (non semplicemente se è diversa). Altre procedure molto utilizzate (ma non per questo consigliabili) sono quelle di Newman Keuls e Duncan, basate su differenze critiche crescenti al crescere della distanza dei trattamenti in graduatoria. Queste procedure non sono consigliabili perchè non danno nè una protezione experimentwise, nè comparisonwise. 5 Scegliere la MCP La cosa fondamentale è muoversi in coerenza con le finalità dell esperimento. In particolare, bisogna decidere se è necessario adottare un tasso di protezione (errore) per confronto o per esperimento. Comparisonwise o experimentwise? Un approccio comparisonwise è accettabile quando il singolo confronto isolato è l unità concettuale di maggior interesse per il ricercatore Un approccio experimentwise è preferibile quando l unità concettuale di maggior interesse per il ricercatore è data da un insieme di confronti La gran parte degli esperimenti è pianificata per rispondere ad un insieme di domande e, di conseguenza, i test d ipotesi non sono mai isolati l uno dall altro! Consigli per l uso Non usare mai contrasti o confronti multipli con serie di dati quantitative. In questo caso la regressione è l approccio corretto. Quando è possibile, pianificare gli esperimenti in modo che sia possibile ottenere le risposte cercate con pochi contrasti di interesse. Se il numero dei contrasti aumenta, si pone un problema di molteplicità. Si può ovviare utilizzando la procedura di Bonferroni, che consiste nell eseguire ogni confronto ad un livello α C = α E /n (n è il numero di confronti). In questo modo ci si riporta ad una livello di protezione experimentwise. Utilizzare i confronti multipli solo se coerenti con la logica dell esperimento. Consigli per l uso - 2 Se è giustificabile un tasso di protezione comparisonwise, utilizzare la MDS: è il metodo più potente. 7

Se invece è necessario utilizzare un tasso di protezione experimentwise, evitare le procedure di Duncan e Newmann-Keuls: non danno il livello di protezione cercato e, inoltre, non hanno una differenza critica costante e sono quindi difficili da commentare. Se la logica dell esperimento è quella di confrontare le medie con un testimone o con il miglior trattamento, utilizzare la procedura di Dunnet, che garantisce una protezione experimentwise, può essere utilizzata con medie sbilanciate e è caratterizzata da una differenza critica comune. Se vogliamo fare tutti i confronti possibili, dobbiamo utilizzare la HSD di Tukey, che ha gli stessi vantaggi del test di Dunnet. 8