Analisi della varianza (anova) a due vie: parcelle di diverse dimensioni

Documenti analoghi
Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011

Sottocampionamento e misure ripetute

Stima dei parametri di modelli lineari

Prova scritta di Affidabilità dei sistemi e controllo statistico di qualità

Livello di esposizione. animale Basso Moderato Alto

VARIETÀ. zona geografica A B C D

Contrasti e confronti multipli

0.1 Percorrenza e Cilindrata

Analisi della varianza

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Il modello lineare e l analisi della varianza con

Analisi della varianza a due fattori

Elementi di Psicometria con Laboratorio di SPSS 1

Analisi della varianza (anova) a due vie

CAPITOLO 4 Blocchi casualizzati, quadrati latini e piani collegati

INTRODUZIONE AI MODELLI LINEARI

CAPITOLO 5 Introduzione ai piani fattoriali

LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE

ANOVA a blocchi randomizzati

Corso di Sistemi di Gestione per la Qualità (SGQ) AA

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico )

Argomenti della lezione:

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Analisi della varianza

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi :

ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale. Corso di laurea specialistica in biotecnologie mediche. Corso di Statistica Medica. Analisi dei dati quantitativi :

TECNICHE DI ANALISI DEI DATI

Metodi statistici per la ricerca sociale ANOVA e ANCOVA in

Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR

CAPITOLO 3 Esperimenti con un singolo fattore: l Analisi della Varianza

ANOVA 2. Monica Marabelli. 15 Gennaio 2016

Tecniche statistiche di analisi del cambiamento

Analisi della varianza a una via

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Misure Ripetute. Analisi dei dati in disegni di ricerca con misure ripetute. Marcello Gallucci

Between / TRA Soggetti Le medie dei due trattamenti sono diverse? Gruppo 2. Media 1. Media 2

L analisi della Varianza (ANOVA): i disegni fattoriali tra i soggetti

Esperimenti multi-ambiente (MET)

Lezione 15. L analisi della Varianza (ANOVA): i disegni entro i sogetti e misti. Argomenti della lezione: Disegni entro i soggetti

Analisi della varianza

ANALISI DELLA VARIANZA A DUE VIE CON INTERAZIONE Prof. Antonio Lanzotti

Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza

Analisi della Varianza Fattoriale. (Cap. 8)

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Analisi della Varianza Fattoriale

Analisi della Varianza Fattoriale

INTRODUZIONE AL DESIGN OF EXPERIMENTS (Parte 2)

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla

Misure Ripetute. Partizione della Varianza. Marcello Gallucci

Disegno dello studio

ANOVA. ANalysis Of VAriance. Federico Plazzi. 1 Dicembre 2015

20/01/2016 ANOVA ANALYSIS OF VARIANCE. Il gruppo di ingegneri responsabile del progetto decide di investigare 4 livelli di concentrazione del legno

ANALISI DELLA VARIANZA

Analisi della Varianza - II

Inferenza statistica Donata Rodi 04/10/2016

Strumenti di indagine per la valutazione psicologica

ANOVA 2. Silvia Parolo. January 16, 2015

Strumenti di indagine per la valutazione psicologica A A B B. 5 ANOVA a due fattori between. ANOVA a due vie. Un esempio. Gli effetti.

Analisi della varianza

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Esperimenti longitudinali e misure ripetute. Massimo Borelli. Motivazioni. Un esempio tipicamente biotec. Anova sbagliate Anova r.m.

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VI

Valutazione dei modelli matematici

Regressione. Monica Marabelli. 15 Gennaio 2016

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value

Metodi Statistici per il Management

Test per una media - varianza nota

7 Disegni sperimentali ad un solo fattore. Giulio Vidotto Raffaele Cioffi

Ancova: il modello lineare in generale

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

TEST 12/17 GEN I seguenti dati sono stati elaborati secondo uno schema sperimentale

1 CRD e confronto multiplo

Analisi della Varianza - II

Cenni di statistica statistica

Fallstudium 3 - Soluzioni Dr Giorgio Pioda 22 novembre 2018

Esame di Statistica del 1 settembre 2004 (Corso di Laurea in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola

Parte 1 : Inferenza. Varianza nota test Z. Distribuzioni asintotiche dei test. Varianza ignota test t ad un campione

INDICE PARTE METODOLOGICA

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Test d Ipotesi

7 punti Fosforo ematico punti punti

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017

26/01/2012 ANOVA ANALYSIS OF VARIANCE

X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica

Approssimazione polinomiale 1

DAL CAMPIONE ALLA POPOLAZIONE: LA STIMA DEI PARAMETRI

Esame di Statistica del 16 aprile 2007 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola

Esercizi di statistica

L Analisi della Varianza (ANOVA)

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

La distribuzione t. Federico Plazzi. 7 Novembre 2015

Rette e piani in R 3

I disegni sperimentali di base

Transcript:

Analisi della varianza (anova) a due vie: parcelle di diverse dimensioni Andrea Onofri 31 gennaio 2012 Indice 1 Motivazioni dei disegni a split-plot 1 2 Calcolo dell ANOVA a split-plot 4 2.1 SED, confronti multipli e SEM................. 5 3 Disegni a split-block 7 4 ANOVA a strip-plot 8 5 SED e confronti multipli 8 6 Disegni gerarchici 9 7 Disegni a split-split-plot 10 1 Motivazioni dei disegni a split-plot Se consideriamo l esempio della lezione precedente (valutazione del tipo di lavorazione del terreno con due diverse modalità di controlo della flora infestante) e come questo è stato disegnato, vediamo che non vi è nessun tipo di gerarchia tra i due fattori sperimentali e non vi è nessuna differenza tra le dimensioni delle parcelle (figura 1). Frequentemente, nella pratica agronomica uno dei due fattori sperimentali richiede parcelle più grandi dell altro (è proprio il caso delle lavorazioni in questo esempio). Di conseguenza si disegna l esperimento in modo da avere parcelle più grandi per un fattore, che vengono poi suddivise per accomodare l altro fattore sperimentale (figura 2). In questo modo si viene ad avere una tesi sperimentale di I ordine (lavorazioni) e una tesi sperimentale di II ordine (diserbo); la prima è randomizzata sulle cosidette parcelle principali (main plots), mentre la seconda è randomizzata sulle sub-parcelle (sub-plots). 1

1 MOTIVAZIONI DEI DISEGNI A SPLIT-PLOT 2 Figura 1: Esempio di un disegno sperimentale fattoriale a blocchi randomizzati. I colori contraddistinguono i quattro blocchi.

1 MOTIVAZIONI DEI DISEGNI A SPLIT-PLOT 3 Figura 2: Esempio di un disegno a split-plot. I colori contraddistinguono le tesi di 1 ordine.

2 CALCOLO DELL ANOVA A SPLIT-PLOT 4 Gli aspetti più importanti di un disegno a split-plot, che non dovrebbero mai essere dimenticati, sono: si introduce un vincolo alla randomizzazione, in quanto il fattore di II ordine non è randomizzato liberamente, ma la sua randomizzazione è vincolata al fatto che tutti i suoi livelli debbono essere inseriti nella stessa parcella principale. I disegni a split-plot non sono limitati alla sola sperimentazione di pieno campo, ma possono essere impiegati anche in laboratorio, per esempio utilizzando come parcelle principali gli armadi climatici e come sub-parcelle le capsule Petri in essi contenute. Si può osservare come, per quanto riguarda le lavorazioni, il disegno può essere assimilato ad un blocco randomizzato; di conseguenza si vengono ad individuare due strati di errore: il primo è quello relativo alle parcelle principali e corrisponde all interazione blocchi x tesi di I ordine (lavorazioni). Il secondo strato di errore, relativo alle sub-parcelle, pertiene alle tesi di II ordine e all interazione A x B e corrisponde al residuo. La presenza delle parcelle principali, insieme alla voce di errore ad esse relativa, non può mai essere dimenticata, in quanto essa da conto del fatto che due sub-parcelle nella stessa parcella principale sono più simili di due sub-parcelle in due parcelle principali diverse. Insomma, se rimuoviamo la voce relativa alle parcelle principali rompiamo l indipendenza degli errori sperimentali, venendo così a violare uno degli assunti fondamentali per l ANOVA. VANTAGGIO: uno dei due fattori può essere studiato con parcelle più grandi, il che consente un uso più efficiente delle risorse. SVANTAG- GIO: un più basso numero di gradi di libertà per le voci di errore può rendere meno potente il test di F nell ANOVA. 2 Calcolo dell ANOVA a split-plot Il modello lineare per l ANOVA a split-plot è analogo a quello dell ANOVA fattoriale, fatto salvo l errore relativo alle parcelle principali. Trascuriamo in questo caso il calcolo manuale dell ANOVA, in quanto, per motivi di tempo, sarà meglio utilizzare un software statistico. Nel caso in cui si usi R, i modelli con più strati di errore debbono essere adattati tramite la funzione aov invece che lm: model.split <- aov(produzione ~ Lavorazione*Diserbo + Error(Lavorazione/Blocco)) Il risultato che otteniamo è:

2 CALCOLO DELL ANOVA A SPLIT-PLOT 5 > summary(model.split) Error: Lavorazione:Blocco Blocco 3 3.6596 1.2199 2.0006 0.215461 Lavorazione 2 23.6565 11.8282 19.3989 0.002403 ** Residuals 6 3.6584 0.6097 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Error: Within Diserbo 1 3.3205 3.3205 1.2246 0.29715 Lavorazione:Diserbo 2 19.4641 9.7321 3.5893 0.07142. Residuals 9 24.4024 2.7114 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Dato che il disegno sperimentale a plit-plot è, di fatto, un modello misto (in quanto, oltre agli effetti fissi, vi è più di un effetto random), i disegni a split plot possonono essere anche elaborati utilizzando la cornice dei mixed models, che, tuttavia, esula dagli obiettivi didattici di questo corso. 2.1 SED, confronti multipli e SEM Nei disegni a split-plot abbiamo 4 tipi di differenze tra medie: 1. Differenze tra due medie del fattore principale A (per esempio tra MIN - SUP) 2. Differenze tra due medie del fattore B (TOT - PARZ) 3. Differenze tra due medie del fattore B per lo stesso livello di A (MIN/TOT - MIN/PARZ) 4. Differenze tra due medie del fattore B per lo stesso/diverso livello di A (MIN/TOT - SUP/PARZ) Per ognuna di queste differenza vi è una voce di errore (Errore standard della differenza = SED), ottenuto con il termine appropriato nell ANOVA. 1. SED A = 2. SED B = 2MSE(1) rb 2MSE(2) ra

2 CALCOLO DELL ANOVA A SPLIT-PLOT 6 3. SED B A = 4. SED A:B = 2MSE(2) r 2[(b 1)MSE(2)+MSE(1)] rb NB: M SE(1) è l errore relativo alle parcelle principali, M SE(2) è il residuo, mentre r, a e b sono il numero dei blocchi, dei livelli di A e dei livelli di B rispettivamente. In questo caso, l unico effetto significativo è quello relativo alla lavorazione, con un SED pari a: 2 0.6097 SED LAV = = 0.3904 4 2 Dato che si tratta di sole tre medie, i test di confronto multiplo possono essere eseguiti con la MDS, pari a 0.955 t ha 1 : PROF 9.91775 a SUP 8.80825 b MIN 7.488875 c Un aspetto da considerare, qualora l interazione A x B fosse significativa, è che se vogliamo confrontare tra di loro combinazioni in cui i livelli di A sono diversi (ad esempio la media ottenuta con le lavorazioni superficiali e il diserbo totale con quella ottenuta con la lavorazione profonda e il diserbo totale), dobbiamo tener presente che entrambi gli strati di errore sono coinvolti. In questo caso il SED è costruito come combinazione lineare di MSE(1) ed MSE(2) e il calcolo dei suoi gradi di libertà non è banale. In questo caso, il SED è: SED A:B = (2 (2 1) 2.711 + 0.6097 4 2 La combinazione lineare tra varianze è della forma: M = α 1 MS(1) + α 2 MS(2) = (2 1) 2.711 + 1 0.6097 ed il numero di gradi di libertà per M (da utilizzare nel confronto multiplo) si può ottenere con l approssimazione di Satterthwaite: df M = n i=1 M 2 (α i MS i ) 2 df i = 11.6097 (2 1) 2.711 6 + 0.6097 9 = 12.554 dove df sta per degrees of freedom (gradi di libertà) relativi ad ognuna delle varianze in gioco. Anche per il calcolo dei SEM (errori standard delle medie), è necessario fare un po di attenzione. Infatti i SEM sono:

3 DISEGNI A SPLIT-BLOCK 7 SEM A = SEM B = SEM A:B = MSE(1) rb MSE(2) ra [(b 1)MSE(2)+MSE(1)] rb e vengono utilizzati come misura di variabilità per le medie del primo fattore sperimentale, del secondo fattore sperimentale e delle combinazioni tra i due fattori sperimentali. 3 Disegni a split-block Una variante dello schema a split plot è relativa al disegno split-block (o strip-plot), che permette di eseguire i trattamenti in bande perpendicolari. Questa esigenza si ravvisa spesso nelle prove sperimentali sui fitofarmaci, quando si vogliono utilizzare per il trattamento le normali attrezzature aziendali, piuttosto che attrezzature parcellari. Un esempio tipico, con i dati presentati in precedenza è riportato in figura 3. Figura 3: Esempio di un disegno a strip-plot. Si può osservare come, per entrambi i fattori sperimentali, il disegno può essere assimilato ad un blocco randomizzato e, di conseguenza, possiamo

4 ANOVA A STRIP-PLOT 8 applicare per entrambi i fattori quanto esposto a proposito del disegno a split-plot. Possiamo quindi individuare tre tipi di errore sperimentale: il primo relativo alla lavorazione, il secondo relativo al diserbo ed il terzo (residuo) relativo all interazione lavorazione x diserbo. 4 ANOVA a strip-plot Anche in questo caso, utilizzando il software R, possiamo impiegare la funzione aov: model.strip<-aov(produzione~blocco + Lavorazione*Diserbo + Error(Blocco/Lavorazione + Blocco/Diserbo)) Ottenendo la seguente tabella ANOVA: Error: factor(blocco) Df Sum Sq Mean Sq factor(blocco) 3 3.6596 1.2199 Error: factor(blocco):lavorazione Lavorazione 2 23.6565 11.8282 19.399 0.002403 ** Residuals 6 3.6584 0.6097 --- Error: factor(blocco):diserbo Diserbo 1 3.3205 3.3205 0.9883 0.3934 Residuals 3 10.0790 3.3597 Error: Within Lavorazione:Diserbo 2 19.464 9.7321 4.0767 0.07619. Residuals 6 14.323 2.3872 --- 5 SED e confronti multipli In questo caso, forniamo solo le formule per il calcolo dei SED (in figura 4).

6 DISEGNI GERARCHICI 9 Figura 4: Calcolo dei SED per i disegni a split-block 6 Disegni gerarchici I disegni che abbiamo trattato finora sono tutti esempi relativi a fattori di tipo CROSSED, nei quali i livelli del fattore A sono gli stessi per tutti i livelli del fattore B (e viceversa). In alcuni casi ciò non avviene ed i livelli del fattore B cambiano al cambiare del livello del fattore A; in questo caso si parla di schemi gerarchici (NESTED) e non ha più nessun senso parlare di effetto medio di B o di interazione AB, mentre si può parlare di effetto di B dato A (B entro A, oppure B A o anche A/B). Un esempio tipico potrebbe verificarsi se, per ognuna delle lavorazioni nell esempio precedente, decidessimo di confrontare due tipi diversi di diserbo chimico; in questo caso non si potrebbero calcolare le medie delle tesi diserbanti se non all interno di ciascuna tesi di lavorazione e non avrebbe quindi senso parlare dell effetto diserbo. Nell esempio in studio, la tabella ANOVA assumerebbe il seguente aspetto: > model.gerarchico<-lm(produzione~blocco+lavorazione/diserbo) > anova(model.gerarchico) Analysis of Variance Table Response: Produzione

7 DISEGNI A SPLIT-SPLIT-PLOT 10 Blocco 3 3.6596 1.2199 0.6521 0.59389 Lavorazione 2 23.6565 11.8282 6.3228 0.01020 * Lavorazione:Diserbo 3 22.7846 7.5949 4.0598 0.02686 * Residuals 15 28.0609 1.8707 --- Possiamo osservare che l effetto del diserbo entro lavorazione ha 3 gradi di libertà, cioè un grado di libertà (2 tesi di diserbo - 1) per ogni livello del fattore principale. 7 Disegni a split-split-plot Se il disegno sperimentale split-plot ha tre livelli (A, B e C) avremo tre tipi di parcelle e quindi tre errori sperimentali (Errore A, Errore B e residuo). Trascuriamo questo disegno per motivi di spazio, assumendo che lo studente utilizzi un software specializzato per l analisi dei dati. Alleghiamo una tabella riassuntiva per il calcolo dei SED (Figura 5)

7 DISEGNI A SPLIT-SPLIT-PLOT 11 Figura 5: Calcolo dei SED per i disegni a split-split-plot