Analisi della varianza (anova) a due vie: parcelle di diverse dimensioni Andrea Onofri 31 gennaio 2012 Indice 1 Motivazioni dei disegni a split-plot 1 2 Calcolo dell ANOVA a split-plot 4 2.1 SED, confronti multipli e SEM................. 5 3 Disegni a split-block 7 4 ANOVA a strip-plot 8 5 SED e confronti multipli 8 6 Disegni gerarchici 9 7 Disegni a split-split-plot 10 1 Motivazioni dei disegni a split-plot Se consideriamo l esempio della lezione precedente (valutazione del tipo di lavorazione del terreno con due diverse modalità di controlo della flora infestante) e come questo è stato disegnato, vediamo che non vi è nessun tipo di gerarchia tra i due fattori sperimentali e non vi è nessuna differenza tra le dimensioni delle parcelle (figura 1). Frequentemente, nella pratica agronomica uno dei due fattori sperimentali richiede parcelle più grandi dell altro (è proprio il caso delle lavorazioni in questo esempio). Di conseguenza si disegna l esperimento in modo da avere parcelle più grandi per un fattore, che vengono poi suddivise per accomodare l altro fattore sperimentale (figura 2). In questo modo si viene ad avere una tesi sperimentale di I ordine (lavorazioni) e una tesi sperimentale di II ordine (diserbo); la prima è randomizzata sulle cosidette parcelle principali (main plots), mentre la seconda è randomizzata sulle sub-parcelle (sub-plots). 1
1 MOTIVAZIONI DEI DISEGNI A SPLIT-PLOT 2 Figura 1: Esempio di un disegno sperimentale fattoriale a blocchi randomizzati. I colori contraddistinguono i quattro blocchi.
1 MOTIVAZIONI DEI DISEGNI A SPLIT-PLOT 3 Figura 2: Esempio di un disegno a split-plot. I colori contraddistinguono le tesi di 1 ordine.
2 CALCOLO DELL ANOVA A SPLIT-PLOT 4 Gli aspetti più importanti di un disegno a split-plot, che non dovrebbero mai essere dimenticati, sono: si introduce un vincolo alla randomizzazione, in quanto il fattore di II ordine non è randomizzato liberamente, ma la sua randomizzazione è vincolata al fatto che tutti i suoi livelli debbono essere inseriti nella stessa parcella principale. I disegni a split-plot non sono limitati alla sola sperimentazione di pieno campo, ma possono essere impiegati anche in laboratorio, per esempio utilizzando come parcelle principali gli armadi climatici e come sub-parcelle le capsule Petri in essi contenute. Si può osservare come, per quanto riguarda le lavorazioni, il disegno può essere assimilato ad un blocco randomizzato; di conseguenza si vengono ad individuare due strati di errore: il primo è quello relativo alle parcelle principali e corrisponde all interazione blocchi x tesi di I ordine (lavorazioni). Il secondo strato di errore, relativo alle sub-parcelle, pertiene alle tesi di II ordine e all interazione A x B e corrisponde al residuo. La presenza delle parcelle principali, insieme alla voce di errore ad esse relativa, non può mai essere dimenticata, in quanto essa da conto del fatto che due sub-parcelle nella stessa parcella principale sono più simili di due sub-parcelle in due parcelle principali diverse. Insomma, se rimuoviamo la voce relativa alle parcelle principali rompiamo l indipendenza degli errori sperimentali, venendo così a violare uno degli assunti fondamentali per l ANOVA. VANTAGGIO: uno dei due fattori può essere studiato con parcelle più grandi, il che consente un uso più efficiente delle risorse. SVANTAG- GIO: un più basso numero di gradi di libertà per le voci di errore può rendere meno potente il test di F nell ANOVA. 2 Calcolo dell ANOVA a split-plot Il modello lineare per l ANOVA a split-plot è analogo a quello dell ANOVA fattoriale, fatto salvo l errore relativo alle parcelle principali. Trascuriamo in questo caso il calcolo manuale dell ANOVA, in quanto, per motivi di tempo, sarà meglio utilizzare un software statistico. Nel caso in cui si usi R, i modelli con più strati di errore debbono essere adattati tramite la funzione aov invece che lm: model.split <- aov(produzione ~ Lavorazione*Diserbo + Error(Lavorazione/Blocco)) Il risultato che otteniamo è:
2 CALCOLO DELL ANOVA A SPLIT-PLOT 5 > summary(model.split) Error: Lavorazione:Blocco Blocco 3 3.6596 1.2199 2.0006 0.215461 Lavorazione 2 23.6565 11.8282 19.3989 0.002403 ** Residuals 6 3.6584 0.6097 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Error: Within Diserbo 1 3.3205 3.3205 1.2246 0.29715 Lavorazione:Diserbo 2 19.4641 9.7321 3.5893 0.07142. Residuals 9 24.4024 2.7114 --- Signif. codes: 0 *** 0.001 ** 0.01 * 0.05. 0.1 1 Dato che il disegno sperimentale a plit-plot è, di fatto, un modello misto (in quanto, oltre agli effetti fissi, vi è più di un effetto random), i disegni a split plot possonono essere anche elaborati utilizzando la cornice dei mixed models, che, tuttavia, esula dagli obiettivi didattici di questo corso. 2.1 SED, confronti multipli e SEM Nei disegni a split-plot abbiamo 4 tipi di differenze tra medie: 1. Differenze tra due medie del fattore principale A (per esempio tra MIN - SUP) 2. Differenze tra due medie del fattore B (TOT - PARZ) 3. Differenze tra due medie del fattore B per lo stesso livello di A (MIN/TOT - MIN/PARZ) 4. Differenze tra due medie del fattore B per lo stesso/diverso livello di A (MIN/TOT - SUP/PARZ) Per ognuna di queste differenza vi è una voce di errore (Errore standard della differenza = SED), ottenuto con il termine appropriato nell ANOVA. 1. SED A = 2. SED B = 2MSE(1) rb 2MSE(2) ra
2 CALCOLO DELL ANOVA A SPLIT-PLOT 6 3. SED B A = 4. SED A:B = 2MSE(2) r 2[(b 1)MSE(2)+MSE(1)] rb NB: M SE(1) è l errore relativo alle parcelle principali, M SE(2) è il residuo, mentre r, a e b sono il numero dei blocchi, dei livelli di A e dei livelli di B rispettivamente. In questo caso, l unico effetto significativo è quello relativo alla lavorazione, con un SED pari a: 2 0.6097 SED LAV = = 0.3904 4 2 Dato che si tratta di sole tre medie, i test di confronto multiplo possono essere eseguiti con la MDS, pari a 0.955 t ha 1 : PROF 9.91775 a SUP 8.80825 b MIN 7.488875 c Un aspetto da considerare, qualora l interazione A x B fosse significativa, è che se vogliamo confrontare tra di loro combinazioni in cui i livelli di A sono diversi (ad esempio la media ottenuta con le lavorazioni superficiali e il diserbo totale con quella ottenuta con la lavorazione profonda e il diserbo totale), dobbiamo tener presente che entrambi gli strati di errore sono coinvolti. In questo caso il SED è costruito come combinazione lineare di MSE(1) ed MSE(2) e il calcolo dei suoi gradi di libertà non è banale. In questo caso, il SED è: SED A:B = (2 (2 1) 2.711 + 0.6097 4 2 La combinazione lineare tra varianze è della forma: M = α 1 MS(1) + α 2 MS(2) = (2 1) 2.711 + 1 0.6097 ed il numero di gradi di libertà per M (da utilizzare nel confronto multiplo) si può ottenere con l approssimazione di Satterthwaite: df M = n i=1 M 2 (α i MS i ) 2 df i = 11.6097 (2 1) 2.711 6 + 0.6097 9 = 12.554 dove df sta per degrees of freedom (gradi di libertà) relativi ad ognuna delle varianze in gioco. Anche per il calcolo dei SEM (errori standard delle medie), è necessario fare un po di attenzione. Infatti i SEM sono:
3 DISEGNI A SPLIT-BLOCK 7 SEM A = SEM B = SEM A:B = MSE(1) rb MSE(2) ra [(b 1)MSE(2)+MSE(1)] rb e vengono utilizzati come misura di variabilità per le medie del primo fattore sperimentale, del secondo fattore sperimentale e delle combinazioni tra i due fattori sperimentali. 3 Disegni a split-block Una variante dello schema a split plot è relativa al disegno split-block (o strip-plot), che permette di eseguire i trattamenti in bande perpendicolari. Questa esigenza si ravvisa spesso nelle prove sperimentali sui fitofarmaci, quando si vogliono utilizzare per il trattamento le normali attrezzature aziendali, piuttosto che attrezzature parcellari. Un esempio tipico, con i dati presentati in precedenza è riportato in figura 3. Figura 3: Esempio di un disegno a strip-plot. Si può osservare come, per entrambi i fattori sperimentali, il disegno può essere assimilato ad un blocco randomizzato e, di conseguenza, possiamo
4 ANOVA A STRIP-PLOT 8 applicare per entrambi i fattori quanto esposto a proposito del disegno a split-plot. Possiamo quindi individuare tre tipi di errore sperimentale: il primo relativo alla lavorazione, il secondo relativo al diserbo ed il terzo (residuo) relativo all interazione lavorazione x diserbo. 4 ANOVA a strip-plot Anche in questo caso, utilizzando il software R, possiamo impiegare la funzione aov: model.strip<-aov(produzione~blocco + Lavorazione*Diserbo + Error(Blocco/Lavorazione + Blocco/Diserbo)) Ottenendo la seguente tabella ANOVA: Error: factor(blocco) Df Sum Sq Mean Sq factor(blocco) 3 3.6596 1.2199 Error: factor(blocco):lavorazione Lavorazione 2 23.6565 11.8282 19.399 0.002403 ** Residuals 6 3.6584 0.6097 --- Error: factor(blocco):diserbo Diserbo 1 3.3205 3.3205 0.9883 0.3934 Residuals 3 10.0790 3.3597 Error: Within Lavorazione:Diserbo 2 19.464 9.7321 4.0767 0.07619. Residuals 6 14.323 2.3872 --- 5 SED e confronti multipli In questo caso, forniamo solo le formule per il calcolo dei SED (in figura 4).
6 DISEGNI GERARCHICI 9 Figura 4: Calcolo dei SED per i disegni a split-block 6 Disegni gerarchici I disegni che abbiamo trattato finora sono tutti esempi relativi a fattori di tipo CROSSED, nei quali i livelli del fattore A sono gli stessi per tutti i livelli del fattore B (e viceversa). In alcuni casi ciò non avviene ed i livelli del fattore B cambiano al cambiare del livello del fattore A; in questo caso si parla di schemi gerarchici (NESTED) e non ha più nessun senso parlare di effetto medio di B o di interazione AB, mentre si può parlare di effetto di B dato A (B entro A, oppure B A o anche A/B). Un esempio tipico potrebbe verificarsi se, per ognuna delle lavorazioni nell esempio precedente, decidessimo di confrontare due tipi diversi di diserbo chimico; in questo caso non si potrebbero calcolare le medie delle tesi diserbanti se non all interno di ciascuna tesi di lavorazione e non avrebbe quindi senso parlare dell effetto diserbo. Nell esempio in studio, la tabella ANOVA assumerebbe il seguente aspetto: > model.gerarchico<-lm(produzione~blocco+lavorazione/diserbo) > anova(model.gerarchico) Analysis of Variance Table Response: Produzione
7 DISEGNI A SPLIT-SPLIT-PLOT 10 Blocco 3 3.6596 1.2199 0.6521 0.59389 Lavorazione 2 23.6565 11.8282 6.3228 0.01020 * Lavorazione:Diserbo 3 22.7846 7.5949 4.0598 0.02686 * Residuals 15 28.0609 1.8707 --- Possiamo osservare che l effetto del diserbo entro lavorazione ha 3 gradi di libertà, cioè un grado di libertà (2 tesi di diserbo - 1) per ogni livello del fattore principale. 7 Disegni a split-split-plot Se il disegno sperimentale split-plot ha tre livelli (A, B e C) avremo tre tipi di parcelle e quindi tre errori sperimentali (Errore A, Errore B e residuo). Trascuriamo questo disegno per motivi di spazio, assumendo che lo studente utilizzi un software specializzato per l analisi dei dati. Alleghiamo una tabella riassuntiva per il calcolo dei SED (Figura 5)
7 DISEGNI A SPLIT-SPLIT-PLOT 11 Figura 5: Calcolo dei SED per i disegni a split-split-plot