Analisi della varianza (anova) a due vie



Documenti analoghi
Esperimenti in vaso: disegni a randomizzazione completa

ANALISI DELLA VARIANZA A PIU CRITERI DI CLASSIFICAZIONE

( x) ( x) 0. Equazioni irrazionali

Piacenza, 10 marzo 2014 La preparazione della tesi di Laurea Magistrale

Interesse, sconto, ratei e risconti

Statistica. Lezione 6

Testo alla base del Pitgame redatto dal prof. Yvan Lengwiler, Università di Basilea

(a cura di Francesca Godioli)

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)

4. Confronto tra medie di tre o più campioni indipendenti

LE ASSUNZIONI DELL'ANOVA

VALORE DELLE MERCI SEQUESTRATE

per immagini guida avanzata Organizzazione e controllo dei dati Geometra Luigi Amato Guida Avanzata per immagini excel

Automazione Industriale (scheduling+mms) scheduling+mms.

ANALISI DELLE FREQUENZE: IL TEST CHI 2

Ufficio Scolastico Regionale per l Abruzzo. Rapporto dal Questionari Studenti

Interesse, sconto, ratei e risconti

STATISTICA IX lezione

Metodi statistici per le ricerche di mercato

Dimensione di uno Spazio vettoriale

3. Confronto tra medie di due campioni indipendenti o appaiati

I ricavi ed i costi di produzione

Excel. A cura di Luigi Labonia. luigi.lab@libero.it

Rapporto dal Questionari Insegnanti

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

Elementi di informatica

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE

Guardiamo ora però la cosa da un altro punto di vista analizzando il seguente grafico a forma di torta. La torta in 5 parti

Capitolo 12 La regressione lineare semplice

GUIDA AL CALCOLO DEI COSTI DELLE ATTIVITA DI RICERCA DOCUMENTALE

LA MASSIMIZZAZIONE DEL PROFITTO ATTRAVERSO LA FISSAZIONE DEL PREZZO IN FUNZIONE DELLE QUANTITÀ

GUIDA ALLA RILEVANZA

UNA LEZIONE SUI NUMERI PRIMI: NASCE LA RITABELLA

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.

TEORIE DI INVESTIMENTO

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI

Fallimenti del mercato: Il monopolio

a) Il campo di esistenza di f(x) è dato da 2x 0, ovvero x 0. Il grafico di f(x) è quello di una iperbole -1 1

Google AdWords. Corrispondenze Parole Chiave

FUNZIONE REALE DI UNA VARIABILE

Alessandro Pellegrini

SOLUZIONI E MISCUGLI PERCORSO PER LA SCUOLA ELEMENTARE

LABORATORIO DI MATEMATICA RENDITE, AMMORTAMENTI, LEASING CON EXCEL

Macroeconomia, Esercitazione 2. 1 Esercizi. 1.1 Moneta/ Moneta/ Moneta/3. A cura di Giuseppe Gori (giuseppe.gori@unibo.

Prova di autovalutazione Prof. Roberta Siciliano

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

PROCEDURA INVENTARIO DI MAGAZZINO di FINE ESERCIZIO (dalla versione 3.2.0)

La candela accesa. Descrizione generale. Obiettivi. Sequenza didattica e metodo di lavoro. Esperimenti sulla crescita delle piante

Concetto di potenza statistica

Calcolo del Valore Attuale Netto (VAN)

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

Tasso di interesse e capitalizzazione

Indice. 1 Il settore reale

Basi di matematica per il corso di micro

Capitolo 13: L offerta dell impresa e il surplus del produttore

Riduzione del tasso tecnico e dell aliquota di conversione

UNIVERSITÀ DEGLI STUDI DI TERAMO

LA CORRELAZIONE LINEARE

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

La Minimizzazione dei costi

EXCEL FUNZIONI PRINCIPALI

Elementi di Psicometria con Laboratorio di SPSS 1

L analisi dei dati. Capitolo Il foglio elettronico

Ai fini economici i costi di un impresa sono distinti principalmente in due gruppi: costi fissi e costi variabili. Vale ovviamente la relazione:

MAGAZZINO FISCALE (agg. alla rel )

Consideriamo due polinomi

1. Scopo dell esperienza.

Olga Scotti. Basi di Informatica. Excel

Sensori a effetto Hall bipolari con ritenuta stabilizzati e non stabilizzati con circuito chopper

Parimenti una gestione delle scorte in maniera non oculata può portare a serie ripercussioni sul rendimento sia dei mezzi propri che di terzi.

MATEMATICA E STATISTICA CORSO B PROF. MARCO ABATE. 23 novembre 2006

LA TRASMISSIONE DELLE INFORMAZIONI QUARTA PARTE 1

13. Campi vettoriali

Nel seguito sono riportati due esercizi che si possono risolvere con la formula di Erlang e le relative risoluzioni.

Autorità Nazionale Anticorruzione e per la valutazione e la trasparenza delle amministrazioni pubbliche

Indice. 1 Introduzione alle Equazioni Differenziali Esempio introduttivo Nomenclatura e Teoremi di Esistenza ed Unicità...

RAPPRESENTAZIONE GRAFICA DEGLI ALGORITMI

Prof.ssa Paola Vicard

Convertitori numerici in Excel

Lezione 10: Il problema del consumatore: Preferenze e scelta ottimale

ALLEGATO 1 Analisi delle serie storiche pluviometriche delle stazioni di Torre del Lago e di Viareggio.

Analisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda

Lezione 13 Il mercato e il prezzo

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010

come nasce una ricerca

Laboratorio di Pedagogia Sperimentale. Indice

Misure della dispersione o della variabilità

E naturale chiedersi alcune cose sulla media campionaria x n

MICHELANGELO Piattaforma autorizzativa per la gestione di interventi riservata ai fornitori

ANALISI. Questionario per il personale ASI. Data Sezione del documento / Motivo della revisione Revisione Prima emissione documento A

SISTEMA di GESTIONE QUALITÀ Non Conformità ed Efficacia delle Azioni Correttive Preventive

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

V= R*I. LEGGE DI OHM Dopo aver illustrato le principali grandezze elettriche è necessario analizzare i legami che vi sono tra di loro.

2.0 Gli archivi. 2.1 Inserire gli archivi. 2.2 Archivio Clienti, Fornitori, Materiali, Noleggi ed Altri Costi. Impresa Edile Guida all uso

So.Di. LINUX: Software Didattico OpenSource per tutti

Il concetto di valore medio in generale

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V

Analisi di scenario File Nr. 10

Sistema operativo: Gestione della memoria

Transcript:

Analisi della varianza (anova) a due vie Andrea Onofri 27 marzo 2014 Indice 1 Il concetto di interazione 1 2 Tipi di interazione 2 3 Descrizione del caso studio 3 4 Analisi dei dati 4 Sommario Scopo di questo documento è illustrare come vengono pianificati, organizzati ed analizzati gli esperimenti fattoriali, con due tesi sperimentali a confronto. 1 Il concetto di interazione In molti casi il ricercatore è interessato ad organizzare esperimenti par valutare l effetto di due fattori sperimentali combinati (ad esempio la lavorazione del terreno ed il diserbo chimico), in modo da mettere in evidenza possibili interazioni. Con questo termine si vuole intendere il fatto che l effetto di un fattore (ad es. la lavorazione) cambia a seconda dei livelli dell altro fattore (il diserbo chimico) come ad esempio nella tabella 1. Nella tabella sovrastante osserviamo che il trattamento A1 ha incrementato il risultato di 1.75 unità rispetto alla media generale, mentre il trattamento B1 ha incrementato il risultato di 0.25 unità rispetto alla media generale. Di conseguenza, ci aspetteremmo per la combinazione A1B1 un risultato finale pari a 11.75 + 1.75 + 0.25 = 13.75, mentre il risultato finale è di 10 unità. Evidentemente la combinazione A1B1 è una combinazione svantaggiosa, cioè i due trattamenti interagiscono tra di loro in modo negativo ed il risultato è inferiore alle attese. 1

Tabella 1: Esempio di interazione tra fattori sperimentali: le medie di B1 e B2 (medie marginali) sono praticamente simili, ma ciò è dovuto al fatto che gli effetti cambiano al cambiare del livello di A (A1 e A2), come si può vedere dalle medie di cella Fattori sperimentali B1 B2 Media Effetto A1 10 17 13.5 1.75 A2 14 6 10-1.75 Media 12 11.5 11.75 Effetto 0.25-0.25 11.75 2 Tipi di interazione In genere, abbiamo due tipi di interazione: quella in cui cambia la graduatoria tra i trattamenti (CROSSOVER INTERACTION. Fig. 2 e tab. 1) o quella in cui vi è solo una modifica dell entità dell effetto (NON-CROSSOVER INTE- RACTION; Fig. 2). Questi aspetti possono evidenziati solamente con esperimenti combinati a più fattori (esperimenti fattoriali) e mai con esperimenti singoli. Figura 1: Esempi di interazione tra fattori sperimentali (Da Kuhel, 2000) 2

3 Descrizione del caso studio Un ricercatore ha organizzato un esperimento fattoriale dove ha valutato l effetto di tre tipi di lavorazione del terreno (lavorazione minima=lm aratura superficiale=sup ed aratura profonda=prof) e di due tipi di diserbo chimico (a pieno campo=tot e localizzato sulla fila della coltura=parz). L ipotesi scientifica è che, in caso di diserbo localizzato, il rovesciamento del terreno prodotto dall aratura sia fondamentale in quanto sotterra i semi prodotti dalle piante infestanti, impedendone l emergenza nella coltura e massimizzando le rese. Figura 2: Esempio di un disegno sperimentale fattoriale a blocchi randomizzati. I colori contraddistinguono i quattro blocchi. In totale, l esperimento include sei tesi (le sei possibili combinazioni tra i due fattori sperimentali) e quattro repliche per un totale di 24 parcelle. Come consuetudine in pieno campo, l esperimento è organizzato a blocchi randomizzati e le sei tesi sperimentali sono randomizzate all interno di ciascun blocco (figura 2). I risultati ottenuti con questo esperimento sono riportati nella tabella 2. 3

Tabella 2: Risultati ottenuti in un esperimento fattoriale Lavorazione Diserbo Blocco Produzione zucchero (t/ha) MIN tot 1 11.614 MIN tot 2 9.283 MIN tot 3 7.019 MIN tot 4 8.015 MIN parz 1 5.117 MIN parz 2 4.306 MIN parz 3 8.940 MIN parz 4 5.617 SUP tot 1 10.019 SUP tot 2 8.686 SUP tot 3 8.904 SUP tot 4 8.956 SUP parz 1 7.975 SUP parz 2 8.355 SUP parz 3 7.990 SUP parz 4 9.581 PROF parz 1 11.477 PROF parz 2 10.671 PROF parz 3 10.567 PROF parz 4 9.800 PROF tot 1 10.111 PROF tot 2 8.784 PROF tot 3 7.927 PROF tot 4 10.005 4 Analisi dei dati Il primo passo dell analisi è il calcolo delle medie, che porta a risultati accettabili, dato che il disegno è perfettamente bilanciato (ugual numero di repliche per ogni combinazione dei fattori sperimentali). La media generale è pari a 8.738 (24 valori), mentre le medie per la lavorazioni (8 valori ognuna) sono: MIN = 7.489 SUP = 8.808 PROF = 9.918 Le medie del diserbo (12 valori ognuna) sono: TOT = 9.110 PARZ = 8.366 4

Oltre a ciò, è possibile calcolare la media per ogni combinazione lavorazione x diserbo (quattro valori ognuna): MIN - TOT = 8.983 MIN - PARZ = 5.995 SUP - TOT = 9.141 SUP - PARZ = 8.475 PROF - TOT = 10.629 PROF - PARZ = 9.207 Oltre alle medie anzidette abbiamo anche le medie dei blocchi (sei valori ognuna), che sono: 1-9.39 2-8.35 3-8.56 4-8.66 Nella analisi della varianza, abbiamo gli effetti principali (blocco, lavorazione e diserbo), più l interazione, che misura se e quanto l effetto di un fattore dipende dai livelli dell altro. Gli effetti principali (blocco, lavorazione e diserbo) sono facili da calcolare, in quanto risultano come differenza tra le medie e la media generale. L effetto dell interazione risulta invece dalla differenza tra la media delle combinazioni e la media generale addizionata degli effetti principali: Effetto interazione = Media combinazione - (Media generale + Effetto Lavorazioni + Effetto Diserbo) Ad esempio, per la combinazione MIN - TOT, l effetto è pari a: 8.983 - (8.738-1.249 + 0.372) = 1.122 La media generale addizionata degli effetti principali (i valori tra parentesi nell equazione sovrastante) rappresenta la produzione attesa se gli effetti della lavorazione e del diserbo fossero completamente additivi (assenza di interazione). La tabella degli effetti risulta di seguito. 5

Produzione Media Effetto Effetto Effetto Effetto osservata generale Lavorazione Diserbo Lav. x Dis. Blocco Residuo 11.614 8.738-1.249 0.372 1.122 0.647 1.984 9.283 8.738-1.249 0.372 1.122-0.391 0.691 7.019 8.738-1.249 0.372 1.122-0.18-1.784 8.015 8.738-1.249 0.372 1.122-0.076-0.892 5.117 8.738-1.249-0.372-1.122 0.647-1.526 4.306 8.738-1.249-0.372-1.122-0.391-1.298 8.94 8.738-1.249-0.372-1.122-0.18 3.126 5.617 8.738-1.249-0.372-1.122-0.076-0.302 10.019 8.738 0.07 0.372-0.039 0.647 0.23 8.686 8.738 0.07 0.372-0.039-0.391-0.065 8.904 8.738 0.07 0.372-0.039-0.18-0.057 8.956 8.738 0.07 0.372-0.039-0.076-0.109 7.975 8.738 0.07-0.372 0.039 0.647-1.147 8.355 8.738 0.07-0.372 0.039-0.391 0.27 7.99 8.738 0.07-0.372 0.039-0.18-0.305 9.581 8.738 0.07-0.372 0.039-0.076 1.182 11.477 8.738 1.179-0.372 1.083 0.647 0.201 10.671 8.738 1.179-0.372 1.083-0.391 0.433 10.567 8.738 1.179-0.372 1.083-0.18 0.119 9.8 8.738 1.179-0.372 1.083-0.076-0.753 10.111 8.738 1.179 0.372-1.083 0.647 0.257 8.784 8.738 1.179 0.372-1.083-0.391-0.032 7.927 8.738 1.179 0.372-1.083-0.18-1.1 10.005 8.738 1.179 0.372-1.083-0.076 0.874 Per ognuno degli effetti inseriti nel modello è possibile calcolare la relativa devianza, giungendo alla tabella ANOVA seguente: ANOVA FATTORE DEVIANZA DF VARIANZA F ProbF Blocco 3.66 3 1.22 0.65 0.59 Lavorazione 23.65 2 11.82 6.32 0.01 Diserbo 3.32 1 3.32 1.78 0.20 Lavorazione x Diserbo 19.46 2 9.73 5.20 0.02 Residuo 28.06 15 1.87 Totale 78.17 23 3.40 Si può notare come lavorazione e diserbo interagiscono significativamente tra loro (p < 0.05). DA RICORDARE SEMPRE Nel leggere una tabella ANOVA a due (o più) vie, è fondamentale procedere dal basso verso l alto, in quanto la presenza di un interazione significativa rende non-informative sia le significanze degli effetti principali, sia le medie marginali. Infatti, come abbiamo visto, vi possono essere casi in cui le medie marginali sono simili, ma ciò è dovuto alla presenza di una interazione CROSSOVER. 6

Diagnostica Per controllare gli assunti di base con DSAASTAT, immaginiamo che il disegno sia a blocco randomizzato. Creiamo una nuova variabile, che combini i livelli delle due variabili precedenti (somma a stringa) ESEMPIO: nella cella A1 ho l etichetta MIN e nella cella A2 ho PARZ. Immetto in A3 la formula = A1&A2, che mi restituisce MINPARZ Utilizzando questa nuova variabile, notiamo la presenza di un outlier (il settimo dato). DSAASTAT ci suggerisce la ricostruzione del dato adottando un valore più in linea con gli altri. Ignoriamo questo aspetto. Che cosa succederebbe se seguissimo il suggerimento? Errori standard Abbiamo un errore standard per ogni effetto NUMERO DI REPLICHE: l interazione ha un numero di repliche pari a quelle effettivo, A ha un numero di repliche pari a quello effettivo per il numero dei livelli di B, B ha un numero di repliche pari a quello effettivo per il numero dei livelli di A SEM A = 1.87 4 2 = 0.483 SEM B = 1.87 4 3 = 0.395 1.87 SEM AB = = 0.684 4 Notare che le medie marginali, grazie al numero di repliche più elevato, sono stimate con maggiore precisione. Dati sbilanciati Valgono le considerazioni già fatte per il blocco randomizzato. Anche in questo caso, in presenza di pochi dati mancanti/aberranti si può procedere alla loro ricostruzione, con il metodo indicato per il blocco randomizzato. In caso 7

di molti dati mancanti e/o di intere combinazioni mancanti, è necessario utilizzare metodiche di analisi più avanzate, che non sono oggetto del presente corso. MCP Le SED si ottengono dalle SEM, moltiplicandole per (2) In questo caso, posso fare i confronti multipli solo tra le medie di cella (l interazione è significativa) Ho solo sei medie, quindi posso utilizzare la MDS 8