COME FUNZIONA L'ANOVA A UN FATTORE: SI CONFRONTANO TANTE MEDIE SCOMPONENDO LA VARIABILITA' TOTALE Per testare l'potes nulla che la meda d una varable n k popolazon sa la stessa, s suddvde la varabltà totale della varable (ecco perchè s chama ANOVA...) La varabltà totale vene suddvsa n due component: 1. La varabltà all'nterno de grupp 2. La varabltà tra grupp Per vedere questa scomposzone, defnamo prma le mede de k grupp con smbol y 1, y2,... y k. Sono semplcemente le mede calcolate n ogn gruppo. Defnamo anche la meda generale con y. E' semplcemente la meda calcolata mettendo nseme tutt dat d tutt grupp o Attenzone! y non è la meda delle k mede calcolate ne sngol grupp.
Utlzzando l tpo d grafco gà vsto, dove sull'asse delle X c sono dvers grupp (4 n fgura), sull'asse delle Y c'e' la varable quanttatva (logco qund chamarla Y nell'anova e non X come abbamo fatto fnora per ndcare una generca varable), possamo faclmente vedere che la varabltà complessva può essere dvsa n due component 1. La varabltà entro grupp, coè quanto medamente sngol valor sono dstant dalla meda del loro gruppo d appartenenza. 2. La varabltà tra grupp, coè quanto medamente sono dstant le mede de dvers grupp dalla meda generale
E' puttosto ntutvo capre che pù c allontana dall'potes nulla (H 0 : tutte le mede sono ugual) e pù la componente tra grupp della varabltà totale dventerà grande, e rappresenterà una mportante frazone della varabltà totale E' anche logco capre che la componente entro grupp della varabltà totale non dpende dalla dfferenza tra grupp. E' una componente che consdera semplcemente l fatto che non tutte le osservazon, anche se appartenent allo stesso gruppo o sottoposte allo stesso trattamento, sono ugual. E' anche defnta come varabltà dell'errore (ha a che fare l'errore nsto nel camponamento) Provate a dsegnare dove cadrebbero approssmatvamente le mede de grupp e la meda generale nel caso qu sotto (l'potes nulla è vera). La varabltà tra grupp è bassa!
La componente della varabltà entro grupp vene defnta nell'anova come meda de quadrat degl error (MSE: Mean Square Error). E' semplcemente la meda pesata delle varanze calcolate all'nterno de grupp, ovvero un'estensone a k grupp della varanza comune gà vsta nel test (dove k=2). E' qund una varanza, chamata anche varanza dell'errore. No la chameremo con l'acronmo nglese MSE. MSE = k = 1 k = 1 ( n 1) s ( n 1) 2 = k = 1 ( n 1) n T k s 2 n è la numerostà dell'-esmo gruppo, n T è la numerostà totale (somma d tutt gl n ) Il numeratore d MSE vene chamato SSE, o somma de quadrat dell'errore, o anche devanza dell'errore Il denomnatore d MSE rappresenta grad d lbertà d questa componente della varabltà totale
La componente della varabltà tra grupp vene defnta nell'anova come meda de quadrat tra grupp (MSB: Mean Square Between groups). Dpende da quanto sono dstant le mede de grupp dalla meda generale, ma consdera anche le numerostà de sngol grupp. E' anche questa una varanza, chamata anche varanza tra grupp. La chameremo con l'acronmo nglese MSB MSB = k = 1 n ( ) y y k 1 2 Il numeratore d MSB vene chamato SSB, o somma de quadrat tra grupp, o anche devanza tra grupp Il denomnatore d MSB rappresenta grad d lbertà d questa componente della varabltà totale (c sono k grupp, e qund k-1 grad d lbertà)
Come gà detto, pù c s allontana dall'potes nulla e pù tende a crescere la componente della varabltà tra grupp. Qund, pù c s allontana dall'potes nulla e pù MSB tende a crescere. E' possble dmostrare che quando è vera l'potest nulla MSB tende ad essere uguale MSE (s veda approfondmento alla fne d questo fle pdf) Ovvamente, se è vera l'potes alternatva (almeno una meda è dversa dalla altre), MSB sarà maggor d MSE (ma mnore) Pochè sa MSB che MSE sono due varanze, e l valore d MSB/MSE atteso quando è vera l'potes nulla è 1, è charo che l'f d Fsher è la statstca test adatta all'anova In altre parole, dopo aver calcolato MSB e MSE, posso calcolare F calc = MSB MSE e utlzzare la dstrbuzone d Fsher per verfcare l'potes nulla µ 1 = µ 2 = µ 3 = µ 4 =...µ k Attenzone! Come abbamo detto pù volte, l'potes alternatva (almeno una meda è dversa) prevede la devazone d F solo verso valor >1 (coè MSB>MSE). Qund, anche se l'potes alternatva nell' l'anova non è undrezonale, prevede devazon solo n una drezone della dstrbuzone nulla d Fsher.
La tabella dell'anova Una tabella utle per rassumere rsultat dell'anova è la seguente Orgne della varazone Grad d lbertà SS MS F P-value Tra grupp k-1 SSB MSB = SSB/(k-1) Entro grupp n T -k SSE MSE = SSE/ (n T -k) Totale n T -1 SSTO F calc = MSB/MSE P(F>F calc ) I grad d lbertà e la somma de quadrat (SS) godono della propretà addtva, ma non le mede de quadrat (MS) o Questa propretà può essere utle Nell ultma colonna, se non dspongo d un calcolatore che m permette d determnare l P- value, posso rportare l valore crtco d F per l'α scelto e qund se l valore calcolato supera quello crtco, ndcare P< α, altrment P> α.
ESEMPIO DI ANOVA CON k = 3
APPROFONDIMENTO: PERCHE' MSE E MSB DOVREBBERO ESSERE UGUALI QUANDO E' VERA L'IPOTESI NULLA NELL'ANOVA? Quando è vera l'potes nulla nell'anova, ovvero quando le mede n tutte le popolazon da cu ho estratto campon, o le mede n tutt trattament analzzat con un certo numero d campon, sono ugual, allora MSE e MSB stmano la stessa cosa, e F tende qund a 1. Ma cosa stmano MSE e MSB?
MSE == k = 1 ( n 1) n T k s 2