Statistica Computazioale Questa ota cosiste per la maggior parte ella traduzioe (co alcue modifiche e itegrazioi) da Descriptive statistics di J. Shalliker e C. Ricketts, 000, Uiversity of Plymouth Questa ota si occupa dell illustrazioe dei metodi per il calcolo degli idici di variabilità di ua distribuzioe. I particolare si vedrà l uso di Excel per il calcolo: i) del campo di variazioe (o rage) ii) dello scarto iterquartile iii) della variaza e della deviazioe stadard Nell illustrazioe dei metodi useremo il file esercizio4_dati.xls. Il campo di variazioe (o rage) Siao x,,x K le diverse modalità osservate del carattere Idichiamo co x max la modalità massima osservata, ossia max(x,,x K ), e co x mi la modalità miima osservata, ossia mi(x,,x K ); allora il rage è dato da R = x x Cosideriamo l esempio el foglio di lavoro statura. Osserviamo che elle celle F3:G4 abbiamo già calcolato l altezza massima (i G3) e miima (i G4). Per calcolare il rage: - ella cella F8 scrivere il titolo R= - ella cella G8 scrivere la formula =G3 G4 Nel ostro esempio si trova che il campo di variazioe è 4,5. Lo scarto iterquartile max Esso è dato dalla differeza tra il terzo quartile e il primo quartile. I formule Scarto iterquartile = Q3 Q abbiamo visto ella ota precedete come calcolare i quartili co Excel (el caso di distribuzioi sia uitarie sia di frequeze). Il calcolo dello scarto iterquartile, ua volta calcolati Q e Q 3, è molto semplice. Cosideriamo l esempio el foglio di lavoro statura e calcoliamo: ) lo scarto iterquartile esatto, ossia la differeza tra il terzo quartile (ella cella G5) e il primo quartile (ella cella G4) otteuti dalla distribuzioe di uità ) lo scarto iterquartile approssimato, ossia la differeza tra il terzo quartile approssimato (ella cella G7) e il primo quartile approssimato (ella cella G6) otteuti dalla distribuzioe di frequeza del carattere raggruppato i classi. Per calcolare lo scarto iterquartile - ella cella F9 scrivere il titolo Scarto iterquatile= - ella cella G9 scrivere la formula =G5 G4 Nel ostro esempio si trova che il campo di variazioe è 8,. Per calcolare lo scarto iterquartile approssimato - ella cella F30 scrivere il titolo Scarto iterquatile approssimato= - ella cella G30 scrivere la formula =G7 G6 Nel ostro esempio si trova che il campo di variazioe è 8,7. mi
Statistica Computazioale La variaza e la deviazioe stadard Si ricordi che la variaza e la deviazioe stadard si possoo calcolare quado il carattere è quatitativo. Vegoo presetate separatamete l aalisi dei dati sotto forma di distribuzioe per uità e l aalisi dei dati sotto forma di distribuzioe di frequeza. Distribuzioi per uità Data ua distribuzioe uitaria a, a,, a, avete media aritmetica µ, la variaza è data da ( ) σ = ai ai µ = µ le due formule sopra riportate soo del tutto equivaleti. La deviazioe stadard è data dalla radice quadrata della variaza ossia σ = i µ = µ ( ) a a i ache i questo caso, le due formule sopra riportate soo del tutto equivaleti. Cosideriamo come esempio il data set coteuto el foglio di lavoro statura. Lavoriamo sulla lista dei dati (D4:D0). Esiste ua fuzioe statistica i Excel che calcola automaticamete la variaza di ua distribuzioe data sotto forma di distribuzioe uitaria. Quidi per calcolare la variaza: - ella cella F3 scrivere il titolo Variaza= - ella cella G3 scrivere la formula =VAR.POP(D4:D0) Nel ostro esempio co la fuzioe VAR.POP si ottiee σ = 34,8 cm La fuzioe VAR.POP si riferisce al calcolo della variaza di ua popolazioe e quidi trova applicazioe ell ambito della statistica descrittiva. La fuzioe VAR, da o usare i questo caso, trova applicazioe ell ambito della statistica ifereziale e calcola la formula σ = ( a ) i µ -. - A questo puto potete ache cambiare il umero di cifre decimali che volete siao visualizzate. Per calcolare la deviazioe stadard: - ella cella F3 scrivere il titolo Deviazioe stadard= - ella cella G3 scrivere la formula =DEV.ST.POP(D4:D0) Se o vi ricordate la fuzioe da usare: ua volta posizioati ella cella G3, ella barra dei comadi cliccare su Iserisci e el meu che si apre scegliere Fuzioe. Si apre ua fiestra di dialogo. I questa scegliere le fuzioi statistiche (i questo modo vedrete la lista di tutte le fuzioi statistiche. I questa lista scegliere VAR.POP. Cliccare su OK. Si apre ua uova fiestra di dialogo. Nello spazio chiamato Num iserire l itervallo i cui si trovao i dati (ossia D4:D0). Cliccare su OK.
Statistica Computazioale Alterativamete, se si è già calcolata la variaza, la deviazioe stadard può essere calcolata come radice quadrata della variaza. Quidi, ad esempio, el ostro caso ella cella H3 basta scrivere la formula =RADQ(G3). Nel ostro esempio sia co la fuzioe DEV.ST.POP sia co RADQ si ottiee σ = 5,90 cm La fuzioe DEV.ST.POP, come VAR.POP, trova applicazioe ell ambito della statistica descrittiva. - A questo puto potete ache cambiare il umero di cifre decimali che volete siao visualizzate. Distribuzioi di frequeza I molto casi può accadere che o si dispoga della distribuzioe per uità ma solo della distribuzioe di frequeza. Allora, come già visto per gli idici di posizioe, Excel o dispoe di fuzioi per il calcolo automatico. Ricordiamo che data ua geerica distribuzioe di frequeze X i f i x f x i i f i x K K f K avete media µ la variaza si defiisce come segue K ( ) K = = i i i i x x σ µ µ se si usao le frequeze assolute o i modo equivalete se si usao le frequeze relative. K ( ) K = xi fi = xi fi σ µ µ Cosideriamo per esempio il data set coteuto el foglio di lavoro Voto chiarezza del file esercizio4_dati.xls. I particolare lavoriamo solo sulla tabella di frequeza (igorado la lista di dati). I calcoli per la media aritmetica soo stati eseguiti ella ota precedete e qui vego dati per assuti. Il calcolo della variaza prevede (se si usa la formula el riquadro azzurro) ) il calcolo del prodotto tra il quadrato di ciascua modalità e la sua rispettiva frequeza ) la somma dei prodotti eseguiti el passo precedete 3) la divisioe del totale per la umerosità della popolazioe 4) la sottrazioe a questo totale del quadrato della media aritmetica (abbiamo visto il calcolo della media aritmetica per distribuzioi i classi ella ota precedete). Vediamo come fare co Excel 3
Statistica Computazioale - ella cella J6 scrivere il titolo x^*freq. - ella cella J7 scrivere la formula =E7^*F7 e trasciare la formula fio a coprire la cella J3. - Nella cella J5 calcolare la somma del prodotti appea eseguiti usado il tasto di somma automatica Σ oppure scrivedo =somma(j7:j3). - Nella cella E4 scrivere Variaza= - Nella cella F4 scrivere la formula =J5/F5-F^. Si ricordi che ella cella F si trova le media aritmetica calcolata i precedeza. A questo puto, se si vuole, è possibile cambiare il formato del umero. Il risultato el ostro esempio è,8. Se volete potete verificare che il risultato che si ottiee i questo modo è lo stesso che si otterrebbe utilizzado la fuzioe VAR.POP sulla lista dei dati i C4:C55. La deviazioe stadard a questo puto si calcola come radice quadrata della variaza: - Nella cella E5 scrivere Deviazioe stadard= - Nella cella F5 scrivere la formula =RADQ(F4). Il risultato el ostro esempio è,35. Dati raggruppati i classi Data la distribuzioe di u carattere, avete media µ, raggruppato i classi X i f i c 0 c f c i- c i i f i c K- c K K f K esattamete come visto el caso del calcolo della media aritmetica, per ogi classe, ci ci diciamo c i e c i, si calcola il suo valore cetrale come segue: c xi = +. Quado la classe è aperta allora si fao opportue ipotesi sul valore rappresetativo della classe. La variaza si calcola co ua delle quattro espressioi sotto riportate. K K K K = ( c i ) i ( c i ) i c i i c i i x = x f = x x f = σ µ µ µ µ Cosideriamo come esempio il data set coteuto el foglio di lavoro statura del file esercizio4_dati.xls. I particolare lavoriamo solo sulla tabella di frequeza (igorado la lista di dati). Il calcolo della variaza i questo caso è approssimato visto che ogi classe viee rappresetata dal suo valore cetrale. Il calcolo si svolge ei segueti passi (se si usa la formula el riquadro rosso) ) calcolo del valore cetrale di ciascua classe (valore che chiamiamo qui cetro) el ostro esempio già dispoiamo del valore cetrale e quidi o è ecessario ricalcolarlo ) calcolo del prodotto tra il quadrato del cetro di ciascua classe e la sua rispettiva frequeza assoluta 3) somma dei prodotti eseguiti el passo precedete 4
Statistica Computazioale 4) divisioe del totale per la umerosità della popolazioe 5) sottrazioe a questo totale del quadrato della media aritmetica (abbiamo visto il calcolo della media aritmetica per distribuzioi i classi ella ota precedete). 6) divisioe del totale per la umerosità della popolazioe Vediamo come fare co Excel - ella cella O3 scrivere il titolo cetro^*freq. - ella cella O4 scrivere la formula =J4^*K4 e trasciare la formula fio a coprire la cella O5. - Nella cella O7 calcolare la somma del prodotti appea eseguiti usado il tasto di somma automatica Σ oppure scrivedo =somma(o4:o5). - Nella cella F33 scrivere Variaza approssimata= - Nella cella G33 scrivere la formula =O7/K7-G^. Si ricordi che ella cella G si trova le media aritmetica approssimata calcolata i precedeza. A questo puto, se si vuole, è possibile cambiare il formato del umero. La variaza approssimata el ostro esempio è 34,7 cm. I questo caso si verifica che la variaza approssimata (calcolata a partire dalla distribuzioe i classi) differisce, sebbee di poco, dalla variaza calcolata a partire dalla lista completa dei dati. La deviazioe stadard a questo puto si calcola come radice quadrata della variaza: - Nella cella F34 scrivere Deviazioe stadard approssimata= - Nella cella G34 scrivere la formula =RADQ(G33). Il risultato el ostro esempio è 5,89 cm. 5