1/4 Capitolo 4 La variabilità di una distribuzione Intervalli di variabilità Box-plot Indici basati sullo scostamento dalla media Confronti di variabilità Standardizzazione Statistica - Metodologie per le scienze economiche e sociali 2/ed S. Borra, A. Di Ciaccio Copyright 2008 The McGraw-Hill Companies srl
2/4 La variabilità La variabilità di una distribuzione esprime la tendenza delle unità di un collettivo ad assumere diverse modalità della variabile Un indice di variabilità almeno due requisiti: deve soddisfare deve assumere il valore minimo se e solo se tutte le unità della distribuzione presentano uguale modalità della variabile Deve aumentare all aumentare della diversità tra le modalità assunte dalle varie unità. Statistica - Metodologie per le scienze economiche e sociali 2/ed S. Borra, A. Di Ciaccio Copyright 2008 The McGraw-Hill Companies srl
Osservazione
Osservazione
5/4 Intervalli di variabilità Il campo di variazione Dati n valori e ordinati in senso crescente, x 1 x 2 x n si considera la differenza tra il più grande e il più piccolo valore: R = L x n x 1 Statistica - Metodologie per le scienze economiche e sociali 2/ed S. Borra, A. Di Ciaccio Copyright 2008 The McGraw-Hill Companies srl
6/4 Intervalli di variabilità La differenza interquartilica Dati n valori consideriamo la differenza tra il terzo e il primo quartile: W = Q 3 Q 1 Oss: rappresenta il campo di variazione per il 50% delle unità più vicine alla mediana. Statistica - Metodologie per le scienze economiche e sociali 2/ed S. Borra, A. Di Ciaccio Copyright 2008 The McGraw-Hill Companies srl
7/4 Box-plot Un modo per rappresentare graficamente la variabilità di una distribuzione è dato dal boxplot. Il box-plot è un grafico caratterizzato da tre elementi: una linea o punto, che indicano la posizione della media della distribuzione; Un rettangolo (box) la cui altezza indica la variabilità dei valori prossimi alla media; Due segmenti che partono dal rettangolo e i cui estremi sono determinati in base ai valori estremi della distribuzione. Ad esempio, come media si può prendere la mediana, come altezza del box la distanza interquartile e come estremi dei segmenti il valore minimo e massimo osservati. Statistica - Metodologie per le scienze economiche e sociali 2/ed S. Borra, A. Di Ciaccio Copyright 2008 The McGraw-Hill Companies srl
8/4 Box-plot: esempio N atti aggressivi 1 2 3 4 5 6 7 8 9 10 frequenza 3 8 30 45 22 12 10 5 2 1 12 10 8 6 4 2 0 Statistica - Metodologie per le scienze economiche e sociali 2/ed S. Borra, A. Di Ciaccio Max = 10 Min = 1 Q3=5 Q1=3 Valore mediano: Me=4 Copyright 2008 The McGraw-Hill Companies srl
Esempio Range Range interquartile Mediana http://www.istat.it/servizi/studenti/valoredati/cap4/cap4_5_2.htm
http://www.istat.it/servizi/studenti/valoredati/cap4/cap4_5_2.htm
11/4 La varianza Un indice basato sugli scostamenti dalla media aritmetica è la varianza. n La varianza di valori x1, x2,..., xn di una variabile X con media aritmetica x è: n 2 1 = ( x i x ) 2 σ n i= 1 n Il numeratore è detto devianza: ( x i x ) i= 1 Calcolo semplificato della varianza σ 2 1 = Statistica - Metodologie per le scienze economiche e sociali 2/ed S. Borra, A. Di Ciaccio n x 2 i ( x ) 2 n 1 i= Copyright 2008 The McGraw-Hill Companies srl 2
σ 2 1 = n ( x i x ) 2 n 1 i=
13/4 La deviazione standard Osservazione: la varianza non possiede la stessa unità di misura dei valori della distribuzione (è espressa nel quadrato dell unità di misura della variabile). Si può utilizzare quindi come indice di variabilità la deviazione standard o scarto quadratico medio che è espresso nella stessa unità di misura della variabile: 2 σ = σ Statistica - Metodologie per le scienze economiche e sociali 2/ed S. Borra, A. Di Ciaccio Copyright 2008 The McGraw-Hill Companies srl
17/4 Esempio Numero di imprese (migliaia) nel 1991 in cinque regioni italiane: 268, 106, 76, 238, 88 x = 155,2 σ = 2 1 5 = 5 i= 1 6557, 76 ( ) x i 155, 2 2 = σ = 6557, 76 = 80, 98 Statistica - Metodologie per le scienze economiche e sociali 2/ed S. Borra, A. Di Ciaccio Copyright 2008 The McGraw-Hill Companies srl
http://www.istat.it/servizi/studenti/valoredati/cap4/cap4_5_2.htm
21/4 Altri indici di variabilità Lo scostamento semplice medio dalla media aritmetica: n S x = 1 n i= 1 Lo scostamento semplice medio dalla mediana: 1 n SM = e xi Me n i= 1 x i x Statistica - Metodologie per le scienze economiche e sociali 2/ed S. Borra, A. Di Ciaccio Copyright 2008 The McGraw-Hill Companies srl
100/3=33
23/4 Il coefficiente di variazione Osservazione: la varianza e la deviazione standard sono indici che risentono dell unità di misura e dell ordine di grandezza dei dati. Pertanto il confronto della variabilità tra due distribuzioni risulta compromesso per: Per confrontare la variabilità di due distribuzioni per la variabile con x > 0 può essere utilizzato il coefficiente di variazione: CV Statistica - Metodologie per le scienze economiche e sociali 2/ed S. Borra, A. Di Ciaccio = σ 100 x Copyright 2008 The McGraw-Hill Companies srl
24/4 Un esempio di confronto della variabilità 9 industrie con dispositivo anti-inquinante di tipo A e 9 di tipo B. Tipo A B 69 35 x A = x B = 80 62 Statistica - Metodologie per le scienze economiche e sociali 2/ed S. Borra, A. Di Ciaccio Quantità di pulviscolo 44 43 64,67 34,22 52 23 54 30 54 28 86 22 77 40 66 25 σ A = 13,65 CV A = 21% σ B = 12, 02 CV B = 35% Si può concludere che è la distribuzione B ad essere più variabile della distribuzione A. Copyright 2008 The McGraw-Hill Companies srl
http://www.istat.it/servizi/studenti/valoredati/cap4/cap4_5_2.htm
26/4 La standardizzazione La standardizzazione è una particolare trasformazione lineare che applicata ai dati originali riconduce qualsiasi variabile X con media x e deviazione standard σ a una nuova variabile con media nulla e varianza unitaria. Ogni osservazione x i viene trasformata in un nuovo valore: x x y i i = La distribuzione risultante ha media nulla e varianza unitaria. σ Statistica - Metodologie per le scienze economiche e sociali 2/ed S. Borra, A. Di Ciaccio Copyright 2008 The McGraw-Hill Companies srl