Valori Medi Docente Dott.ssa Domenica Matranga
Valori medi Medie analitiche - Media aritmetica - Media armonica - Media geometrica - Media quadratica Medie di posizione - Moda -Mediana - Quantili
La media aritmetica è quel valore che sostituito alle singole osservazioni ne lascia inalterata la SOMMA x + x +... + x = M + M... + M+ * M 2 = M = i= x i
Valori medi Date N unità statistiche sulle quali si rileva un carattere X con le seguenti modalità: x, x 2, x 3, x la media aritmetica semplice è espressa da: M x + x2 +... x i = = = x i Il valore assunto dalla media è espresso nella stessa unità di misura in cui sono espresse le modalità x i del carattere. (Ad es. Se si considerano le stature espresse in cm, la statura media sarà espressa in cm)
Valori medi Carattere X x Frequenza n La media aritmetica ponderata dei dati osservati è: x 2 x 3.. n 2 n 3.. M x n + x2n2 +... x N i= = = n x n N i i x Totale n N con N = i = n i Se la media coincide con una delle modalità viene detta media effettiva o reale. Se non coincide con una delle modalità è detta media di conto
Esempio Esempio. In un campione di 30 studenti si rileva il voto di maturità. Si riporta la distribuzione di frequenze assolute: x i n i xi*n i 62 2 24 66 2 32 70 3 20 73 3 29 75 4 300 76 4 304 79 79 8 2 62 83 3 249 86 2 72 92 92 94 3 282 Totale 30 2325 Media aritmetica 77.5 x i n i fi fi% xi*fi xi*fi% 62 2 0.067 6.7 4.3 43.3333 66 2 0.067 6.7 4.40 440 70 3 0.00 0.0 7.00 700 73 3 0.00 0.0 7.30 730 75 4 0.33 3.3 0.00 000 76 4 0.33 3.3 0.3 03.333 79 0.033 3.3 2.63 263.3333 8 2 0.067 6.7 5.40 540 83 3 0.00 0.0 8.30 830 86 2 0.067 6.7 5.73 573.3333 92 0.033 3.3 3.07 306.6667 94 3 0.00 0.0 9.40 940 Totale 30.000 00.0 77.50 7750.00 xi * ni M = i= = 2325: 30 = 77.5 M = x i * f i = 77. 5 i= n i i= M = x i * f i % 00 7750 00 i= = = 77.5
3-6 6-9 9-5 5-25 25-50 50-00 Oltre 00 Totale 4,5 7,5 2 20 37,5 75 25 8.763 4.30.76 297 05 8 3 22.468 Esempio Esempio 2. Distribuzione secondo la spesa delle Unità sanitarie. Calcolare la spesa media medio Si ipotizza che tutte le unità di Classe di (valore N. Unità x i *n i ogni classe siano spesa (in centrale sanitarie n i equidistribuite migliaia di classe) x i euro) al interno della classe 0-3,5 7.976.964 39.433,5 30.975 4.2 5.940 3.937,5.350 325 08.087 Tuttavia si perde informazione M = 08.087 : 22.468 = 4,8 mila reddito medio
Esempio Esempio 2 bis. Distribuzione secondo il reddito dei dichiaranti dei redditi percepiti. Calcolare il reddito medio Classe di spesa (in migliaia di euro) 0-3 3-6 6-9 9-5 5-25 25-50 50-00 Oltre 00 Totale N. Unità n i 7.976 8.763 4.30.76 297 05 8 3 22.468 Ammontare spesa X i (in migliaia di euro) 2.792 40.650 29.320 2.932 5.580 3.405.72 532 06.383 Reddito medio x = X n i,60 4,64 7,0,0 8,79 32,43 65, 77,33 i i Non è necessaria nessuna ipotesi, perché si conosce l ammontare totale della classe Il valore del reddito medio è più preciso M= 06.383 : 22.468 = 4,73 mila diverso dal reddito medio calcolato nell es. 2
Proprietà della media aritmetica a) la media è sempe un valore compreso tra il valore minimo e massimo della distribuzione; b) il prodotto N x M dà il totale del carattere della distribuzione; c) la somma degli scarti dalla media aritmetica è zero ( x i M ) i= = 0 ( x M) Esempio In un campione di 5 famiglie si rilevano le seguenti ampiezze: 2, 3, 3, 4, 5 La media è 3,4 a) 2 < 3,4 < 5 b) 5 x 3,4= 7 c) (2-3,4) + (3-3,4) + (3-3,4) + (4-3,4) + (5-3,4) = 0 i = i n i = 0
Proprietà della media aritmetica d) E associativa e) La somma dei quadrati degli scarti dalla media aritmetica è il minimo della somma dei quadrati degli scarti da un qualsiasi valore α: i= 2 ( x ) i M ( xi α ) i= 2 f) È invariante per traslazioni, cioè per cambiamenti dell origine: x, x 2.x M= μ x +b, x 2 +b,.x +b M= μ + b g) È invariante per cambiamenti dell unità di misura: x, x 2.x M= μ x b, x 2 b,.x b M= μ b
La media geometrica è quel valore che sostituito alle singole osservazioni ne lascia inalterato il PRODOTTO x x *...* x = M * M *...* M = * 2 g g g M g
Valori medi Data la distribuzione: x, x 2, x 3, x n, n 2, n 3..n in cui le x i sono tutte positive, la radice n-esima del prodotto delle x i si definisce media geometrica semplice, espressa da: g = x x2 x M... se n = n 2 = n 3 =..n = La media geometrica ponderata è: N n n2 M g = x x2... x n dove N = i = n i
Valori medi La media geometrica può essere anche calcolata anche ricorrendo ai logaritmi, essendo equivalente alla quantità: log M g PROPRIETA = n log x + n2 log x2 + N... n a) La media geometrica è non superiore alla media aritmetica (Mg M) b) E non esterna all intervallo (x, x ), ossia compresa tra il valore minimo e massimo della distribuzione c) Non è invariante per le traslazioni d) E invariante per cambiamenti dell unità di misura: x, x 2.x M g = γ x b, x 2 b,.x b M g = γ b con b>0 log x
Esempio: i numeri Indice A base fissa: consentono di confrontare tutte le osservazioni di una serie storica ( o geografica) con un unica osservazione di riferimento La variazione relativa= I- I = x x t 0 00 R.O. Indice Variazione % 2000 23-200 43.6260626 6.26 2002 43.6260626 6.26 2003 34.089430894 8.94 2004 5 0.93495935-6.50 2005 62.370737 3.7 2006 40.382382 3.82 2007 32.07370732 7.32 2008 39.300830 3.0 Media geomet.252304 Varizione med 2.2 Per calcolare la variazione media nel periodo 2000-2008 occorre calcolare la Mg degli 8 indici a base fissa
Esempio: i numeri Indice A base mobile: consentono di confrontare ciascuna osservazione di una serie storica ( o geografica) con la precedente, assunta come osservazione di riferimento I = x x t t 00 La variazione relativa= I- R.O. Indice Variazione % 2000 23 - - 200 43.626 0.6260626 2002 43 0 2003 34 0.937-0.06293706 2004 5 0.8582-0.47904 2005 62.4087 0.408695652 2006 40 0.8642-0.3580247 2007 32 0.9429-0.0574286 2008 39.053 0.053030303 media geometrica.05403629 Per calcolare la variazione annuale media nel periodo 2000-2008 occorre calcolare la Mg degli 8 indici a base mobile
Valori medi Date N unità statistiche sulle quali si rileva un carattere X con le seguenti modalità: x, x 2, x 3, x la media armonica è espressa dal reciproco della media aritmetica degli inversi: N Mar = + +... x x 2 x In generale, data la distribuzione: x, x 2, x 3, x n, n 2, n 3..n la media armonica è definita da: Mar = n x N n2 x + + 2 n... x dove= N = i= n i
Valori medi La media armonica è non superiore alla media geometrica E non esterna all intervallo (x, x ), ossia compresa tra il valore minimo e massimo della distribuzione Non è invariante rispetto alle traslazioni E invariante per cambiamenti dell unità di misura: x, x 2.x x b, x 2 b,.x b Mar = α Mar= α b In generale, vale la seguente relazione: x Mar Mg M x
Esempio Esempio: il consumo medio di un farmaco si ottiene dalla media armonica dei tempi di durata del farmaco C=/D tempo di durata consumo =/tempo 0.5 0.095238.7 0.08547 2.5 0.08.9 0.084034 2. 0.082645 0.7 0.093458 2.3 0.0830.8 0.084746 0.9 0.09743.6 0.086207.56282.56282
Valori medi Date N unità statistiche sulle quali si rileva un carattere X con le seguenti modalità: x, x 2, x 3, x la media quadratica è espressa da: M q = 2 2 x + x2 +... x N 2 In generale, data la distribuzione: x, x 2, x 3, x n, n 2, n 3..n la media quadratica è definita da: M q = 2 2 x n + x2n2 +... x N 2 n dove= N = i= n i
Media di potenze Date N unità statistiche sulle quali si rileva un carattere X con le seguenti modalità: x, x 2, x 3, x (che sono numeri reali non nulli) la media di potenze di ordine s è espressa da: M s x + x +... x N s s s s s 2 i= = = N x s i Il numero s è un qualunque numero reale non nullo
Media di potenze In generale, data la distribuzione: x, x 2, x 3, x n, n 2, n 3..n la media di potenze di ordine s è definita da: dove = = = i n i N s i i s i s s s s s N n x N n x n x n x M = = + + = 2 2...
Media di potenze La media di potenze di ordine s comprende infinite medie, tra cui la media aritmetica, armonica, quadratica, e come limite, la media geometrica. Infatti: Dalla formula M s = s x x N s s + 2 +... x s a) s = si ottiene la media aritmetica b) s = - si ottiene la media armonica c) s = 2 si ottiene la media quadratica d) s 0 la media di potenze tende alla media geometrica, ossia: lim M s = M g s 0
Media di potenze Le medie di potenze sono funzioni crescenti di s, ossia: x M - M g M M 2. x N Quindi anche la media di potenze è non esterna all intervallo (x, x N ) Definizione di Wald di media Se le modalità del carattere sono uguali non si ha perdita di informazione usando la media. Se le modalità del carattere sono diverse, come accade nei casi concreti, la sintesi mediante la media comporta una perdita di informazione o danno che, cresce all aumentare delle differenze tra la media e le modalità considerate.
Moda La moda di un collettivo è quella modalità del carattere alla quale è associata la massima frequenza. Se la distribuzione è per classi di valori del carattere osservato (tutte della stessa ampiezza) la classe modale è quella con la maggiore frequenza. Se le classi hanno diversa ampiezza, si divide la frequenza per l ampiezza della classe e si sceglie il valore massimo dei quozienti ottenuti, detti densità di frequenza Se la distribuzione presenta una sola moda, è detta unimodale. Se vi sono due mode è detta bimodale, se ve sono tre è trimodale, La moda può essere individuata anche graficamente. Ad es.: in un grafico a colonne o a nastri, la colonna più alta o il nastro più lungo individua la moda della distribuzione.
Distribuzione uni-modale 25 20 5 0 5 0
Distribuzione bi-modale 30 25 20 5 0 5 0
Calcolo della moda ES. Distribuzione per classi Classi) <3 3-6 6-0 0-20 20-30 Frequenze 338 4084 5740 0269 6302 Densità di frequenza 046 36 435 027 630 Si sceglierà il valore max tra le densità di frequenza. La classe modale è 6-0 anni 30 e oltre 3237 324
Mediana La mediana di una distribuzione è quella modalità del carattere che divide la distribuzione in due parti uguali e che nell ordinamento delle modalità occupa il posto centrale. Suddivide una distribuzione ordinata in due distribuzioni con una numerosità pari al 50% della numerosità della distribuzione totale. La mediana rappresenta un centro intorno a cui si dispone la distribuzione
Mediana Il carattere deve essere almeno ordinato rettilineo Per determinare la mediana occorrono le frequenze cumulate Se la numerosità del collettivo è un numero dispari, la mediana è quel valore che occupa il posto (N+)/2; se n è pari esisteranno due posti centrali (N/2) ed (N/2 +). Se ad entrambi corrisponde la stessa modalità, questa è la mediana; se al posto (N/2) e al posto (N/2 +) corrispondono due modalità diverse esse saranno le due modalità mediane.
Esempio Carattere - Frequenz Frequenza Frequenza Frequenza relativa Voto a assoluta cum ulata relativa cum ulata 62 2 2 0.067 0.067 66 2 4 0.067 0.33 70 3 7 0.00 0.233 73 3 0 0.00 0.333 75 4 4 0.33 0.467 76 4 8 0.33 0.600 79 9 0.033 0.633 8 2 2 0.067 0.700 83 3 24 0.00 0.800 86 2 26 0.067 0.867 92 27 0.033 0.900 94 3 30 0.00.000 Totale 30.000 Mediana = 76
Distribuzione per classi di valori Mediana Distribuzione per classi di valori del carattere osservato (classi della stessa ampiezza). Si può individuare la classe mediana oppure ipotizzando la distribuzione uniforme all interno dell intervallo si calcola il valore puntuale della mediana. Quindi: Me x r ( r+ ) xr N + = x + ( r) nr 2 i= Dove x (r) e x (r+) sono gli estremi inferiore e superiore della classe mediana ed n r la frequenza assoluta della classe mediana. Se N è pari, si deve sostituire a (N+)/2 una volta N/2 e una volta (N/2+) e poi fare la semisomma dei due valori mediani. L ultimo termine della formula rappresenta la frequenza cumulata della classe che precede la classe mediana. n i
Distribuzione per classi di valori Voto x i n i fi Fi 60-70 7 0.233 0.233 70-80 2 0.400 0.633 80-90 7 0.233 0.867 90-00 4 0.33.000 30.000 Con la proporzione:.23.50.63 70 Me 80 Equivale alla formula: 80 70 Me = 70 + 0.4 ( 0.5 0.23) ( 80 70)( : Me 70) = (.63.23) : (.50.23)
Quantili Quantili Un quantile-p, dove p [0,] è quel valore che divide una distribuzione statistica in p parti uguali, ognuna delle quali contiene la p-esima parte della numerosità della distribuzione totale E un numero più grande del 00 x p % dei valori osservati e più piccolo del restante 00 (-p) %. Es. Un quantile di 0, deve essere un valore che lascia a sinistra il 0% delle osservazioni e a destra il rimanente 90%
Quantili Se p= 4 Quartili: dividono la distribuzione in quattro parti uguali Se p=0 Decili: dividono la distribuzione in dieci parti uguali Se p=00 Percentili: dividono la distribuzione in cento parti uguali In generale si definisce α-percentile quel valore a destra del quale cade (- α)% dei casi e a sinistra l α% dei casi. (p=0,0, 0,02..0,99) La mediana si può considerare il 2 quartile e il 50 percentile. Quartili Le quattro distribuzioni individuate dai quartili contengono ognuna il 25% della numerosità totale. Così il quartile contiene il 25% e la distribuzione rimanente è il 75% del totale
Capacità di informazione delle medie Tutte le medie sono capaci di fornire la stessa quantità di informazione sulla distribuzione o la capacità informativa è diversa da una media all altra? La capacità di informazione di una media è tanto maggiore quanto più elevato è, nella gerarchia dei caratteri, il carattere con cui inizia la validità della media, ossia quanto maggiore è il numero di relazioni o operazioni che individuano il carattere. Inoltre, con riferimento alla robustezza di una media si può affermare che essa è tanto maggiore quanto più basso è il livello di misura del carattere con cui inizia la validità della media (es. mediana più robusta della media aritmetica)
Cautela nell utilizzo della mediana Studente M Me X 8 8 8 8 8 8 8 8 8 8 30 30 30 30 30 30 30 30 23.65 8 Y 8 8 8 8 8 8 8 8 8 30 30 30 30 30 30 30 30 30 24.35 30 Z 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 30 W 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 8 La mediana non va bene quando la differenza tra due popolazioni è rilevante proprio nel centro della distribuzione ordinata delle modalità
Il box plot Q3+.5IR 3 quartile mediana quartile Q-.5IR
Il box plot è un grafico caratterizzato da tre elementi principali:. Una linea o un punto, che indicano la posizione del centro della distribuzione (mediana); 2. Un rettangolo (box) la cui altezza indica la variabilità dei valori prossimi alla media (IR= terzo quartile-primo quartile); 3. Due segmenti (baffi) che partono dai lati minori del rettangolo e che terminano in corrispondenza del più piccolo e del più grande valore non outlier. 4. Dei punti, detti outliers, che giacciono,5*ir al di sotto del primo quartile e,5*ir al di sopra del terzo quartile
Rapporti statistici. di composizione: esprimono il rapporto tra la quantità relativa ad una modalità e l ammontare complessivo. Si applica alle distribuzioni di quantità 2. di coesistenza: esprime il rapporto tra la frequenza (quantità) relativa ad una modalità e la frequenza (quantità) relativa ad una altra modalità. Esempio: rapporto di mascolinità Pm/Pf*00; indice di vecchiaia P >=65 /P <=4 *00 3. di derivazione o tasso: numero di casi di un evento che si verifica in un determinato periodo di tempo rapportato alla popolazione totale di quel periodo. Esempi: tasso di mortalità M/P*000; quoziente di natalità N/P*000; tasso di abortività ab/p*000; tasso di mortalità infantile M 0-365 /NV*000