Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati numerici a disposizione trae degli indicatori sintetici che possano riassumere le proprietà salienti dell intera distribuzione. Statistica inferenziale: utilizza dati statistici per pevisioni di tipo probabilistico su situazioni future (incerte), su popolazioni più ampie... POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici) CAMPIONE: serie di dati, che rappresenta una porzione della popolazione (campione rappresentativo) VARIABILI: qualitative, quantitative (continue, discrete)
Distribuzione di Frequenza - Esempio Supponiamo di avere un campione di n = famiglie, di cui rileviamo il carattere titolo di studio del capo famiglia. Questo carattere può presentare m = 5 differenti realizzazioni (categorie). Costruiamo la tabella della distribuzione di frequenza: f i f i / n F i F i / n Laurea 18 0.090 18 0.090 Diploma scuola media superiore 5 0.60 70 0.350 Diploma scuola media inferiore 74 0.370 144 0.70 Licenza elementare 49 0.45 193 0.965 Nessun titolo 7 0.035 1.000 1.000
Distribuzione di Frequenza - Esempio Rappresentiamo i dati riportati nella tabella della distribuzione delle frequenze con un istogramma delle frequenze 80 74 70 titolo di studio fi fi / n nessuno 18 0,09 elementare 5 0,60 media inferiore 74 0,370 media superiore 49 0,45 università 7 0,035 1,000 60 50 40 30 0 10 0 18 5 nessuno elementare media inferiore 49 media superiore 7 università ogni rettangolo rappresenta un carattere l area del rettangolo e proporzionale alla frequenza di quel carattere
Distribuzione di Frequenza dati raggruppati in classi o categorie ( x i, f i )...m FREQUENZA ASSOLUTA f i : è numero di osservazioni che ricadono in ciascuna classe. Numero totale di osservazioni n = FREQUENZA RELATIVA f i /n: è il rapporto tra la frequenza assoluta e il numero totale n di osservazioni e rappresenta la percentuale di osservazoni in ogni classe o categoria. m f i FREQUENZA ASSOLUTA CUMULATA F i : F i = i k=1 f k FREQUENZA RELATIVA CUMULATA F i /n: 1 n i k=1 f k
Statistica Descrittiva misure, indici (numerici) che descrivono le caratteristiche della distribuzione di una o più variabili in modo sintetico indici di posizione o centralità : valore centrale, medie algebriche, mediana, moda ( detti anche misure di intensità, centri...) indici di dispersione o variabilità : intervallo di variazione, varianza, varianza stimata, deviazione standard, deviazione standard stimata indici di simmetria o asimmetria :...
Valore Centrale VALORE CENTRALE : dato l insieme di valori { x 1, x,... x n }, considera solo i due valori estremi (non tiene conto di tutti i valori) x max + x min x max = max { x 1, x,... x n } e x min = min { x 1, x,... x n } ESEMPIO : {3, 0, 7, 5, 30, 310} x max + x min = 310 + 3 = 156.5
Media Aritmetica - 1 MEDIA SEMPLICE : dato l insieme di valori { x 1, x,... x n } x = 1 n x i = x 1 + x +... + x n n MEDIA PONDERATA (dati raggruppati): dato l insieme di valori { x 1, x,... x m } con le rispettive frequenza assolute { f 1, f,... f m } m x = m f i x i f i = 1 n m f i x i = f 1 x 1 + f x +... + f n x n n
Media Aritmetica - la media può non appartenere all insieme dei dati insiemi di dati diversi possono avere la stessa media utilizza tutti i dati centro di gravità dei dati riduce l effetto dei dati estremi (outlier) PROPRIETÀ: se applico una trasformazione lineare ai dati y i = a x i + b ȳ = a x + b la somma degli scarti dalla media è nulla (x i x) = 0 la somma dei quadrati degli scarti dalla media è minima (x i x) assume il valore minimo per x = x
Media Aritmetica - 3 La somma degli scarti dalla media è nulla. (x i x) = x i x = x i n x = x i n 1 n x i = 0 La somma dei quadrati degli scarti dalla media è minima. Nel caso di due soli dati { x 1, x } tale somma è F(x) = (x 1 x) + (x x) Determino i punti di massimo e di minimo relativo F (x) = (x 1 x) + (x x) = 0 x = 1 (x 1 + x ) lo studio del segno di F (x) mi dice che la somma dei quadrati degli scarti ha un punto di minimo in x = 1 (x 1 + x ) media aritmetica
Media Aritmetica - Esercizi ESERCIZIO 1 : dato l insieme di valori {1,5,37,41,0,53} x = 1 6 (1 + 5 + 37 + 41 + 0 + 53) = 8 ESERCIZIO :dato l insieme di valori {8,8,8,8,8,8} x = 1 6 (8 + 8 + 8 + 8 + 8 + 8) = 8 ESERCIZIO 3 (dati raggruppati) : In un campione di persone si sa che 0 pesano 50 kg, 30 pesano 55kg, 50 pesano 60kg, 70 pesano 65kg, 0 pesano 75 Kg e 10 pesano 80kg. Calcolare il peso medio. x = 0 50 + 30 55 + 50 60 + 70 65 + 0 75 + 10 80 = = 0 50 + 30 55 + 50 60 + 70 65 + 0 75 + 10 80 = 6.5Kg
Media Geometrica MEDIA SEMPLICE : dato l insieme di valori { x 1, x,... x n } x g = n n x i = n x 1 x x n log x g = 1 n log x i MEDIA PONDERATA : dato l insieme di valori { x 1, x,... x m } con le rispettive frequenza assolute { f 1, f,... f m } log x g = 1 n i= f i log x i
Mediana Dato l insieme di valori ordinati x 1 x... x n 1 x n si chiama mediana (valore mediano) il valore M e che occupa la posizione centrale se n è dispari c è un unico termine mediano di posto n+1 M e = x n+1 se n è pari ci sono due termini mediani di posti n e n + 1 M e = 1 (x n + xn +1) Utilizza tutti i valori ma si basa soltanto sull ordinamento degli stessi. ESEMPIO 1: {0,13,5,81,503} M e = 5 ESEMPIO : {1,,81,93,37,503} M e = 87
Moda MODA : valore (o classe) al quale associata la frequenza più alta titolo di studio fi fi / n nessuno 18 0,09 elementare 5 0,60 media inferiore 74 0,370 media superiore 49 0,45 università 7 0,035 1,000 80 70 60 50 40 30 0 10 0 18 5 74 nessuno elementare media inferiore 49 media superiore 7 università (si può applicare anche a dati qualitativi espressi su scala nominale)
Esempio: Media, Mediana, Moda 7 6 5 4 3 1 0 classe ri fi fi / n 1-5 3 5 0,5 5-9 7 6 0,300 9-13 11 4 0, 13-17 15 3 0,150 17-1 19 0,100 5 6 4 0 1,000 3 7 11 15 19 3 MEDIA: si calcola come media ponderata x = 9. MEDIANA: M e = 7 è la media del decimo e dell undicesimo termine che hanno entrambi valore 7. MODA: è la classe 5 9 o il suo rappresentante r = 7, corrispondenti a f = 6 moda < mediana < media distribuzione obliqua a destra