Statistica Il e Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 21
Outline Il e 1 2 3 Il 4 e 5 () Statistica 2 / 21
Il e Due distribuzioni aventi stessa posizione e variabilità possono differire per forma. In altre parole, la forma dipende dal valore delle modalità più piccole (o più grandi) del valore centrale della. () Statistica 3 / 21
Il e Due distribuzioni aventi stessa posizione e variabilità possono differire per forma. In altre parole, la forma dipende dal valore delle modalità più piccole (o più grandi) del valore centrale della. Aspetti che caratterizzano la forma di sono curtosi () Statistica 3 / 21
Il e Due distribuzioni aventi stessa posizione e variabilità possono differire per forma. In altre parole, la forma dipende dal valore delle modalità più piccole (o più grandi) del valore centrale della. Aspetti che caratterizzano la forma di sono curtosi () Statistica 3 / 21
Asimmetria simmetrica rettangolare Il e () Statistica 4 / 21
Asimmetria simmetrica campanulare Il e () Statistica 4 / 21
Asimmetria asimmetrica positiva Il e () Statistica 4 / 21
Asimmetria asimmetrica negativa Il e () Statistica 4 / 21
Esercizio: confronto tra distribuzioni Il e Si considerino tre studenti, X, Y e Z che nei primi 9 esami hanno riportato i seguenti voti: X Y Z 18 22 21 20 23 22 21 24 23 23 24 24 25 25 25 2 27 2 27 29 27 27 29 28 30 30 29 misurare la tendenza centrale, la variabilità e la forma della dei voti di ciascun studente; utilizzare un opportuno strumento per confrontare le tre distribuzioni. () Statistica 5 / 21
Il e indice normalizzato di A Tale indice la versione normalizzata della differenza tra media e mediana, dal momento che σ risulta essere in qualunque caso tale che σ µ Me A = µ Me σ Tale indice varia nell intervallo [ 1, 1]. () Statistica / 21
Il e indice normalizzato di A Tale indice la versione normalizzata della differenza tra media e mediana, dal momento che σ risulta essere in qualunque caso tale che σ µ Me A = µ Me σ Tale indice varia nell intervallo [ 1, 1]. se A > 0 allora la asimmetrica positiva se A < 0 allora la asimmetrica negativa se A = 0 allora la simmetrica () Statistica / 21
Il e Standardizzazione di variabile L operazione di standardizzazione consiste nel sottrarre a ciasc modalita x i la media µ, dividendo poi per lo scarto quadratico medio σ. Tale operazione consente il confronto tra distribuzioni con medie e varianze diverse. z i = x i µ σ () Statistica 7 / 21
Il e indice di di Fisher γ γ = 1 n (z i ) 3 = 1 n n i=1 n ( xi µ i=1 σ ) 3 () Statistica 8 / 21
Il indice di di Fisher γ γ = 1 n (z i ) 3 = 1 n n i=1 n ( xi µ i=1 σ ) 3 e se γ > 0 allora la asimmetrica positiva se γ < 0 allora la asimmetrica negativa se γ = 0 allora la simmetrica () Statistica 8 / 21
Esercizio: confronto tra distribuzioni Il e Si considerino tre studenti, X, Y e Z che nei primi 9 esami hanno riportato i seguenti voti: misurare la tendenza centrale, la variabilità e la forma della dei voti di ciascun studente; x i y i z i sc xi = (x i µ x) 2 sc yi = (y i µ y) 2 sc zi = (z i µ z) 2 18 22 21 37.34 15.123 1 20 23 22 1.901 8.34 9 21 24 23 9.79 3.58 4 23 24 24 1.235 3.58 1 25 25 25 0.790 0.790 0 2 27 2 3.58 1.235 1 27 29 27 8.34 9.79 4 27 29 28 8.34 9.79 9 30 30 29 34.79 1.901 1 217 233 225 120.89 8.89 0 (xi ) µ x = = n 217 9 = 24.11, µy = (yi ) = n 233 9 = 25.89, µz = (zi ) = n 225 9 = 25 (xi µx) σ x = 2 = 120.89 = 13.43 = 3., n 9 (yi µy ) σ y = 2 = 8.89 = 7.5 = 2.7, n 9 (zi µz ) σ z = 2 = 0 n 9 =.7 = 2.58 () Statistica 9 / 21
calcolo dell indice normalizzato di A A = µ Me σ Il e A x = µx Mex σ x = 24.11 25 3. = 0.242 A y = µy Mey σ y = 25.89 25 2.7 = 0.321 A z = µz Mez σ z = 25 25 2.58 = 0 () Statistica 10 / 21
di Fisher γ calcolo indice γ n n ( ) xi µ 3 γ = 1 (z i ) 3 = 1 n i=1 n i=1 σ Il e S x S y S z Sx 3 Sy 3 Sz 3-1.7-1.41-1.55-4.4-2.78-3.72-1.12-1.04-1.1-1.41-1.14-1.57-0.85-0.8-0.77-0.1-0.32-0.4-0.30-0.8-0.39-0.03-0.32-0.0 0.24-0.32 0.00 0.01-0.03 0.00 0.52 0.40 0.39 0.14 0.0 0.0 0.79 1.12 0.77 0.49 1.42 0.4 0.79 1.12 1.1 0.49 1.42 1.57 1.1 1.49 1.55 4.15 3.28 3.72-1.41 1. 0 (xi µx) γ x = = 1.41 = 0.15 n 9 (yi µy ) γ y = = n 1.04 = 0.178 9 (zi µz ) γ z = = n 0 9 = 0 () Statistica 11 / 21
Il Il a scatola () è particolare rappresentazione di : gli elementi utilizzati per costruire la scatola sono i quantili e gli estremi della. Il e () Statistica 12 / 21
tra distribuzioni: confrontare graficamente le tre distribuzioni Il e min x = 18, max x = 30, Q 1 = 21, Q 2 = 25, Q 3 = 27 min y = 22, max y = 30, Q 1 = 24, Q 2 = 25, Q 3 = 27 min z = 21, max z = 29, Q 1 = 23, Q 2 = 25, Q 3 = 29 () Statistica 13 / 21
Costruzione di un box plot Si consideri la seguente di frequenze Il e () Statistica 14 / 21
Costruzione di un box plot La rappresentazione evidenzia la presenza di un valore anomalo Il e () Statistica 14 / 21
Costruzione di un box plot Il e () Statistica 14 / 21
Costruzione di un box plot Il e () Statistica 14 / 21
Costruzione di un box plot I, che quindi non parteciano alla costruzione della scatola, vengono determinati dal confronto con il campo di variazione interquartile. In particolare vengono considerate due soglie: Il e () Statistica 15 / 21
Costruzione di un box plot Il e I, che quindi non parteciano alla costruzione della scatola, vengono determinati dal confronto con il campo di variazione interquartile. In particolare vengono considerate due soglie: Q 1 1, 5 (Q 3 Q 1 ) rappresenta il valore al di sotto del quale modalità considerata outlier () Statistica 15 / 21
Costruzione di un box plot Il e I, che quindi non parteciano alla costruzione della scatola, vengono determinati dal confronto con il campo di variazione interquartile. In particolare vengono considerate due soglie: Q 1 1, 5 (Q 3 Q 1 ) rappresenta il valore al di sotto del quale modalità considerata outlier Q 3 + 1, 5 (Q 3 Q 1 ) rappresenta il valore al di sopra del quale modalità considerata outlier () Statistica 15 / 21
Box plot e istogramma Il e () Statistica 1 / 21
Box plot e istogramma Il e () Statistica 1 / 21
Box plot e istogramma Il e () Statistica 1 / 21
Box plot e istogramma Il e () Statistica 1 / 21
Box plot e istogramma Il e () Statistica 1 / 21
Il e Nel caso di variabili ordinali, è possibile misurare l attraverso un indice costruito sulla base della dispersione D. L indice D L indice D per il calcolo della dispersione in variabili ordinali si basa sulle frequenze cumulate F j e retrocumulate RF j, con j = 1,..., k, dove k è il numero di modalità della variabile. Ricordando che la frequenza relativa cumulata F j e quella retrocumulata RF j della j-esima modalità sono date rispettivamente da: L indice D è il seguente: indice di A F j = f 1 + f 2 +... + f j e RF j = f j + f j+1 +... + f K ; k [ D = Fj (1 F j ) + RF j (1 RF j ) ] k [ = 2 Fj (1 F j ) ] j=1 j=1 Tale indice si basa sul confronto tra la dispersione che caratterizza la delle modalità che si trovano alla sinistra di quella centrale e quella delle variabili alla destra di quelle centrali. A = D d D s D d + D s dove D d è la dispersione a dx e D s quella a sx () Statistica 17 / 21
Il e Esempio di calcolo dell indice A t.studio n j f j F j 1 F j a. 5 0.25 0.25 0.75 l.e. 5 0.25 0.50 0.5 l.m 3 0.15 0.5 0.35 d. 3 0.15 0.80 0.2 l. 4 0.2 1.00 0 tot 20 1.00 Per effettuare il calcolo dell indice bisogna individuare le modalità della parte destra della e quelle della parte sinistra. Poichè N è pari, N = 10. Dunque le modalità della parte sinistra sono {1, 2}, 2 quelle della parte destra sono {3, 4, 5}. () Statistica 18 / 21
Il e Parte sinistra della Esempio di calcolo dell indice A t.studio n j f j F j 1 F j a. 5 0.5 0.5 0.5 l.e. 5 0.5 1 0 l.m 0 0 1 0 d. 0 0 1 0 l. 0 0 1 0 tot 10 1.00 Per effettuare il calcolo dell indice bisogna individuare le modalità della parte destra della e quelle della parte sinistra. Poichè N è pari, N = 10. Dunque le modalità della parte sinistra sono {1, 2}, 2 quelle della parte destra sono {3, 4, 5}. 2 D s = 2 F j (1 F j ) = 2 0.5(0.5) = 0.5 j=1 () Statistica 19 / 21
Parte destra della Il e Esempio di calcolo dell indice A t.studio n j f j F j 1 F j a. 0 0 0 1 l.e. 0 0 0 1 l.m 3 0.3 0.3 0.7 d. 3 0.3 0. 0.4 l. 4 0.4 1 0 tot 10 1.00 Per effettuare il calcolo dell indice bisogna individuare le modalità della parte destra della e quelle della parte sinistra. Poichè N è pari, N = 10. Dunque le modalità della parte sinistra sono {1, 2}, 2 quelle della parte destra sono {3, 4, 5}. 2 D d = 2 F j (1 F j ) = 2 [0.3 0.7 + 0. 0.4] = 2 0.45 = 0.9 j=1 () Statistica 20 / 21
dispersione Il e Esempio di calcolo dell indice A Per effettuare il calcolo dell indice bisogna individuare le modalità della parte destra della e quelle della parte sinistra. Poichè N è pari, N = 10. Dunque le modalità della parte sinistra sono {1, 2}, 2 quelle della parte destra sono {3, 4, 5}. A = D d D s 0.9 0.5 = D d + D s 0.9 + 0.5 = 0.4 1.4 = 0.2857 () Statistica 21 / 21