Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini"

Transcript

1 Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini Anno accademico 2016/2017

2 Quartili e distribuzioni di frequenze Stanze Appartamenti Frequenze cumulate ,000 2, ,000 5, , , ,350 Per calcolare : A. Rango: Q1 Q1 ( ) 0,25 = 1587,75 B. Pertanto si colloca fra x ( 1587) e x ( 1588) x ( 1587) = x ( 1588) = 3 = Q Stanze Per calcolare : A. Rango: Q3 ( ) 0,75 = 4763,25 Q3 B. Pertanto si colloca fra x ( 4763) e x ( 4764) x ( 4763) = x ( 4764) = 4 = Q3

3 Quartili e distribuzioni di frequenze Per calcolare : A. Rango: Q1 ( 28 +1) 0,25 = 7,25 Modalità Frequenza Frequenza cumulata M = 5 Q1 B. Pertanto si colloca fra x ( 7) e x ( 8) x ( 7) = x ( 8) = 4 = Q1 Per calcolare : A. Rango: Q3 Q3 B. Pertanto si colloca fra e x 21 ( ) x ( 22) ( 28 +1) 0,75 = 21,75 x ( 21) = 6, x ( 22) = 7 Q3 = 6 + ( 7 6) 0, = 6,575

4 Quartili e distribuzioni di frequenze Q1 Per calcolare : Modalità Frequenza Frequenza cumulata M = 3 A. Rango: Q1 B. Pertanto si colloca fra e x 7 ( 28 +1) 0,25 = 7,25 ( ) = 1 x ( 8) = 2 Q1 = 1+ ( 2 1) Per calcolare : A. Rango: Q3 ( 28 +1) 0,75 = 21,75 Q3 B. Pertanto si colloca fra x ( 21) e x ( 22) x ( 21) = x ( 22) = 4 = Q3 0,25 =1,25

5 Box-plot & simmetria Asimmetria: A = ( max M ) ( M min) 7 Per il box-plot rosso A = ( 7 5) 5 1 asimmetria negativa ( ) = Per il box-plot blu A = ( 7 3) 3 1 asimmetria positiva ( ) = Da 1 a 7 Da 7 a 1

6 Percentili Dopo una visita di controllo ad un bambino, il medico farà uso di un grafico come questo: Quindi,dopo aver constatato che il soggetto in questione è al 95-esimo percentile, si preoccuperà un po. Cosa significa percentile? Il percentile x è quel valore (non necessariamente appartenente al campione) che lascia a sinistra l x% dei dati. E allora dire che un bambino ha un peso al 95-esimo percentile vuol dire che il 95% della popolazione maschile di quell età ha un peso inferiore.

7 Percentili Riprendiamo l esempio della scuola 10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7; 16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3; 20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8. p = 90 : ( 30 +1) 0,90 = 27,9 Il 90-esimo percentile si colloca fra gli elementi di posizione 27 & 28, ossia fra 26,1 & 27,1: 26,1+ ( 27,1 26,1) 0,9 = 27 Conclusione: il 90% degli intervistati dedica allo studio non più di 27 ore. E se volessimo l informazione inversa

8 Percentili 1 0, Qual è la percentuale di studenti che non studia più di 27 ore? Numero studenti che studiano non più di 27 ore = 27. Taglia = 30 Calcolo la percentuale: p = = 0,90

9 Percentili In sintesi: 27 è il 90 percentile del campione casuale perchè la percentuale di studenti del campione che studia 27 ore o meno è il 90%.

10 Mediana per classi di modalità Se non si conoscono i valori del campione ma solamente un riassunto in forma tabellare delle classi di frequenza... [10;14) [14;18) [18;22) [22;26) [26;30) [30;34] Estremi classi Frequenze cumulate = = } In 18 la frequenza cumulata è 14 < 30 2 = 15, mentre in 22 la frequenza cumulata è 23 > 30 2 = , 0 Pertanto la classe [18;22) contiene la mediana ? 22

11 Mediana per classi di modalità Se non si conoscono i valori del campione ma solamente un riassunto in forma tabellare delle classi di frequenza... Estremi classi Frequenze relative cumulate [10;14) [14;18) [18;22) [22;26) [26;30) [30;34] } Fra gli estremi 18 e 22 si passa da un valore inferiore a 0,50 ad uno superiore a 0,50. Risolvere: 34 1 Siccome non so come aumenta la frequenza all'interno della classe [18,22), assumo che l'incremento sia lineare (cioè quello della retta congiungente i punti P e Q) P Q Mediana y = 0,50

12 Mediana per classi di modalità Se non si conoscono i valori del campione ma solamente un riassunto in forma tabellare delle classi di frequenza... Estremi classi Frequenze relative cumulate x = 18 + } 0,50 0,47 0,77 0,47 La mediana varrà x [10;14) [14;18) [18;22) [22;26) [26;30) [30;34] Traccio una linea orizzontale in corrispondenza della frequenza 0,50 ed individuo l'intersezione. Risolviamo: y 0,47 0,77 0,47 = x y = 0,50 ( 22 18) = 18, P Q Mediana y = 0,

13 Quartili per classi di modalità Per calcolare i quartili Q1 e Q3 è possibile considerare di nuovo la tabella delle frequenze cumulate relative. Estremi classi Frequenze relative cumulate } Per Q1: la frequenza cumulata relativa passa da un valore inferiore a 0,25 (ossia 0,17 in 14) ad un valore superiore a 0,25 (ossia 0,47 in 18). A. la classe di riferimento per Q1 = ,25 0,17 0,47 0,17 Q1 è [14;18) ( 18 14) = 15,08.

14 Quartili per classi di modalità Per calcolare i quartili Q1 e Q3 è possibile considerare di nuovo la tabella delle frequenze cumulate relative. Estremi classi Frequenze relative cumulate } PerQ3: la frequenza cumulata relativa passa da un valore inferiore a 0,87 (ossia 0,47 in 18) ad un valore superiore a 0,75 (ossia 0,77 in 22). A. la classe di riferimento per Q3 = ,75 0,47 0,77 0,47 Q3 è [18;22) ( 22 18) = 21,72.

15 Box-plot di distribuzioni in classi Per costruire il box-plot della distribuzione in classi riportiamo come al solito i quartili per costruire la scatola ed all'interno disegnamo la linea della mediana. I baffi li disegniamo in relazione al minimo della prima classe ed al massimo dell'ultima classe. Box-plot dataset esatto Box-plot dataset per classi di modalità

16 Indici di dispersione Si dicono indici di dispersione (o indici di variabilità) quei parametri che misurano la variabilità del campione casuale. Fra di essi riconosciamo: 1. Campo di variazione: 2. Intervallo interquartile: CVar = max min IQR = Q3 Q1

17 Indici di dispersione Si dicono indici di dispersione (o indici di variabilità) quei parametri che misurano la variabilità del campione casuale. Fra di essi riconosciamo: 1. Campo di variazione: 2. Intervallo interquartile: CVar = max min IQR = Q3 Q1 Chiamiamo varianza (campionaria) il valore s 2 calcolato attraverso la formula s 2 = 1 n 1 ( x 1 X ( m) 2 +!+ ( x n ) 2 = 1 X X (x i ) X 2 ) 2 + x 2 n 1 n i=1 dove X è la media aritmetica del campione casuale. Un ulteriore indice di dispersione che introduciamo è

18 Indici di dispersione Si dicono indici di dispersione (o indici di variabilità) quei parametri che misurano la variabilità del campione casuale. Fra di essi riconosciamo: 1. Campo di variazione: 2. Intervallo interquartile: CVar = max min IQR = Q3 Q1 Chiamiamo varianza (campionaria) il valore s 2 calcolato attraverso la formula s 2 = 1 n 1 ( x 1 X ( m) 2 +!+ ( x n ) 2 = 1 X X (x i ) X 2 ) 2 + x 2 n 1 n i=1 dove X è la media aritmetica del campione casuale. Un ulteriore indice di dispersione che introduciamo è 3. Deviazione standard (campionaria): s = s 2 va s

19 Indici di dispersione Esempio 10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7; 16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3; 20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8. La media campionaria è X =19,01 10,3 12,9 13,5 13,7 19,01 19,7 20,3 20,7 20,8 21,4 La varianza vale s 2 = ,3 19,01 ( ) 2 + 2( 12,9 19,01) 2 + ( 13,5 19,01) 2 +!+ ( 33,8 19,01) 2 = 28,7

20 Indici di dispersione Esempio 10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7; 16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3; 20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8. La media campionaria è X =19,01 10,3 12,9 13,5 13,7 19,01 19,7 20,3 20,7 20,8 21,4 La varianza vale s 2 = ,3 19,01 ( ) 2 + 2( 12,9 19,01) 2 + ( 13,5 19,01) 2 +!+ ( 33,8 19,01) 2 = 28,7 La deviazione standard è la radice quadrata della varianza s = 28,7 = 5,36.

21 Indici di dispersione Esempio 10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7; 16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3; 20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8. La media campionaria è X =19,01 10,3 12,9 13,5 13,7 19,01 19,7 20,3 20,7 20,8 21,4 La varianza vale s 2 = ,3 19,01 ( ) 2 + 2( 12,9 19,01) 2 + ( 13,5 19,01) 2 +!+ ( 33,8 19,01) 2 = 28,7 La deviazione standard è la radice quadrata della varianza s = 28,7 = 5,36 La deviazione standard fornisce una misura della concentrazione dei dati intorno alla media..

22 Indici di dispersione La deviazione standard non è una statistica robusta { 1,2,3,4,5 } { 1,2, 3, 4,15} { 1,2, 3, 4,100} CVar = 4 IQR = 43,. 2 IQR = 82. IQR = 5,0,5 2. s = 1,58 CVar = 14 s = 5,07 CVar = 99. s = 43,62

23 Indici di dispersione La deviazione standard non è una statistica robusta { 1,2,3,4,5 } { 1,2, 3, 4,15} { 1,2, 3, 4,100} CVar = 4 IQR = 43,. 2 IQR = 82. IQR = 5,0,5 2. s = 1,58 CVar = 14 s = 5,07 CVar = 99 s = 43,62 Per variabili quantitative: ordinate in scale sia intervallari che proporzionali. Per il suo calcolo vengono utilizzati tutti i dati. Un insieme di dati ha una sola deviazione standard. Vale zero quando tutti i dati assumono lo stasso valore (variabile statistica degenere). [Esempio: È invariante per traslazione. Ossia, se ad ogni dato viene aggiunta una quantità costante allora la deviazione standard non cambia..

24 Indici di dispersione La deviazione standard non è una statistica robusta { 1,2,3,4,5 } { 1,2, 3, 4,15} { 1,2, 3, 4,100} CVar = 4 IQR = 43,. 2 IQR = 82. IQR = 5,0,5 2. s = 1,58 Per variabili quantitative: ordinate in scale sia intervallari che proporzionali. Per il suo calcolo vengono utilizzati tutti i dati. Un insieme di dati ha una sola deviazione standard. Vale zero quando tutti i dati assumono lo stasso valore (variabile statistica degenere). [Esempio: CVar = 14 s = 5,07 CVar = 99 s = 43,62 È invariante per traslazione. Ossia, se ad ogni dato viene aggiunta una quantità costante allora la deviazione standard non cambia..

25 Indici di dispersione La deviazione standard non è una statistica robusta { 1,2,3,4,5 } { 1,2, 3, 4,15} { 1,2, 3, 4,100} CVar = 4 IQR = 43,. 2 IQR = 82. IQR = 5,0,5 2. s = 1,58 Per variabili quantitative: ordinate in scale sia intervallari che proporzionali. Per il suo calcolo vengono utilizzati tutti i dati. Un insieme di dati ha una sola deviazione standard. Vale zero quando tutti i dati assumono lo stasso valore (variabile statistica degenere). [Esempio: CVar = 14 s = 5,07 CVar = 99 s = 43,62 È invariante per traslazione. Ossia, se ad ogni dato viene aggiunta una quantità costante allora la deviazione standard non cambia..

26 Indici di dispersione La deviazione standard non è una statistica robusta { 1,2,3,4,5 } { 1,2, 3, 4,15} { 1,2, 3, 4,100} CVar = 4 IQR = 43,. 2 IQR = 82. IQR = 5,0,5 2. s = 1,58 CVar = 14 s = 5,07 Per variabili quantitative: ordinate in scale sia intervallari che proporzionali. Per il suo calcolo vengono utilizzati tutti i dati. CVar = 99 s = 43,62 Un insieme di dati ha una sola deviazione standard. Vale zero quando tutti i dati assumono lo stasso valore (variabile statistica degenere). [Esempio: { 2,2,2},.X µ = 2, s = 0]. È invariante per traslazione. Ossia, se ad ogni dato viene aggiunta una quantità costante allora la deviazione standard non cambia..

27 Indici di dispersione La deviazione standard non è una statistica robusta { 1,2,3,4,5 } { 1,2, 3, 4,15} { 1,2, 3, 4,100} CVar = 4 IQR = 43,. 2 IQR = 82. IQR = 5,0,5 2. s = 1,58 CVar = 14 s = 5,07 CVar = 99. s = 43,62 { 2, 3, 4,5,101} CVar = 99 IQR = 5,0,5 2.. s = 43,62 Per variabili quantitative: ordinate in scale sia intervallari che proporzionali. Per il suo calcolo vengono utilizzati tutti i dati. Un insieme di dati ha una sola deviazione standard. Vale zero quando tutti i dati assumono lo stasso valore (variabile statistica degenere). [Esempio: { 2,2,2},.X µ = 2, s = 0]. È invariante per traslazione. Ossia, se ad ogni dato viene aggiunta una quantità costante allora la deviazione standard non cambia.

28 Concentrazione dei valori Assumendo in un campione casuale di taglia n la media aritmetica X come indice centrale, considerando la deviazione standard come indice di dispersione dei dati, ci si pone la questione di stabilire a priori una stima della percentuale di dati che si "concentrano" in prossimità di X.

29 Concentrazione dei valori Assumendo in un campione casuale di taglia n la media aritmetica X come indice centrale, considerando la deviazione standard come indice di dispersione dei dati, ci si pone la questione di stabilire a priori una stima della percentuale di dati che si "concentrano" in prossimità di X. Più precisamente: che percentuale di dati si trova nell'intervallo [ X - s, X+ s]? Che percentuale nell'intervallo [ X - 2s, X + 2s]? E nell'intervallo? [ X - 3s, X + 3s]

30 La regola empirica vs la regola di Čebyšëv Quando la distribuzione dei dati non è caratterizzata da una forte asimmetria e le osservazioni sono concentrate in prossimità di media e mediana, vale la seguente regola empirica:

31 La regola empirica vs la regola di Čebyšëv Quando la distribuzione dei dati non è caratterizzata da una forte asimmetria e le osservazioni sono concentrate in prossimità di media e mediana, vale la seguente regola empirica: approssimativamente il 68% dei valori presenta uno scostamento dalla media pari ad 1 volta la deviazione standard; Approssimativamente il 95% dei valori presenta uno scostamento dalla media pari a 2 volte la deviazione standard. Approssimativamente il 99,7% dei valori presenta uno scostamento dalla media pari a 3 volte la deviazione standard.

32 La regola empirica vs la regola di Čebyšëv Quando la distribuzione dei dati non è caratterizzata da una forte asimmetria e le osservazioni sono concentrate in prossimità di media e mediana, vale la seguente regola empirica: approssimativamente il 68% dei valori presenta uno scostamento dalla media pari ad 1 volta la deviazione standard; approssimativamente il 95% dei valori presenta uno scostamento dalla media pari a 2 volte la deviazione standard; Approssimativamente il 99,7% dei valori presenta uno scostamento dalla media pari a 3 volte la deviazione standard.

33 La regola empirica vs la regola di Čebyšëv Quando la distribuzione dei dati non è caratterizzata da una forte asimmetria e le osservazioni sono concentrate in prossimità di media e mediana, vale la seguente regola empirica: approssimativamente il 68% dei valori presenta uno scostamento dalla media pari ad 1 volta la deviazione standard; approssimativamente il 95% dei valori presenta uno scostamento dalla media pari a 2 volte la deviazione standard; approssimativamente il 99,7% dei valori presenta uno scostamento dalla media pari a 3 volte la deviazione standard.

34 La regola empirica vs la regola di Čebyšëv Quando siamo in presenza di una generica distribuzione (anche asimmetrica), interviene la cosiddetta regola di Čebyšëv:

35 La regola empirica vs la regola di Čebyšëv Quando siamo in presenza di una generica distribuzione (anche asimmetrica), interviene la cosiddetta regola di Čebyšëv: "Detto k un numero intero maggiore o uguale a 2, la percentuale di valori che non si discosta dalla media (a destra o sinistra) più di k volte la deviazione standard è pari ALMENO a ( 1 1 ) k 2 X 100 % ".

36 La regola empirica Consideriamo l'istogramma delle densità relativo alle ore di studio della I scuola X - 2s X - s + 2s [10;14) [14;18) [18;22) [22;26) [26;30) [30,34] 10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7; 16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3; 20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8. Secondo la regola empirica, circa il 68% dei dati appartiene a [. µ s;. µ + s] = [ 13,65; 24,7] 22 X X 37]. Nel nostro caso 2 30 = 0, % Secondo la regola empirica, circa il 95% dei dati appartiene a [ X. µ 2s;. µ + 2s] = [ 8,29; 29,72] 28 X. Nel nostro caso 2 30 = 0, % X + s X

37 La regola di Čebyšëv Consideriamo l'istogramma delle densità relativo alle ore di studio della I scuola 10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7; 16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3; 20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8. Secondo la regola di Čebyšëv, non meno del 75% dei dati appartiene a [ X. µ 2s;. µ + 2s] X = 8,29; 29,72 [ ]. Infatti k =2 1 1 k 2 28 Nel nostro caso 2 30 = 0, % ( ) X 100 % =75%

38 Concentrazione: uso dei percentili [10;14) [14;18) [18;22) [22;26) [26;30) [30,34] 10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7; 16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3; 20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8.. X µ = 19,01, s = 5, [10;14) [14;18) [18;22) [22;26) [26;30] 25,8; 23,2; 10,1; 24,2; 21,0; 22,3; 15,1; 22,4; 28,3; 25,7; 19,8; 21,4; 17,7; 19,3; 18,2; 21,5; 23,3; 24,3; 20,9; 27,0; 22,3; 20,9; 21,1; 25,1; 23,9; 21,1.. Xµ = 21,77, s = 3,78 La deviazione standard del secondo dataset è inferiore a quella del primo. Per avere una misura del grado di dispersione si può confrontare la deviazione standard con la metà della lunghezza dell intervallo che contiene il 70% dei dati.

39 Concentrazione: uso dei percentili 15% 70% 15% 15-esimo percentile 85-esimo percentile 10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7; 16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3; 20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8. p = 0,15 : ( 30 +1) 0,15 = 4,65 Il 15-esimo percentile si colloca fra gli elementi di posizione 4 e 5, ossia fra 13,5 e 13,7: 13,5 + 0,65 ( 13,7 13,5 ) = 13,63 p = 0,85 : ( 30 +1) 0,85 = 26,35 L 85-esimo percentile si colloca fra gli elementi di posizione 26 e 27, ossia fra 23,7 e 26,1: 23,7 + 0,35 ( 26,1 23,7 ) = 24,54 24,54 13,63 2 = 5,46 > 5,36

40 Concentrazione: uso dei percentili 15% 70% 15% 15-esimo percentile 85-esimo percentile 10,1; 15,1; 17,7; 18,2; 19,3; 19;8; 20,9; 20,9; 21,0; 21,1; 21,1; 21,4; 21,5; 22,3; 22,3; 22,4; 23,2; 23,3; 23,9; 24,2; 24,3; 25,1; 25,7; 25,8; 27,0; 28,3. p = 0,15 : ( 26 +1) 0,15 = 4,05 Il 15-esimo percentile si colloca fra gli elementi di posizione 4 e 5, ossia fra 18,2 e 19,3: 18,2 + 0,05 ( 19,3 18,2) = 18,26 p = 0,85 : ( 26 +1) 0,85 = 22,95 l 85-esimo percentile si colloca fra gli elementi di posizione 22 e 23, ossia fra 25,1 e 25,7: 25,1+ 0,95 ( 25,7 25,1) = 25,67 25,67 18,26 2 = 3,71 < 3,78

41 La deviazione standard per classi Supponiamo che i dati relativi al numero di ore siano stati forniti in tabella secondo le classi di modalità già usate per l istogramma. Per il calcolo della varianza, e quindi della deviazione standard, si usa lo stesso procedimento visto per la media, ossia: Classi [10;14) [14;18) [18;22) [22;26) [26;30) [30;34] Centri Frequenze assolute s 2 = = 1 29 ( centri delle classi media) 2 frequenze assolute taglia 1 s = 5,32 ( 12 19,1) 2 5 +!+ ( 32 19,1) 2 1 = 28,34

42 La deviazione standard Un caso particolare: stessa media. X s = 1 µ = 0 e stessa deviazione standard

43 Variabilità nei caratteri qualitativi Per caratteri qualitativi, la variabilità è più opportunamente stimata attraverso un indice di eterogeneità. ( ) Indice di eterogeneità (di Gini): E = 1 f 1 2 +!+ f k 2 Minimo quando vi è una sola modalità con frequenza relativa 1 E = 0 E' il caso di massima omogeneità nella distribuzione di frequenze. Massimo quando tutte le k modalità sono equifrequenti: 1 k E = 1 1 k +!+ 1 2 k 2 = 1 k k = k 1 2 k E' il caso di massima eterogeneità nella distribuzione di frequenze.

44 Variabilità nei caratteri qualitativi Colore dei capelli N di persone Frequenze relative Neri 10 0,35 Castano chiaro 3 0,11 Castano scuro 6 0,21 Rossi 1 0,04 Biondi 5 0,18 Bianchi 3 0,11 Totale 28 1 ( 0,35 0,11 0,11 ) = 0,78 0,67 E = 1 0, , !+ 0,047 2 Poiché k 1 k 5 = = 0,86, 0,83 concludiamo che la tabella è piuttosto eterogenea!

45 Il coefficiente di variazione Una proprietà auspicabile per un indice di variabilità è che esso non dipenda dalla unità di misura in cui il carattere è espresso. Questa proprietà consente di effettuare confronti fra grandezze con misure diverse e non solo Esempio: l altezza di 5 studenti (in cm) è: 172, 175, 176, 178, 180. Si ha µ. = 176,2 ed s = 3,033 X X In metri la media sarebbe µ. = 1, 762 mentre la deviazione standard sarebbe s = 0,03!.

46 Il coefficiente di variazione Una proprietà auspicabile per un indice di variabilità è che esso non dipenda dalla unità di misura in cui il carattere è espresso. Questa proprietà consente di effettuare confronti fra grandezze con misure diverse e non solo Esempio: l altezza di 5 studenti (in cm) è: 172, 175, 176, 178, 180. Si ha µ. = 176,2 ed s = 3,033 X X In metri la media sarebbe µ. = 1, 762 mentre la deviazione standard sarebbe s = 0,03! Possiamo concludere che nel secondo caso la variabilità sia inferiore?.

47 Il coefficiente di variazione Una proprietà auspicabile per un indice di variabilità è che esso non dipenda dalla unità di misura in cui il carattere è espresso. Questa proprietà consente di effettuare confronti fra grandezze con misure diverse e non solo Esempio: l altezza di 5 studenti (in cm) è: 172, 175, 176, 178, 180. Si ha µ. = 176,2 ed s = 3,033 X X In metri la media sarebbe µ. = 1, 762 mentre la deviazione standard sarebbe s = 0,03! Possiamo concludere che nel secondo caso la variabilità sia inferiore? Certamente NO!.

48 Il coefficiente di variazione Si introduce il cosiddetto coefficiente di variazione, definito come il rapporto fra la deviazione standard e la media campionaria (presa con il segno positivo). Tale definizione è ben posta per distribuzioni statistiche a media non nulla..

49 Il coefficiente di variazione Si introduce il cosiddetto coefficiente di variazione, definito come il rapporto fra la deviazione standard e la media campionaria (presa con il segno positivo). Tale definizione è ben posta per distribuzioni statistiche a media non nulla. In simboli. CV = s. X.

50 Si introduce il cosiddetto coefficiente di variazione, definito come il rapporto fra la deviazione standard e la media campionaria (presa con il segno positivo). Tale definizione è ben posta per distribuzioni statistiche a media non nulla. In simboli Il coefficiente di variazione. CV = s. X. Nell esempio appena visto il coefficiente di variazione è CV = 0,0172.

51 Il coefficiente di variazione Esempio: l altezza di 5 neonati (in cm) è: 52, 50, 46, 51, 53..

52 Il coefficiente di variazione Esempio: l altezza di 5 neonati (in cm) è: 52, 50, 46, 51, 53. Risulta che: la media è 50,4 cm; la deviazione standard è 2,70 cm..

53 Il coefficiente di variazione Esempio: l altezza di 5 neonati (in cm) è: 52, 50, 46, 51, 53. Risulta che: la media è 50,4 cm; la deviazione standard è 2,70 cm..

54 Il coefficiente di variazione Esempio: l altezza di 5 neonati (in cm) è: 52, 50, 46, 51, 53. Risulta che: la media è 50,4 cm; la deviazione standard è 2,70 cm..

55 Il coefficiente di variazione Esempio: l altezza di 5 neonati (in cm) è: 52, 50, 46, 51, 53. Risulta che: la media è 50,4 cm; la deviazione standard è 2,70 cm. E pertanto... il coefficiante di variazione è.

56 Il coefficiente di variazione Esempio: l altezza di 5 neonati (in cm) è: 52, 50, 46, 51, 53. Risulta che: la media è 50,4 cm; la deviazione standard è 2,70 cm. E pertanto... il coefficiante di variazione è. CV = 0,053..

57 Il coefficiente di variazione Anche quando le unità di misura sono le stesse il coefficiente di variazione può tornare utile. Regione DC PLI Regione DC PLI Regione DC PLI Piemonte Toscana Puglia Lombardia Umbria Basilicata Veneto Marche Calabria Liguria Lazio Sardegna Friuli V. G Abruzzo Sicilia Trentino A. A. Distribuzione delle percentuali di voto nel Molise Emilia R Campania La percentuale media è del 33,9% per la DC mentre per il PLI è del 2,3%. Le differenze fra una regione e l altra sono maggiori, in punti percentuali, nella DC. Infatti tra la Basilicata e l Emilia Romagna vi è una differenza di 23,2 punti percentuali mentre per il PLI la differenza massima è solo di 5,8 punti percentuali. La deviazione standard della percentuale di voti e 8,23 per la DC mentre è 1,41 per il PLI. CV DC = 8,23 33,9 = 0,24, CV PLI = 1,41 2,3 = 0,61 Se si confrontano i coefficienti di variazione il risultato si rovescia. La distribuzione di voto della DC presenta una variabilità minore rispetto a quella del PLI.

58 Precisione della media campionaria Il coefficiente di variazione consente di valutare anche la correttezza della media campionaria. Infatti la media campionaria si ritiene un indice corretto se il coefficiente di variazione assume valori inferiori a 0,5. Esempio: CV DC = 8,23 33,9 = 0,24, CV PLI = 1,41 2,3 = 0,61 La media è un indice corretto per la percentuale della DC ma non per quella del PLI. Si definisce precisione della media campionaria SEM il rapporto fra la deviazione campionaria e la radice quadrata della taglia. SEM = s n 1,5 per la DC = 0,27 per il PLI Al crescere della taglia il parametro SEM diminuisce e quindi la media campionaria fornisce una valutazione più precisa.

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini antonio.azzollini@unibas.it Anno accademico 2017/2018 Quartili e distribuzioni di frequenze Stanze Appartamenti

Dettagli

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini antonio.azzollini@unibas.it Anno accademico 2017/2018 Le medie La mediana La mediana M di un insieme di dati (ordinato)

Dettagli

Le misure numeriche. La media aritmetica

Le misure numeriche. La media aritmetica Le misure numeriche La media aritmetica Indice centrale dei dati: somma dei valori numerici presi in considerazione diviso la numerosità. Per variabili quantitative: scala intervallare o rapporto. Per

Dettagli

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini antonio.azzollini@unibas.it Anno accademico 2017/2018 Variabilità nei caratteri qualitativi Colore dei capelli N

Dettagli

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini antonio.azzollini@unibas.it Anno accademico 2016/2017 Le medie Le medie si applicano ai caratteri quantitativi,

Dettagli

Rappresentazione dei dati

Rappresentazione dei dati Rappresentazione dei dati Riprendiamo il data set Ore: > setwd(..) > ore

Dettagli

Indici di variabilità relativa

Indici di variabilità relativa Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 2014-2015 Indici di variabilità relativa Consentono di effettuare confronti sulla variabilità di fenomeni che presentano unità

Dettagli

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione [1/2] Gli indici di variabilità consentono di riassumere le principali caratteristiche di una distribuzione (assieme alle medie) Le

Dettagli

Scale di Misurazione Lezione 2

Scale di Misurazione Lezione 2 Last updated April 26, 2016 Scale di Misurazione Lezione 2 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura II anno, II semestre Tipi di Variabili 1 Scale di Misurazione 1. Variabile

Dettagli

Misure di dispersione (o di variabilità)

Misure di dispersione (o di variabilità) 08/04/014 Misure di dispersione (o di variabilità) Range Distanza interquartile Deviazione standard Coefficiente di variazione Misure di dispersione 7 8 9 30 31 9 18 3 45 50 x 9 range31-74 x 9 range50-941

Dettagli

tabelle grafici misure di

tabelle grafici misure di Statistica Descrittiva descrivere e riassumere un insieme di dati in maniera ordinata tabelle grafici misure di posizione dispersione associazione Misure di posizione Forniscono indicazioni sull ordine

Dettagli

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini antonio.azzollini@unibas.it Anno accademico 2016/2017 Rapporti Statistici I rapporti statistici sono rapporti fra

Dettagli

Matematica Lezione 22

Matematica Lezione 22 Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,

Dettagli

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini antonio.azzollini@unibas.it Anno accademico 2018/2019 Diagramma delle frequenze relative Si chiama diagramma delle

Dettagli

Capitolo 3 Sintesi e descrizione dei dati quantitativi

Capitolo 3 Sintesi e descrizione dei dati quantitativi Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 3 Sintesi e descrizione dei dati quantitativi Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e tecnologie Alimentari" Unità

Dettagli

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di

Dettagli

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016 Corso di Laurea in Economia Aziendale Docente: Marta Nai Ruscone Statistica a.a. 2015/2016 1 Indici di posizione GLI INDICI DI POSIZIONE sono indici sintetici che evidenziano le caratteristiche essenziali

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Sintesi a cinque e misure di variabilità rispetto ad un centro Una catena di fast-food ha selezionato

Dettagli

STATISTICA DESCRITTIVA (variabili quantitative)

STATISTICA DESCRITTIVA (variabili quantitative) STATISTICA DESCRITTIVA (variabili quantitative) PRIMO ESEMPIO: Concentrazione di un elemento chimico in una roccia. File di lavoro di STATVIEW Cliccando sul tasto del pane control si ottiene il cosiddetto

Dettagli

Modelli descrittivi, statistica e simulazione

Modelli descrittivi, statistica e simulazione Modelli descrittivi, statistica e simulazione Master per Smart Logistics specialist Roberto Cordone (roberto.cordone@unimi.it) Statistica descrittiva Cernusco S.N., martedì 28 febbraio 2017 1 / 1 Indici

Dettagli

STATISTICHE DESCRITTIVE Parte II

STATISTICHE DESCRITTIVE Parte II STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una

Dettagli

Settimana 2. G. M. Marchetti. 4 Marzo 2017

Settimana 2. G. M. Marchetti. 4 Marzo 2017 Settimana 2 G. M. Marchetti 4 Marzo 2017 1 / 54 Mediana Un indice di posizione alternativo alla media e molto usato è la mediana È basato sull ordinamento dei dati La mediana è il valore Me tale che la

Dettagli

Statistica Sociale - modulo A

Statistica Sociale - modulo A Statistica Sociale - modulo A e-mail: stella.iezzi@uniroma2.it i quartili IL TERZO QUARTILE per un carattere diviso in classi ESEMPIO: il boxplot I QUARTILI I quartili sono tre indici che dividono la distribuzione

Dettagli

STIME STATISTICHE. Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 2/2

STIME STATISTICHE. Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 2/2 p. 1/1 INFORMAZIONI Prossime lezioni Giorno Ora Dove 10/02 14:30 P50 11/02 14:30 Laboratorio (via Loredan) 17/02 14:30 P50 23/02 14:30 P50 25/02 14:30 Aula informatica (6-7 gruppi) 02/03 14:30 P50 04/03

Dettagli

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl 1/4 Capitolo 4 La variabilità di una distribuzione Intervalli di variabilità Box-plot Indici basati sullo scostamento dalla media Confronti di variabilità Standardizzazione Statistica - Metodologie per

Dettagli

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative TRACCIA DI STUDIO Un indice di tendenza centrale non è sufficiente a descrivere completamente un fenomeno. Gli indici di dispersione assolvono il compito di rappresentare la capacità di un fenomeno a manifestarsi

Dettagli

Nozioni di statistica

Nozioni di statistica Nozioni di statistica Distribuzione di Frequenza Una distribuzione di frequenza è un insieme di dati raccolti in un campione (Es. occorrenze di errori in seconda elementare). Una distribuzione può essere

Dettagli

ESERCIZI DI STATISTICA SOCIALE

ESERCIZI DI STATISTICA SOCIALE ESERCIZI DI STATISTICA SOCIALE FREQUENZA ASSOLUTA Data una distribuzione semplice di dati, ovvero una serie di microdati, si chiama frequenza assoluta di ogni modalità del carattere studiato il numero

Dettagli

Variabilità e Concentrazione Esercitazione n 02

Variabilità e Concentrazione Esercitazione n 02 Variabilità e Concentrazione Esercitazione n 02 ESERCIZIO 1 Nella tabella di seguito sono riportati i dati relativi al tempo necessario a 8 studenti per svolgere un test di valutazione (in ore): Tempo

Dettagli

Indici di variabilità ed eterogeneità

Indici di variabilità ed eterogeneità Indici di variabilità ed eterogeneità Corso di STATISTICA Prof. Roberta Siciliano Ordinario di Statistica, Università di apoli Federico II Professore supplente, Università della Basilicata a.a. 011/01

Dettagli

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi ISTITUZIONI DI STATISTICA A A 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Statistica. Matematica con Elementi di Statistica a.a. 2015/16 Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati

Dettagli

Indici di Dispersione

Indici di Dispersione Indici di Dispersione Si cercano indici di dispersione che: utilizzino tutti i dati {x 1, x 2,..., x n } siano basati sulla nozione di scarto (distanza) dei dati rispetto a un centro d i = x i C ad esempio,

Dettagli

MISURE DI SINTESI 54

MISURE DI SINTESI 54 MISURE DI SINTESI 54 MISURE DESCRITTIVE DI SINTESI 1. MISURE DI TENDENZA CENTRALE 2. MISURE DI VARIABILITÀ 30 0 µ Le due distribuzioni hanno uguale tendenza centrale, ma diversa variabilità. 30 0 Le due

Dettagli

7. STATISTICA DESCRITTIVA

7. STATISTICA DESCRITTIVA 7. STATISTICA DESCRITTIVA Quando si effettua un indagine statistica si ha a che fare con un numeroso insieme di oggetti, detto popolazione del quale si intende esaminare una o più caratteristiche (matricole

Dettagli

Grafici e tabelle permettono di fare valutazioni qualitative, non quantitative. E necessario poter sintetizzare i dati attraverso due importanti

Grafici e tabelle permettono di fare valutazioni qualitative, non quantitative. E necessario poter sintetizzare i dati attraverso due importanti Grafici e tabelle permettono di fare valutazioni qualitative, non quantitative. E necessario poter sintetizzare i dati attraverso due importanti indici : Indici di posizione Indici di variazione Indici

Dettagli

Corso di Laurea triennale Tecniche della Prevenzione PERCORSO STRAORDINARIO 2007/08. Insegnamento di STATISTICA MEDICA. Modulo II

Corso di Laurea triennale Tecniche della Prevenzione PERCORSO STRAORDINARIO 2007/08. Insegnamento di STATISTICA MEDICA. Modulo II Università degli Studi di Padova Facoltà di Medicina e Chirurgia Corso di Laurea triennale Tecniche della Prevenzione PERCORSO STRAORDINARIO 2007/08 Insegnamento di STATISTICA MEDICA Docente:Dott.ssa Egle

Dettagli

Università di Cassino (sede di Terracina) Esercitazione di Statistica 1 del 17 ottobre Dott.ssa Paola Costantini

Università di Cassino (sede di Terracina) Esercitazione di Statistica 1 del 17 ottobre Dott.ssa Paola Costantini Università di Cassino (sede di Terracina) Esercitazione di Statistica 1 del 17 ottobre 2007 Dott.ssa Paola Costantini La seguente tabella (tab1) riporta le informazioni relative a 15 aziende operanti nel

Dettagli

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici) Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:

Dettagli

Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche.

Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche. Misure di tendenza centrale e di variabilità: Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche. Il valore medio di una variabile in un gruppo di osservazioni

Dettagli

Statistica Un Esempio

Statistica Un Esempio Statistica Un Esempio Un indagine sul peso, su un campione di n = 100 studenti, ha prodotto il seguente risultato. I pesi p sono espressi in Kg e sono stati raggruppati in cinque classi di peso. classe

Dettagli

autosnodato auto-treno con rimorchio totale incidenti trattore stradale o motrice auto-articolato

autosnodato auto-treno con rimorchio totale incidenti trattore stradale o motrice auto-articolato Tab. IS.9.1a - Incidenti per tipo di e - Anni 2001-2013 a) Valori assoluti Anno 2001 o a altri Piemonte 16.953 23.818 19 77 167 146 80 67 1.942 123 254 153 50 59 824 1.920 1.037 653 50 4 23 0 112 31.578

Dettagli

Consideriamo due variabili quantitative Y e X, e supponiamo di essere interessati a comprendere come la Y

Consideriamo due variabili quantitative Y e X, e supponiamo di essere interessati a comprendere come la Y 1 Analisi della interdipendenza lineare Quando si analizzano due o più caratteri quantitativi si può cercare di individuare una funzione che descriva in modo dettagliato la relazione che emerge dai dati,

Dettagli

Range interquartile. Calcolare e interpretare Range interquartile

Range interquartile. Calcolare e interpretare Range interquartile Range interquartile W Q 3 Q 1 Quantifica l estensione del 50% della distribuzione del carattere che si trova attorno alla mediana: il 50% delle unita statistiche che presentano una modalità prossima a

Dettagli

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano Strumenti statistici in Excell Pacchetto Analisi di dati Strumenti di analisi: Analisi varianza: ad un fattore Analisi

Dettagli

Descrittiva. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali

Descrittiva. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali Elementi di Statistica Descrittiva La Variabilità V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali Soriano nel Cimino (VT), 5 Ottobre 2009 Pier Francesco

Dettagli

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 LA RAPPRESENTAZIONE E LA SINTESI

Dettagli

Seconda Lezione. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 DISTRIBUZIONE DI FREQUENZA

Seconda Lezione. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 DISTRIBUZIONE DI FREQUENZA Seconda Lezione "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando

Dettagli

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini Anno accademico 2016/2017

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini Anno accademico 2016/2017 Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini antonio.azzollini@unibas.it Anno accademico 2016/2017 Rappresentazione dei dati I dati raccolti in tabelle possono

Dettagli

Dispersione. si cercano indici di dispersione che:

Dispersione. si cercano indici di dispersione che: Dispersione si cercano indici di dispersione che: utilizzino tutti i dati { x 1, x 2... x n } siano basati sulla nozione di scarto (distanza) dei dati rispetto ad un centro d i = x i C ad es. rispetto

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono

Dettagli

Statistica descrittiva II

Statistica descrittiva II Probabilità e Statistica Esercitazioni a.a. 009/010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Statistica descrittiva II Ines Campa Probabilità e Statistica - Esercitazioni

Dettagli

geografica Maschio Femmina Maschio Femmina

geografica Maschio Femmina Maschio Femmina 1 In una recente indagine gli intervistati sono stati classificati rispetto al sesso, allo stato civile e alla ripartizione geografica di residenza. I dati sono sintetizzati nella seguente tabella: Ripartizione

Dettagli

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici) Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:

Dettagli

Variabilità o Dispersione Definizione Attitudine di un fenomeno ad assumere diverse modalità

Variabilità o Dispersione Definizione Attitudine di un fenomeno ad assumere diverse modalità Punti deboli della media aritmetica Robustezza: sensibilità ai valori estremi Non rappresentava nei confronti di distribuzioni asimmetriche. La media aritmetica è un valore rappresentativo nei confronti

Dettagli

Variabilità. ..senza variabilità non ci sarebbe la statistica

Variabilità. ..senza variabilità non ci sarebbe la statistica Variabilità..senza variabilità non ci sarebbe la statistica Se tutti votassimo lo stesso partito alle elezioni (=moda), non ci sarebbero i sondaggi, nè le previsioni elettorali il voto politico sarebbe

Dettagli

STATISTICHE DESCRITTIVE

STATISTICHE DESCRITTIVE STATISTICHE DESCRITTIVE ARGOMENTI DELLA LEZIONE concetti introduttivi indici di tendenza centrale indici di dispersione indici di posizione 2 concetti introduttivi Unità statistiche elementi che costituiscono

Dettagli

Daniela Tondini

Daniela Tondini Daniela Tondini dtondini@unite.it Facoltà di Medicina veterinaria CdS in Tutela e benessere animale Università degli Studi di Teramo 1 INDICI STATISTICI La moda M O di una distribuzione di frequenza X,

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Indici di posizione variabilità e forma per caratteri qualitativi Il seguente data set riporta la rilevazione

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione

Dettagli

Le medie. Antonello Maruotti

Le medie. Antonello Maruotti Le medie Antonello Maruotti Outline 1 Medie di posizione 2 Definizione Moda La moda di un collettivo, distributio secondo un carattere qualsiasi, è la modalità prevalente del carattere ossia quella a cui

Dettagli

p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali.

p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica

Dettagli

La Variabilità statistica

La Variabilità statistica La Variabilità statistica Una peculiarità dei caratteri rilevati nelle unità statistiche di un collettivo, è quella di presentare valori o attributi in tutto o in parte diversi. Si chiama variabilità (nel

Dettagli

Prova scritta di Statistica

Prova scritta di Statistica Prova scritta di Statistica 5 Febbraio 2016 1. Da un indagine riguardante l utilizzo del telefono cellulare si sono ottenuti i seguenti risultati: Età No.telefonini Chiamate Spesa sett. Bluetooth 20 2

Dettagli

Soggetto Genere Costo del soggiorno Titolo di studio

Soggetto Genere Costo del soggiorno Titolo di studio Esercitazione n. 1 Corso di Statistica Università della Basilicata Prof. Roberta Siciliano La tabella seguente raccoglie i dati grezzi, relativamente ad un gruppo di 30 turisti per i quali sono state osservate

Dettagli

II ESERCITAZIONE ESERCIZIO

II ESERCITAZIONE ESERCIZIO II ESERCITAZIONE ESERCIZIO 1 Quale percentuale di osservazioni sotto la curva normale standardizzata cade nell'intervallo compreso tra i valori z=-1 e z=+1? a) 66% circa b) 70,2% circa c) 68,2% circa d)

Dettagli

STATISTICA PSICOMETRICA a.a. 2004/2005 Corsi di laurea Scienze e tecniche neuropsicologiche. Modulo 1. Modulo 1 Statistica descrittiva Monovariata

STATISTICA PSICOMETRICA a.a. 2004/2005 Corsi di laurea Scienze e tecniche neuropsicologiche. Modulo 1. Modulo 1 Statistica descrittiva Monovariata STATISTICA PSICOMETRICA a.a. 004/005 Corsi di laurea Scienze e tecniche neuropsicologiche Modulo Modulo Distribuzioni semplici di frequenza e loro rappresentazioni Operatori di tendenza centrale Operatori

Dettagli

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni

Dettagli

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Istituzioni di Statistica 1 Esercizi su indici di posizione e di variabilità Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Durata (ore) Frequenza 0 100? 100 200

Dettagli

Esame di Statistica A-Di Prof. M. Romanazzi

Esame di Statistica A-Di Prof. M. Romanazzi 1 Università di Venezia Esame di Statistica A-Di Prof. M. Romanazzi 12 Giugno 2015 Cognome e Nome..................................... N. Matricola.......... Valutazione Il punteggio massimo teorico di

Dettagli

Statistica Elementare

Statistica Elementare Statistica Elementare 1. Frequenza assoluta Per popolazione si intende l insieme degli elementi che sono oggetto di una indagine statistica, ovvero l insieme delle unità, dette unità statistiche o individui

Dettagli

Anno Regione Euro AL BE BG BM EL GA IB IG ND Totale 2017 PIEMONTE EURO

Anno Regione Euro AL BE BG BM EL GA IB IG ND Totale 2017 PIEMONTE EURO Automobile Club d'italia - Distribuzione Parco Veicoli (esclusi rimorchi) per Anno, Regione, Norma Euro e Alimentazione Categorie: AV elaborazione del 16-11-2018 2017 PIEMONTE EURO 0 47 183.851 12.184

Dettagli

Misure di dispersione (o di variabilità)

Misure di dispersione (o di variabilità) 14/1/01 Misure di dispersione (o di variabilità) Range Distanza interquartile Deviazione standard Coefficiente di variazione Misure di dispersione 7 8 9 30 31 9 18 3 45 50 x = 9 range=31-7=4 x = 9 range=50-9=41

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Gli indici statistici di sintesi: Gli indici di centralità Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 7 Ottobre 2014 Stefania Spina Esercitazioni

Dettagli

Esercizi. Esercizio 1. Date le funzioni f(x) = x 2 3x + 2 e g(x) = 2x 1,

Esercizi. Esercizio 1. Date le funzioni f(x) = x 2 3x + 2 e g(x) = 2x 1, Esercizi Esercizio 1. Date le funzioni f(x) = x 2 3x + 2 e g(x) = 2x 1, (a) dire quanto vale f g e qual è il suo insieme di definizione; (b) dire quanto vale g f e qual è il suo insieme di definizione;

Dettagli

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6) Sintesi dei dati in una tabella Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6) Sintesi dei dati Spesso si vuole effettuare una sintesi dei dati per ottenere indici

Dettagli

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri;

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri; Esercizio 1 Il corso di Statistica è frequentato da 10 studenti che presentano le seguenti caratteristiche Studente Sesso Colore Occhi Voto Soddisfazione Età Stefano M Nero 18 Per niente 21 Francesca F

Dettagli

Statistica Descrittiva Soluzioni 4. Medie lasche

Statistica Descrittiva Soluzioni 4. Medie lasche ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Indici di posizione per caratteri quantitativi discreti e continui Il seguente data set riporta la rilevazione

Dettagli

Gennaio-Febbraio 2018

Gennaio-Febbraio 2018 1 - TOT Gennaio-Febbraio 2018 EXTR 536 3729 4265 28756 60882 89638 14522 20990 35512 15147 20853 36000 1401982 2554245 3956227 Lazio 912 23.184 41.077 8.978 22.483 32.162 63.560 Umbria 910 6.099 15.401

Dettagli

Anno TOT CAPACITA' RICETTIVA FLUSSI TURISTICI 05/02/2019 TOTALE ITALIANI

Anno TOT CAPACITA' RICETTIVA FLUSSI TURISTICI 05/02/2019 TOTALE ITALIANI 1 - TOT Anno 2018 EXTR 527 4439 4966 28582 65265 93847 14436 22139 36575 15068 22474 37542 9557727 19675376 29233103 Lazio 912 219.840 411.696 140.452 331.490 360.292 743.186 Lombardia 903 145.687 275.986

Dettagli

Distribuzione di Frequenza: Esempio

Distribuzione di Frequenza: Esempio Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati

Dettagli

Significato probabilistico di σ: su 100 misure, 68.3 hanno probabilità di cadere nell intervallo x σ, x +σ, 95.5 nell intervallo

Significato probabilistico di σ: su 100 misure, 68.3 hanno probabilità di cadere nell intervallo x σ, x +σ, 95.5 nell intervallo Significato probabilistico di σ: su 1 misure, 68.3 hanno probabilità di cadere nell intervallo x σ, x +σ, 95.5 nell intervallo x σ, x + σ e 99.7 nell intervallo x 3 σ, x + 3 Se si considerano campioni

Dettagli

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria Università del Piemonte Orientale Corsi di Laurea Triennale di Area Tecnica Corso di Statistica e Biometria Statistica descrittiva: Dati numerici: statistiche di tendenza centrale e di variabilità Corsi

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Boxplot e numeri indici Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 14 Ottobre 014 Stefania Spina Esercitazioni di statistica 1/37 Definizioni La

Dettagli

ESERCIZI DI RIEPILOGO 1

ESERCIZI DI RIEPILOGO 1 ESERCIZI DI RIEPILOGO 1 ESERCIZIO 1 La tabella seguente contiene la distribuzione di frequenza della variabile X = età (misurata in anni) per un campione casuale di bambini: x i 4.6 8 3.2 3 5.4 6 2.6 2

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA. Lezione 4 DISTRIBUZIONE DI FREQUENZA 1 DISTRIBUZIONE DI PROBABILITA Una variabile i cui differenti valori seguono una distribuzione di probabilità si chiama variabile aleatoria. Es:il numero di figli maschi

Dettagli

Statistica Medica. Sez. 1 - Analisi esplorativa dei dati. Statistica Medica p.1/39

Statistica Medica. Sez. 1 - Analisi esplorativa dei dati. Statistica Medica p.1/39 Statistica Medica Sez. 1 - Analisi esplorativa dei dati Statistica Medica p.1/39 La sommatoria Il simbolo è noto come sommatoria. n i=1 x i = x 1 + x 2 +... + x n 1 + x n Proprietà fondamentali sono (

Dettagli

Statistica a.a Autovalutazione 1

Statistica a.a Autovalutazione 1 Statistica a.a. 016-17 Autovalutazione 1 CORSO: Diritto per le Imprese e le Istituzioni ATTENZIONE: alle domande aperte è stato dato un possibile esempio di risposta, altre parole possono essere usate

Dettagli

Università di Cassino. Esercitazioni di Statistica 1 del 29 Gennaio 2010. Dott. Mirko Bevilacqua

Università di Cassino. Esercitazioni di Statistica 1 del 29 Gennaio 2010. Dott. Mirko Bevilacqua Università di Cassino Esercitazioni di Statistica del 29 Gennaio 200 Dott. Mirko Bevilacqua DATASET STUDENTI N SESSO ALTEZZA PESO CORSO NUMERO COLORE COLORE (cm) (kg) LAUREA SCARPA OCCHI CAPELLI M 79 65

Dettagli