Corso di Statistica Esercitazione.3 Indici di variabilità ed eterogeneità Concentrazione Asimmetria Prof.ssa T. Laureti a.a. 202-203
Esercizio Si considerino i seguenti dati relativi al numero di addetti nelle imprese presenti in un determinato comune 7 5 8 4 9 5 8 0 6 3 9 2 4 9 Determinare: la media aritmetica la mediana il range la varianza 2 2
a) Calcolo della media aritmetica Per un insieme di n=5 valori osservati del carattere quantitativo addetti la formula della media aritmetica è la seguente: n xa = (x + x 2 +... + x n ) = x i n n Quindi: 7 5 8 4 9 5 8 0 6 3 9 2 4 9 i= x a = 5 ( 7 + 5 + 8 +... + 9) = 0 3 3
b) Calcolo della mediana Per individuare la posizione mediana è necessario ordinare le osservazioni in senso non decrescente: 3 4 5 6 7 8 9 9 0 2 4 5 8 9 Posizione mediana La posizione i centrale per n dispari i (n=5) è data da ( n + ) 2 6 = = 8 Quindi Me=9 2 4 4
Addetti x j 7 5 8 4 d) Calcolo del range L indice di variabilità range espresso dalla differenza tra il valore massimo e il valore minimo della distribuzione, ossia range = x max x min 9 5 8 0 Min=3 Max=9 6 3 Quindi: 9 2 range = 9 3 = 6 4 9 Nella distribuzione considerata si ha: 5 5
Addetti x i Scarti dalla media (x i -µ) Quadrato degli scarti (x i -µ) 2 7-3 9 5-5 25 8-2 4 n 4-6 36 9-5 5 25 8 8 64 0 0 0 6-4 6 d) Calcolo della varianza 2 ( xi x) = Dev(X) = 332 i= 2 σ n ( ) 2 332 = xi x = = 22,3 n 5 3-7 49 n 9 9 8 2 2 4 4 4 6 9 - i= n σ = n i= = 22,3 ( x x) i = 4,70 2 = 6 6
Esercizio 2. La seguente distribuzione riporta il numero di chilometri percorsi in una settimana da 3 rappresentanti di commercio di una nota marca di occhiali da sole. Classi di chilometri [400 450) 6 [ 450-500) 9 [ 500-550) 7 [ 550-600) 6 [ 600-650) ) 3 totale 3 7 7
A) Calcolare le frequenze relative, le frequenze percentuali e le frequenze relative cumulate B) Determinare il numero medio di chilometri percorsi. C) Calcolare la mediana e il primo quartile. D) Misurare la variabilità della distribuzione utilizzando la deviazione standard 8 8
A) Calcolo delle frequenze relative, frequenze percentuali e relative cumulate 6 9 f = = 0,94 f2 = = 3 3 n j 0,290 Classi di fj pj chilometri [400 450) 6 0,94 9,4 0,94 [ 450-500) 9 0,290 29,0 0,484 [ 500-550) 7 0,226 22,6 0,70 [ 550-600) 6 0,94 9,4 0,903 [ 600-650) ) 3 0,097 9,7,000 totale 3,000 00,0 Fj 9 9
B) Calcolo della media aritmetica Classi di Valore c j *n j chilometri centrale nj classi (cj) x j x j+ [400 450) 6 425 2.550 [ 450-500) ) 9 475 4.275 [ 500-550) 7 525 3.675 [ 550-600) 6 575 3.450 [ 600-650) 3 625.875 totale 3 5.825 x a K c jn j= n j = 5.825 3 = 50,48 0 0
C) Calcolo della mediana. Individuazione della classe mediana Classi di chilometri nj Nj [400 450) 6 6 0,94 [ 450-500) 9 5 0,484 [ 500-550) 7 22 0,70 [ 550-600) 6 28 0,903 [ 600-650) 3 3,000 totalet 3 Fj n + 3 + rango mediana = = = 6 2 2 + La mediana è contenuta nella classe 500-550
C) Calcolo della mediana 2. Individuazione della mediana nella classe sotto l ipotesi di distribuzione uniforme (applicazione della formula) Classi di chilometri Me I m 0,5 F + F F nj m m m Nj m Fj I m =estr inf della classe mediana=500 F m- =freq rel cum fino alla classe precedente a quella mediana =0,484 [400 450) 6 6 0,94 [ 450-500) 9 5 0,484 [ 500-550) 7 22 0,70 F [ 550-600) 6 28 0,903 [ 600-650) 3 3,000 totale 3 0,5 F m 0,5 0,484 Me I m + m = 500 + 50 = Fm Fm 0,70 0,484 F m =freq rel cum fino alla classe mediana=0,70 m =ampiezza della classe mediana= =550-500=50 503,57 2 2
C) Calcolo del primo quartile Q è il primo valore xi in corrispondenza del quale la frequenza cumulata relativa 0, 25 Classi di chilometri nj Nj Fj F j Q [400 450) 6 6 0,94 [ 450-500) 9 5 0,484 [ 500-550) 7 22 0,70 [ 550-600) 6 28 0,903 [ 600-650) 3 3,000 totale 3 0, 25 F Q 0, 25 0,94 I + Q 450 50 459, 72 Q FQ F = + Q 0, 484 0,94 = 3 3
D) Calcolo della deviazione standard Classi di n j Valore (c j -µ) 2 (c j -µ) 2 *n j chilometri centrale classi (cj) [400 450) 6 425 7306,8 43840,8 [ 450-500) 9 475 258,8 329,2 [ 500-550) 7 525 20,8 475,6 [ 550-600) 6 575 462,8 24976,8 [ 600-650) 3 625 34,8 39344,4 totale 3 20966,8 σ = x = 50,48 20966,8 a 2 K 2 σ = ( c x) n 3902,5 j j = = 3902,5 = 62,47 n j= 3 4 4
Esercizio 3 Si consideri la seguente distribuzione di 00 imprese per classi di fatturato: N. Classi di fatturato imprese (migliaia di euro) (0-20] 30 (20-50] 50 (50-00] 20 Totale 00 a) Rappresentare graficamente la distribuzione b) Determinare la moda 5 5
a) Costruzione dell istogramma. Le classi hanno diversa ampiezza. E necessario calcolare la densità di frequenza Classi di fatturato (migliaia di euro) nj Ampiezza classe (a j ) Densità di freq (h j ) 0-20 30 20,5 20-50 50 30,67 50-00 20 50 0,4 Totale 00 b) La classe modale è quella che ha la densità di frequenza maggiore. Quindi la classe modale è 20-50 6 6
ISTOGRAMMA h i,7,5 0,4 0 20 50 00 7 7
Esercizio 4 Si consideri la distribuzione degli alunni della scuola secondaria di primo grado per giudizio riportato all esame di Stato nell Anno scolastico 2006/07 in Italia (dati Istat) Giudizio Licenziati Sufficiente 37, Buono 26,4 Distinto 9,2 Ottimo 7,3 00,00 Determinare la moda e la mediana. Misurare l eterogeneità della distribuzione 8 8
Si tratta di una distribuzione percentuale Giudizio i Licenziatii Sufficiente 37, 0,37 0,37 Buono 26,4 0,264 0,635 Distinto 9,2 0,92 0,827 Ottimo 7,3 0,73 fj 00,0,000 La moda, ossia la modalità più frequente è sufficiente Per il calcolo l della mediana sulla colonna delle frequenze relative cumulate si individua la prima F j che è uguale o maggiore di 0,5 La mediana è Buono Fj 9 9
b) Eterogeneità della distribuzione Giudizio i Licenziatii fj f 2 j Sufficiente 37, 0,37 0,376 Buono 26,4 0,264 0,06970697 Distinto 9,2 0,92 0,0369 Ottimo 7,3 0,73 0,02990299 00,0,000 0,274 K 2 E = f j = 0,274 = e j= 0,7259 0,75 = = 0,968 0,7259 K 3 0 E = = 0,75 K 4 20 20
Esercizio Le retribuzioni, in migliaia a di euro, di 5 dipendenti dpe de di un grande ga magazzino risultano le seguenti: 0 20 28 8 4 a) Disegnare la curva di Lorenz; b) Misurare la concentrazione. 2 2
Per la distribuzione precedente è necessario ordinare innanzitutto le intensità del carattere. Quindi si procede al calcolo di Fi e Qi Retribuzioni (valori ordinati) Intens. ass. cum. A i Freq. rel. cum. F F i Intens. rel. cum. Q i F i -Q i 8 8 0,20 0,00 0,00 0 8 040 0,40 0,225 0,75 4 32 0,60 0,400 0,200 20 52 0,80 0,650 0,50 28 80,00,000 F i = i 3 n = 5 Q A 32 i = i = A 80 n 22 22
a) Curva di Lorenz Q i,000 0,650 superficie di concentrazione 0,400 0,225 0,00 0,2 0,4 0,6 0,8,0 F i b) n- i= R = ( Fi Qi) 0,625 = =0,325 n 2 Fi Si è in presenza di una modesta concentrazione i= 23 23
Esercizio 2 Si consideri la seguente distribuzione delle industrie del legno per classi di fatturato in migliaia e fatturato totale per classe (milioni): Classi di fatturato n J Fatturato totale 0-5 750.930 5-0 420 3.260 0-25 390 6.350 25-50 50 80 5.450 Oltre 50 50 76.400.890 Determinare il rapporto di concentrazione. 24 24
Per il calcolo dell indice di concentrazione deve essere utilizzato il fatturato totale che è noto (intensità) Classi di fatturato n J N j Fatturato totale (intensità Aj) F i = N j /n 0-5 750 750.930 0,397 0,02 Q j = A j /A K 5-0 420 70 5.90 0,69 0,056 0-25 390 560.540 0,825 0,24 25-50 80 740 6.990 0,92 0,82 Oltre 50 50 890 93.390390,000,000.890 25 25
Quindi: Classi di fatturato F i = N j /n Q j = F j+ -F j Q j+ +Q j (F j+ -F j )(Q j+ +Q j ) A j /A K 0-5 0,397 0,02 0,397 0,02 0,008 5-0 0,69 0,056 0,222 0,076 0,07 0-25 082 0,825 0,24 0,206 0,79 003 0,037 25-50 0,92 0,82 0,095 0,305 0,029 Oltre 50,000,000 0,079,82 0,094 0,85 R = 0,85 = 0,85 Elevata concentrazione del fatturato tra le imprese 26 26
Esercizio 3 Si consideri la seguente distribuzione delle famiglie per classi di reddito mensile in migliaia di euro Classi di reddito Famiglie n j 0-2 2 2-6 4 6-8 3 8-0 0 A) Disegnare la curva di Lorenz B) Misurare la concentrazione del reddito 27 27
Classi c j n J N j F i = N j /n c j *n j Aj Q j = A j /A K 0-2 2 2 0,2 2 2 2/48=0,042 2-6 4 4 6 0,6 6 8 8/48=0,375 6-8 7 3 9 0,9 2 39 39/48=0,83 8-0 9 0,0 9 48 48/48=,000 0 48,000 Q i i superficie di 0,83 concentrazione 0,375 0,042 P i 0,2 0,6 0,9,0 28 28
(Fj+- Fj) (Qj++Qj) (F - Classi F i = Q j = N j/n A j/a K j+ F j )(Q j+ +Q j ) 0-2 0,2 0,042 0,2 0,042 0,0084 2-6 0,6 0,375 0,4 0,47 0,668 6-8 09 0,9 0,83 03 0,3,8888 0,3564 8-0,0,000 0,,83 0,83 R R k ( F j + F j )( Q j+ + Q j ) = 0, 729 = + j= 0 = 0,287 = Modesta concentrazione 29 29
Esercizio 4 Si consideri la seguente distribuzione di 20 imprese secondo il numero di addetti: Addetti N. imprese 0 3 5 5 3 0 2 20 Misurare l asimmetria della distribuzione 30 30
Si può procedere ad una rappresentazione grafica per valutare il grado di simmetria della distribuzione Imprese secondo il numero di addetti 2 0 8 6 4 2 0 3 5 0 3 3
Addetti N imprese N ( x 3 X) ( 3 j ) j Addetti N. imprese N J x X n 0 0-8 -80 3 5 5 0 0 5 3 8 8 24 0 2 20 343 686 j 20 630 X = 3 σ = 274 2,74 M = M = o M e β = M 3 630 20 = = 3 20,57 σ, 53 La distribuzione è asimmetrica positiva 32 32
Indagine Bankitalia sul reddito delle famiglie italiane nel 2006 (tiene conto della composizione i demografica della famiglia) entrambe le distribuzioni sono asimmetriche positive 33 33