Variabilità e Concentrazione Esercitazione n 02 ESERCIZIO 1 Nella tabella di seguito sono riportati i dati relativi al tempo necessario a 8 studenti per svolgere un test di valutazione (in ore): Tempo (in ore) 4,4 3,2 3,6 4,7 5,1 3,2 4,2 2,8 1) precisare il collettivo, il fenomeno e la natura del carattere oggetto di studio 2) calcolare il tempo medio impiegato dagli studenti per completare il test 3) studiare la variabilità del tempo impiegato dagli studenti con un indice opportuno 4) data la trasformazione lineare Z=2X 3, calcolare media e varianza del carattere Z ESERCIZIO 2 Le due distribuzioni seguenti sono relative ad un gruppo di 1570 studenti iscritti al primo anno fuori corso del Corso di Laurea in Economia Aziendale, divisi in matricole pari e dispari e distribuiti secondo il numero di esami sostenuti: Esami Matricole Matricole sostenuti pari dispari 0-4 38 12 5-9 116 171 10-14 168 234 15-19 203 300 20-24 215 113 Totale 740 830 1) precisare il collettivo, il fenomeno e la natura del carattere oggetto di studio 2) calcolare il n medio di esami sostenuti dagli studenti con matricola pari e con matricola dispari 3) stabilire quale delle due distribuzioni presenta maggiore variabilità ESERCIZIO 3 Negli ultimi 20 giorni alle ore 12:00 è stata rilevata la temperatura di una località montana (in C): Giorno 01 02 03 04 05 06 07 08 09 10 11 12 13 14 15 16 17 18 19 20 Temperatura (in C) 0-3 2 0-1 -1 2-2 1-2 -3 1-3 2 1-2 1 2-3 1 1) precisare il collettivo, il fenomeno e la natura del carattere oggetto di studio 2) costruire la distribuzione di frequenza 3) stabilire in quanti giorni la temperatura si è mantenuta al di sotto dello zero 4) determinare la temperatura mediana e studiare la variabilità con un indice opportuno
ESERCIZIO 4 In una indagine sui consumi telefonici è stato chiesto a tutti gli studenti iscritti al primo anno del C. di L. in Economia Aziendale che importo ricaricano sul cellulare in un mese. Nella tabella che segue sono riportati i risultati: Ricarica ( ) n i 10 44 25 112 50 176 100 41 150 27 totale 400 1) studiare la concentrazione del carattere calcolando l indice R e utilizzando la Curva di Lorenz 2) cosa accade se il prossimo mese ogni studente ricarica il proprio cellulare della metà? ESERCIZIO 5 È stata analizzata la quantità di ferro (in mg) contenuta in 84 campioni prelevati dal terreno A e in 72 campioni prelevati dal terreno B. I risultati sono riportati nella seguente tabella: TERRENO A TERRENO B quantità ferro (mg) n campioni totale ferro (mg) n campioni totale ferro (mg) 0-5 15 20 8 40 5-15 18 108 8 112 15-40 19 304 10 400 40-60 12 600 25 1025 60-70 6 390 15 975 70-100 14 1260 6 426 Totale 84 2682 72 2978 1) verificare quale tra le due distribuzioni ha la maggiore variabilità 2) verificare in quale terreno il ferro è più concentrato
ESERCIZIO 1 1) Il collettivo oggetto di studio è costituito dagli 8 studenti che hanno svolto il test di valutazione; il fenomeno che stiamo analizzando è il tempo impiegato da ciascun studente per completare il test, carattere quantitativo di tipo continuo. 2) Per calcolare il tempo medio impiegato dagli studenti utilizziamo la media aritmetica: 1 x a = (4,4 + 3,2 + 3,6 + 4,7 + 5,1 + 3,2 + 4,2 + 2,8) = 3,9 ore 8 Possiamo quindi concludere che mediamente gli studenti hanno impiegato 3 ore e 54 minuti per completare il test di valutazione (0,9 x 60 = 54). 3) Avendo calcolato il tempo medio, possiamo studiare la variabilità attraverso lo scostamento semplice medio oppure attraverso la varianza: S x a [ 4,4 3,9 + 3,2 3,9 + 3,6 3,9 + 4,7 3,9 + + 5,1 3,9 + 3,2 3,9 + 4,2 3,9 + 2,8 3,9 ] = = 0,7 ore 8 [(4,4 3,9) (3,2 3,9) (3,6 3,9) (4,7 3,9) 2 2 2 2 + + + + 2 2 2 2 (5,1 3,9) (3,2 3,9) (4,2 3,9) (2,8 3,9) ] 2 + + + + σ = = 0,5875 8 Con lo scostamento semplice medio si rileva una variabilità di 42 minuti (0,7 x 60), mentre invece considerando lo scarto quadratico medio (radice quadrata della varianza) si rileva una variabilità di circa 46 minuti (0,77 x 60). 4) Utilizzando le proprietà della media aritmetica e della varianza possiamo facilmente calcolare media e varianza del carattere Z = 2X - 3. Infatti avremo che: z = 2x 3 = 2 3,9 3 = 4,8 ore a a σ = 2 σ = 4 0,5875 = 2,35 σ = 2,35 = 1,53 ore 2 2 2 z x z Dopo la trasformazione avremo quindi un tempo medio pari a 4 ore e 48 minuti, con uno scostamento medio da tale tempo pari a circa ± 1 ora e 32 minuti.
ESERCIZIO 2 1) Il collettivo è costituito da tutti gli studenti iscritti al primo anno fuori corso del CdL in Economia Aziendale, divisi in due gruppi a seconda che la loro matricola sia pari o dispari; il fenomeno studiato è il numero di esami sostenuti alla data di rilevazione, carattere quantitativo di tipo discreto. 2) Per calcolare il numero medio di esami sostenuti dagli studenti dei due diversi collettivi è necessario innanzi tutto calcolare il valore centrale delle diverse classi di voto. Esami Matricole Matricole v.c. sostenuti pari dispari 0-4 2 38 12 5-9 7 116 171 10-14 12 168 234 15-19 17 203 300 20-24 22 215 113 Totale 740 830 Calcoliamo la media aritmetica considerando i valori centrali di ciascuna classe e il numero di studenti corrispondente, prima per il collettivo degli studenti con matricola pari e quindi per quello degli studenti con matricola dispari. Il n medio di esami sostenuti dagli studenti con matricola pari è pari a circa 15, mentre il n medio di esami sostenuto dagli studenti con matricola dispari è 14. Possiamo anche calcolare il n medio di esami sostenuto da tutti gli studenti: x x N + x N 15 740 + 14 830 pari pari dispari dispari a = = = Npari + Ndispari 1570 14,7 esami 3) Per poter stabilire quale distribuzione è più variabile (cioè se il carattere numero di esami ha una maggiore variabilità tra gli studenti con matricola pari o tra quelli con matricola dispari), è necessario prima calcolare lo scarto quadratico medio e quindi il coefficiente di variazione. σ 2 pari 2 2 2 2 2 (2 15) 38 + (7 15) 116 + (12 15) 168 + (17 15) 203 + (22 15) 215 36 σpari 6 esami = = 740 σ 2 dispari 2 2 2 2 2 (2 14) 12 + (7 14) 171 + (12 14) 234 + (17 14) 300 + (22 14) 113 25 σ dispari 5 esami = = 830 Abbiamo quindi nel caso delle matricole pari una variabilità di ± 6 esami (in termini di s.q.m), mentre nel caso delle matricole dispari una variabilità di ± 5 esami. Possiamo ora calcolare i coefficienti di variazione e confrontare le distribuzioni: σ 6 σ 5 = = = = pari dispari CVpari 0,40 40% CVdispari 0,36 36% x pari 15 x dispari 14 Dal confronto dei due coefficienti di variazione concludiamo che il numero di esami sostenuti dagli studenti con matricola pari ha una maggiore variabilità rispetto al numero di esami sostenuti dagli studenti con matricola dispari.
ESERCIZIO 3 1) Il collettivo statistico è costituito dai 20 giorni nei quali abbiamo registrato la temperatura; il fenomeno è dato quindi dalla temperatura (in C), carattere quantitativo di tipo continuo. 2) Per costruire la distribuzione di frequenza dobbiamo individuare tutti i diversi modi di manifestarsi del fenomeno, cioè le diverse modalità del carattere temperatura: Temperatura (in C) Giorni -3 XXXX 4-2 XXX 3-1 XX 2 0 XX 2 1 XXXXX 5 2 XXXX 4 20 3) Per stabilire in quanti giorni la temperatura si è mantenuta sotto lo zero è necessario derivare le frequenze cumulate assolute dalle frequenze assolute: Temperatura (in C) Giorni N i F i -3 4 4 0,20-2 3 7 0,35-1 2 9 0,45 0 2 11 0,55 1 5 16 0,80 2 4 20 1,00 Totale 20 - La temperatura si è mantenuta sotto lo zero per 9 giorni (N 3 ). 4) La temperatura mediana è pari a 0 C, poiché osserviamo dalle frequenze cumulate relative che in corrispondenza di tale valore abbiamo il 55% dei casi, quindi l unità che bipartisce la distribuzione ha come modalità corrispondente la temperatura 0. Avendo utilizzato la mediana come misura di centralità calcoliamo lo scostamento semplice mediano per valutare la variabilità del fenomeno: S Me 0 + 3 + 2 + 0 + 1 + 1 + 2 + 2 + 1 + 2 + + 3 + 1 + 3 + 2 + 1 + 2 + 1 + 2 + 3 + 1 33 = = = 1,65 C 20 20
ESERCIZIO 4 1) Per calcolare la concentrazione abbiamo bisogno di determinare la frazione delle prime i unità statistiche e la frazione di carattere posseduto dalle prime i unità statistiche. La prima quantità (p i ) corrisponde in questo caso alla frequenza cumulata relativa (F i ) poiché stiamo considerando una distribuzione di frequenza; la seconda quantità (q i ) corrisponde invece all intensità del carattere nelle prime i unità del collettivo, ovvero quanta parte del carattere è posseduta dalle prime i unità del collettivo. Considerando la tabella dei dati avremo quindi: Ricarica ( ) n i p i (F i ) A i (x i n i ) q i p i - q i 10 44 0,11 440 0,02 0,09 25 112 0,39 3240 0,16 0,23 50 176 0,83 12040 0,60 0,23 100 41 0,93 16140 0,80 0,13 150 27 1,00 20190 1,00 0,00 Totale 400 - - - - Possiamo allora calcolare il rapporto di concentrazione R: k 1 (pi q i) i= 1 0,09 + 0,23 + 0,23 + 0,13 R = = = 0,3025 30% k 1 0,11 + 0,39 + 0,83 + 0,93 p i= 1 i Abbiamo quindi un indice R pari al 30% circa, che indica un basso livello di concentrazione. Possiamo dedurre la stessa informazione disegnando la Curva di Lorenz: q i 1 0.9 0.8 0.7 0.6 0.5 R 0.4 0.3 0.2 0.1 0 0 0.1 0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9 1 p i 2) Se il prossimo mese ogni studente ricarica sul proprio cellulare la metà di quello che ha ricaricato questo mese allora la concentrazione del carattere non cambia, poiché è invariante per trasformazioni del tipo ax (in questo caso 0,5 X).
ESERCIZIO 5 1) E necessario calcolare il contenuto medio di ferro nei campioni estratti dai terreni A e B: x = 2,5 15 + 10 18 + 27,5 19 + 50 12 + 65 6 + 85 14 84 = 34,76 Mg 2,5 8 + 10 8 + 27,5 10 + 50 25 + 65 15 + 85 6 x = = 43,19 Mg 72 Mediamente i campioni di terreno A presentano un contenuto di 34,76 mg, mentre i campioni di terreno B presentano un contenuto di 43,19 mg. A questo punto è necessario calcolare per ciascun terreno la deviazione standard: σ = (2,5 15) + (10 18) + (27,5 19) + (50 12) + (65 6) + (85 14) 84 = 848,31 σ = 848,31 = 29,13 Mg 34,76 = σ = (2,5 8) + (10 8) + (27,5 10) + (50 25) + (65 15) + (85 6) 72 = 601,43 σ = 601,43 = 24,12 Mg 43,19 = Con la media e la deviazione standard possiamo calcolare i coefficienti di variazione e confrontare la variabilità delle due distribuzioni: CV = 29,13 34,76 = 0,84 84% CV = 24,52 = 0,57 57% 43,19 Quindi è possibile concludere che il terreno A ha una maggiore variabilità della quantità di ferro rispetto al terreno B. 2) Per calcolare la concentrazione, avendo a disposizione l ammontare di carattere posseduto da ciascuna classe, assumiamo l equidistribuzione del carattere in ciascuna classe: quantità ferro n. campioni frequenze totale ferro frequenze p (mg) terreno A relative i (mg) relative q i 0-5 15 0,18 0,18 20 0,01 0,01 5-15 18 0,21 0,39 108 0,04 0,05 15-40 19 0,23 0,62 304 0,11 0,16 40-60 12 0,14 0,76 600 0,22 0,38 60-70 6 0,07 0,83 390 0,15 0,53 70-100 14 0,17 1,00 1260 0,47 1,00 Totale 84 1,00 2682 1,00
quantità ferro n. campioni frequenze totale ferro frequenze p (mg) terreno B relative i (mg) relative q i 0-5 8 0,11 0,11 40 0,01 0,01 5-15 8 0,11 0,22 112 0,04 0,05 15-40 10 0,14 0,36 400 0,13 0,19 40-60 25 0,35 0,71 1025 0,34 0,53 60-70 15 0,21 0,92 975 0,33 0,86 70-100 6 0,08 1,00 426 0,14 1,00 Totale 72 1,00 2978 1,00 Per calcolare l indice R applichiamo la formula: k-1 i=0 ( )( ) R 1- q + q p - p i+1 i i+1 i Terreno A Terreno B 0,001 0,001 0,012 0,007 0,047 0,033 0,078 0,248 0,065 0,289 0,255 R 0,155 R 0,459 0,541 0,733 0,267 Confrontando l indice R nel primo e nel secondo terreno si deduce che la concentrazione di ferro del terreno A è maggiore (54,1% vs 26,7%).