Esame di Statistica TEMA B Corso di Laurea in Economia Prof.ssa S. Giordano 15 luglio 2015 Cognome Nome Matr. TEORIA: dimostrare la proprietà che la somma degli scarti al quadrato dalla media aritmetica è un minimo. Esercizio 1 Ad alcuni viaggiatori è stato chiesto di indicare l attesa (in minuti) al ritiro bagagli e l aeroporto di arrivo. I dati sono riportati nella seguente tabella Aeroporto Tempo d attesa Napoli Roma Fiumicino Milano Malpensa 20 -- 30 25 5 34 30 -- 45 40 33 129 45 -- 120 5 217 17 1. Individuare l unità statistica e la natura dei caratteri oggetto di studio 2. Rappresentare l ogiva di frequenze 3. Quanti sono i viaggiatori intervistati che hanno atteso più di 38 minuti? 4. Tra i viaggiatori che atterrano a Roma Fiumicino, qual è la percentuale di quelli che superano i 30 minuti di attesa? 5. Determinare il 15esimo quantile dell attesa dei viaggiatori che atterrano a Napoli 6. Confrontare la variabilità dell attesa a Roma e Milano 7. Utilizzando solo un opportuna proprietà, determinare l attesa media complessiva dei viaggiatori che atterrano negli aeroporti di Roma e Milano 8. Stabilire se i due caratteri sono statisticamente dipendenti e, in caso positivo, valutarne il grado 9. Stabilire se esiste dipendenza in media. Esercizio 2 Nella tabella che segue sono riportati i dati riferiti al numero di denunce di smarrimento bagagli (W) ed al numero di addetti al trasporto bagagli (Z) in alcuni aeroporti nel mese di giugno di quest anno Aeroporti Napoli Bari Lamezia Roma Catania W 340 180 9 552 77 Z 14 81 10 50 12 1. Stabilire se tra i due caratteri esiste dipendenza lineare e, in caso positivo, valutarne il grado 2. Determinare i parametri della retta di regressione con W come variabile dipendente e commentarne il significato 3. Valutare la bontà di adattamento della retta ai dati 4. Quanti smarrimenti ci si attende, in base alla retta, in un aeroporto in cui 5 sono gli addetti al trasporto bagagli? Esercizio 3 Nella tabella seguente sono riportate le serie storiche del numero di aerei in ritardo in 4 aeroporti Determinare: Milano Torino Firenze Bologna 2011 359 286 429 112 2012 415 334 315 134 2013 243 365 339 144 2014 528 124 394 189 a. Le variazioni percentuali annue (commentare un risultato a scelta) e la variazione media (commentare) del numero di aerei in ritardo nell aeroporto di Torino b. Valutare il grado di concentrazione degli aerei in ritardo nell anno 2011.
Esercizio 1 Tempo attesa ci Napoli Roma Milano n_i f_i F_i amp H_i h_i 20 30 25 25 5 34 64 0,127 0,127 10 6,400 0,0127 30 45 37,5 40 33 129 202 0,400 0,527 15 13,467 0,0267 45 120 82,5 5 217 17 239 0,473 1,000 75 3,187 0,0063 70 255 180 505 1 1) Individuare l unità statistica e la natura dei caratteri oggetto di studio Unita' statistica: il singolo viaggiatore Carattere Tempo: Quantitativo Continuo Carattere Aeroporto: Qualitativo Sconnesso 2) Rappresentare l ogiva di frequenze: in ordinata si riportano le Fi frequenze cumulate relative 3) Quanti sono i viaggiatori intervistati che hanno atteso più di 38 minuti? (45 38) * 13.467 + 239 = 333,269 4) Tra i viaggiatori che atterrano a Roma Fiumicino, qual è la percentuale di quelli che superano i 30 minuti di attesa? (217+33)/255 = 0,980392 5) Determinare il 15esimo quantile dell attesa dei viaggiatori che atterrano a Napoli Tempo attesa Napoli f_i F_i 20 30 25 0,357143 0,357143 30 45 40 0,571429 0,928571 45 120 5 0,071429 1 70 15esimo = E_i + (0.15 F_i) * (E_s E_i)/(F_s F_i) 15esimo = 20 + (0.15 0) * (30 20)/(0.357143 0) =24,2
6) Confrontare la variabilità dell attesa a Roma e Milano ci Milano fi fi*ci (ci M)^2 *ni ci Roma fi fi*ci (ci M)^2 *ni 25 34 0,188889 4,722222 7039,3642 25 5 0,019608 0,490196 12776,02 37,5 129 0,716667 26,875 460,259259 37,5 33 0,129412 4,852941 47775,02 82,5 17 0,094444 7,791667 31595,6543 82,5 217 0,85098 70,20588 10484,6 180 39,38889 39095,2778 255 75,54902 71035,64 Var_mil = 39095,278/180 = 217,196 Var_roma = 71035,64/255 = 278,5711 SQM_mil = (217,196)^0,5 = 14,73757 SQM_roma = (278,5711)^0,5 = 16,69045 CV_mil = 14,738/39,39 = 0,374156 CV_roma = 16,69/75,55 = 0,220922 7) Utilizzando solo un opportuna proprietà, determinare l attesa media complessiva dei viaggiatori che atterrano negli aeroporti di Roma e Milano Applicando la proprietà associativa della media M =(39,39*180+75,55*255)/(180+255)= 60,58 8) Stabilire se i due caratteri sono statisticamente dipendenti e, in caso positivo, valutarne il grado ci Napoli Roma Milano 25 25 5 34 64 37,5 40 33 129 202 82,5 5 217 17 239 70 255 180 505 n'_ij 8,871287 32,31683 22,81188 28 102 72 33,12871 120,6832 85,18812 n^2_ij/n'_ij 70,45201 0,773591 50,67535 57,14286 10,67647 231,125 0,754632 390,187 3,392492 somma 815,1794 Chi = 310,1794 Max Chi = 2 * N = 1010 C^2 = 0,307108
9) Esiste dipendenza in media perché le medie condizionate differiscono tra loro e dalla marginale medie M(attesa aeroporto M(attesa aeroporto M(attesa aeroporto M(attesa) Napoli) Roma) Milano) 57,21 36,25 75,55 39,39 Esercizio 2 Z W WZ Z^2 W^2 Napoli 14 340 4760,000 196,000 115600,000 Bari 81 180 14580,000 6561,000 32400,000 Lamezia 10 9 90,000 100,000 81,000 Roma 50 552 27600,000 2500,000 304704,000 Catania 12 77 924,000 144,000 5929,000 totale 167 1158 47954 9501 458714 M(Z) M(W) Cov(Z;W) V(Z) V(W) 33,4 231,6 1855,360 784,640 38104,240 1) Stabilire se tra i due caratteri esiste dipendenza lineare e, in caso positivo, valutarne il grado M(Z) 33,4 M(W) 231,6 Var (Z) 784,640 Var (W) 38104,240 SQM(Z) 28,011 SQM(W) 195,203 Cov (Z,W) 1855,360 r(z,w) 0,339 r(z,w)=cov(z,w)/[sqm(z)*sqm(w)] 2) b = cov(z,w)/v(z)= 2,364 a = M W bm Z = 152,622 W = 152,622349 + 2,3646 Z 3) R^2 = r^2 = 0,115 4) Quanti smarrimenti ci si attende, in base alla retta, in un aeroporto in cui 5 sono gli addetti al trasporto bagagli? addetti 5 W=152,622349+2,3646*5 =164,445
Esercizio 3 a) Le variazioni percentuali annue (commentare un risultato a scelta) e la variazione media (commentare) del numero di aerei in ritardo nell aeroporto di Torino Torino 2011 2012 2013 2014 1,1678 1,0928 0,3397 Var. annue 16,78% 9,28% 66,03% Mg=(1,168*1,09*0,34)^(1/3)=0,75 Var. media = (1-0.75)*100 =25% b) Valutare il grado di concentrazione degli aerei in ritardo nell anno 2011 P_i p_i Q_i q_i (p_i q_i) 112 1 0,25 112 0,0944351 0,16 286 2 0,50 398 0,3355818 0,16 359 3 0,75 757 0,6382799 0,11 429 4 1,00 1186 1 0,00 1186 1,50 0,43 R =0,43/1,5 =0,28