Eercizio: calcolo di media e deviazione tandard campionaria Per verificare le pretazioni di un hard dik per PC, i oervano in miure ripetute i tempi di crittura T di uno teo file di grandi dimenioni. In 5 prove ripetute i ottengono i eguenti valori, in econdi (): T, T, T,3 T,4 T,5 8. 8.4 8.0 7.5 7.9 Si calcoli il valor medio di T nel campione di miure coniderato e i ricavi la corripondente deviazione tandard campionaria (T ). Quanto vale la dinamica D di variazione dei valori miurati? e i rapporti D/ T e (T )/ T ("diperione relativa")?
Eercizio: calcolo di media e deviazione tandard campionaria La media degli n=5 dati coniderati (media delle miure) i calcola come T x x n... x 5 n 5 i La varianza campionaria è invece T T, i T T 0.339 0.34 5 ( T, i T ) i 5 0.46 0.5 4 58.0 (0. 0.4 0 0.5 0.) 5 0. 0.4 0 0. 0.5 e dunque la deviazione tandard del campione (dei dati raccolti in queto campione) vale 4 8.0
Eercizio: calcolo di media e deviazione tandard campionaria Per calcolare la dinamica D, oerviamo prima i valori minimo (MIN) e maimo (MAX) dei dati raccolti: MIN(T i )=7.5 MAX(T i )=8.4 e dunque la dinamica vale D=[MAX(T i )-MIN(T i )]=[8.4 7.5 ]=0.9 I due rapporti cercati (diperioni relative, in percentuale) ono: D/ T =.5 % [facia di fluttuazione rapportata al valor medio] (T )/ =4.4 % [fluttuazione tatitica rapportata al valor medio] T 3
Eercizi per caa (. e.6) Otto miure del diametro interno (in mm) di anelli forgiati per un pitone da automobile hanno portato ai valori:., 3, 5, 0, 5,, 5, 4 Si calcolino la media e la deviazione tandard del campione. Si diegni il corripondente diagramma a punti (dot plot) e i commentino i dati. I dati eguenti riultano da miure di intenità olare (W/m ) in differenti giorni in una località della Spagna meridionale:.6 56, 869, 708, 775, 775, 704, 809, 856, 655, 806, 878, 909, 98, 558, 768, 870, 98, 940, 946, 66, 80, 898, 935, 95, 957, 693, 835, 905, 939, 955, 960, 498, 653, 730, 753 Si calcolino la media e la deviazione tandard del campione. Si diegni il corripondente diagramma a ramo-e-foglia. 4
Eercizio. D i (mm) =, 3, 5, 0, 5,, 5, 4 (diametro foro anelli) FARE: media; dev. t.; dot diagram; commenti.. n=8 dati nel campione D 8 8 i D i 35 8 mm 4.375mm 3 0 D 7 8 Di D.7 mm i 0 3 4 5 6 7 8 9 0 3 4 5 6 D 4.658 mm D c è un punto (valore D 3 =5 mm) deciamente lontano da tutti gli altri per i valori da 0 a 5 mm i oerva una forte diperione la dev. t. circa uguale alla media lacia da penare 5
Eercizio.6 Ci ono n= 35 dati I i (W/m ) nel campione coniderato 56, 869, 708, 775, 775, 704, 809, 856, 655, 806, 878, 909, 98, 558, 768, 870, 98, 940, 946, 66, 80, 898, 935, 95, 957, 693, 835, 905, 939, 955, 960, 498, 653, 730, 753.6 Media e deviazione tandard campionarie ono: 8368 35 35 I I i W/m 80.5 W/m I I i I 8.3 W /m 35 i 35 34 i I dati ordinati e il corripondente diagramma a ramo-e-foglia ono: adeo appare evidente come la ditribuzione dei dati non è immetrica 6
Eercizio u calcolo di media, deviazione tandard e box plot Si tudia il tempo di accenione a freddo di un motore di una automobile. Da un inieme (campione) di miure ul veicolo i ottengono i eguenti dati (in econdi): K 3 4 5 6 7 8 T acc.75.9.6.35 3.09 3.5.53.9 a) Calcolare la media campionaria e la deviazione tandard campionaria b) Diegnare il box plot dei dati 7
Eercizio u calcolo di media, deviazione tandard e box plot La media degli n = 8 dati coniderati i calcola come T acc n n i T acc, i 9.3 8.45 La deviazione tandard dei dati nel campione vale T T acc acc n n i ( T acc, i T acc ) 7 8 i T acc, i 8T acc 7 48.6554 85.83 0.534 8
Eercizio u calcolo di media, deviazione tandard e box plot Box plot (tutti i dati, n=8, ono in econdi) Cominciamo col riordinare i dati (in ordine crecente):.75.9.9.35.53.6 3.09 3.5 n/ = 4 dati n/ = 4 dati n/4 = dati n/4 = dati Q 5-eimo percentile Q o Me 50-eimo percentile Q 3 75-eimo percentile 9
Eercizio u calcolo di media, deviazione tandard e box plot I 50 =(n+)(50/00)=9 /=4.5 I 5 =9 /4=.5 I 75 =9 3/4=6.75 Me = Q = (.35 +.53)/ =.44 Q =.35 + (.53 -.35)(0.5) =.44 Q =.9 + (.9 -.9)(0.5) =.9 + 0.005 =.95 Q 3 =.6 + (3.09 -.6) (0.75)=.6 + 0.355 =.975 DIQ = Q 3 Q =.06 W H Q 3 +.5 DIQ =.975 +.5.06 4.56 W L Q -.5 DIQ =.95 -.5.06 0.3 0
Eercizio u calcolo di media, deviazione tandard e box plot Q =.95 Me =.44 Q 3 =.975 T T acc 0.534 acc.45.5.5 3 3.5 4 W L 0.3 =.75 DIQ =.06 W H 4.56 = 3.5
Eercizio u itogrammi, cumulativa e box plot Tema d Eame di STATISTICA E MISURAZIONE lunedì novembre 004 ) Siamo intereati a controllare il notro conumo dometico (giornaliero) di energia elettrica. Miuriamo quindi i valori del contatore per 3 giorni, ottenendo: E i [kwh]:.5 9.6.3 0.8. 8.9. 0.6 0.9 0. 9.3.4 3.9 a) Si calcolino media e varianza campionaria del conumo giornaliero di energia, decrivendo il ignificato e l utilità di quete tatitiche. b) Si cotruica un diagramma rami-e-foglie dai dati miurati e un itogramma della frequenza cumulativa. c) Si dia la definizione di mediana e di quartile (primo, econdo e terzo) e i rappreenti il box-plot dei dati.
Eercizio u itogrammi, cumulativa e box plot a) media campionaria n n i E i 0.893 kwh n varianza campionaria ( T i ).7074 (kwh) i T n i La media campionaria è uno timatore non polarizzato del valor medio della popolazione che i ta campionando. Stima la tendenza centrale della popolazione. Si può dimotrare che è uno timatore più efficiente del ingolo campione, in quanto preenta un errore quadratico medio inferiore (i veda l inizio del capitolo 4). La varianza campionaria è uno timatore non polarizzato della varianza della popolazione. È una miura o tima del grado di diperione della popolazione attorno alla media. 3
Eercizio u itogrammi, cumulativa e box plot E i [kwh]: 8.9 9.3 9.6 0. 0.6 0.8 0.9..3.4.5. 3.9 b) Diagramma a ramo e foglia con N = 3 Rami Foglie Freq. F.cum. 8 9 9 36 3 0 689 4 7 345 4 3 9 3 F. Relative: F/n Frequenza cumulativa 4 0 8 6 4 ISTOGRAMMA CUMULATIVO 0 8 9 0 3 4 Energia conumata [kwh] 4
Eercizio u itogrammi, cumulativa e box plot c) Mediana: è una miura del centro del campione che divide i dati in due parti uguali (tante miure al di opra quante al di otto). Se il numero di dati è pari, la mediana è a metà tra i due valori centrali. Se dipari, la mediana coincide con il valore centrale. Fornice un'idea della tendenza centrale dei dati. Primo quartile (quartile bao o di x): valore tale che un quarto delle oervazioni abbia un valore inferiore; corriponde al 5-eimo percentile. (tre quarti delle oervazioni hanno invece un valore uperiore) Secondo quartile: valore tale che due quarti delle oervazioni abbiano un valore inferiore; corriponde al 50-eimo percentile e dunque alla mediana. (due quarti delle oervazioni hanno un valore uperiore) Terzo quartile (quartile alto o di dx): valore tale che tre quarti delle oervazioni abbiano un valore inferiore; corriponde al 75-eimo percentile. (un quarto delle oervazioni ha invece un valore uperiore) 5
Eercizio u itogrammi, cumulativa e box plot Per diegnare il box-plot dei dati dobbiamo innanzitutto calcolare la mediana e il primo e terzo quartile. La formula generale per ricavare l indice di un generico k-eimo percentile è: I k = (n+)k /00. Dall indice i ricava quindi il valore eatto con un interpolazione lineare tra i due dati (con indici uguali all intero precedente e ucceivo a I k ). I 3 dati ordinati ono E i [kwh]: 8.9 9.3 9.6 0. 0.6 0.8 0.9..3.4.5. 3.9. La mediana è il 50-eimo percentile, per cui I mediana = (3+)50 /00 = 7, quindi la mediana coincide con il ettimo dato (ricordiamo infatti che per un numero dipari di dati corriponde al valore centrale). Quindi, mediana= 0.9 kwh =Me = Q. Il primo quartile è il 5-eimo percentile, per cui I Q = (3+)5 /00 = 3.5, quindi il primo quartile i trova tra il terzo ed il quarto dato, per cui: primo quartile = 9.6+(0.-9.6)(0.5) = 9.85 kwh = Q. Il terzo quartile è il 75-eimo percentile, per cui I 3Q = (3+)75 /00 = 0.5, quindi il terzo quartile i trova tra il decimo e l undiceimo dato: terzo quartile =.4+(.5-.4)(0.5) =.45kWh = Q 3. La dinamica interquartile vale DIQ= Q 3 -Q =.6 kwh. I baffi i poono etendere fino a.5diq =.4 kwh dai quartili, quindi fino a 9.85-.4= 7.45 kwh e.45+.4= 3.85 kwh. Minimo dato=8.9 kwh. Maimo dato=3.9 kwh. Sulla parte inferiore del box-plot tutti i dati ono contenuti nel baffo, che dunque termina a 8.9 kwh, ma nella parte uperiore non tutti i dati ono contenuti nel baffo, che dunque termina a. kwh. Ricordiamo che i baffi i fermano empre all ultimo dato contenuto nel campione coniderato. 6
Eercizio u itogrammi, cumulativa e box plot 4 Frequenza aoluta 3 0 8 9 0 3 4 8 9 0 3 4 Energia conumata [kwh] In figura ono riportati anche i ingoli punti perimentali e (opra) l itogramma della frequenza aoluta 7