STATISTICA (L-Z) - Parte I Esercitazione 3 A.A. 2009/2010 Debora Slanzi debora.slanzi@unive.it 1
Esercizio 1 In un gruppo di 20 persone sono state rilevate due variabili, il sesso e l età In relazione all età: 47 61 38 40 26 41 49 65 53 55 F M M M F M F F M F 30 23 34 33 40 21 65 32 47 50 M F M F M M M F F F 1. Calcolare media, varianza, scarto quadratico medio, campo di variazione, scarto interquantile e coefficiente di variazione. 2. Si chiamino y i i valori originali e z i quelli standardizzati: si trovino media e varianza degli z i attraverso le corrispondenti quantità degli y i. Esercizio 2 Una fabbrica di televisori produce due tipi di tubi catodici: il tipo A e il tipo B. I tubi catodici hanno tempi di durata media, rispettivamente di 1495 ore e 1875 ore e scarti quadratici medi rispettivamente di 280 ore e 310 ore. In generale, è preferibile il tubo catodico che ha la durata più alta e variabilità più bassa. Quale dei due tubi catodici è preferibile? Esercizio 3 I seguenti dati sono relativi ai minuti di ritardo con cui un treno è arrivato a destinazione negli ultimi dieci giorni (un numero negativo sta ad indicare che il treno è arrivato in anticipo per i minuti corrispondenti): -3, 6, 4, 10, -4, 124, 2, -1, 4, 1 1. Se foste assunti dalle ferrovie per mostrare che le ferrovie forniscono un buon servizio quali misure di posizione usereste? 2. Se foste assunti da una televisione locale per mostrare che le ferrovie forniscono un cattivo servizio quali misure di posizione usereste? 3. Se cercaste di essere obiettivi e imparziali nel valutare le ferrovie, quali misure di posizione usereste? 4. Calcolate il campo di variazione, la varianza, lo scarto quadratico medio e il coefficiente di variazione per il ritardo (in minuti). 5. Commentate la variabilità dei dati. 2
6. Quale sarebbe l effetto sulle vostre conclusioni in (1)-(5) se al posto di 124 si fosse scorrettamente rilevato 12? 7. Descrivete la forma della distribuzione dei dati originari. 8. Descrivete la forma della distribuzione dei dati se a 124 è sostituito 12. 9. Calcolate la funzione di ripartizione empirica e dire se la funzione di ripartizione vale 0 in 0, 1 in 124, 1 in 140. Esercizio 4 Un portafoglio è composto da azioni delle seguenti 6 società: Accenture, IBM, Oracle, Microsoft, Cisco Systems e Sun Microsystems. Nel corso degli ultimi 6 mesi la composizione del portafoglio, nonchè i prezzi delle azioni, ovviamente, si sono modificati. Nella seguente tabella vengono indicate le quotazioni, alla borsa di N.Y., delle azioni delle 6 società sopra riportate in 3 diverse date. Le quotazioni riportate sono espresse in euro. Titolo Quotazioni al Quotazioni al Quotazioni al 10/04/2002 10/06/2002 09/08/2002 Accenture 27.58 21.54 16.99 IBM 122.84 114.37 111.05 Cisco Syatems 17.69 16.38 13.49 Sun MicroSystems 10.07 6.72 4.06 Oracle 17.97 16.73 16.25 Microsoft 62.44 54.01 47.30 La composizione del portafoglio nelle 3 date prese in esame è la seguente: Titolo N.ro azioni al N.ro azioni al N.ro azioni al 10/04/2002 10/06/2002 09/08/2002 Accenture 250 130 110 IBM 150 130 180 Cisco Syatems 100 130 200 Sun MicroSystems 50 50 110 Oracle 200 250 200 Microsoft 120 180 150 Calcolare l indice di Laspeyres in ciascun tempo t rispetto al tempo base. 3
Esercizio 5 Si è rilevato il numero di giorni di assenza per malattia in un anno dei dipendenti di un azienda. 4 10 6 0 1 2 5 7 7 8 10 2 2 1. Si costruisca la distribuzione di frequenze assolute, relative e cumulate. 2. Si calcoli la media, mediana, il primo e il terzo quartile? 3. Si disegni e si commenti il diagramma box-plot. Esercizio 6 Il dirigente che sta valutando le richieste di rimborso spese dei rappresentanti commerciali vuole conoscere i percentili della distribuzione dei dati. I chilometri dichiarati nei moduli del rimborso spese sono i seguenti: 1158, 1617, 1655, 1709, 1716, 1733, 1758, 1908, 1963, 2062, 2075, 2171 1. Trovate il primo e il terzo quartile. 2. Qual è lo scarto interquantile? 3. Costruite un grafico box-plot dei dati e descrivete la distribuzione dei dati. 4. Vi sono valori anomali? Esercizio 7 Un gruppo di anziani d una piccola città lamenta che la durata del semaforo pedonale è troppo breve per permettere lõattraversamento sicuro della carreggiata. Per esaminare il problema l ufficio traffico del comune raccoglie i dati sul tempo impiegato da 12 anziani per attraversare la strada. I tempi sono registrati al decimo di secondo: 21.4, 15.1, 13.6, 16.0, 15.0, 19.1, 21.0, 14.2, 15.6, 20.1, 21.1, 22.2 1. Trovate la media, la mediana e la moda dei dati. 2. Trovate il range e lo scarto quadratico medio dei dati. 3. Confrontate la media e la mediana. Ritenete che i dati siano asimmetrici? 4
4. Qual è il rank di percentile di chi ha impiegato 20.1 secondi per attraversare la strada? 5. Trovate i quartili di dati. 6. Costruite un diagramma box-plot dei dati. 7. Commentate la distribuzione 5