Esercitazioni di Statistica



Documenti analoghi
Esercitazioni di Statistica

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri;

Istituzioni di Statistica e Statistica Economica

Università di Cassino. Esercitazioni di Statistica 1 del 29 Gennaio Dott. Mirko Bevilacqua

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

MISURE DI SINTESI 54

Questionario 1. Sono assegnati i seguenti dati

ESERCIZI. La seguente tabella riporta la classificazione delle famiglie italiane secondo il reddito dichiarato (in milioni di lire) nel 1983:

ESERCIZI DI STATISTICA SOCIALE

STATISTICA 1 ESERCITAZIONE 1 CLASSIFICAZIONE DELLE VARIABILI CASUALI

Esercizio 1. Ricavi 102,3 105,6 100,7 105,2 104,8 104,6 100,7 100,2 100,9 102,7 95,4 120,7

Statistica Un Esempio

STATISTICA 1 ESERCITAZIONE 2

Esercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

Esercitazioni di Statistica: ES.1.1

Esercitazioni di Statistica per Biotecnologie. Francesca Pizzorni Ferrarese

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003

Indici di Dispersione

ESERCITAZIONI N. 1 Corso di Statistica

Lezione 4. Statistica. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Lezione 4. A. Iodice. Indici di posizione.

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Indici di variabilità relativa

Statistica. Matematica con Elementi di Statistica a.a. 2017/18

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Rappresentazioni grafiche

Nuovo Ordinamento Esame di Statistica I 24 giugno 2002 Cognome docente: J. Mortera / P. Vicard Nome

La sintesi delle distribuzioni

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Distribuzioni Statistiche e Medie Esercitazione n 01

7. STATISTICA DESCRITTIVA

PSICOMETRIA Voto X frequenza

7. Si confronti la variabilità del carattere età nel gruppo dei maschi ed in quello delle femmine.

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

Statistica Descrittiva Soluzioni 4. Medie lasche

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Statistica descrittiva

Istituzioni di Statistica 1 Esercizi su tabelle di contingenza

Statistica Sociale - modulo A

STATISTICA A-K (2014) Soluzione esercizi da svolgere prima settimana

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Le medie. Antonello Maruotti

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

Con riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati.

Istituzioni di Statistica 1 Esercizi su strumenti grafici e funzione di frequenza relativa cumulata

Lo scarto quadratico medio è s = s 2 2,15. c) Le confezioni con peso inferiore a 500g sono 18, quindi in percentuale sono 18 = 0,72 = 72%.

Fonte:

Dispensa di Statistica

Insegnamento di Statistica Parte 1: Distribuzioni Univariate Prof. P.F. Perri. Raccolta dei temi d esame assegnati nell anno accademico 2004/2005

STATISTICHE DESCRITTIVE Parte II

Le rappresentazioni grafiche

Daniela Tondini

1) Calcolare l indice di eterogeneità di Gini per i caratteri Qualifica Funzionale e Regime di Impiego.

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Fonti e strumenti statistici per la comunicazione

Medie. Monia Ranalli. Ranalli M. Medie Settimana # 2 1 / 22

Statistica - Esercitazione 1 Dott. Danilo Alunni Fegatelli

Università di Cassino Corso di Statistica 1 Esercitazione del 14/01/2008 Dott. Alfonso Piscitelli

PROVA SCRITTA DI STATISTICA. cod CLEA-CLAPI-CLEFIN-CLELI cod CLEA-CLAPI-CLEFIN-CLEMIT. 5 Novembre 2003 SOLUZIONI MOD.

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Una statistica è una quantità numerica il cui valore è determinato dai dati.

Transcript:

Esercitazioni di Statistica Rappresentazioni grafiche Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Si consideri la seguente distribuzione delle industrie tessili secondo il fatturato annuo in milioni di vecchie lire: Fatturato ]300,500] ]500,800] ]800,1500] ]1500,2000] Aziende 20 45 56 50 a) Determinare la distribuzione di frequenze relative; b) Fornire una rappresentazione grafica della distribuzione; c) Qual è la percentuale di industrie con fatturato annuo superiore a 500 milioni e non superiore a 1.5 miliardi? d) Calcolare la classe modale del fatturato; e) Calcolare il fatturato medio; f) Calcolare la varianza della distribuzione del fatturato. 1

Soluzione a) Le frequenze relative si ottengono dividendo ciascuna frequenza assoluta per la numerosità del collettivo n = k i=1 n i = 20 + 45 + 56 + 50 = 171 Classi di Frequenze Frequenze Ampiezza di Densità di Valore modalità assolute relative classe frequenza centrale ]x i, x i+1 ] n i f i = n i /n A i = x i+1 x i h i = f i /A i x i ]300, 500] 20 20/171=0.117 500-300=200 0.117/200=5.85 10 4 400 ]500, 800] 45 0.2632 800-500=300 8.77 10 4 650 ]800, 1500] 56 0.3275 1500-800=700 4.68 10 4 1150 ]1500, 2000] 50 0.2924 2000-1500=500 5.85 10 4 1750 Totale 171 1 b) L istogramma è un grafico mediante il quale rappresentare una distribuzione di frequenza. Si costruisce disegnando tanti rettangoli quante sono le classi. Le basi dei rettangoli sono costituite dalle classi, A i = x i x i 1 mentre le altezze sono pari alle densità h i = f i /A i 0e+00 2e 04 4e 04 6e 04 8e 04 500 1000 1500 2000 c) Il numero di industrie con tali caratteristiche risulta dalla somma delle frequenze assolute delle classi ]500, 800] e ]800, 1500]. La percentuale richiesta è quindi 100 = 59.06% 45+56 171 d) La classe modale è la classe con la densità di frequenza più elevata, che risulta essere la classe ]500, 800]. e) Per calcolare il fatturato medio, essendo le modalità raggruppate in classi, è necessario fare qualche ipotesi sulla distribuzione del fatturato all interno di ciascuna classe. Si può ipotizzare, ad esempio, che il fatturato medio in ogni classe sia pari al 2

valore centrale x i. Questa ipotesi conduce all approssimazione del fatturato medio come: x 1 n k n i x i = (400 20 + 650 45 + 1150 56 + 1750 50)/171 = 1106.14 i=1 f) In base allo stesso assunto, s 2 1 n k i=1 n i ( x i x) 2 = 1 171 (20 (400 1106.14)2 + 45 (650 1106.14) 2 + + 56 (1150 1106.14) 2 + 50 (1750 1106.14) 2 ) = = 1 (498634.195 + 208064.020 + 1923.669 + 414555.248) = 171 = 6568.287 Esercizio 2 240 piccole imprese vengono classificate in base al numero dei dipendenti, e i risultati sono rappresentati mediante il seguente istogramma: 0.08 0.06 densita di frequenza 0.04 0.02 0.00 0 10 15 20 40 Numero di dipendenti a) Ricostruire, a partire dal grafico, la distribuzione di frequenza del carattere X= Numero di impiegati, sapendo che le densità di frequenza h i sono pari a 0.03,0.04,0.08,0.005; b) Quante sono le imprese con più di 20 dipendenti? c) Qual è la percentuale di imprese con meno di 10 dipendenti? 3

Soluzione a) Il grafico ci fornisce indicazioni circa l ampiezza delle classi (A i ) e la densità di frequenza (h i ). Possiamo quindi calcolare la frequenza relativa f i = h i A i, e la frequenza assoluta n i = f i n. Classi di Ampiezza di Densità di Frequenze Frequenze modalità classe frequenza relative assolute x i x i+1 A i = x i+1 x i h i = f i /A i f i = h i A i n i = f i n 0-10 10 0.03 0.03*10=0.3 0.3*240=72 10-15 5 0.04 0.2 48 15-20 5 0.08 0.4 96 20-40 20 0.005 0.1 24 Totale 1 240 b) Le imprese con più di 20 dipendenti sono 24. c) La frequenza relativa (f i ) di imprese con meno di 10 dipendenti è 0.3, quindi la percentuale è p i = f i 100 = 30%. Esercizio 3 Data la seguente distribuzione di frequenze relative degli abbonati alla pay per view 1997-1998 per squadra di calcio Squadra Bari Bologna Lecce Milan Piacenza Roma Sampdoria Vicenza f i 0.027 0.076 0.023 0.512 0.013 0.259 0.053 0.037 rappresentarla graficamente e calcolare la moda. Soluzione Un grafico adatto a rappresentare caratteri di tipo qualitativo è il grafico a barre. La moda è rappresentata dalla modalità con frequenza più elevata (Milan). 0.0 0.1 0.2 0.3 0.4 0.5 Bari Bologna Lecce Milan Piacenza Roma Sampdoria Vicenza 4

Esercizio 4 Data la seguente distribuzione delle macchine vendute per casa produttrice Casa Fiat Ford Lancia Opel Renault Volkswagen n i 77000 19800 14600 18700 13040 16500 rappresentarla graficamente e calcolare la moda. Soluzione La moda è la Fiat, che ha la frequenza più elevata. Un grafico a torta consente dvisualizzare come la totalità delle vendite si ripartisce tra le varie case costruttrici. Fiat Ford Volkswagen Lancia Renault Opel Esercizio 5 In un pronto soccorso di un ospedale è stato registrato il numero delle richieste di intervento giornaliere (X) su un arco di 100 giorni, ottenendo la seguente distribuzione di frequenza: X 0 1 2 3 4 5 6 7 8 9 10 n i 2 9 18 22 16 12 9 5 4 2 1 a) Fare la rappresentazione grafica della distribuzione; b) Calcolarne la media, la mediana e lo scostamento quadratico medio. 5

Soluzione La rappresentazione grafica adatta alla distribuzione di frequenze sopra è il grafico a barre, che consente di visualizzare in modo efficace l intensità con cui il fenomeno numero di interventi giornalieri si manifesta in un arco di 100 giorni. a) 0 5 10 15 20 0 1 2 3 4 5 6 7 8 9 10 b) x = 3.84, Per calcolare la mediana à necessario calcolare le frequenze cumulate N i X 0 1 2 3 4 5 6 7 8 9 10 n i 2 9 18 22 16 12 9 5 4 2 1 N i 2 11 29 51 67 79 88 93 97 99 100 s 2 = 1 n k i=1 (x i x) 2 n i = 4.47 pos(med) = n + 1 2 med = x (50) + x (51) 2 = 101/2 = 50.5 = 3, (1) Esercizio 6 seguenti: Gli stipendi degli impiegati di un ufficio del comune di Mestre sono i Impiegato 1 2 3 4 5 6 7 8 9 10 Stipendio 160 161 162 170 172 168 175 163 179 172 stip=c(160,161,162,170,172,168,175,163,179,172) a) Calcolare media, mediana e quartili della distribuzione degli stipendi; b) Calcolare la varianza, la differenza interquartilica; c) Fornire una rappresentazione grafica della distribuzione e calcolare il recinto interno e il recinto esterno; 6

d) Verificare che la somma delle differenze tra i dati osservati e la media sia nulla; e) Come cambierebbero la media e la mediana se x 9 fosse pari a 190?; f) Il comune decide di alzare gli stipendi mensili di tutti i suoi impiegati di 10 euro. Come cambierà lo stipendio mensile medio? Come cambierà la varianza degli stipendi?; g) e se, invece, decidesse di aumentare gli stipendi del 10%? Soluzione a) x = 1 n n x i = i=1 160 + 161 + + 172 10 = 168.2 Per calcolare la mediana è necessario ordinare le osservazioni in maniera crescente. Serie ordinata x (1) = 160 x (2) = 161 x (3) = 162 x (4) = 163 x (5) = 168 x (6) = 170 x (7) = 172 x (8) = 172 x (9) = 175 x (10) = 179, per poi calcolare la posizione della mediana e il suo valore pos(med) = n + 1 2 = 11 2 = 5.5 med = x (5) + x (6) 2 = 168 + 170 2 = 169 Equivalentemente n/2=5 due posizioni mediane, 5 e 6. Per il primo e terzo quartile risulta n/4=2.5 e 3n/4 = 7.5, posizioni che vanno arrotondate all intero successivo per cui le posizioni relative al primo e terzo quartile risultano la 3 e la 8 e i relativi valori risultano: Q 1 = x (3) = 162 Q 3 = x (8) = 172 7

b) s 2 = x (2) x 2 x (2) = n i=1 x2 i n = (160 2 + 161 2 + + 172 2 )/10 = (25600 + 25921 + + 29584)/10 = 283292/10 = 28329.2 s 2 = 1 n (x i x) 2 = x (2) x 2 = 28329.2 28291.24 = 37.96 n i=1 Differenza interquartile = Q 3 Q 1 = 172 162 = 10 c) Il box-plot è un grafico che fornisce contemporaneamente informazioni circa la posizione e la variabilità di un insieme di dati. 160 165 170 175 Calcoliamo gli estremi inferiore (r 1 ) e superiore (r 2 ) del recinto interno: r 1 = Q 1 1.5 DQ = 162 1.5 10 = 147 r 2 = Q 3 + 1.5 DQ = 172 + 1.5 10 = 187 e gli estremi inferiore (R 1 ) e superiore (R 2 ) del recinto esterno: R 1 = Q 1 3 DQ = 162 3 10 = 132 R 2 = Q 3 +3 DQ = 172+3 10 = 202 8

d) Differenze x i x 160 168.2 = 8.2 161 168.2 = 7.2 162 168.2 = 6.2 170 168.2 = +1.8 172 168.2 = +3.8 168 168.2 = 0.2 175 168.2 = +6.8 163 168.2 = 5.2 179 168.2 = +10.8 172 168.2 = +3.8 Somma = 0 e) Mentre la media risente del valore elevato di x 9, la mediana resta immutata x = 169.3 med = 169 f) Proprietà 1 della media. La media di una trasformazione lineare dei dati è data dalla trasformazione lineare della media. Se Y = ax + b allora ȳ = a x + b In questo caso, a = 1 e b = 10. Dato che x = 168.2, allora ȳ = 1 168.2 + 10 = 178.2 La varianza di una trasformazione lineare Y = ax + b è data da s 2 Y questo caso, s 2 y = 1 2 s 2 x = 37.96 = a2 s 2 X. In cioè la varianza degli stipendi non aumenta (la varianza è indipendente dalla posizione). g) Sempre in base alle stesse proprietà, avendo a = 1.1 e b = 0, ȳ = 1.1 168.2 + 0 = 185.02 e s 2 y = 1.1 2 s 2 x = 45.93 9

Esercizio 7 I seguenti dati si riferiscono ai tempi di reazione motori a uno stimolo luminoso, espressi in decimi di secondo, di un gruppo di piloti: 5, 6 6, 8 7, 8 8, 8 5, 6 7, 0 8, 0 10, 2 5, 6 7, 0 8, 0 10, 2 5, 8 7, 2 8, 2 10, 2 5, 8 7, 2 8, 2 10, 2 6, 6 7, 4 8, 4 10, 2 Alla distribuzione unitaria presentata si riferiscono i quesiti che seguono. a) Il carattere è quantitativo discreto qualitativo ordinabile quantitativo continuo quantitativo continuo b) La distribuzione è unimodale bimodale la moda non è definita unimodale c) Dividere i piloti in 4 gruppi di uguale numerosità, con tempi di reazione brevi, - medio-brevi, medio-lunghi, lunghi, ed indicare quali piloti fanno parte di ognuno dei gruppi brevi medio-brevi medio-lunghi lunghi 5, 6 6, 8 7, 8 8, 8 5, 6 7, 0 8, 0 10, 2 5, 6 7, 0 8, 0 10, 2 5, 8 7, 2 8, 2 10, 2 5, 8 7, 2 8, 2 10, 2 6, 6 7, 4 8, 4 10, 2 d) Determinare in ciascun gruppo i quartili I quartili sono quei valori tali che le osservazioni sono per un quarto, due quarti e tre quarti, rispettivamente, più piccole. In ciascun gruppo le osservazioni sono 6. La posizioni mediane sono due, la terza e la quarta, mentre le posizioni relative al primo e terzo quartile sono la seconda e la quinta. Infatti n/4, n/2, 3n/4 risultano rispettivamente 1.5, 3, 4.5 e le posizioni relative a Q1, Q2 e Q3 2, 3 e 4, 5 (la prima e la terza arrotondate all intero successivo). In un gruppo la terza e la quarta unità hanno la stessa modalità. I quartili per ciascuno dei gruppi risultano i seguenti: brevi medio-brevi medio-lunghi lunghi Q 1 5, 6 7, 0 8, 0 10, 2 Q 2 (med) 5, 7 7, 1 8, 1 10, 2 Q 3 5, 8 7, 2 8, 2 10, 2 e) Rappresentare il boxplot per ciascun gruppo e commentare i grafici in termini di variabilità delle distribuzioni relative a ciascun gruppo, utilizzando anche il range e la Differenza Interquartile 10

frequenza assoluta 5.6 6.0 6.4 frequenza assoluta 6.8 7.0 7.2 7.4 tempi di reazione brevi tempi di reazione medio brevi frequenza assoluta 7.8 8.0 8.2 8.4 frequenza assoluta 8.8 9.2 9.6 10.0 tempi di reazione medio lunghi tempi di reazione lunghi brevi medio-brevi medio-lunghi lunghi range 1 0, 6 0, 6 1, 4 Dif f erenza Interquartile 0, 2 0, 2 0, 2 0 I gruppi con tempi di reazione medio-brevi e medio-lunghi hanno stesso range e stessa Differenza Interquartile, il gruppo con tempi di reazione brevi ha range più grande e stessa Differenza Interquartile il gruppo con tempi di reazione lunghi range più grande e Differenza Interquartile più piccolo, pari a zero. Il gruppo con tempi di reazione lunghi ha la maggiore variabilità considerando il range, la minore considerando la Differenza Interquartile, che non risente delle osservazioni che si trovano alle estremità della distribuzione. Infatti nel gruppo lunghi la metà delle osservazioni, quelle comprese tra il primo e il terzo quartile, risulta di pari valore. f) Rappresentare il grafico a barre per ciascun gruppo e commentare i grafici in termini di asimmetria, utilizzando anche il confronto tra media aritmetica e mediana brevi medio-brevi medio-lunghi lunghi media aritmetica 5, 84 7, 1 8, 1 9, 97 Q 2 (med) 5, 7 7, 1 8, 1 10, 2 tempi di reazione brevi: coda a destra, media maggiore di mediana tempi di reazione medio-brevi: simmetrica, media = mediana tempi di reazione medio-lunghi: simmetrica, media = mediana tempi di reazione lunghi: coda a sinistra, media minore di mediana g) Se il valore 8,4 relativo ai tempi di reazione medio-lunghi fosse 8,5 la distribuzione sarebbe simmetrica: 11

frequenza assoluta 0.0 1.0 2.0 3.0 frequenza assoluta 0.0 0.5 1.0 1.5 2.0 5.6 5.8 6.6 tempi di reazione brevi 6.8 7 7.2 7.4 tempi di reazione medio brevi frequenza assoluta 0.0 0.5 1.0 1.5 2.0 frequenza assoluta 0 1 2 3 4 5 7.8 8 8.2 8.4 tempi di reazione medio lunghi 8.8 10.2 tempi di reazione lunghi No. Infatti i valori 7.8 e 8.4, equidistanti dalla mediana pari a 8.1, non avrebbero la stessa frequenza (7.8 frequenza 1, 8.4 frequenza 0). 12