Statistica Corso Base (Serale) Dott.ssa Cristina Mollica cristina.mollica@uniroma1.it Caratteri e distribuzioni di frequenza Esercizio 1: Stabilire la tipologia dei seguenti caratteri (Qualitativo Nominale, Qualitativo Ordinale, Quantitativo Discreto, Quantitativo continuo): (a) Segno zodiacale (b) Reddito familiare (c) Salario in Euro (d) Classe di reddito (I, II, ecc.) (e) Ore di studio al giorno (f) Tempo dedicato allo studio al giorno (g) Livello di inquadramento lavorativo (h) Attività lavorativa (i) Grado di soddisfazione di un cliente (j) Colore degli occhi (k) Mese di nascita (l) Genere (m) Altezza (n) Stadio della malattia (o) Voto all esame di statistica (p) Marca di caffè preferita (q) Consumo giornaliero di calorie (r) Regione di provenienza (s) Debito pubblico (di un paese) (t) Numero di componenti della famiglia (u) Tasso d interesse annuale (v) Numero di abbonati Sky (w) Sistema operativo (di un computer) (x) Numero di dipendenti di un azienda (y) Peso (z) Velocità in Km/h Qualitativo nominale: Marca di caffè preferita, Regione di provenienza, Attività lavorativa, Colore degli occhi, Genere, Sistema operativo (di un computer). Qualitativo Ordinale Rettilineo: Classe di reddito (I, II, ecc.), Livello di inquadramento lavorativo, Grado di soddisfazione di un cliente, Stadio della malattia. Qualitativo Ordinale Ciclico: Segno zodiacale, Mese di nascita. Quantitativo Discreto: Voto all esame di statistica, Ore di studio al giorno, Numero di componenti della famiglia, Numero di abbonati Sky, Numero di dipendenti di un azienda. Quantitativo Semi-continuo: Reddito familiare, Salario in Euro, Debito pubblico (di un paese). Quantitativo Continuo: Consumo giornaliero di calorie, Tempo dedicato allo studio al giorno, Altezza, Peso, Tasso d interesse annuale, Velocità in Km/h. 1
2 Esercizio 2: Data la seguente distribuzione unitaria del carattere numero di figli 2 1 2 1 3 2 0 2 0 1 2 2 (1) indicare la natura della variabile; (2) determinare il numero di unità e di modalità osservate; (3) costruire la distribuzione di frequenze assolute, relative e percentuali. (1) Il carattere è quantitativo discreto; (2) Le unità sono n = 12, le modalità osservate sono K = 4; X n j f j p j 0 2 2/12=0.17 0.17 100 = 17 (3) 1 3 0.25 25 2 6 0.50 50 3 1 0.08 8 12 1 100
3 Esercizio 3: Sia data la seguente distribuzione doppia (congiunta) unitaria dei caratteri X 1 = Funzionalità del prodotto (difettoso, non difettoso) e X 2 = Stadio del processo produttivo (I, II, III) X 1 X 2 Difettoso I Difettoso II Non Difettoso I Difettoso III Non Difettoso III Non Difettoso II Difettoso II Non Difettoso III Difettoso I Non Difettoso I Non Difettoso II Non Difettoso I Difettoso III Difettoso III (1) indicare la natura dei caratteri; (2) indicare il numero di modalità dei due caratteri e di unità osservate; (3) costruire la distribuzione di frequenze assolute cumulate e la distribuzione di frequenze relative cumulate per il carattere opportuno. (1) I caratteri sono qualitativi, in particolare X 1 è nominale dicotomico mentre X 2 è ordinale rettilineo; (2) X 1 ha due modalità (Difettoso, Non difettoso) e X 2 ha tre modalità (I, II, III) e sono rilevate su n = 14 unità; (3) Ha senso calcolare le frequenze assolute e relative cumulate per il carattere ordinale X 2, date rispettivamente da X 2 N j F j I 5 5/14=0.36 II 9 9/14=0.64 III 14 1
4 Esercizio 4: Mario si è distratto durante l esercitazione di Statistica e non ha preso bene gli appunti. Si consideri la seguente distribuzione di frequenze associata ad un collettivo di ampiezza n = 20 su cui si è osservato il numero di prove superate ad un concorso # Prove superate Frequenze 0 0 1 0.10 2 0.05 3 0.30 4 0.15 5 1 Aiuta Mario a: (1) determinare di che tipo sono le frequenze riportate nella tabella e a colmare la cella mancante; (2) costruire la distribuzione di frequenze assolute; (3) determinare di che natura è il carattere considerato; (4) determinare quanti soggetti hanno vinto il concorso, posto che il numero minimo di prove da superare è 3; (5) costruire la distribuzione di frequenze percentuali per il carattere Vincitore del concorso determinato in base alla soglia fornita al punto precedente; (6) indicare di che tipo è la variabile Vincitore del concorso. (1) le frequenze riportate sono relative, come suggerito dalla loro somma pari ad 1. Per differenza, si ricava che la cella mancante è pari a 0.40. (2) # Prove superate Freq. relative n j 0 0 0 20 = 0 1 0.10 2 2 0.05 1 3 0.30 6 4 0.15 3 5 0.40 8 1 20 (3) il carattere è quantitativo discreto; (4) il concorso è stato vinto da 6 + 3 + 8 = 17 soggetti; (5) la soglia dà luogo alla dicotomizzazione del carattere quantitativo di partenza nelle due classi [0, 3) e [3, 5] che, per il risultante carattere Vincitore del concorso, corrispondo rispettivamente alle modalità NO = 0 = insuccesso vs SI = 1 = successo Vincitore del concorso p j NO 100 3/20=15 SI 85 100 (6) è qualitativo nominale dicotomico.
5 Esercizio 5: Nella seguente tabella si è registrato il numero di iscritti per l anno accademico 2016-2017 nei seguenti atenei: Ateneo # Iscrizioni 1 10589 2 5089 3 762 4 20897 5 1835 6 36 7 1085 8 935 9 2846 10 1597 11 40297 12 33527 13 8722 14 905 15 12578 16 37027 (1) la distribuzione fornita nella tabella è unitaria o di frequenze?; (2) indicare l unità statistica e il numero di unità osservate; (3) qual è il carattere d interesse? qual è la sua natura?; (4) si considerino le classi [0,10000], (10000,20000] e >20000 per il numero di iscrizioni, in base al quale un ateneo è classificato rispettivamente come Piccolo, Medio e Grande. Costruire la distribuzione di frequenze assolute, relative e percentuali per il carattere Dimensione dell ateneo definito dalle suddette classi; (5) di che tipo è il nuovo carattere Dimensione dell ateneo? (6) considerando il valore 50000 come estremo superiore della classe aperta >20000, associare a ciascuna classe la sua densità di frequenze assolute e fornirne l interpretazione; (7) ha senso cumulare le frequenze per il carattere Dimensione dell ateneo? in caso affermativo, calcolare le frequenze relative cumulate. (1) la distribuzione è unitaria; (2) l unità statistica è l ateneo e l ampiezza del collettivo è n = 16; (3) il carattere d interesse è il numero di iscritti nell a.a. 2016-2017; la variabile è quantitativa discreta; (4) Dimensione ateneo n j f j p j [0, 10000] = Piccolo 10 10/16=0.625 62.5 (10000, 20000] = Medio 2 0.125 12.5 > 20000 = Grande 4 0.250 25 16 1 100 (5) il carattere Dimensione ateneo ottenuto dalla suddivisione in classi del numero di iscritti è qualitativo ordinato rettilineo;
6 (6) la densità di frequenze assolute (relative) si ottiene rapportando la frequenza assoluta (relativa) all ampiezza della classe. La generica densità di frequenze assolute indica il numero di unità statistiche in un intervallo di ampiezza unitaria della classe corrispondente; in altre, rappresenta il risultato dell equidistribuzione della frequenza nella data classe. In questo caso, le densità di frequenze assolute risultano: Dimensione ateneo d j [0, 10000] = Piccolo 10/10000=0.001 (10000, 20000] = Medio 0.0002 (20000, 50000] = Grande 0.0001 (7) data la natura ordinata del carattere, ha senso cumulare le frequenze Dimensione ateneo F j [0, 10000] = Piccolo 0.625 (10000, 20000] = Medio 0.750 (20000, 50000] = Grande 1