ESERCITAZIONI N. 1Corso di Statistica p. 1/33 ESERCITAZIONI N. 1 Corso di Statistica Marco Picone Università Roma Tre
ESERCITAZIONI N. 1Corso di Statistica p. 2/33 Introduzione sito: http://scienzepolitiche.uniroma3.it/flagona/ programma, slides ed esercitazioni: materiali didattici: statistica (A-L) Esercitazioni: giovedì 16:15-17:45 Aula 1A orario di ricevimento: giovedì 18:00-19:00 (stanza professori visitatori - quarto piano)
ESERCITAZIONI N. 1Corso di Statistica p. 3/33 Modalità d esame L esame scritto contiene quesiti teorico-metodologici ed esercizi applicativi, relativi a tutto il programma del corso
ESERCITAZIONI N. 1Corso di Statistica p. 4/33 Introduzione Le componenti fondamentali dell analisi statistica La distribuzione di un carattere Le rappresentazioni grafiche
ESERCITAZIONI N. 1Corso di Statistica p. 5/33 Le componenti fondamentali dell analisi statistica Unità statistica Oggetto dell osservazione di ogni fenomeno individuale che costituisce il fenomeno collettivo Carattere Caratteristica di ciascuna unità statistica Popolazione o collettivo statistico Insieme di unità statistiche omogenee rispetto ad una o più caratteristiche Modalità Il modo in cui si presenta un carattere. Ciascun carattere é presente in ogni unità con una determinata modalità Tipi di caratteri 1. Qualitativo: sconnesso (scala nominale), ordinato (scala ordinale) 2. Quantitativo: discreto (scala ad intervalli), continuo (scala ad intervalli). In questo tipo di caratteri le modalità sono espresse numericamente
ESERCITAZIONI N. 1Corso di Statistica p. 6/33 Relazioni ed operazioni tra le modalità Caratteri qualitativi quantitativi sconnessi ordinati Uguaglianza e disuguaglianza si si si Ordinamento no si si Addizione e sottrazione no no si Esempio Sconnessi Ordinati Discreti Continui Sesso Grado di soddisfazione n. figli Peso Settore Attività Posizione in graduatoria n. pezzi prodotti Altezza Luogo di nascita Titolo di studio n. rispose esatte ad un test Reddito Stato civile Livello di qualità durata Religione Livello di importanza distanza Colore occhi
ESERCITAZIONI N. 1Corso di Statistica p. 7/33 Esercizio 1 Per uno studente universitario viene rilevato il punteggio ottenuto in 5 diversi test, dove il punteggio ad ogni singolo test é ottenuto dalla somma delle risposte esatte. Sapendo che ogni test contiene 30 quesiti, a) indicare, tra le risposte alternative di seguito riportate, a cosa corrispondono: i. singolo studente; ii. l insieme di tutti gli studenti universitari; 1. una unità statistica 2. una modalità 3. il collettivo di riferimento iii. singolo punteggio; iv. l insieme dei 5 punteggi conseguiti; v. singolo test; vi. l insieme dei 5 test sostenuti; vii. l insieme di tutti i test sostenibili.
ESERCITAZIONI N. 1Corso di Statistica p. 8/33 Esercizio 1 Per uno studente universitario viene rilevato il punteggio ottenuto in 5 diversi test, dove il punteggio ad ogni singolo test é ottenuto dalla somma delle risposte esatte. Sapendo che ogni test contiene 30 quesiti, a) indicare, tra le risposte alternative di seguito riportate, a cosa corrispondono: i. singolo studente; ii. l insieme di tutti gli studenti universitari; 1. una unità statistica 2. una modalità 3. il collettivo di riferimento Soluzione. 1. v; 2. iii; 3. vi. iii. singolo punteggio; iv. l insieme dei 5 punteggi conseguiti; v. singolo test; vi. l insieme dei 5 test sostenuti; vii. l insieme di tutti i test sostenibili.
ESERCITAZIONI N. 1Corso di Statistica p. 9/33 Esercizio 1 Per uno studente universitario viene rilevato il punteggio ottenuto in 5 diversi test, dove il punteggio ad ogni singolo test é ottenuto dalla somma delle risposte esatte. Sapendo che ogni test contiene 30 quesiti, b) indicare il tipo di carattere considerato (se qualitativo, ordinabile o sconnesso, oppure quantitativo, continuo o discreto) e le possibili modalità da esso assumibili. Soluzione. Tipo di carattere: quantitativo discreto; modalità assumibili: numeri interi compresi tra 0 e 30.
ESERCITAZIONI N. 1Corso di Statistica p. 10/33 Esercizio 2 La seguente tabella raccoglie i dati dei primi 5 classificati nella gara individuale di tiro con l arco. Nome Graduatoria Altezza (cm) Residenza Punteggio Mauro 1 178 Roma 170 Carla 2 159 Milano 155 Alberto 3 180 Roma 140 Fabiana 4 170 Firenze 136 Andrea 5 182 Torino 91 a) Indicare quale è l unità statistica e quante unità statistiche sono presenti. b) Indicare quali sono i caratteri e per ogni carattere indicare se é quantitativo, discreto o continuo, oppure qualitativo, sconnesso o ordinato.
ESERCITAZIONI N. 1Corso di Statistica p. 11/33 Esercizio 2 La seguente tabella raccoglie i dati dei primi 5 classificati nella gara individuale di tiro con l arco. Nome Graduatoria Altezza (cm) Residenza Punteggio Mauro 1 178 Roma 170 Carla 2 159 Milano 155 Alberto 3 180 Roma 140 Fabiana 4 170 Firenze 136 Andrea 5 182 Torino 91 a) Indicare quale è l unità statistica e quante unità statistiche sono presenti. b) Indicare quali sono i caratteri e per ogni carattere indicare se é quantitativo, discreto o continuo, oppure qualitativo, sconnesso o ordinato. Soluzione a. Unità statistica: singolo atleta; numero unità statistiche: 5. Soluzione b. I caratteri sono: Graduatoria (qualitativo ordinato), Altezza (quantitativo continuo), Residenza (qualitativo sconnesso), Punteggio (quantitativo discreto poichè assume numeri interi).
ESERCITAZIONI N. 1Corso di Statistica p. 12/33 Esercizio 3 Dati i seguenti caratteri, indicare se sono: discreti o continui. Numero di laureati in Scienze Politiche nel 2013 Il peso corporeo (Kg) osservato su un collettivo di individui Numero di voli giornalieri effettuati da una compagnia aerea Il tempo di attesa a uno sportello bancario Soluzione. Rispettivamente: discreto, continuo, discreto, continuo.
ESERCITAZIONI N. 1Corso di Statistica p. 13/33 La distribuzione di un carattere Distribuzione unitaria L informazione statistica di base prende solitamente la forma di una distribuzione unitaria che consiste in un elenco delle modalità di un carattere osservate sulle unità statistiche che compongono il collettivo oggetto di studio. Limite delle distribuzioni unitarie: poco adatto a grandi numerosità. Unità statistica Modalità di X u 1 x 1 u 2 x 2........................ u N x N Distribuzione unitaria semplice
ESERCITAZIONI N. 1Corso di Statistica p. 14/33 La distribuzione di un carattere Distribuzione unitaria L informazione statistica di base prende solitamente la forma di una distribuzione unitaria che consiste in un elenco delle modalità di un carattere osservate sulle unità statistiche che compongono il collettivo oggetto di studio. Limite delle distribuzioni unitarie: poco adatto a grandi numerosità. Unità statistica Modalità di X Modalità di Y u 1 x 1 y 1 u 2 x 2 y 2.................................... u N x N y N Distribuzione unitaria multipla
ESERCITAZIONI N. 1Corso di Statistica p. 15/33 La distribuzione di un carattere Distribuzione di frequenza Rappresentazione tabellare che riporta le modalità del carattere ed il numero (assoluto, relativo, percentuale) delle unità che condividono la stessa modalità. Distribuzione di frequenze assolute Dato un collettivo di n unità statistiche che presentano il carattere X con modalità x 1,...,x K, si ha: Modalità di X Frequenze assolute x 1 n 1 x 2 n 2............ x K Totale n K N dove n k à la frequenza assoluta della modalità x k (k = 1,...,K) del carattere X e rappresenta il numero di volte che questa si presenta nel collettivo.
ESERCITAZIONI N. 1Corso di Statistica p. 16/33 La distribuzione di un carattere Distribuzione di frequenza Rappresentazione tabellare che riporta le modalità del carattere ed il numero (assoluto, relativo, percentuale) delle unità che condividono la stessa modalità. Distribuzione di frequenze relative Modalità di X Frequenze relative x 1 f 1 x 2 f 2............ x K f K Totale 1 dove f k = n k n è la frequenza relativa della modalità k (k = 1,...,K) del carattere X.
ESERCITAZIONI N. 1Corso di Statistica p. 17/33 La distribuzione di un carattere Distribuzione di frequenza Rappresentazione tabellare che riporta le modalità del carattere ed il numero (assoluto, relativo, percentuale) delle unità che condividono la stessa modalità. Distribuzione di frequenze percentuali Modalità di X Frequenze percentuale x 1 p 1 x 2 p 2............ x K p K Totale 100 dove p k = 100 nk n è la frequenza percentuale della modalità x k (k = 1,...,K) del carattere X.
ESERCITAZIONI N. 1Corso di Statistica p. 18/33 La distribuzione di un carattere Le distribuzioni di frequenze possono riassumersi in una tabella del seguente tipo: Modalità di X n k f k p k x 1 n 1 f 1 p 1 x 2 n 2 f 2 p 2............ x K n K f K p K Totale N 1 100
ESERCITAZIONI N. 1Corso di Statistica p. 19/33 La distribuzione di un carattere Distribuzioni per classi di frequenze per caratteri quantitativi Un carattere continuo può, in teoria, assumere infinite modalità. Per questo può essere conveniente organizzare i risultati in una tabella in cui le modalità sono raggruppate in classi (in genere chiuse a sinistra e aperte a destra). L ampiezza della classe è definita dalla differenza tra l estremo superiore e l estremo inferiore della classe. Esempio. Da uno studio, rileviamo le seguenti quantità di nicotina (mg) per 13 pazienti: {0.38, 0.61, 0.63, 0.64, 0.70, 0.71, 0.97, 0.98, 1.03, 1.06, 1.08, 1.09, 1.94}
ESERCITAZIONI N. 1Corso di Statistica p. 20/33 La distribuzione di un carattere Distribuzioni per classi di frequenze per caratteri quantitativi Arbitrarietà della suddivisione in classi. Linee guida: al fine di facilitare l interpretazione della distribuzione, qualora possibile, le classi dovrebbero avere la stessa ampiezza evitare di costruire classi caratterizzate da un numero di frequenze molto basso equilibrio tra due esigenze in conflitto: sintesi e grado di risoluzione
ESERCITAZIONI N. 1Corso di Statistica p. 21/33 La distribuzione di un carattere Distribuzioni per classi di frequenze per caratteri quantitativi Esempio. Da uno studio, rileviamo le seguenti quantità di nicotina (mg) per 13 pazienti: {0.38, 0.61, 0.63, 0.64, 0.70, 0.71, 0.97, 0.98, 1.03, 1.06, 1.08, 1.09, 1.94} Classi nicotina (mg) Valore centrale n k f k p k [0.35 0.70) 0.525 4 0.31 31 [0.70 1.05) 0.875 5 0.38 38 [1.05 1.40) 1.225 3 0.23 23 [1.40 1.75) 1.575 0 0.00 0 [1.75 2.10) 1.925 1 0.08 8 Totale 13 1 100
ESERCITAZIONI N. 1Corso di Statistica p. 22/33 La distribuzione di un carattere Consideriamo il caso di una variabile almeno qualitativa ordinabile. La distribuzione ordinata delle frequenze relative della variabile: modalità ordinata frequenza relativa x (1) f (1) x (2) f (2). x (k). x (K). f (k). f (K)
ESERCITAZIONI N. 1Corso di Statistica p. 23/33 La distribuzione di un carattere x (1),x (2),...x (k)...x (K) sono le modalità osservate in seguito alla rilevazione, ordinate dalla prima all ultima, ed f (1),f (2),...f (k)...f (K) sono le corrispondenti frequenze relative. Da tale distribuzione si può costruire la distribuzione delle frequenze relative cumulate modalità ordinata frequenza relativa cumulata x (1) F 1 = f (1) x (2) F 2 = f (1) +f (2).. x (k). F k = f (1) +f (2) +...f (k). x (K) F K = f (1) +f (2) +...f (k) +...f (K) = 1
ESERCITAZIONI N. 1Corso di Statistica p. 24/33 Esercizio 4 Data la seguente tabella: Studente Punteggio Sesso Occhi Soddisfazione Altezza Peso A 26 M Nero Molto 160 59 B 30 F Verde Molto 163 63 C 18 F Marrone Poco 159 55 D 26 M Marrore Abbastanza 155 58 E 30 M Azzurro Molto 163 65 F 18 M Azzurro Niente 165 68 G 24 F Marrone Abbastanza 169 62 H 18 M Verde Poco 165 69 a) Indicare i tipi di caratteri considerati (qualitativo, ordinabile o sconnesso, oppure quantitativo, continuo o discreto). Soluzione. discreto, sconnesso, sconnesso, ordinabile, continuo, continuo. b) Costruire le distribuzioni di frequenze (assoluta, relativa, percentuale, cumulate) per ogni carattere considerato (se il carattere considerato è continuo si consideri il raggruppamento in classi).
ESERCITAZIONI N. 1Corso di Statistica p. 25/33 Esercizio 4 - Soluzione Sesso n k f k p k M 5 0.625 62.5 F 3 0.375 37.5 Tot 8 1 100 Occhi n k f k p k Verdi 2 0.25 25 Neri 1 0.125 12.5 Marroni 3 0.375 37.5 Azzurri 2 0.25 25 Tot 8 1 100 Soddisf. n k f k p k F k Niente 1 0.125 12.5 0.125 Poco 2 0.25 25 0.375 Abbast. 2 0.25 25 0.625 Molto 3 0.375 37.5 1 Tot 8 1 100
ESERCITAZIONI N. 1Corso di Statistica p. 26/33 Esercizio 4 - Soluzione Voto n k f k p k F k 18 3 0.375 37.5 0.375 24 1 0.125 12.5 0.5 26 2 0.25 25 0.75 30 2 0.25 25 1 Tot 8 1 100 Altezza n k f k p k F k [155 160) 2 0.25 25 0.25 [160 165) 3 0.375 37.5 0.625 [165 170) 3 0.375 37.5 1 Tot 8 1 100 Peso n k f k p k F k [55 60) 3 0.375 37.5 0.375 [60 65) 2 0.25 25 0.625 [65 70) 3 0.375 37.5 1 Tot 8 1 100
ESERCITAZIONI N. 1Corso di Statistica p. 27/33 Le rappresentazioni grafiche La rappresentazione grafica di uno o più fenomeni statistici non aggiunge nè toglie alcuna informazione alla tabella che ne illustra la distribuzione di frequenza. Le rappresentazioni grafiche consentono di cogliere con evidenza visiva la struttura e l andamento di uno o più fenomeni, il confronto tra più distribuzioni. Attraverso un grafico si riescono ad evidenziare aspetti fondamentali di una distribuzione di frequenza.
ESERCITAZIONI N. 1Corso di Statistica p. 28/33 Le rappresentazioni grafiche I grafici a barre (barplot) per tutti i caratteri tranne che caratteri quantitativi continui. Le barre presentano tutte uguale larghezza; in ordinata appaiono le frequenze assolute o quelle relative. Grafico a barre per titolo di studio in un collettivo di 100 soggetti. EL=licenza elementare (3 soggetti), ME=licenza media (20 soggetti), MA=maturita (47 soggetti), LA=laurea (30soggetti).
ESERCITAZIONI N. 1Corso di Statistica p. 29/33 Le rappresentazioni grafiche Gli istogrammi per caratteri quantitativi continui. Definiamo la densità di frequenza (indicata con h k ) come il rapporto tra la frequenza (assoluta o relativa) e l ampiezza (indicata con A k ) di una classe. Ad ogni classe è associato un rettangolo, tale che: la base è pari a A k e l altezza è pari a h k. L area del rettangolo è dunque pari alla frequenza (assoluta n k = A k h k o relativa f k = A k h k ) associata alla classe. L area totale è pari a n o 1 a seconda della frequenza considerata (assoluta o relativa). IMPORTANTE!!!! L istogramma è profondamente diverso dal grafico a barre
ESERCITAZIONI N. 1Corso di Statistica p. 30/33 Le rappresentazioni grafiche Gli istogrammi densita 0.00 0.02 0.04 0.06 0.08 0.33 0.04 0.35 0.15 0.13 0 5 10 15 20 25 30 durata Istogramma della distribuzione del tempo impiegato da 100 studenti per recarsi all universita ; le cifre all interno dei rettangoli indicano le aree dei rettangoli.
ESERCITAZIONI N. 1Corso di Statistica p. 31/33 Esercizio 5 Utilizzando le distribuzioni di frequenze dell esercizio 4, rappresentare Colore degli occhi, Soddisfazione, Voto, Altezza, Peso mediante un opportuna rapprentazione grafica. Soluzione. Colore occhi: grafico a barre; Soddisfazione: grafico a barre; Voto: grafico a barre; Altezza: istogramma; Peso: istogramma.
ESERCITAZIONI N. 1Corso di Statistica p. 32/33 Esercizio 6 240 piccole imprese vengono classificate in base al fatturato prodotto (in milioni di euro) ed i risultati ottenuti sono rappresentati nel seguente istogramma: densita 0.00 0.02 0.04 0.06 0.08 0 10 20 30 40 fatturato Ricostruire la distribuzione di frequenze (assolute, relative) corrispondente
ESERCITAZIONI N. 1Corso di Statistica p. 33/33 Esercizio 7 Data la seguente distribuzione percentuale degli occupati per settore di attività economica, ricostruire la distribuzione di frequenze assolute e relative (n=19498). Soluzione. Settore p k Agricoltura 18 Industriale 39 Economico 43 Settore p k f k n k Agricoltura 18 0.18 3510 Industriale 39 0.39 7604 Economico 43 0.43 8384