Distribuzioni statistiche

Documenti analoghi
Lezione 2. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 2. A. Iodice. Distribuzioni unitarie

Università di Cassino Corso di Statistica 1 Esercitazione del 14/01/2008 Dott. Alfonso Piscitelli

Statistica Economica Capitolo 2

Le rappresentazioni grafiche

Le rappresentazioni grafiche

Rilevazione (Raccolta) Dati: Raccolta Campionaria e Raccolta Globale

Statistica descrittiva

Questionario 1. Sono assegnati i seguenti dati

Lezione n. 1 _Complementi di matematica

Istituzioni di Statistica 1 Esercizi su strumenti grafici e funzione di frequenza relativa cumulata

Costruire il grafico di una distribuzione di frequenza

STATISTICA 1 ESERCITAZIONE 1 CLASSIFICAZIONE DELLE VARIABILI CASUALI

Distribuzioni e rappresentazioni grafiche

Statistica. Campione

Statistica. Alfonso Iodice D Enza

Lezione 1.2 Corso di Statistica. Francesco Lagona

Statistica Descrittiva Soluzioni 1. Caratteri e distribuzioni statistiche

Università di Cassino Corso di Statistica 1 Esercitazione del 15/10/2007 Dott. Alfonso Piscitelli. Esercizio 1

Concetti base - Classificazione dei caratteri. Antonello Maruotti

STATISTICA 1 ESERCITAZIONE 2

Rappresentazioni grafiche

Statistica. Lezione 1

Istituzioni di Statistica e Statistica Economica

Distribuzione di frequenza e rappresentazioni grafiche

Esempio: Media, Mediana, Moda

Obiettivi Strumenti Cosa ci faremo? Probabilità, distribuzioni campionarie. Stimatori. Indici: media, varianza,

Statistica Descrittiva Soluzioni 3. Medie potenziate

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Capitolo 6. Variabili casuali continue. 6.1 La densità di probabilità

Con riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati.

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2010/2011 STATISTICA. Docente: Paolo Mazzocchi

LA STATISTICA

Statistica Sociale e Criminale

STATISTICA. La Statistica è la scienza che studia i fenomeni collettivi utilizzando metodi matematici.

Rappresentazioni grafiche per variabili qualitative

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Statistica Un Esempio

Variabili aleatorie. Variabili aleatorie e variabili statistiche

I principali tipi di grafici

Parlami un po di te.

Cosa studia la Statistica?

DISTRIBUZIONE DI UN CARATTERE

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

Elementi di Probabilità e Statistica

Fonte:

ESERCIZI. La seguente tabella riporta la classificazione delle famiglie italiane secondo il reddito dichiarato (in milioni di lire) nel 1983:

Esercitazioni di Statistica: ES.1.1

Rappresentazione dei dati statistici

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Statistica 1 A.A. 2015/2016

L INDAGINE STATISTICA

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Sistemi di rappresentazione

Probabilità e Statistica Esercizi

Variabili casuali. - di Massimo Cristallo -

Scale di Misurazione Lezione 2

STATISTICA AZIENDALE Modulo Controllo di Qualità

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno

La rappresentazione grafica di dati statistici COS E UN GRAFICO? Esistono diversi tipi di grafici DIAGRAMMA A TORTA DIAGRAMMA A TORTA

LE RAPPRESENTAZIONI GRAFICHE DELLE DISTRIBUZIONI DI FREQUENZA

LE MEDIE DI POSIZIONE

Cosa vuol dire misurare l'area di una figura piana a contorno curvilineo?

Elementi di Statistica

Esercitazioni di Statistica

CURRICOLO VERTICALE MATEMATICA RELAZIONI/ DATI E PREVISIONI/ MISURA

Anno Scolastico 2015/16 PROGRAMMAZIONE ANNUALE CLASSE PRIMA LICEO LINGUISTICO LICEO DELLE SCIENZE UMANE LICEO ECONOMICO-SOCIALE LICEO MUSICALE

Lezione II RAPPORTI DI COMPOSIZIONE E COSTRUZIONE DI PIRAMIDI PER ETÀ. Agnese Maria Di Brisco

Prof. Anna Paola Ercolani (Università di Roma) Lez. 9 - Distribuzioni di frequenza e rappresentazione grafica

Fonte: Esempio a fini didattici

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Indici di variabilità relativa

2. I numeri reali e le funzioni di variabile reale

Statistica del turismo. Indice. 1. Premessa La compilazione di un grafico La rappresentazione di mutabili... 5

ALCUNI STRUMENTI DELLA GEOGRAFIA. La scala Le carte geografiche Gli atlanti

Transcript:

Distribuzioni statistiche L operazione di determinazione delle modalità del carattere per ciascuno degli elementi del collettivo origina una distribuzione del collettivo secondo il carattere considerato. Il nome distribuzione deriva dal fatto che mediante essa si indica come la modalità del carattere considerato si distribuiscono nelle unità del collettivo. La distribuzione secondo un carattere origina una distribuzione semplice; La distribuzione secondo due caratteri origina una distribuzione doppia; In generale, la distribuzione secondo più caratteri origina una distribuzione multipla p. 1/20

Distribuzioni unitarie popolazione Ω = {ω 1, ω 2 ω 3,, ω N } carattere X = {a 1, a 2, a 3,, a N } La successione a 1,...,a N costituisce una distribuzione unitaria di Ω secondo il carattere o variabile statistica X; a i è la modalità con cui il carattere X si presenta nella unità statistica ω i. Ovviamente nell insieme {a 1,a 2,...,a N } possono essere presenti più gruppi di elementi uguali, cioè vi possono essere più unità statistiche per cui il carattere X assume la stessa modalità. Esempio: redditi, elezioni politiche, residenza. p. 2/20

Distribuzioni di frequenze Raggruppando fra loro gli elementi uguali di una distribuzione unitaria di N elementi si origina una distribuzione di frequenze (assolute o relative). Nella popolazione Ω vi saranno: n 1 elementi in cui il carattere X assume modalità x 1, n 2 elementi in cui il carattere X assume modalità x 2,..., n k elementi in cui il carattere X assume modalità x k. Si ottiene la distribuzione di frequenze assolute di X: X = { x1 x 2 x k modalità di X n 1 n 2 n k frequenze assolute Ovviamente risulta: n 1 + n 2 + + n k = N. p. 3/20

Distribuzioni di frequenze relative Sia assegnata una popolazione Ω e consideriamo la distribuzione di frequenze assolute di X: X = { x1 x 2 x k n 1 n 2 n k Si definisce frequenza relativa della modalità x i f i = n i N o, in percentuale f i % = n i N 100% Si ottiene pertanto una distribuzione di frequenze relative: X = { x1 x 2 x k f 1 f 2 f k Per ciascuna modalità x i, questa distribuzione fornisce la frazione f i dei casi in cui è stata osservata tale modalità. Ovviamente risulta: f 1 + f 2 + + f k = 1. p. 4/20

Esempio Consideriamo la seguente distribuzione delle famiglie italiane per numero di componenti al Censimento 1991: Componenti (x i ) n i f i % 1 4.099.970 20,6 2 4.920.050 24,7 3 4.410.961 22,2 4 4.228.722 21,2 5 1.576.409 7,9 6 474.343 2,4 7 e più 198.548 1,0 Totale 19.909.003 100,0 p. 5/20

Distribuzioni per classi di valori Sia X un carattere quantitativo continuo in base al quale studiare una popolazione Ω. Poichè il carattere è continuo, il carattere può assumere un qualunque valore in un certo intervallo [a,b] R. a Allora si divide l intervallo [a, b] in più sottointervalli: b a 0 a 1 a 2 a k 1 ed associamo ad ogni unità statistica ω i il sottointervallo in cui ricade il valore assunto dal carattere X in ω i. Si origina così una distribuzione per classi: a k = b { [a0,a 1 [ [a 1,a 2 [ [a k 1,a k ] X = n 1 n 2 n k p. 6/20

Esempio La tabella seguente riporta la popolazione residente in Italia per classi di età (Censimento 1991): Classi di età f i % fino a 5 anni 4,9 5-14 11,0 15-19 7,6 20-39 30,1 40-59 25,3 60-74 14,4 75 e oltre 6,7 p. 7/20

Distribuzioni cumulate Un carattere quantitativo può essere assegnato mediante una distribuzione cumulata di frequenze che fa corrispondere a ciascuna modalità x i il numero n 1 + n i di unità statistiche per cui il carattere X assume un valore al più uguale a X: X = { x1 x 2 x 3 x k n 1 n 1 + n 2 n 1 + n 2 + n 3 N o, in termini di frequenze relative X = { x1 x 2 x 3 x k f 1 f 1 + f 2 f 1 + f 2 + f 3 1 Nel seguito porremo: N i = n 1 + n 2 + + n i = N i 1 + n i F i = f 1 + f 2 + + f i = F i 1 + f i p. 8/20

Esempio Consideriamo la seguente distribuzione delle famiglie italiane per numero di componenti al Censimento 1991: Componenti (x i ) n i N i f i F i 1 4.099.970 4.099.970 0,21 0,21 2 4.920.050 9.020.020 0,25 0,45 3 4.410.961 13.430.981 0,22 0,67 4 4.228.722 17.659.703 0,21 0,89 5 1.576.409 19.236.112 0,08 0,97 6 474.343 19.710.455 0,02 0,99 7 e più 198.548 19.909.003 0,01 1,00 Totale 19.909.003 1,00 p. 9/20

Esempio Distribuzione di 890 utenti internet nel 1996 secondo l età: Età Numero di utenti Freq. relativa Distr. cumulativa n i f i (in %) F i (in %) meno di 20 30 3.4 3.4 20-24 107 12.0 15.4 25-29 213 23.9 39.3 30-34 217 24.4 63.7 35-39 139 15.6 79.3 40-44 95 10.7 90.0 45-49 50 5.6 95.6 50-54 28 3.2 98.8 55 e più 11 1.2 100.0 Totale 890 100.0 p. 10/20

Esempio Consideriamo la seguente distribuzione di N = 290 aziende parmensi per numero di postazioni Internet: numero postazioni n i f i 0 56 19,31% 1 103 35,52% 2-5 60 20,69% 6-10 41 14,41 % > 10 28 9,66% mancata risposta 2 0,69% Totale 290 100,00% p. 11/20

Densità di frequenza 1/2 Nel caso di distribuzioni per classi di valori, una quantità importante è la densità di frequenza o frequenza specifica della classe i-esima d i data dal rapporto fra la frequenza relativa della classe e la sua ampiezza: d i := f i i. p. 12/20

Densità di frequenza 2/2 La seguente tabella riporta la distribuzione dei redditi, in milioni di lire, dichiarati ai fini IRPEF, dei lavoratori dipendenti nel 1995: Classi di età i n i N i f i F i d i 0-9 9 1.787 1.787 0,12 0,12 0,0138 9-15 6 1.310 3.097 0,09 0,22 0,0152 15-19 4 972 4.069 0,07 0,28 0,0169 19-25 6 2.753 6.822 0,19 0,48 0,0320 25-35 10 4.227 11.049 0,29 0,77 0,0295 35-50 15 2.174 13.223 0,15 0,92 0,0101 50-100 50 920 14.143 0,06 0,99 0,0013 100-150 50 138 14.281 0,01 1,00 0,0002 150-300 150 54 14.335 0,00 1,00 0,0000 300 e oltre 150 9 14.344 0,00 1,00 0,0000 Totale 14.344 1,00 p. 13/20

Funzione di ripartizione o cumulata Una variabile statistica X con distribuzione {f i } i può essere caratterizzata anche in termini della cosidetta funzione di distribuzione cumulata di frequenza o funzione di ripartizione. Sia X una v.s. discreta con distribuzione {(x 1,f 1 ),...,(x k,f k )} definita su Ω, si definisce funzione cumulativa di frequenza la funzione reale di variabile reale F : R [0, 1] definita per ogni x R come segue: F(x) := x j xf j. p. 14/20

Funzione di ripartizione - Proprietà Indicate con x 1,...,x k le modalità di una variabile statistica X, con x 1 < x 2 < < x k, la funzione di ripartizione di X presenta tre proprietà: i. F(x) = 0 per x < x 1, ii. F(x) = 1 per x > x k, iii. F(x) è non decrescente in R. p. 15/20

empio di diagramma di funzione cumulat F(x) 1 0 x 1 x 2 x 3 x 4 x 5 p. 16/20

Rappresentazioni grafiche Hanno lo scopo di fornire immediatamente a chiunque le caratteristiche essenziali del fenomeno oggetto dell indagine. Tali rappresentazioni sono basate essenzialmente su una proporzionalità fra le frequenze (assolute o relative) e delle grandezze geometriche (aree o lunghezze) che vengono utilizzate per rappresentare il fenomeno. Non esistono regole fisse generali per la scelta della rappresentazione grafica con cui sintetizzare una distribuzione. L importante è che venga assicurata l immediata percezione del fenomeno in esame. Le rappresentazioni grafiche possono essere d aiuto per scoprire relazioni fra le caratteristiche di distribuzioni. p. 17/20

Rapp. grafiche di caratteri qualitativi Diagramma a settori circolari o a torta in cui, a ciascuna modalità x i si associa un settore circolare avente area proporzionale alla sua frequenza f i. Diagramma a canne d organo in cui a ciascuna modalità x i si associa un rettangolo avente base costante ed un altezza proporzionale alla frequenza f i. Diagrammi figurativi in cui si utilizzano delle figure per rappresentare la distribuzione in esame: ciascuna figura rappresenta una modalità e la sua dimensione è proporzionale alla sua frequenza. (maneggiare con cura!) p. 18/20

app. grafiche di caratteri quantitativi 1/2 Istogramma (caratteri continui): plurirettangolo avente basi proporzionale all ampiezza delle classi e aree proporzionali alla frequenza. Nota: Poichè nell istogramma le aree dei singoli rettangoli sono proporzionali alle frequenze delle rispettive classi, l altezza h i del rettangolo della classe i-esima deve essere proporzionale al rapporto fra la frequenza della classe e la corrispondente ampiezza: h i f i x i+1 x i La quantità h i viene anche chiamata frequenza specifica della classe i-esima. p. 19/20

app. grafiche di caratteri quantitativi 2/2 Poligono di frequenza è una poligonale che unisce i punti centrali delle basi superiori dei rettangoli dell istogramma. Diagrammi a segmenti (caratteri discreti): grafico cartesiano in cui, in corrispondenza di ciascuna modalità x i, si riporta un segmento di altezza proporzionale alla corrispondente frequenza relativa (f i ) oppure frequenza assoluta (n i ) p. 20/20