STATISTICA DESCRITTIVA



Documenti analoghi
Università degli Studi di Bergamo - Corsi di laurea in Ingegneria Edile e Tessile Indici di posizione e variabilità Esercitazione 2

Strumenti di indagine per la valutazione psicologica

Introduzione alla Statistica descrittiva. Definizioni preliminari. Definizioni preliminari. Fasi di un indagine statistica. Tabelle statistiche

Campionamento stratificato. Esempio

Anno 5 Successioni numeriche

CONCETTI BASE DI STATISTICA

LE MISURE DI VARIABILITÀ DI CARATTERI QUANTITATIVI

Statistica 1 A.A. 2015/2016

SUCCESSIONI NUMERICHE

DISTRIBUZIONI DOPPIE

SUCCESSIONI E SERIE NUMERICHE

EQUAZIONI ALLE RICORRENZE

Successioni. Grafico di una successione

Sistemi e Tecnologie della Comunicazione

52. Se in una città ci fosse un medico ogni 500 abitanti, quale sarebbe la percentuale di medici? A) 5 % B) 2 % C) 0,2 % D) 0,5% E) 0,02%

IL CALCOLO COMBINATORIO

STATISTICA INFERENZIALE SCHEDA N. 2 INTERVALLI DI CONFIDENZA PER IL VALORE ATTESO E LA FREQUENZA

Elementi di matematica finanziaria

LA VERIFICA DELLE IPOTESI SUI PARAMETRI

Appunti sulla MATEMATICA FINANZIARIA

Numerazione binaria Pagina 2 di 9 easy matematica di Adolfo Scimone

ESERCIZI DI STATISTICA DESCRITTIVA ALCUNI TRATTI DA PROVE D ESAME DA REALIZZARE ANCHE CON L AUSILIO DI UN FOGLIO DI CALCOLO. Angela Donatiello 1

Calcolo della risposta di un sistema lineare viscoso a più gradi di libertà con il metodo dell Analisi Modale

Disposizioni semplici. Disposizioni semplici esercizi

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Limiti di successioni

Una funzione è una relazione che ad ogni elemento del dominio associa uno e un solo elemento del codominio

V Tutorato 6 Novembre 2014

Statistica (Prof. Capitanio) Alcuni esercizi tratti da prove scritte d esame

Sintassi dello studio di funzione

Il test parametrico si costruisce in tre passi:

Soluzione La media aritmetica dei due numeri positivi a e b è data da M

Terzo appello del. primo modulo. di ANALISI

8. Quale pesa di più?

SERIE NUMERICHE Con l introduzione delle serie vogliamo estendere l operazione algebrica di somma ad un numero infinito di addendi.

LA GESTIONE DELLA QUALITA : IL TOTAL QUALITY MANAGEMENT

Prova scritta di Statistica per Biotecnologie. 29 Aprile Programma Cristallo 1

1 Limiti di successioni

La matematica finanziaria

DEFINIZIONE PROCESSO LOGICO E OPERATIVO MEDIANTE IL QUALE, SULLA BASE

Rendita perpetua con rate crescenti in progressione aritmetica

Tecnica delle misurazioni applicate Esame del 4 dicembre 2007

Capitolo 27. Elementi di calcolo finanziario EEE

Corso di Laurea Magistrale in Ingegneria Informatica A.A. 2014/15. Complementi di Probabilità e Statistica. Prova scritta del del

DIPENDENZA O CONNESSIONE. Ovvero quando la conoscenza della modalità di X presente su un unità è informativa della presenza della modalità di Y.

Risposte. f v = φ dove φ(x,y) = e x2. f(x) = e x2 /2. +const. Soluzione. (i) Scriviamo v = (u,w). Se f(x) è la funzione richiesta, si deve avere

Interesse e formule relative.

Distribuzione di un carattere

Teorema 13. Se una sere converge assolutamente, allora converge:

Statistica di base. Luca Mari, versione

Analisi statistica dell Output

Daniela Tondini

INTRODUZIONE ALLA STATISTICA

PARTE QUARTA Teoria algebrica dei numeri

APPUNTI DI MATEMATICA ALGEBRA \ ARITMETICA \ NUMERI NATURALI (1)

Principi base di Ingegneria della Sicurezza

5 ln n + ln. 4 ln n + ln. 6 ln n + ln

Metodi statistici per l analisi dei dati

Esercizi riguardanti limiti di successioni

LE MISURE DI SINTESI (misure di tendenza centrale)

Calcolo Combinatorio (vers. 1/10/2014)

SUCCESSIONI e LIMITI DI SUCCESSIONI. c Paola Gervasio - Analisi Matematica 1 - A.A. 15/16 Successioni cap3b.pdf 1

IMPLICAZIONE TRA VARIABILI BINARIE: L Implicazione di Gras

Metodi statistici per l'analisi dei dati

Percorsi di matematica per il ripasso e il recupero

Corso di Laurea in Ing. Edile Politecnico di Bari A.A Prof. ssa Letizia Brunetti DISPENSE DEL CORSO DI GEOMETRIA

Esempio: distribuzione di frequenze. =, Pagina 90. Esempio: distribuzione di frequenze

Un problema! La letteratura riporta che i pazienti affetti da cancro. = mesi

STATISTICA 1 parte 2/2 STATISTICA INFERENZIALE

,5 882,5 894,5 906,5 918,5 930,5 942,5 954,5

Il concetto di valore medio in generale

Il confronto tra DUE campioni indipendenti

Fonti e strumenti statistici per la comunicazione

Successioni ricorsive di numeri

Foglio di esercizi N. 1 - Soluzioni

LE MISURE DI TENDENZA CENTRALE

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Corso di laurea in Matematica Corso di Analisi Matematica 1-2 Dott.ssa Sandra Lucente 1 Funzioni potenza ed esponenziale.

Statistica. Lezione 5

I numeri complessi. Pagine tratte da Elementi della teoria delle funzioni olomorfe di una variabile complessa

Le onde elettromagnetiche. Origine e natura, spettro delle onde e.m., la polarizzazione

Serie numeriche: esercizi svolti

Introduzione all assicurazione. (Dispensa per il corso di Microeconomia per manager. Prima versione, marzo 2013; versione aggiornata, marzo 2014)

STIME E LORO AFFIDABILITA

Selezione avversa e razionamento del credito

CAPITOLO SETTIMO GLI INDICI DI FORMA 1. INTRODUZIONE

Le carte di controllo

ESAME DI STATO DI LICEO SCIENTIFICO CORSO DI ORDINAMENTO 2006

ANALISI MATEMATICA 1 Area dell Ingegneria dell Informazione. Appello del TEMA 1. f(x) = arcsin 1 2 log 2 x.

Formula per la determinazione della Successione generalizzata di Fibonacci.

STATISTICA 1 ESERCITAZIONE 4

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

STATISTICA 1 ESERCITAZIONE 3

LA DERIVATA DI UNA FUNZIONE

Random walk classico. Simulazione di un random walk

STATISTICA ECONOMICA STATISTICA PER L ECONOMIA

5. Le serie numeriche

Introduzione all assicurazione. (Dispensa per il corso di Microeconomia)

Metodi statistici per le ricerche di mercato

CAPITOLO UNDICESIMO VARIABILI CASUALI 1. INTRODUZIONE

Transcript:

STATISTICA DESCRITTIVA La statistica descrittiva serve per elaborare e sitetizzare dati. Tipicamete i dati si rappresetao i tabelle. Esempio. Suppoiamo di codurre u idagie per cooscere gli iscritti al primo ao di u corso di laurea dell Uiversità di Torio e di essere iteressati alla regioe di origie. Ua volta raccolti i dati, si costruisce la seguete tabella: Regioi Frequeze assolute Piemote 11 Campaia 9 Sicilia 7 Calabria 6 Veeto 5 Abruzzo 3 Sardega 3 Lombardia Liguria 1 Lazio 1 Essa è formata da due coloe, la prima rappreseta i valori assuti dalla variabile (i omi delle regioi), la secoda i corrispodeti umeri di volte che ogi regioe si è presetata ell idagie. Ogi umero della secoda coloa è detto peso o frequeza. A volte è utile riportare ella tabella ache le frequeze relative e/o le frequeze percetuali. La frequeza relativa è il rapporto tra la frequeza assoluta e il totale delle frequeze della distribuzioe. La frequeza percetuale è la frequeza relativa moltiplicata per 100. Nel caso del ostro esempio, si ottiee la seguete tabella: Regioi Frequeze assolute Freq. relative Freq. % Piemote 11 0.3 3 Campaia 9 0.19 19 Sicilia 7 0.15 15 Calabria 6 0.13 13 Veeto 5 0.10 10 Abruzzo 3 0.06 6 Sardega 3 0.06 6 Lombardia 0.04 4 Liguria 1 0.0 Lazio 1 0.0 1

Si oti che le frequeze relative soo state approssimate. Nel ostro caso il totale delle frequeze della distribuzioe è 48. La frequeza relativa della regioe Campaia è 9/48 = 0.1875, approssimata a 0.19. I dati si rappresetao poi co istogrammi o diagrammi a torta. Le variabili statistiche soo di due tipi: qualitative, come ad esempio la regioe di proveieza, il colore degli occhi, il corso di laurea a cui si è iscritti, il cadidato per cui si è votato; quatitative, cioè misurabili ed esprimibili umericamete, come ad esempio l altezza di ua persoa, il reddito di ua famiglia, etc. A loro volta le variabili quatitative possoo essere discrete o cotiue. Ua variabile si dice discreta se può assumere solo u umero fiito di valori, o u ifiità umerabile di valori ( ad esempio il umero di staze delle abitazioi, il umero di errori per pagia i u libro, le votazioi riportate ad u esame, il umero di volte il cui esce testa se si lacia più volte ua moeta). Ua variabile si dice cotiua se può assumere uo qualsiasi dei valori i u certo itervallo di umeri reali (ad esempio la durata di pile elettriche, l altezza di persoe, il peso di oggetti o la loro lughezza). Nel caso di variabili quatitative, il campo di variazioe di ua distribizioe di dati è la differeza tra il dato maggiore e quello miore. A volte per le variabili quatitative si preferisce utilizzare il raggruppameto i classi, come ell esempio seguete. La tabella mostra i dati relativi alle altezze i cetimetri di u campioe di 50 studeti di ua scuola superiore. Questo è u esempio di distribuzioe i classi. Le misurazioi soo state arrotodate, cosicchè il umero 165.3, arrotodato a 165, è coteggiato ella terza classe. Classi di altezza Frequeze assolute Valori cetrali 151 155 4 153 156 160 9 158 161 165 15 163 166 170 7 168 171 175 8 173 176 180 3 178 181 185 3 183 186 190 1 188 Ua scrittura del tipo 161 165 riferita ad ua classe è detta itervallo della classe. I umeri 161 e 165 soo chiamati limiti della classe e, i paricolare, 161 è detto limite iferiore e 165 è detto limite superiore della classe.

Le regole dell approssimazioe ci suggeriscoo che ella classe 161 165 si trovao ache valori come 160.8 e 165.4, pertato i limiti reali della classe soo 160.5 e 165.5. I geerale i limiti reali o cofii della classe si defiiscoo come segue. Il cofie iferiore di ua classe è la semisomma del limite iferiore della classe stessa e del limite superiore della classe precedete. Nell esempio precedete, il cofie iferiore della classe 161 165 è dato da 160+161 = 160.5. Aalogamete il cofie superiore di ua classe è la semisomma del limite superiore della classe stessa e del limite iferiore della classe successiva. Nel ostro esempio il cofie superiore della classe 161 165 è dato da 165+166 = 165.5. Il primo cofie iferiore della distribuzioe dista dal limite iferiore della prima classe della stessa quatità di cui il cofie superiore dista dal limite superiore della classe. Il cofie iferiore della classe 151 155 è perciò 150.5. Aalogamete per l ultimo cofie superiore. L ampiezza di ua classe è defiita come la differeza tra il cofie superiore e il cofie iferiore della classe stessa. Nel ostro caso l ampiezza della classe 161 165 è data da 165.5 160.5 = 5. L itervallo di variazioe è dato dalla differeza tra l ultimo cofie superiore e il primo cofie iferiore. La semisomma dei limiti o dei cofii forisce il valore cetrale della classe. Ad esso vegoo riferite tutte le osservazioi sulla classe. Così il valore cetrale della classe 161 165 è 161+165 = 163. Ogiqualvolta u isieme di dati viee suddiviso i classi, oltre ai ecessari arrotodameti dei umeri viee fatta u ulteriore approssimazioe, quella di sostituire di fatto il valore cetrale della classe ad ogi valore apparteete a quella classe. Nel ostro caso, ad esempio, il valore 163 viee a sostituire ciascua altezza compresa tra 160.5 e 165.5, di cui si perde l iformazioe. Ciò che si guadaga i siteticità lo si perde i precisioe, e occorre trovare il compromessso che risulti più utile per la descrizioe del feomeo i esame. Suppoiamo ora di essere iteressati al umero di studeti alti sio a 160.5 cm. Per otteere tale umero sommiamo tutte le frequeze che precedoo il cofie di 160.5, otteedo: 4 + 9 = 13. I geerale la frequeza di tutti i valori iferiori al cofie superiore di ua certa classe è detta frequeza cumulata dal basso e si ottiee dalla somma della frequeza di quella classe co tutte le frequeze che la precedoo. La sequete tabella riporta le frequeze cumulate relative alla distribuzioe i esame: 3

Classi di altezza Freq. assolute Freq. cumulate 151 155 4 4 156 160 9 13 161 165 15 8 166 170 7 35 171 175 8 43 176 180 3 46 181 185 3 49 186 190 1 50 Alcue classi, e più frequetemete quelle estreme, possoo avere ampiezza diversa dalle altre. Per esempio, el ostro caso potremmo riuire le ultime tre classi della tabella precedete i u uica classe avete itervallo 176 190. Si ottiee così la seguete tabella, che mostra gli stessi dati della tebella precedete, distribuiti però i classi i modo diverso. I particolare, l ultima classe o ha la stessa ampiezza delle altre classi. Classi di altezza Frequeze assolute 151 155 4 156 160 9 161 165 15 166 170 7 171 175 8 176 190 7 I caso di classi di ampiezza diversa, quado si utilizzao gli istogrammi per rappresetare la distribuzioe statistica, è importate otare che le frequeze assolute soo proporzioali all area e o all altezza dei corrispodeti rettagoli. Il segueti istogrammi rappresetao rispettivamete le distribuzioi statistiche della tabella di pag. e dell ultima tabella. 3.5 3.5 3 3.5.5 1.5 1.5 1 1 0.5 0.5 0 150 160 170 180 190 0 150 160 170 180 190 Gli itervalli di ua classe possoo ache essere aperti a siistra o a desta, 4

rispettivamete el caso i cui o si è specificato il limite iferiore o il limite superiore (i tal caso o ha seso parlare di valore cetrale della classe). La seguete tabella mostra come si distribuiscoo le famiglie degli alui di ua scuola rispetto al umero di libri posseduti. N. di libri Frequeze assolute fio a 15 7 16 30 55 31 50 301 51 100 10 101 e oltre 77 Le classi di questo esempio o soo di uguale ampiezza. Questo perchè la suddivisioe effettuata, oltre a raggruppare dati dispersi, sottitede alcue cosiderazioi. Si è pesato che alla classe sio a 15 appartegao tutte la famiglie che hao i casa solo i libri scolastici del figlio, alla classe 15 30 le famiglie co qualche libro i più, evetualmete acora scolastico, e che comuque o soo dedite alla lettura, e così via. Valori medi statistici Siao x 1, x,..., x valori assuti da ua variabile statistica. Si defiisce loro media aritmetica, e si idica co x, il valore x = x 1 + x + + x = 1 x i. Dalla defiizioe segue che, se ad ogi x i si sostituisce il valore x, la somma degli termii o cambia, ifatti: x + x + x = x = 1 x i = x 1 + x + + x. Esempio. Ua famiglia ha pagato, i u ao, i segueti importi i euro, relativi al cosumo bimestrale di eergia elettrica: 45.10-37.50-34.0-56.80-48.30-39.70 La cifra bimestrale pagata i media da questa famiglia è: 45.10 + 37.50 + 34.0 + 56.80 + 48.30 + 39.70 6 = 61.60 6 = 43.60 Se quella famiglia avesse pagato ogi bimestre euro, alla fie ell ao avrebbe pagato la stessa somma, ifatti 43.60 6 = 61.60. Vediamo il caso i cui i dati siao raggruppati i ua distribuzioe di frequeze. U commerciate ha veduto 5 diversi modelli di u prodotto, riportado i segueti guadagi uitari: 5

Modello Guadago etto per u pezzo Numero di pezzi veduti A 0.35 60 B 0.53 100 C 0.60 85 D 0.75 35 E 0.80 10 Il guadago medio è: x = 60 0.35 + 100 0.53 +... + 10 0.80 90 = 0.54569 0.55 Siao x 1, x,..., x i valori assuti da ua variabile statistica, co frequeze assolute f 1, f..., f rispettivamete. La loro media aritmetica è: x = f 1x 1 + f x +... f x = f ix i f 1 + f... + f f. i Questa media si dice media aritmetica poderata co pesi f i. Nel caso di dati distribuiti i classi la media aritmetica è ua media poderata i cui gli x i soo i valori cetrali delle classi e i pesi soo le corrispodeti frequeze delle classi. Si dice itervallo di variazioe I V di u isieme di dati la differeza I V = x max x mi, dove x max e x mi deotao rispettivamete il più grade e il più piccolo tra i valori della serie di misure i esame. Nell esempio delle bollette si ha x max = 56.80 e x mi = 34.0, quidi I V = 56.80 34.0 =.60. Si dice scarto la differeza x i x tra u valore e la media aritmetica x. La somma algebrica degli scarti di ua distribuzioe è uguale a zero. Questo fatto è ua cosegueza della defiizioe stessa di media aritmetica, ifatti si ha che x i = x, quidi x i x = 0. Si dice variaza di u isieme di dati statistici, i simboli V ar, la media aritmetica dei quadrati degli scarti: V ar = (x 1 x) +... + (x x) = (x i x). 6

Nell esempio delle bollette si ha: V ar = (45.10 43.6) + (37.50 43.6) +... + (39.70 43.6) 6 = 56.56 Nel il caso i cui i dati siao raggruppati i ua distribuzioe di frequeze si ha: V ar = f i(x i x) f. i Nell esempio del commerciate si ha: V ar = 60(0.35 0.55) + 100(0.5 0.55) +... + 10(0.80 0.55) 90 Si dice scarto quadratico medio o deviazioe stadard, i simboli σ, la radice quadrata della variaza: σ = V ar = (x i x). Nell esempio delle bollette si ha: σ = 58.76 7.5. La variaza dà ua misura di quato i dati statistici si discostao dalla media. Maggiore è la variaza, più i dati soo dispersi. Moda e mediaa Si dice moda di ua distribuzioe di frequeze di ua variabile statistica il dato che corrispode alla massima frequeza. Può succedere che ua ditribuzioe abbia più mode; i tal caso si dice plurimodale. Ad esempio, la seguete distribuzioe dei colori delle automobili parcheggiate i ua strada: ha mode: Blu e Grigio. Colori Frequeze Blu 7 Rosso 5 Nero 4 Biaco 4 Grigio 7 Verde 1 Nel caso i cui i dati siao raggruppati e le classi abbiao la stessa ampiezza la moda è data dalla seguete formula: moda = l 1 + 7 1 1 + a

dove: l 1 = cofie iferiore della classe avete la massima frequeza, detta classe modale; 1 = differeza tra la frequeza della classe modale e quella della classe precedete; = differeza tra la frequeza della classe modale e quella della classe seguete; a = ampiezza della classe modale. Nel caso della seguete distribuzioe i classi, relativa alle altezze i cetimetri di u campioe di 50 studeti di ua scuola superiore, si ha che: Classi di altezza Frequeze assolute 151 155 4 156 160 9 161 165 15 166 170 7 171 175 8 176 180 3 181 185 3 186 190 1 la classe modale è la classe 161 165, l 1 = 160.5, 1 = 15 9 = 6, = 15 7 = 8, a = 5. Quidi la moda è: moda = 160.5 + 6 6 + 8 5 = 16.64. La mediaa di dati x i, ordiati i ordie cresete, è il dato che occupa la posizioe cetrale se è dispari, oppure la media aritmetica dei due dati cetrali se è pari. Ad esempio, si chiede a 7 persoe di u ufficio quate telefoate hao effettuato i u certo gioro, e si ottegoo i segueti dati: 8 5 5 8 7 6 8. Per trovare la mediaa bisoga disporli i ordie crescete: 5 5 6 7 8 8 8. Duque il dato cetrale che dà la mediaa è 7. Se le persoe soo 6, e il umero di telefoate: 6 7 7 9 11 1, la mediaa è la media aritmetica dei due dati cetrali, cioè 7+9 = 8. Nel caso di dati raggruppati bisoga idividuare iazitutto la posizioe cetrale (o le posizioi cetrali) e poi stabilire quale dato occupi quella posizioe. Si cosideri ad esempio la seguete distribuzioe: 8

umero di telefoate Frequeze assolute 3 11 4 17 5 38 6 3 7 43 8 50 Nel ostro caso il umero totale dei dati è 11 + 17 + 38 + 3 + 43 + 50 = 191, che è dispari, quidi la posizioe cetrale è la 96-esima. Si calcolao poi, ua alla volta, le frequeze cumulate, sichè o si raggiuge u umero maggiore o uguale alla posizioe cetrale. Si ha duque: 11 + 17 = 8 < 96, 8 + 38 = 66 < 96, 66 + 3 = 98 > 96, quidi ella 96-esima posizioe c è il valore 6, che dà la mediaa. Nel caso di ua distribuzioe i classi si utilizza la seguete formula: mediaa = l 1 + (P F c ) a f, dove: l 1 = cofie iferiore della classe coteete la mediaa, detta classe mediaa; P F c = posizioe della mediaa rispetto alla classe cui appartiee, otteuta sottraedo dalla posizioe cetrale P la frequeza cumulate F c della classe precedete quella mediaa; a = ampiezza della classe mediaa; f = frequeza assoluta della classe mediaa. Calcoliamo ora la mediaa el caso della secoda tabella di pag. 1, che riscriviamo co ache il calcolo delle frequeze cumulate: Classi di altezza Freq. assolute Freq. cumulate 151 155 4 4 156 160 9 13 161 165 15 8 166 170 7 35 171 175 8 43 176 180 3 46 181 185 3 49 186 190 1 50 Si ha che il umero totale dei dati è 50, che è pari, quidi le posizioi cetrali soo la 5-esima e la 6-esima, che cadoo ella classe 161 165. Tale classe è duque la classe mediaa. La posizioe cetrale P è i questo caso, per covezioe, 5.5. Si ha che l 1 = 160.5, F c = 13, a = 5, f = 15, quidi mediaa = 160.5 + (5.5 13) 5 15 164.7. Aaloghi alla mediaa soo i quartili, i decili e i percetili. 9

Dati valori x i disposti i ordie crescete, i 3 valori che dividoo l isieme dei dati i 4 parti uguali si dicoo quartili e si idicao co Q 1, Q, Q 3. I 9 valori che dividoo l isieme dei dati i 10 parti uguali si dicoo decili e si idicao co D 1, D,..., D 9. I 99 valori che dividoo l isieme dei dati i 100 parti uguali si dicoo cetili e si idicao co P 1, P,..., P 99. 10