Statistica Un Esempio

Похожие документы
Indici di Dispersione

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Esempio: Media, Mediana, Moda

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Statistica descrittiva II

Esercizi di statistica descrittiva. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 30

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

Distribuzione Normale

Questionario 1. Sono assegnati i seguenti dati

Teoria e tecniche dei test. Concetti di base

Distribuzione normale

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Esercitazioni di Statistica

LA MISURA IN PSICOLOGIA

Istituzioni di Statistica e Statistica Economica

Misure di dispersione (o di variabilità)

tabelle grafici misure di

Matematica ed elementi di statistica Corso di laurea in Scienze e tecnologie per i beni culturali - a.a Esercizi 12: Statistica Descrittiva

Lezione 4 a - Misure di dispersione o di variabilità

Nozioni di statistica

Esercizi di Probabilità e Statistica

Dispensa di Statistica

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

Esercizi di Ricapitolazione

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

STATISTICHE DESCRITTIVE Parte II

Esercitazioni di Statistica

Esercitazioni di Metodi Statistici per la Biologia

Rappresentazioni grafiche

STATISTICA. La Statistica è la scienza che studia i fenomeni collettivi utilizzando metodi matematici.

VENGONO DETTI QUANTILI

Misure di dispersione (o di variabilità)

Statistica di base per l analisi socio-economica

STATISTICA 1 ESERCITAZIONE 2

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Statistica Sociale - modulo A

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

Distribuzione Normale

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Esercitazioni di Statistica per Biotecnologie. Francesca Pizzorni Ferrarese

Le medie. Antonello Maruotti

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

1/55. Statistica descrittiva

Esercitazioni. Es 1. Dato il seguente dataset

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Università di Cassino. Esercitazioni di Statistica 1 del 29 Gennaio Dott. Mirko Bevilacqua

Lo scarto quadratico medio è s = s 2 2,15. c) Le confezioni con peso inferiore a 500g sono 18, quindi in percentuale sono 18 = 0,72 = 72%.

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

Distribuzioni Statistiche e Medie Esercitazione n 01

INDICI DI POSIZIONE - I QUANTILI

Esercitazioni di statistica

Una statistica è una quantità numerica il cui valore è determinato dai dati.

Esercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

STATISTICA I - CORSO DI LAUREA IN STATISTICA a.a. 2004/2005 Prova intermedia del 01 aprile 2005

Scale di Misurazione Lezione 2

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Esercitazioni di statistica

Teorema del Limite Centrale

Variabilità e Concentrazione Esercitazione n 02

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

STATISTICHE DESCRITTIVE

Le rappresentazioni grafiche

ESAME. 9 Gennaio 2017 COMPITO B

REGRESSIONE E CORRELAZIONE

Statistica Inferenziale

LE DISTRIBUZIONI CAMPIONARIE

Elementi di Statistica

Capitolo 3 Sintesi e descrizione dei dati quantitativi

Valori Medi. Docente Dott.ssa Domenica Matranga

Indici di posizione e dispersione per distribuzioni di variabili aleatorie

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Lezione n. 1 _Complementi di matematica

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva

Rilevazione (Raccolta) Dati: Raccolta Campionaria e Raccolta Globale

Gli indici di variabilità

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2010/2011 STATISTICA. Docente: Paolo Mazzocchi

Statistica. Esplicazione integrato con Appunti. Marco D Epifano

Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano:

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Nuovo Ordinamento Esame di Statistica 20 Giugno 2003 docente: P. Vicard Nome

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche

Транскрипт:

Statistica Un Esempio Un indagine sul peso, su un campione di n = 100 studenti, ha prodotto il seguente risultato. I pesi p sono espressi in Kg e sono stati raggruppati in cinque classi di peso. classe (peso in Kg) f i f i /n 60 p 62 5 0.05 63 p 65 18 0.18 66 p 68 42 0.42 69 p 71 27 0.27 72 p 74 8 0.08 100 1.00 Sono riportate le frequenze assolute f i (numero di individui appartenenti alla classe di peso i-sima) e le frequenze relative f i /n. Le classi sono di uguale ampiezza, ma non sono contigue

Statistica Un Esempio Estendiamo i confini di ciascuna classe in modo simmetrico di 0.5 Kg. La popolazione non è cambiata e possiamo rappresentare i dati, in classi contigue, come segue: classe (peso in Kg) r i f i f i /n 59.5 p < 62.5 61 5 0.05 62.5 p < 65.5 64 18 0.18 65.5 p < 68.5 67 42 0.42 68.8 p < 71.5 70 27 0.27 71.5 p < 74.5 73 8 0.08 100 1.00 Supponendo che gli individui di una classe siano distribuiti uniformemente al suo interno, è naturale associare a ciascuna classe, come rappresentante, il valore centrale r i della classe stessa.

Calcolo della Media Come si può calcolare la media dei dati conoscendo solo un informazione parziale (per classi) sulle frequenze? Occorre formulare un ipotesi su come i dati si distribuiscono all interno di ogni classe. In assenza di ulteriori informazioni, è ragionevole congetturare che gli elementi appartenenti ad una classe si distribuiscano uniformemente al suo interno. È naturale associare ad ogni classe un rappresentante: il valore centrale della classe. r i 61 64 67 70 73 f i 5 18 42 27 8 Ai fini del calcolo della media si utilizzano solo i rappresentanti r i : p = 5 61 + 18 64 + 42 67 + 27 70 + 8 73 100 = 67.45Kg

Distribuzione delle frequenze Poligono di Frequenza classe r i f i 59.5 p < 62.5 61 5 62.5 p < 65.5 64 18 65.5 p < 68.5 67 42 68.8 p < 71.5 70 27 71.5 p < 74.5 73 8 42 27 f possiamo rappresentare in modo efficace le frequenze delle classi del campione mediante un istogramma (dove le aree dei rettangoli sono proporzionali alle frequenze della classe) unendo i punti medi dei lati superiori dei rettangoli, si ottiene il cosiddetto poligono di frequenza 18 8 5 61 64 67 70 73 p (kg) Ipotesi: classi equispaziate distribuzione uniforme all interno della classe

Ogiva di Frequenza Distribuzione delle frequenze classe r i f i F i p < 59.5-0 0 59.5 p < 62.5 61 5 5 62.5 p < 65.5 64 18 23 65.5 p < 68.5 67 42 65 68.8 p < 71.5 70 27 92 71.5 p < 74.5 73 8 100 100 92 65 F calcoliamo le frequenze cumulate F i (F i rappresenta il numero dei dati, che sono minori del secondo estremo della i-sima classe) costruiamo il diagramma cumulativo delle frequenze unendo i punti, si ottiene la cosiddetta ogiva di frequenza 23 5 59.5 62.5 65.5 68.5 71.5 74.5 p (kg)

Calcolo della Mediana: Primo Metodo Calcolo della mediana M e Trovare il punto M e tale che l area in giallo sia il 50% dell area totale sottesa dall istogramma delle frequenze area totale istogramma = 300 3 5 + 3 18 + (M e 65.5) 42 = 150 42 27 18 f M e = 81 42 + 65.5 67.43Kg 8 5 NOTA: ricordiamo che le aree sono proporzionali alle frequenze. 59.5 62.5 M e 65.5 71.5 74.5 p (kg)

Calcolo della Mediana: Secondo Metodo Calcolo della mediana M e 100 92 65 50 F B Trovare il punto di intersezione della retta F = 50 con l ogiva di frequenza. Significa trovare l intersezione con la retta passante per i punti: A = (65.5, 23) e B = (68.5, 65) F = 50 23 A F = 23 + 42 3 (p 65.5) 5 59.5 62.5 65.5 71.5 74.5 M e p (kg) p = 65.5 + 3 42 27 67.43

Indici di Dispersione Si cercano indici di dispersione che: utilizzino tutti i dati {x 1, x 2,..., x n } siano basati sulla nozione di scarto (distanza) dei dati rispetto a un centro d i = x i C ad esempio, rispetto alla media aritmetica d i = x i x rispetto a un dato d i = x i x j con alcune proprietà generali: l indice di dispersione non deve mai essere negativo assume il valore 0 se i dati sono tutti uguali non cambia se si aggiunge una costante ai dati

Varianza Varianza: è la media aritmetica (semplice o ponderata) dei quadrati degli scarti. Dato l insieme di valori {x 1, x 2,..., x n } Var = s 2 = 1 n n (x i x) 2 Dato l insieme di valori {x 1, x 2,..., x m } con le rispettive frequenze assolute {f 1, f 2,..., f m } Var = s 2 = 1 n m f i (x i x) 2 dove n = m f i

Deviazione Standard Deviazione standard (o scarto quadratico medio): è la radice quadrata della varianza. s = 1 n n (x i x) 2 oppure s = 1 n m f i (x i x) 2 Consente di avere un indice di dispersione espresso nella stessa unità di misura dei dati. Nota: applicando una trasformazione lineare ai dati y i = ax i + b s 2 y = a2 s 2 x, s y = a s x

Statistiche Campionarie Spesso gli indici statistici vengono applicati non all intera popolazione, ma a un suo campione. Si cerca di stimare (inferenza) nel miglior modo possibile le caratteristiche dell intera popolazione a partire dalle informazioni desunte da un campione rappresentativo. In questo caso si utilizzano le seguenti formule modificate: Varianza campionaria (stimata): s 2 = 1 n 1 n (x i x) 2 Deviazione standard campionaria (stimata): s = 1 n 1 n (x i x) 2

Esempio Riassuntivo Caso A x i f i f i /n 1 1 0.100 3 1 0.100 5 6 0.600 7 1 0.100 9 1 0.100 10 1.000 Caso B x i f i f i /n 1 2 0.200 3 2 0.200 5 2 0.200 7 2 0.200 9 2 0.200 10 1.000

Esempio Riassuntivo Caso A x i f i f i /n 1 1 0.100 3 1 0.100 5 6 0.600 7 1 0.100 9 1 0.100 10 1.000 media 5.00 mediana 5.00 varianza 4.00 varianza stimata 4.44 deviazione standard 2.00 deviazione standard stimata 2.11 Caso B x i f i f i /n 1 2 0.200 3 2 0.200 5 2 0.200 7 2 0.200 9 2 0.200 10 1.000 media 5.00 mediana 5.00 varianza 8.00 varianza stimata 8.89 deviazione standard 2.83 deviazione standard stimata 2.98

Esercizi Esercizio 1. Si consideri la seguente tabella relativa alle frequenze dei pesi in Kg di 100 individui adulti. Peso p in Kg 50 p < 55 20 55 p < 60 15 60 p < 65 18 65 p < 70 22 70 p < 75 18 75 p < 80 7 f ass le classi sono di uguale ampiezza supponiamo che i dati siano uniformemente distribuiti all interno di ogni classe possiamo definire per ogni classe un rappresentante r i (class mark) Calcolare il peso medio e lo scarto quadratico medio.

Esercizi Soluzione: calcoliamo la media e lo scarto quadratico medio utilizzando i valori dei rappresentanti. Calcoliamo il peso medio: p = 1 100 Peso p in Kg f i F i r i 50 p < 55 20 20 52.5 55 p < 60 15 35 57.5 60 p < 65 18 53 62.5 65 p < 70 22 75 67.5 70 p < 75 18 93 72.5 75 p < 80 7 100 77.5 (20 52.5 + 15 57.5 + 18 62.5 + 22 67.5+ +18 72.5 + 7 77.5) = 63.7Kg

Esercizi Calcoliamo la varianza e lo scarto quadratico medio: r i r i p (r i p) 2 f i 52.5 11.2 125.44 20 57.5 6.2 38.44 15 62.5 1.2 1.44 18 67.5 3.8 14.44 22 72.5 8.8 77.44 18 77.5 13.8 190.44 7 s 2 = 1 (20 125.44 + 15 38.44 + 18 1.44 + 22 14.44+ 100 +18 77.44 + 7 190.44) 61.56Kg 2 s 7.85 Kg

Varianza Deviazione Standard Le espressioni della varianza (e della deviazione standard) possono essere riscritte come segue: s 2 = 1 n ( n x 2 i n x2 ) o s 2 = 1 n ( m f i x 2 i n x2 ) Infatti, n (x i x) 2 = n (x 2 i 2x i x + x 2 ) = n x 2 i 2 x n x i + n x 2 = = n x 2 i 2 x(n x) + n x2 = n x 2 i n x2

Esercizi Esercizio 1. Nel rilevare l altezza in cm di un gruppo di reclute si è ottenuta la seguente tabella delle frequenze. Calcolare media, mediana e quartili. Soluzione: cm f ass f cum 166 1 1 168 3 4 169 6 10 170 11 21 171 8 29 172 6 35 173 4 39 174 3 42 175 1 43 178 1 44 n = 44 dimensione del campione x 170.9 media M e = x 22 + x 23 2 q 1 = x 11 + x 12 2 = 171 mediana = 170 primo quartile q 3 = x 33 + x 34 = 172 terzo quartile 2 q 3 q 1 = 2 distanza interquartile La distanza interquartile è un altro indice di dispersione, legato alla nozione di mediana. La mediana suddivide l insieme dei dati ordinati {x i } in due parti ugualmente numerose. I quartili si ottengono suddividendo i dati ordinati in quattro parti ugualmente numerose.

Esercizi Esercizio 2. Trovare media, mediana, moda, varianza e deviazione standard dei seguenti dati non ordinati e non raggruppati. Tracciare l istogramma delle frequenze. 7 4 10 9 15 12 7 8 11 4 14 10 5 14 1 10 8 12 6 5

Esercizi Soluzione: si costruisce la tabella della distribuzione di frequenza x 1 4 5 6 7 8 9 10 11 12 14 15 f ass 1 2 2 1 2 2 1 3 1 2 2 1 20 x = 1 (1+8+10+6+14+16+9+30+11+24+28+15) = 8.6 20 s 2 = 1 (57.76 + 42.32 + 25.92 + 6.76 + 5.12 + 0.72 + 0.16 + 5.88+ 20 s 3.69 +5.76 + 23.12 + 58.33 + 40.96) 13.64 moda = 10.0 mediana = 8.5