RAPPRESENTAZIONE DEI DATI



Похожие документы
Il concetto di valore medio in generale

Corso di. Dott.ssa Donatella Cocca

Grafici delle distribuzioni di frequenza

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Statistica descrittiva univariata

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Elementi di Statistica descrittiva Parte I

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

Esempio di introduzione. della statistica a scuola

Statistica descrittiva

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 1

Facciamo qualche precisazione

Elementi di Psicometria con Laboratorio di SPSS 1

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V

Statistica descrittiva: prime informazioni dai dati sperimentali

Statistica. Le rappresentazioni grafiche

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA

Capitolo 12 La regressione lineare semplice

Elementi di statistica descrittiva I 31 Marzo 2009

IL NONIO. Nelle misure di lunghezza non è possibile aumentare a piacere la sensibilità di un regolo, dato che una scala

E naturale chiedersi alcune cose sulla media campionaria x n

Dr. Marco Vicentini Anno Accademico Rev 30/03/2011

INDICI DI TENDENZA CENTRALE

ESERCIZI DI STATISTICA DESCRITTIVA

Statistica inferenziale

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria. Statistica descrittiva

Slide Cerbara parte1 5. Le distribuzioni teoriche

STATISTICA DESCRITTIVA UNIVARIATA

La distribuzione Normale. La distribuzione Normale

ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2004

Modelli descrittivi, statistica e simulazione

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

ANALISI GRAFICHE PER IL CONTROLLO DELLA QUALITA : ESEMPI DI APPLICAZIONI

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco

LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di

Elementi di Psicometria con Laboratorio di SPSS 1

matematica probabilmente

SPC e distribuzione normale con Access

Statistica. Lezione 6

Indici (Statistiche) che esprimono le caratteristiche di simmetria e

INTEGRALI DEFINITI. Tale superficie viene detta trapezoide e la misura della sua area si ottiene utilizzando il calcolo di un integrale definito.

Indici di dispersione

Metodi statistici per le ricerche di mercato

Capitolo 13: L offerta dell impresa e il surplus del produttore

Esercitazione di riepilogo 23 Aprile 2013

2. Leggi finanziarie di capitalizzazione

1. Distribuzioni campionarie

Analisi statistica degli errori

Analisi e diagramma di Pareto

Inferenza statistica. Statistica medica 1

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Prova di autovalutazione Prof. Roberta Siciliano

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

CAPITOLO III CONFRONTI TRA DISTRIBUZIONI

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

CONTINUITÀ E DERIVABILITÀ Esercizi risolti

Prof.ssa Paola Vicard

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate

CENNI DI METODI STATISTICI

Capitolo 2 Distribuzioni di frequenza

DISTRIBUZIONI DI VARIABILI CASUALI DISCRETE

Analisi di dati di frequenza

Esercitazione I. Serena Arima Distribuzioni di frequenza: frequenza assoluta, relativa, percentuale;

GRANDEZZE ALTERNATE SINUSOIDALI

Introduzione all economia

Misure della dispersione o della variabilità

Dott.ssa Caterina Gurrieri

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

Statistica. Esercitazione 3 5 maggio 2010 Serie storiche. Connessione e indipendenza statistica

La distribuzione Gaussiana

Test statistici di verifica di ipotesi

Codifiche a lunghezza variabile

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

Lezione 1. Concetti Fondamentali

PROBABILITA MISURARE L INCERTEZZA Lanciamo due dadi, facciamo la somma dei punteggi ottenuti. Su quale numero mi conviene scommettere?

Premesse alla statistica

Indice Statistiche Univariate Statistiche Bivariate

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

1. L analisi statistica

Introduzione all analisi dei segnali digitali.

Lezioni di Matematica 1 - I modulo

Informatica. Rappresentazione binaria Per esempio diventa /10/2007. Introduzione ai sistemi informatici 1

SISTEMI DI NUMERAZIONE E CODICI

Esercizio 1. Nella Tabella A sono riportati i tempi di percorrenza, in minuti, di un tratto autostradale da parte di 40 autoveicoli.

Usando il pendolo reversibile di Kater

8 Elementi di Statistica

STATISTICA IX lezione

Politecnico di Milano. Facoltà di Ingegneria Industriale. Corso di Analisi e Geometria 2. Sezione D-G. (Docente: Federico Lastaria).

Librerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video

2 FUNZIONI REALI DI VARIABILE REALE

Introduzione alla Teoria degli Errori

LOGISTICA APPUNTI DI STATISTICA

1. PRIME PROPRIETÀ 2

Транскрипт:

Rappresentazione dei Dati RAPPRESENTAZIONE DEI DATI Quando si dispone di un alto numero di misure della stessa grandezza fisica è opportuno organizzarle in modo da rendere evidente Quandoil si loro dispone significato. di un alto numero di misure della stessa grandezza fisica è opportuno organizzarle in modo da rendere evidente il loro significato. Strumenti Strumenti di uso frequente sono: tabelle, diagrammi a barre, istogrammi. di uso frequente sono: tabelle, diagrammi a barre, istogrammi. Consideriamo, ad ad esempio, due due sperimentatori, A e AB, eche B, abbiano effettuato che abbiano ciascuno effettuato 10 misurazioni ciascuno 10 di tempo misurazioni con strumenti di a sensibilità tempo con diversa. strumenti I dati asono sensibilità registrati diversa. nella tabella: I dati sono registrati nella tabella: tempo (in secondi) A 1.4 1.7 1.4 1.6 1.5 1.5 1.4 1.6 1.6 1.7 B 1.52 1.50 1.51 1.53 1.51 1.50 1.50 1.51 1.52 1.51

Rappresentazione dei Dati RAPPRESENTAZIONE DEI DATI Quando si dispone di un alto numero di misure della stessa grandezza fisica è opportuno organizzarle in modo da rendere evidente Quandoil si loro dispone significato. di un alto numero di misure della stessa grandezza fisica è opportuno organizzarle in modo da rendere evidente il loro significato. Strumenti Strumenti di uso frequente sono: tabelle, diagrammi a barre, istogrammi. di uso frequente sono: tabelle, diagrammi a barre, istogrammi. Consideriamo, ad ad esempio, due due sperimentatori, A e AB, eche B, abbiano effettuato che abbiano ciascuno effettuato 10 misurazioni ciascuno 10 di tempo misurazioni con strumenti di a sensibilità tempo con diversa. strumenti I dati asono sensibilità registrati diversa. nella tabella: I dati sono registrati nella tabella: tempo (in secondi) A 1.4 1.7 1.4 1.6 1.5 1.5 1.4 1.6 1.6 1.7 B 1.52 1.50 1.51 1.53 1.51 1.50 1.50 1.51 1.52 1.51

UENZE Frequenze FREQUENZE TA: n i numero di volte che si (dato). M j=1 n j = N FREQUENZA ASSOLUTA: ni numero di volte che si verifica un certo evento (dato). FREQUENZA FREQUENZA ASSOLUTA: ASSOLUTA: n i numero di volte che si verifica un certo evento (dato). n i numero di volte che si M verifica un certo evento (dato). j=1 n j = MN j=1 M rappresenta il nu- n j = N M rappresenta il numero di gruppi in cui insi cui sono si suddivise le Misure A Freq. ass. Misure B Freq. ass. M rappresenta il numero di gruppi in cui si Freq. ass. Misure A Freq. ass. Misure B Freq. ass. gruppi 1.4 3 mero1.50 di gruppi 3 in cui si 3 1.4 3 1.50 3 sono suddivise le misure (M N). M = N 1.5 2 1.51 4 misure (M sono suddivise le misure 3 (M sono N). suddivise M =N le mis- solo in 1.5 2 1.51 4 41.6 3 1.52 2 caso di misure 1.7 1.6 2 1.53 1.52 N). 1 M = 2Nsolo in caso di (M misure senza N). M ripetizioni. = N 2 1.7 senza ripetizioni. solo in caso di misure solo 2 in caso 1.53 di misure 1 1 senza ripetizioni. FREQUENZA RELATIVA: RELATIVA: rapportotrafrequenza senza ripetizioni. rapporto tra assoluta e il numero totale di prove (misure). assoluta FREQUENZA e il numerorelativa: totale di prove rapporto (misure). trafrequenza A: rapportotrafrequenza ale di prove (misure). n j f i = n i N M j=1 FREQUENZE assoluta e il numero totale di prove (misure). N =1 Misure Af Freq. rel. Misure B Freq. rel. i = n i N M n j j=1 N =1 1.4 0.3 1.50 0.3 1.5 0.2 1.51 0.4 1.6 0.3 1.52 0.2 M rappresenta il numero di Misure A Freq. rel. Misure B Freq. rel. 1.4 Misure 0.3A Freq. 1.50 rel. Misure 0.3 B Freq. rel. 1.5 0.2 1.4 1.51 0.3 0.4 1.50 0.3 1.6 0.3 1.52 0.2 1.5 0.2 1.51 0.4 1.7 0.2 1.53 0.1 1.6 0.3 1.52 0.2 p.32/49 1.7 0.2 1.53 0.1 p.32/49

Diagrammi In ascissa a Barre i valori delle misure; in ordinata le freq. assolute o relative. In ascissa i valori delle misure; in ordinata le freq. assolute o relative. Si utilizzano Si utilizzano quando le grandezze quando le assumono grandezze valori che discreti. possono assumere solo valori discreti. Indicazione Indicazione lampante: I lampante: dati di B sono IdatidiB molto raggruppati sono molto intorno raggruppati ad un valore prossimo intorno ada 1.5 unmentre valorei prossimo dati di A sono a 1.5 mentre molto più dati dispersi. A sono Qual è molto la serie piùdi dispersi. misure più Qualèlaseriedi precisa? misure più precisa?

DIAGRAMMI A BARRE Diagramma a Barre Sperimentatore A: seconda serie di 100 misure. Sperimentatore A: secondaseriedi100 misure. diagramma in frequenze assolute diagramma in frequenze relative Idiagrammiinfreq.realtivesidicononormalizzati. I diagrammi in freq. realtive si dicono normalizzati. Sono utili per il confronto di campioni Sonodi utili grandezza per il confronto diversa di dati diversi. All aumentare del numero delle misure il diagramma All aumentare tende adel diventare numero delle molto misure più regolare. il diagramma tende a diventare più regolare Precisione di un esperimento larghezza della distribuzione di frequenza. Precisione di un esperimento larghezza della distribuzione di frequenza.

Istogrammi Rappresentazione utile quando + La grandezza misurata si presenta con valori discreti + Il numero dei dati è grande Si raggruppano i dati in intervalli successivi di valori. Nel caso di misure, a causa della loro precisione finita (numero finito di cifre significative), conviene raggrupparle in M intervalli successivi di valori, la cui ampiezza non potrà mai essere inferiore alla sensibilità dello strumento. In altre parole, la più piccola ampiezza degli intervalli corrisponde alla cifra significativa più piccola apprezzabile.

Istogramma L asse delle ascisse suddiviso in K intervalli, detti classi di frequenza. Queste possono essere uguali o diverse. Frequenza: numero ni o frazione ni/n di dati compresi nell intervallo i-esimo. Se le classi sono di ampiezza diversa, le frequenze non sono direttamente confrontabili Densità di frequenza: rapporto tra la frequenza e l ampiezza di una classe di = ni/ xi o di = fi/ xi Ad ogni classe è associato un rettangolo: la base è pari all ampiezza della classe xi (ascissa); l altezza è pari alla densità di frequenza di(ordinata); l area è per costruzione la frequenza (assoluta o relativa) associata alla classe.

ME COSTRUIRE GLI ISTOGRAMMI Come costruire gli Istogrammi Definire il numero K delle classi e le loro ampiezze x i,i=1,k Definire il numero K delle classi e le loro ampiezze xi, i = 1, K In un piano catesiano porre in In un piano catesiano porre in: ascissa la variabile x evidenziando le suddivisioni delle classi; ordinata ordinata la densità la densità di di frequenza. ascissa la variabile x evidenziando le suddivisioni delle classi;

Istogrammi in Frequenze Assolute Ad ogni singola misura è associato un rettangolo di area unitaria. Area del rettangolo relativo all intervallo i-esimo pari alla frequenza assoluta ni (xi xi 1) hi = x hi =ni Area totale dell istogramma x1 h1 + x2 h2 + xk hk =n1+n2+ +nk =N

Istogrammi in frequenze relative Ad ogni singola misura associato un rettangolo di area pari a 1/N Area del rettangolo relativo all intervallo i-esimo pari alla frequenza realtiva ni/n (xi xi 1) hi = x hi = ni/n Area totale dell istogramma è unitaria L istogramma si dice normalizzato. x1 h1+ x2 h2+ xk hk=n1/n+n2/n+ nk/n =1 OSS: Se le classi di frequenza sono uguali hi frequenza Se le classi di frequenza sono diverse hi densità di frequenza

p.40/4 Un errore frequente Nel caso le classi di frequenza siano diverse occorre prestare attenzione a come si costruisce l istogramma. Nel caso le classi di frequenza siano diverse occorre prestare attenzione a come Le si costruisce altezzel istogramma. dei rettangoli non scalano come le Le altezze frequenze, dei rettangoli ma non come scalano lecome densità le frequenze, di frequenza. ma come le densità di frequenza. Consideriamo Consideriamo i dati ISTAT i2001 datisull ISTAT età della 2001 popolazione sull etàitaliana. della popolazione italiana.

Un errore frequente... corretto Un errore frequente... corretto Calcoliamo Calcoliamo l ampiezza l ampiezza delle classi dellee classi densità eladi densità frequenza. di frequenza. p.41/49

ISTOGRAMMI: il caso Old Faithful ISTOGRAMMI: il caso Old Faithful La significatività di un istogramma dipende dalla scelta dell ampiezza La significatività di un istogramma dipende dalla scelta delle classi di frequenza. dell ampiezza delle classi di frequenza. Consideriamo, come esempio, la variabile durata temporale delle eruzioni Consideriamo, del geyser Old come Faithful, esempio, presso lalo variabile Yellowstone durata National Park. temporale delle eruzioni del geyser Old Faithful, presso lo Yellowstone National Park.

ISTOGRAMMI: il caso Old Faithful Le eruzioni seguono un andamento quasi regolare, quindi per motivi turistici c è interesse a studiare e prevedere quando esse si manifesteranno e quanto dureranno. Lo studio statistico ha dimostrato che esistono 2 gruppi di eruzioni: eruzioni brevi ( 3 min) ed eruzioni lunghe (> 3 min). Costruiamo l istogramma Ampiezze troppo piccole producono fluttuazioni troppo forti non significative. Ampiezze troppo grandi nascondono la natura bimodale dei dati

Dipendenza dalla base dell istogramma Dipendenza dalla base dell istogramma 100 misure 100 misure del periodo del periodo di un pendolo di un pendolo con cronometro con cronometro digitale S=1 s 1, ripetute in identiche condizioni. digitale S=1 s 1,ripetuteinidentichecondizioni. p.44/49

Dipendenza dalla base dell istogramma Dipendenza dalla base dell istogramma 100 misure 100 misure del periodo del periodo di un pendolo di un pendolo con cronometro con cronometro digitale S=1 s 1, ripetute in identiche condizioni. digitale S=1 s 1,ripetuteinidentichecondizioni. p.44/49

Dipendenza dalla base dell istogramma Dipendenza dalla base dell istogramma 100 misure 100 misure del periodo del periodo di un pendolo di un pendolo con cronometro con cronometro digitale S=1 s 1, ripetute in identiche condizioni. digitale S=1 s 1,ripetuteinidentichecondizioni. p.44/49

Dipendenza dalla base dell istogramma Dipendenza dalla base dell istogramma 100 misure 100 misure del periodo del periodo di un pendolo di un pendolo con cronometro con cronometro digitale S=1/100 s 1, ripetute in identiche condizioni. digitale S=1 s 1,ripetuteinidentichecondizioni. p.44/49

Come suddividere i dati in classi? La morfologia di un istogramma dipende dalla scelta delle classi. Non esiste una legge rigorosa. Se le classi sono troppo ampie caratteristiche importanti possono essere omesse. Se le classi sono troppo strette l informazione può risultare poco significativa, poiché essendo poco popolate, le classi sono soggette a fluttuazioni statistiche. È sempre meglio effettuare dei test, variando l ampiezza delle classi per verificare la sensibilità dei dati. Generalmente il numero di classi varia tra 5 20, ma dipende dal caso specifico. Il numero degli intervalli K viene fissato, solitamente, dell ordine di N (scarto quadratico medio della statistica di Poisson...vedremo piu avanti).

FREQUENZA CUMULATIVA Frequenza Cumulativa Frequenza cumulativa F (x) (assoluta o relativa), per Frequenza ogni valore cumulativa di x, èilnumero(ass.orel.)divoltepercui F (x) (assoluta o relativa), ogni valore Frequenza cumulativa F (x) (assoluta relativa), per di ilx, risultato è il numero (ass. o rel.) di volte per cui il risultato della ognidella valoremisura di x, èilnumero(ass.orel.)divoltepercui è stato minore o uguale a x. misura è il stato risultato minore dellao misura uguale èa stato x. F (x) = n i (frequenza cumulativa minore ass.) oouguale a x. x i x F (x) = x i x n i (frequenza cumulativa ass.) o F (x) = x i x f i (frequenza cumulativa rel.) F (x) = x i x f i (frequenza cumulativa rel.) funzione funzione monotona monotona non non decrescente decrescente con uno con scalino uno pari scalino rispettivamente ad 1 o a 1/N in corrispondenza di ognuno degli pari rispettivamente ad 1 o a 1/N in corrispondenza di N valori osservati. ognuno degli N valori osservati. funzione monotona non decrescente con uno scalino pari rispettivamente ad 1 o a 1/N in corrispondenza di ognuno degli N valori osservati. (ass.) 0 = F ( ) F (x) F (+ ) = N (ass.) 1 (rel.) 0 = F ( ) F (x) F (+ ) = 1 (rel.) p.46/49

REQUENZA CUMULATIVA: un esempio FREQUENZA CUMULATIVA: un esempio Consideriamo N = 100 studenti maschi dei quali si voglia studiare la distribuzione del peso Consideriamo N = 100 studenti maschi dei quali si voglia studiare la distribuzione dei pesi. Massa in kg numero di studenti 59.5 62.5 5 62.5 65.5 18 65.5 68.5 42 68.5 71.5 27 71.5 74.5 8 Le classi scelte siano M =5 Totale 100 Le classi (59.5 scelte siano 62.5; M 62.5 = 5 (59.5 65.5; 62.5; 65.5 62.5 68.5; 65.5; 68.5 65.5 71.5; 68.5; 71.5 68.5 74.5) 71.5; 71.5 74.5) frequenza assoluta (in ordine di classe): numero studenti per ogni frequenza assoluta (in ordine di classe): numero studenti per ogni classe di pesi ni = {5, 18, 42, classe di pesi n 27, 8} i = {5, 18, 42, 27, 8} frequenza relativa: frequenzaassolutadivisaperilnumerodidati frequenza f i relativa: = n i /N frequenza = {5/100, assoluta 18/100, divisa 42/100, per il 27/100, numero di 8/100} dati fi = ni/n = {5/100, 18/100, 42/100, 27/100, 8/100} frequenza cumulativa relativa: sommadellefrequenzeassolutedelle frequenza varie cumulativa classi divisa relativa: per somma il numero delle frequenze di dati) assolute delle varie classi divisa per il numero F di (x) dati) ={5/100, F (x) = {5/100, (5 + 18)/100, (5 + 18)/100, (23 (23 + 42)/100, + 42)/100, ecc.} ecc.} p.47/49

FREQUENZA CUMULATIVA: un esempio p.48/49

Istogramma Cumulativo È utile per determinare quanti o quale percentuale dei dati (campione) sono al di sotto (o uguali) ad un certo valore. Vantaggi dell istogramma cumulativo 1. Le fluttuazioni risultano ridotte rispetto all istogramma: scostamenti di segno opposto si annullano sommando; 2. Non dipende dalla suddivisione in classi mentre l istogramma dipende dalla suddivisione scelta dello sperimentatore Svantaggi dell istogramma cumulativo La forma di questa funzione non è utile per suggerirci ipotesi sulla distribuzione della variabile