Rappresentazione dei Dati RAPPRESENTAZIONE DEI DATI Quando si dispone di un alto numero di misure della stessa grandezza fisica è opportuno organizzarle in modo da rendere evidente Quandoil si loro dispone significato. di un alto numero di misure della stessa grandezza fisica è opportuno organizzarle in modo da rendere evidente il loro significato. Strumenti Strumenti di uso frequente sono: tabelle, diagrammi a barre, istogrammi. di uso frequente sono: tabelle, diagrammi a barre, istogrammi. Consideriamo, ad ad esempio, due due sperimentatori, A e AB, eche B, abbiano effettuato che abbiano ciascuno effettuato 10 misurazioni ciascuno 10 di tempo misurazioni con strumenti di a sensibilità tempo con diversa. strumenti I dati asono sensibilità registrati diversa. nella tabella: I dati sono registrati nella tabella: tempo (in secondi) A 1.4 1.7 1.4 1.6 1.5 1.5 1.4 1.6 1.6 1.7 B 1.52 1.50 1.51 1.53 1.51 1.50 1.50 1.51 1.52 1.51
Rappresentazione dei Dati RAPPRESENTAZIONE DEI DATI Quando si dispone di un alto numero di misure della stessa grandezza fisica è opportuno organizzarle in modo da rendere evidente Quandoil si loro dispone significato. di un alto numero di misure della stessa grandezza fisica è opportuno organizzarle in modo da rendere evidente il loro significato. Strumenti Strumenti di uso frequente sono: tabelle, diagrammi a barre, istogrammi. di uso frequente sono: tabelle, diagrammi a barre, istogrammi. Consideriamo, ad ad esempio, due due sperimentatori, A e AB, eche B, abbiano effettuato che abbiano ciascuno effettuato 10 misurazioni ciascuno 10 di tempo misurazioni con strumenti di a sensibilità tempo con diversa. strumenti I dati asono sensibilità registrati diversa. nella tabella: I dati sono registrati nella tabella: tempo (in secondi) A 1.4 1.7 1.4 1.6 1.5 1.5 1.4 1.6 1.6 1.7 B 1.52 1.50 1.51 1.53 1.51 1.50 1.50 1.51 1.52 1.51
UENZE Frequenze FREQUENZE TA: n i numero di volte che si (dato). M j=1 n j = N FREQUENZA ASSOLUTA: ni numero di volte che si verifica un certo evento (dato). FREQUENZA FREQUENZA ASSOLUTA: ASSOLUTA: n i numero di volte che si verifica un certo evento (dato). n i numero di volte che si M verifica un certo evento (dato). j=1 n j = MN j=1 M rappresenta il nu- n j = N M rappresenta il numero di gruppi in cui insi cui sono si suddivise le Misure A Freq. ass. Misure B Freq. ass. M rappresenta il numero di gruppi in cui si Freq. ass. Misure A Freq. ass. Misure B Freq. ass. gruppi 1.4 3 mero1.50 di gruppi 3 in cui si 3 1.4 3 1.50 3 sono suddivise le misure (M N). M = N 1.5 2 1.51 4 misure (M sono suddivise le misure 3 (M sono N). suddivise M =N le mis- solo in 1.5 2 1.51 4 41.6 3 1.52 2 caso di misure 1.7 1.6 2 1.53 1.52 N). 1 M = 2Nsolo in caso di (M misure senza N). M ripetizioni. = N 2 1.7 senza ripetizioni. solo in caso di misure solo 2 in caso 1.53 di misure 1 1 senza ripetizioni. FREQUENZA RELATIVA: RELATIVA: rapportotrafrequenza senza ripetizioni. rapporto tra assoluta e il numero totale di prove (misure). assoluta FREQUENZA e il numerorelativa: totale di prove rapporto (misure). trafrequenza A: rapportotrafrequenza ale di prove (misure). n j f i = n i N M j=1 FREQUENZE assoluta e il numero totale di prove (misure). N =1 Misure Af Freq. rel. Misure B Freq. rel. i = n i N M n j j=1 N =1 1.4 0.3 1.50 0.3 1.5 0.2 1.51 0.4 1.6 0.3 1.52 0.2 M rappresenta il numero di Misure A Freq. rel. Misure B Freq. rel. 1.4 Misure 0.3A Freq. 1.50 rel. Misure 0.3 B Freq. rel. 1.5 0.2 1.4 1.51 0.3 0.4 1.50 0.3 1.6 0.3 1.52 0.2 1.5 0.2 1.51 0.4 1.7 0.2 1.53 0.1 1.6 0.3 1.52 0.2 p.32/49 1.7 0.2 1.53 0.1 p.32/49
Diagrammi In ascissa a Barre i valori delle misure; in ordinata le freq. assolute o relative. In ascissa i valori delle misure; in ordinata le freq. assolute o relative. Si utilizzano Si utilizzano quando le grandezze quando le assumono grandezze valori che discreti. possono assumere solo valori discreti. Indicazione Indicazione lampante: I lampante: dati di B sono IdatidiB molto raggruppati sono molto intorno raggruppati ad un valore prossimo intorno ada 1.5 unmentre valorei prossimo dati di A sono a 1.5 mentre molto più dati dispersi. A sono Qual è molto la serie piùdi dispersi. misure più Qualèlaseriedi precisa? misure più precisa?
DIAGRAMMI A BARRE Diagramma a Barre Sperimentatore A: seconda serie di 100 misure. Sperimentatore A: secondaseriedi100 misure. diagramma in frequenze assolute diagramma in frequenze relative Idiagrammiinfreq.realtivesidicononormalizzati. I diagrammi in freq. realtive si dicono normalizzati. Sono utili per il confronto di campioni Sonodi utili grandezza per il confronto diversa di dati diversi. All aumentare del numero delle misure il diagramma All aumentare tende adel diventare numero delle molto misure più regolare. il diagramma tende a diventare più regolare Precisione di un esperimento larghezza della distribuzione di frequenza. Precisione di un esperimento larghezza della distribuzione di frequenza.
Istogrammi Rappresentazione utile quando + La grandezza misurata si presenta con valori discreti + Il numero dei dati è grande Si raggruppano i dati in intervalli successivi di valori. Nel caso di misure, a causa della loro precisione finita (numero finito di cifre significative), conviene raggrupparle in M intervalli successivi di valori, la cui ampiezza non potrà mai essere inferiore alla sensibilità dello strumento. In altre parole, la più piccola ampiezza degli intervalli corrisponde alla cifra significativa più piccola apprezzabile.
Istogramma L asse delle ascisse suddiviso in K intervalli, detti classi di frequenza. Queste possono essere uguali o diverse. Frequenza: numero ni o frazione ni/n di dati compresi nell intervallo i-esimo. Se le classi sono di ampiezza diversa, le frequenze non sono direttamente confrontabili Densità di frequenza: rapporto tra la frequenza e l ampiezza di una classe di = ni/ xi o di = fi/ xi Ad ogni classe è associato un rettangolo: la base è pari all ampiezza della classe xi (ascissa); l altezza è pari alla densità di frequenza di(ordinata); l area è per costruzione la frequenza (assoluta o relativa) associata alla classe.
ME COSTRUIRE GLI ISTOGRAMMI Come costruire gli Istogrammi Definire il numero K delle classi e le loro ampiezze x i,i=1,k Definire il numero K delle classi e le loro ampiezze xi, i = 1, K In un piano catesiano porre in In un piano catesiano porre in: ascissa la variabile x evidenziando le suddivisioni delle classi; ordinata ordinata la densità la densità di di frequenza. ascissa la variabile x evidenziando le suddivisioni delle classi;
Istogrammi in Frequenze Assolute Ad ogni singola misura è associato un rettangolo di area unitaria. Area del rettangolo relativo all intervallo i-esimo pari alla frequenza assoluta ni (xi xi 1) hi = x hi =ni Area totale dell istogramma x1 h1 + x2 h2 + xk hk =n1+n2+ +nk =N
Istogrammi in frequenze relative Ad ogni singola misura associato un rettangolo di area pari a 1/N Area del rettangolo relativo all intervallo i-esimo pari alla frequenza realtiva ni/n (xi xi 1) hi = x hi = ni/n Area totale dell istogramma è unitaria L istogramma si dice normalizzato. x1 h1+ x2 h2+ xk hk=n1/n+n2/n+ nk/n =1 OSS: Se le classi di frequenza sono uguali hi frequenza Se le classi di frequenza sono diverse hi densità di frequenza
p.40/4 Un errore frequente Nel caso le classi di frequenza siano diverse occorre prestare attenzione a come si costruisce l istogramma. Nel caso le classi di frequenza siano diverse occorre prestare attenzione a come Le si costruisce altezzel istogramma. dei rettangoli non scalano come le Le altezze frequenze, dei rettangoli ma non come scalano lecome densità le frequenze, di frequenza. ma come le densità di frequenza. Consideriamo Consideriamo i dati ISTAT i2001 datisull ISTAT età della 2001 popolazione sull etàitaliana. della popolazione italiana.
Un errore frequente... corretto Un errore frequente... corretto Calcoliamo Calcoliamo l ampiezza l ampiezza delle classi dellee classi densità eladi densità frequenza. di frequenza. p.41/49
ISTOGRAMMI: il caso Old Faithful ISTOGRAMMI: il caso Old Faithful La significatività di un istogramma dipende dalla scelta dell ampiezza La significatività di un istogramma dipende dalla scelta delle classi di frequenza. dell ampiezza delle classi di frequenza. Consideriamo, come esempio, la variabile durata temporale delle eruzioni Consideriamo, del geyser Old come Faithful, esempio, presso lalo variabile Yellowstone durata National Park. temporale delle eruzioni del geyser Old Faithful, presso lo Yellowstone National Park.
ISTOGRAMMI: il caso Old Faithful Le eruzioni seguono un andamento quasi regolare, quindi per motivi turistici c è interesse a studiare e prevedere quando esse si manifesteranno e quanto dureranno. Lo studio statistico ha dimostrato che esistono 2 gruppi di eruzioni: eruzioni brevi ( 3 min) ed eruzioni lunghe (> 3 min). Costruiamo l istogramma Ampiezze troppo piccole producono fluttuazioni troppo forti non significative. Ampiezze troppo grandi nascondono la natura bimodale dei dati
Dipendenza dalla base dell istogramma Dipendenza dalla base dell istogramma 100 misure 100 misure del periodo del periodo di un pendolo di un pendolo con cronometro con cronometro digitale S=1 s 1, ripetute in identiche condizioni. digitale S=1 s 1,ripetuteinidentichecondizioni. p.44/49
Dipendenza dalla base dell istogramma Dipendenza dalla base dell istogramma 100 misure 100 misure del periodo del periodo di un pendolo di un pendolo con cronometro con cronometro digitale S=1 s 1, ripetute in identiche condizioni. digitale S=1 s 1,ripetuteinidentichecondizioni. p.44/49
Dipendenza dalla base dell istogramma Dipendenza dalla base dell istogramma 100 misure 100 misure del periodo del periodo di un pendolo di un pendolo con cronometro con cronometro digitale S=1 s 1, ripetute in identiche condizioni. digitale S=1 s 1,ripetuteinidentichecondizioni. p.44/49
Dipendenza dalla base dell istogramma Dipendenza dalla base dell istogramma 100 misure 100 misure del periodo del periodo di un pendolo di un pendolo con cronometro con cronometro digitale S=1/100 s 1, ripetute in identiche condizioni. digitale S=1 s 1,ripetuteinidentichecondizioni. p.44/49
Come suddividere i dati in classi? La morfologia di un istogramma dipende dalla scelta delle classi. Non esiste una legge rigorosa. Se le classi sono troppo ampie caratteristiche importanti possono essere omesse. Se le classi sono troppo strette l informazione può risultare poco significativa, poiché essendo poco popolate, le classi sono soggette a fluttuazioni statistiche. È sempre meglio effettuare dei test, variando l ampiezza delle classi per verificare la sensibilità dei dati. Generalmente il numero di classi varia tra 5 20, ma dipende dal caso specifico. Il numero degli intervalli K viene fissato, solitamente, dell ordine di N (scarto quadratico medio della statistica di Poisson...vedremo piu avanti).
FREQUENZA CUMULATIVA Frequenza Cumulativa Frequenza cumulativa F (x) (assoluta o relativa), per Frequenza ogni valore cumulativa di x, èilnumero(ass.orel.)divoltepercui F (x) (assoluta o relativa), ogni valore Frequenza cumulativa F (x) (assoluta relativa), per di ilx, risultato è il numero (ass. o rel.) di volte per cui il risultato della ognidella valoremisura di x, èilnumero(ass.orel.)divoltepercui è stato minore o uguale a x. misura è il stato risultato minore dellao misura uguale èa stato x. F (x) = n i (frequenza cumulativa minore ass.) oouguale a x. x i x F (x) = x i x n i (frequenza cumulativa ass.) o F (x) = x i x f i (frequenza cumulativa rel.) F (x) = x i x f i (frequenza cumulativa rel.) funzione funzione monotona monotona non non decrescente decrescente con uno con scalino uno pari scalino rispettivamente ad 1 o a 1/N in corrispondenza di ognuno degli pari rispettivamente ad 1 o a 1/N in corrispondenza di N valori osservati. ognuno degli N valori osservati. funzione monotona non decrescente con uno scalino pari rispettivamente ad 1 o a 1/N in corrispondenza di ognuno degli N valori osservati. (ass.) 0 = F ( ) F (x) F (+ ) = N (ass.) 1 (rel.) 0 = F ( ) F (x) F (+ ) = 1 (rel.) p.46/49
REQUENZA CUMULATIVA: un esempio FREQUENZA CUMULATIVA: un esempio Consideriamo N = 100 studenti maschi dei quali si voglia studiare la distribuzione del peso Consideriamo N = 100 studenti maschi dei quali si voglia studiare la distribuzione dei pesi. Massa in kg numero di studenti 59.5 62.5 5 62.5 65.5 18 65.5 68.5 42 68.5 71.5 27 71.5 74.5 8 Le classi scelte siano M =5 Totale 100 Le classi (59.5 scelte siano 62.5; M 62.5 = 5 (59.5 65.5; 62.5; 65.5 62.5 68.5; 65.5; 68.5 65.5 71.5; 68.5; 71.5 68.5 74.5) 71.5; 71.5 74.5) frequenza assoluta (in ordine di classe): numero studenti per ogni frequenza assoluta (in ordine di classe): numero studenti per ogni classe di pesi ni = {5, 18, 42, classe di pesi n 27, 8} i = {5, 18, 42, 27, 8} frequenza relativa: frequenzaassolutadivisaperilnumerodidati frequenza f i relativa: = n i /N frequenza = {5/100, assoluta 18/100, divisa 42/100, per il 27/100, numero di 8/100} dati fi = ni/n = {5/100, 18/100, 42/100, 27/100, 8/100} frequenza cumulativa relativa: sommadellefrequenzeassolutedelle frequenza varie cumulativa classi divisa relativa: per somma il numero delle frequenze di dati) assolute delle varie classi divisa per il numero F di (x) dati) ={5/100, F (x) = {5/100, (5 + 18)/100, (5 + 18)/100, (23 (23 + 42)/100, + 42)/100, ecc.} ecc.} p.47/49
FREQUENZA CUMULATIVA: un esempio p.48/49
Istogramma Cumulativo È utile per determinare quanti o quale percentuale dei dati (campione) sono al di sotto (o uguali) ad un certo valore. Vantaggi dell istogramma cumulativo 1. Le fluttuazioni risultano ridotte rispetto all istogramma: scostamenti di segno opposto si annullano sommando; 2. Non dipende dalla suddivisione in classi mentre l istogramma dipende dalla suddivisione scelta dello sperimentatore Svantaggi dell istogramma cumulativo La forma di questa funzione non è utile per suggerirci ipotesi sulla distribuzione della variabile