Elaborazione statistica di dati

Похожие документы
Esclusione dei valori meno probabili Il criterio di Chauvenet

RICHIAMI DI CALCOLO DELLE PROBABILITÀ

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Dispensa di Statistica

tabelle grafici misure di

La distribuzione delle frequenze. T 10 (s)

Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazion

Osservazioni e Misura. Teoria degli errori

Vedi: Probabilità e cenni di statistica

ESAME. 9 Gennaio 2017 COMPITO A

distribuzione normale

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Contenuti: Capitolo 14 del libro di testo

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Questionario 1. Sono assegnati i seguenti dati

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Statistica. Matematica con Elementi di Statistica a.a. 2017/18

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Variabili casuali. - di Massimo Cristallo -

DISTRIBUZIONI DI PROBABILITA

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

Variabile casuale Normale

LA DISTRIBUZIONE NORMALE o DI GAUSS

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II

Teoria e tecniche dei test

Note sulla probabilità

ESAME. 9 Gennaio 2017 COMPITO B

SCHEDA DIDATTICA N 7

Approssimazione normale alla distribuzione binomiale

Teoria e tecniche dei test. Concetti di base

Statistica. Campione

Esercizi di statistica

Esercitazione: La distribuzione NORMALE

PAROLE CHIAVE Accuratezza, Accuracy, Esattezza, PRECISIONE, Precision, Ripetibilità, Affidabilità, Reliability, Scarto quadratico medio (sqm), Errore

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Analisi degli Errori di Misura. 08/04/2009 G.Sirri

Intervalli di confidenza

Distribuzioni statistiche

DISTRIBUZIONE NORMALE (1)

Il campionamento e l inferenza. Il campionamento e l inferenza

standardizzazione dei punteggi di un test

CALCOLO DELL ERRORE E VALUTAZIONE DI UN METODO ANALITICO

LA DISTRIBUZIONE NORMALE. La distribuzione Gaussiana. Dott.ssa Marta Di Nicola

Probabilità e Statistica

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità

LEZIONI DI STATISTICA MEDICA

05. Errore campionario e numerosità campionaria

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

Statistica Inferenziale

Indici di posizione e dispersione per distribuzioni di variabili aleatorie

5 DETERMINAZIONE DELL'INCERTEZZA TIPO COMPOSTA Grandezze d'ingresso incorrelate Grandezze d'ingresso correlate...

Транскрипт:

Elaborazione statistica di dati CONCETTI DI BASE DI STATISTICA ELEMENTARE Taratura strumenti di misura IPOTESI: grandezza da misurare identica da misura a misura Collaudo sistemi di produzione IPOTESI: accuratezza strumento di misura migliore della variabilità dei manufatti Per la presenza di errori casuali, ripetendo più volte la misura di una stessa grandezza, si può ottenere una serie di valori diversi. 3 Una serie di valori di misure casualmente diverse può essere ottenuta anche misurando una sola volta diversi elementi, nominalmente uguali, di una produzione industriale. 4

Esempio di serie di dati: Lo spessore di dadi estratti dalla produzione di una macchina Ogni serie di valori estratta dalla totalità dei valori possibili può essere considerato un campione. Esistono vari metodi per estrarre un campione che sia rappresentativo dell'universo. Qui si considerano campioni estratti casualmente. 5 6 7 8

Al sottoinsieme di n valori estratti dall insieme dei valori possibili viene dato il nome di campione; l intero insieme di dati N viene definito popolazione (o universo). media m= x CAMPIONE varianza s = n = n x i i= n- n (x i -x) i = 9 La media gode della proprietà di rendere minima la somma dei quadrati degli scarti. Inoltre la somma algebrica degli scarti rispetto al valore medio è nulla. La radice quadrata della varianza s, costituisce una stima della dispersione delle misure intorno al valore medio, al pari di s, ma ha il pregio di avere le stesse dimensioni delle misure x.

I due parametri precedenti nel caso della popolazione, o universo composto di N elementi, si indicano con i simboli: N µ= x N i i= I dati possono essere raggruppati in diversi modi. Una prima forma di raggruppamento si può osservare nella tabella. σ = = N i N ( x i µ ) 3 4 Una forma di raggruppamento molto più usata è quella delle classi di intervalli di appartenenza, che non è necessario abbiano tutti la stessa ampiezza. 5 6

Raggruppando per intervalli: Limiti delle classi > di mm < di mm Valore centrale della classe Frequenza assoluta Frequenza Densità di percentuale frequenza x j (mm) f j f p = f j n (%) fp x Frequenza cumulata percentuale j f k (%) n k= 6,6 6,7 6,65 3,73,73,73 6,7 6,8 6,75 6 5,45,545 8,8 6,8 6,9 6,85,9,9 9,9 6,9 6, 6,95 3,9,9 4, 6, 6, 6,5 6 3,64,364 63,64 6, 6, 6,5 9,9,99 8,73 6, 6,3 6,5,, 9,73 6,3 6,4 6,35 6 5,45,545 98,8 6,4 6,5 6,45,8,8, Il numero dei dati che appartengono a una determinata classe j si chiama frequenza della classe e viene indicato con f j. 7 8 Il raggruppamento in k classi o sottogruppi, G...G j...g k, avviene secondo il valore, ad esempio se a è il minimo degli x i e b il massimo: Ad ogni classe G i è associato il numero di elementi che vi appartengono, f i. Si definisce frequenza relativa percentuale della classe il parametro: se x = b- a k x i G a+ ( j- ) x x < a+ j x i j f f i, = n pi f p,i è compreso nell'intervallo [-]% 9

Raggruppando per intervalli: La probabilità p i di ottenere la misura all interno dell intervallo che definisce la classe G i vale: p i = lim n fi n Limiti delle classi > di mm < di mm Valore centrale della classe Frequenza assoluta Frequenza Densità di percentuale frequenza x j (mm) f j f p = f j n (%) fp x Frequenza cumulata percentuale j f k (%) n k= 6,6 6,7 6,65 3,73,73,73 6,7 6,8 6,75 6 5,45,545 8,8 6,8 6,9 6,85,9,9 9,9 6,9 6, 6,95 3,9,9 4, 6, 6, 6,5 6 3,64,364 63,64 6, 6, 6,5 9,9,99 8,73 6, 6,3 6,5,, 9,73 6,3 6,4 6,35 6 5,45,545 98,8 6,4 6,5 6,45,8,8, Rappresentazione dei dati raggruppati in classi Nell esempio precedente per ognuna delle classi G i è stata definita la probabilità p i che una misura appartenga all intervallo della classe i- esima. 3 4

La densità di probabilità è l insieme delle probabilità p i assegnate alle k classi. La rappresentazione della densità di probabilità può essere fatta o con l istogramma delle frequenze o con il poligono delle frequenze, cioè mediante k punti discreti. 5 Per variabili discrete valgono le seguenti relazioni: K p = ; p = p i= i st, i= s k k i i i i i= i= µ = px σ = p( x µ ) p s,t rappresenta la probabilità cumulata delle classi da s a t ovvero del verificarsi che : x x x s t i t 6 Frequenza_relativa [%] 4 8 6 4 8 6 4 % = Percentuale di dati con valore compreso in questa classe 6.65 6.45 valore centrale della classe 7 Frequenza relativa [%] 4 8 6 4 8 6 4 Poligono delle frequenze G 6.6 6.7 6.8 6.9 6. 6. 6. 6.3 6.4 6.5 x [mm] 8

Un diagramma di tipo diverso si ottiene rappresentando le frequenze cumulate. In corrispondenza al limite superiore di ogni classe si riporta la frequenza relativa percentuale dei dati che hanno una misura inferiore a quel limite. Frequenze cumulate percentuali 9 8 7 6 5 4 3 N i= ( f ) = p i (Vedi pag. ) k = 4 k ( f p ) = i i= % dati che assumono valori minori di x k 9 6.7 6.8 6.9 6. 6. 6. 6.3 6.4 6.5 limite superiore della classe mm 3 frequenza relativa 4 8 6 4 8 6 4 distribuzione di Gauss Frequenza relativa LE DISTRIBUZIONI DI PROBABILITA 6.6 6.7 6.8 6.9 6. 6. 6. 6.3 6.4 6.5 x (mm) 3 3

Variabili continue Nell esempio precedente se si considera la variabile altezza (prescindendo dalla sua misura) quello che si ottiene è una variabile continua. Ogni valore dell altezza è possibile e la distribuzione di probabilità è rappresentata da una funzione continua. 33 34 LA DISTRIBUZIOINE GAUSSIANA O NORMALE Il teorema limite centrale afferma che la distribuzione gaussiana permette di descrivere in maniera soddisfacente tutti quei fenomeni fisici caratterizzati dalla sovrapposizione di un elevato numero di effetti deboli indipendenti aventi loro natura statistica a media nulla. 35 36

Distribuzione gaussiana (o normale) ( x ) µ σ f(x) = σ π e Esempio: distribuzione della variabile somma probabilità di a B = a A = b B = b A = 5% probabilità di a B + b B = 5% probabilità valore basso = 5% probabilità di a B + b A = 5% probabilità valore medio = 5% probabilità di a A + b B = 5% probabilità di a A + b A = 5% probabilità valore alto = 5% f(x) σ π Distribuzione di a a B a A Distribuzione di b Distribuzione di a+b µ b σ 37 B b A 38 frequenza relativa 4 8 6 4 8 6 4 distribuzione di gauss Frequenza relativa 6.6 6.7 6.8 6.9 6. 6. 6. 6.3 6.4 6.5 x (mm) 39 Distribuzione normale standard z= x - µ f(z) = σ σ Il valor medio è nullo e la varianza è pari ad σ f(z). 4. 3.. -5 z π e 5 4

F(z) = p(z i z) Frequenze cumulate.4.3. Utilità della funzione cumulativa: F(z ) F(z) = p(z i z).9.8.7.6.5.4 F (z).9.8. -5 5 F(z ).3...7.6.5.4.3.. -3 - - 3 z Grafico delle Frequenze cumulate Il valor medio è in corrispondenza del 5% di probabilità cumulata 4-3 - - 3 z p(z i [z,z ]) = p(z i < z ) - p(z i < z ) p(z i [z,z ]) = F(z ) - F(z ) z z 4 Distribuzione di probabilità simmetrica: ( < z) = ( > z) pz i ( z) pz i p z i > = ( F( z)) Valori notevoli.9.8.7.6.5.4.3 p(z i >z) p(z i <z) = F(z).. z -3 - - 3. 4 ANALISI DEI DATI A CAMPIONE p( x µ < σ) = 68. p( x µ < σ) =. 95 p( x µ < 3σ) =. 997. 3.. -5 z 43 5 44

I modelli di distribuzione statistica permettono di determinare la probabilità che ha una singola misura di avere un certo scarto dal valore medio. Si pensi di estrarre dalla totalità delle misure (universo) alcuni campioni costituiti ciascuno da n elementi. Le medie dei campioni, considerate come variabili statistiche hanno una dispersione inferiore a quella dei singoli elementi. 45 46 Data una distribuzione qualsiasi di elementi con media m e scarto quadratico s, se si raggruppano gli elementi a caso in campioni sufficientemente numerosi, n= 5-6, la distribuzione delle medie segue quasi fedelmente la legge di distribuzione normale (di Gauss). 47 Inoltre la media di tali medie è ancora m e lo scarto quadratico si riduce a: σ(x) = σ (x) n per questo motivo è sempre opportuno ripetere più volte una misura e prendere come migliore stima il valore medio 48

Esclusione dei valori meno probabili Il criterio di Chauvenet Nel campo dell analisi sperimentale è frequente trovare, in una serie di misure, qualche dato che non concorda con gli altri. Il criterio di Chauvenet dà la possibilità di formulare un giudizio di accettazione dei dati in base a considerazioni di tipo statistico. 49 5 CRITERIO DI CHAUVENET In una serie di n dati sperimentali, se alcuni valori presentano uno scostamento dal valore medio che ha probabilità di verificarsi inferiore di /(n), allora quei valori devono essere scartati. Scarto ridotto x x, s, si = x i - s determinare z: z s i s z i > Si F p = ( z) n =.5 n SCARTARE IL DATO 5 5

La spiegazione discende da semplici considerazioni sulla distribuzione:.5 n.9.8.7.6 ANALISI DELLA NORMALITA DI UNA DISTRIBUZIONE.5 n.5.4.3.. -z z -3 - - 3 z Il grafico di probabilità normale Il test del chi-quadro I valori appartenenti a questo intervallo esterno possono essere eliminati (si noti che la probabilità associata ai due semi-intervalli è effettivamente pari a /n) 53 54 grafico di probabilità normale IL GRAFICO DI PROBABILITÀ NORMALE Si vuole verificare se la distribuzione dei dati sperimentali può essere rappresentata mediante la legge di Gauss o meno. 55.9.8.7.6.5.4.3.. -3 - - 3 Cambio scala sulle ordinate y.99.98.95.9.5..5.. -3 - - y 3 Si ottiene una retta 56

x x s = s x x x = x s s 3 x x3.99.98.95.9.5.99.98.95.9 Distribuzione iper-normale..5.5.. x x x 3 x..5.. 57 58 Distribuzione ipo-normale Distribuzione asimmetrica.99.98.95.9.99.98.95.9.5.5..5....5.. 59 6

Distribuzione bimodale IL TEST DEL χ.99.98.95.9.5..5.. Permette di valutare quantitativamente, su base statistica, se una serie di dati appartiene ad un tipo di distribuzione (non necessariamente normale). 6 6 IL TEST DEL Χ PROCEDURA ( o j aj) χ K = f f j= fa K è il numero di classi in cui si sono suddivisi i dati f oj è la frequenza assoluta osservata per la classe j f aj è la frequenza assoluta aspettata in base alla distribuzione che si vuole provare j 63 ) Calcolare: K ( j aj) χ = f o f j= f a j 64

PROCEDURA ) Definire il rischio d errore α e calcolare: PROCEDURA 3) Calcolare il numero di gradi di libertà ν : p α α =, p = ν = K 3 65 66 PROCEDURA 4) Dalle tabelle determinatre: (, ), (, ) χ p ν χ p ν 5) Eseguire il test: PROCEDURA (, ) < < (, ) χ p ν χ χ p ν Se verificato, non vi sono ragioni statistiche, per rifiutare il modello di distribuzione sottoposto a test. 67 68