Distribuzioe ormale o gaussiaa Ua variabile radom si dice distribuita ormalmete (o secodo ua curva gaussiaa) se la sua fuzioe di desità di probabilità è del tipo: f () ( ) ep co - rappreseta il valore cetrale, che i questo caso corrispode ache alla media della distribuzioe, metre è la variaza. I molti casi si preferisce itrodurre per praticità la variabile radom Z, espressa dalla relazioe: Z = X Se X è distribuita ormalmete ache Z lo è e la sua fuzioe di desità di probabilità è data da: f (z) ep z co - z ota come fuzioe di desità di probabilità ormale stadard.
f(z) è ua curva simmetrica cetrata sul valore 0 e co variaza e spesso viee idicata co la otazioe N(0,) Come per ogi fuzioe desità di probabilità ache per f(z) vale la relazioe: f (z)dz La probabilità che la variabile radom Z sia compresa fra due valori z e z, P(z z z ), corrispode all area sottesa dalla curva gaussiaa fra i due valori ed è calcolabile dalla relazioe: z z f ( z ) dz L itegrale, detto Q, di f(z) fra e u certo z Q corrispode alla frequeza cumulativa relativa per tale z Q (quatile).
Il calcolo di P può essere effettuato ache a partire dalla curva di distribuzioe ormale stadard, F(z): F(z) z ep z dz -3 ifatti la probabilità che la variabile Z sia iferiore ad u geerico valore z Q è data direttamete da F(z Q ), metre P(z z z ) = F(z ) - F(z ) Gli itervalli di valori di z del tipo, co itero, delimitao porzioi caratteristiche dell area sottesa alla curva gaussiaa stadard. I particolare: fra z = - e z = è racchiuso il 68.3 % dell area sottesa totale; fra z = - e z = il 95.4 % fra z = -3 e z = 3 il 99.7 %
Ragioi dell importaza della curva gaussiaa Ci soo almeo quattro ragioi che giustificao l uso esteso della curva gaussiaa per le variabili radom: l esperieza pratica mostra che la curva gaussiaa è la più appropriata per descrivere la misura di molte gradezze chimicofisiche; la distribuzioe gaussiaa è stata studiata a fodo ed i suoi valori soo facilmete accessibili i forma di tavole; molte teciche statistiche basate sulla distribuzioe ormale soo statisticamete robuste, ossia rimagoo approssimativamete corrette ache i preseza di scostameti ragioevolmete gradi dalla ormalità; i virtù del Teorema del Limite Cetrale, molte distribuzioi campioarie appaioo essere gaussiae a prescidere dalla distribuzioe effettiva della popolazioe a cui si riferiscoo, purché le dimesioi del campioe (ossia il umero dei dati cosiderati) siao sufficietemete elevate.
Il teorema del limite cetrale, dimostrato el 9 dal matematico e statistico filadese Jarl Waldemar Lideberg, afferma che: date le variabili radom X, X, X, ciascua delle quali caratterizzata da ua media i e variaza i, la variabile data dalla loro somma tede ad ua distribuzioe ormale di media S i i e variaza S i i al tedere di ad ifiito. Si oti che le variabili X i del teorema potrebbero essere rappresetate ache da valori derivati da ua stessa popolazioe, duque essere distribuite allo stesso modo. Le fluttuazioi elle misure aalitiche, dovute a foti diverse (strumetali, ambietali, umae, ecc.), possoo essere cosiderate derivati dalla combiazioe lieare di compoeti diverse aveti distribuzioi idipedeti. Per il Teorema del Limite Cetrale tale combiazioe, e quidi l errore radom ad essa legato, può avere ua distribuzioe ormale.
Nella figura mostrata a lato si mostra l effetto della combiazioe fra u certo umero di valori (da a 50) estratti dalla stessa distribuzioe i due casi diversi: siistra) distribuzioe uiforme fra i valori 0 e ; destra) distribuzioe uiforme fra 0 e 0.5 e fra 0.75 e e ulla altrove. I grafici soo stati costruiti simulado di ripetere il processo 0000 volte. Si oti che per quato straa possa essere la distribuzioe iiziale, l esito è sempre ua distribuzioe gaussiaa. 50
Distribuzioe chi-quadro (c ) Si dice che ua variabile radom X è distribuita secodo ua distribuzioe c co gradi di libertà (ua fuzioe scoperta dall ottico Erst Abbe el 863) se la sua curva di desità di probabilità è data da: f / ( ) / -/ e G( /) co > 0 e 0 + G è la fuzioe gamma: Γ(m) e - m 0 d Media di ua distribuzioe c : Variaza di ua distribuzioe c :
Proprietà pricipali della distribuzioe chi-quadro date le variabili radom X, X,,X, ciascua distribuita secodo ua distribuzioe ormale stadard N(0,), la variabile data dalla somma dei loro quadrati è distribuita secodo ua distribuzioe c co - gradi di libertà (c - ) date le variabili radom X, X,,X, ciascua distribuita secodo ua distribuzioe ormale N(, ), la variabile S i (X i - X ) / = (-)s / è distribuita ach essa come ua c co - gradi di libertà se le variabili X e X soo distribuite idipedetemete come c e c, la variabile data dalla loro somma è distribuita come c +.
Distribuzioe t di Studet Ua distribuzioe t di Studet (William S. Gosset, 908) a gradi di libertà è descritta matematicamete dalla seguete fuzioe di desità di probabilità: f ( ) ( ) / G ( ) / G( / ) ( ) / co: Γ(m) e - 0 m d La distribuzioe t di Studet è simmetrica itoro al valore = 0 ha ua variaza V() = /(-) se >, altrimeti è ifiita tede ad ua distribuzioe gaussiaa per che tede ad ifiito.
Proprietà fodametale della distribuzioe t di Studet: se A e B soo due variabili radom idipedeti, distribuite rispettivamete come N(0,) e c, la variabile radom Z = A/(B/)/ è distribuita secodo ua fuzioe t di Studet co gradi di libertà. Poiché per ua variabile X ~ N(, ) la variabile radom: X / è distribuita secodo ua curva ormale stadard, N(0,), metre la variabile radom: ( )s è distribuita secodo ua distribuzioe c -, la variabile radom: (X ) /( / ) / ( )s / ( ) s / è distribuita secodo t -. X
Distribuzioe F Si dice che ua variabile radom è distribuita secodo ua distribuzioe F (ome attribuitole i oore dello statistico iglese Sir Roald Fisher, che la itrodusse el aalisi della variaza el 94) co gradi di libertà ed se la sua curva di desità di probabilità è del tipo: / () f G G G f()
Date le variabili radom A e B, distribuite rispettivamete secodo c e c, la variabile (A/ )/(B/ ) è distribuita secodo ua distribuzioe F,. Se duque X e Y soo variabili radom distribuite rispettivamete secodo curve gaussiae N(, ) e N(, ) e, quidi, le variabili ( -)s / e ( -)s / soo distribuite rispettivamete secodo c - e c -, la variabile (s / )/(s / ) è distribuita secodo ua fuzioe F co gradi di libertà -, -.