Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 27
Outline 1 () Statistica 2 / 27
Outline 1 2 () Statistica 2 / 27
Outline 1 2 3 () Statistica 2 / 27
Variabile Una v.c. continua X una v.c. o Gaussiana, di parametri µ e σ 2, se definita la funzione di densità f(x 0 ) = 1 1 (x µ) 2 2πσ 2 e 2 σ 2 con < x < +, X N(µ, σ 2 ) E possibile definire il valore atteso e la varianza della che corrispondono ai parametri della distribuzione, dal momento che E(X) = µ e V ar(x) = σ 2 () Statistica 3 / 27
Variabile Standardizzata Data la v.c. continua XÑ(µ, σ2 ), la standardizzazione di X, ovvero Z = X µ σ rappresenta la Standardizzata ZÑ(0, 1), con funzione di densità φ(z) = 1 2π e 1 2 w2 dw ; < z < + I valori della funzione di ripartizione (funzione di distribuzione cumulata) della standardizzata sono riportate sulle tavole statistiche. () Statistica 4 / 27
La v.c. () Statistica 5 / 27
La v.c. In seguito ad uno studio interno di un istituto bancario è stato rilevato che i tempi di attesa per le operazioni di sportello si distribuiscono secondo una con media pari a 20 e varianza pari a 9. Qual è la probabilità che il tempo di attesa... superi i 25 minuti; sia inferiore ai 16 minuti; sia compreso tra 18 e 21 minuti. () Statistica 6 / 27
La v.c. superi i 25 minuti; () Statistica 7 / 27
La v.c. superi i 25 minuti; la prima operazione da fare è standardizzare il problema 25 20 z = = 1.667 3 A questo punto è possibile utilizzare le distribuzione stardizzata per trovare la probabilità di interesse. () Statistica 8 / 27
La v.c. superi i 25 minuti; la prima operazione da fare è standardizzare il problema 25 20 z = = 1.667 3 A questo punto è possibile utilizzare le distribuzione stardizzata per trovare la probabilità di interesse. () Statistica 8 / 27
La v.c. superi i 25 minuti; la prima operazione da fare è standardizzare il problema 25 20 z = = 1.667 3 A questo punto è possibile utilizzare le distribuzione stardizzata per trovare la probabilità di interesse. () Statistica 8 / 27
La v.c. superi i 25 minuti; la prima operazione da fare è standardizzare il problema 25 20 z = = 1.667 3 A questo punto è possibile utilizzare le distribuzione stardizzata per trovare la probabilità di interesse. P (Z 1.66) = 1 P (Z 1.66) = 1 0.95254 = 0.047 () Statistica 8 / 27
La v.c. sia inferiore a 16 minuti; () Statistica 9 / 27
La v.c. sia inferiore a 16 minuti; la prima operazione da fare è standardizzare il problema 16 20 z = = 1.33 3 A questo punto è possibile utilizzare le distribuzione stardizzata per trovare la probabilità di interesse. () Statistica 10 / 27
La v.c. sia inferiore a 16 minuti; la prima operazione da fare è standardizzare il problema 16 20 z = = 1.33 3 A questo punto è possibile utilizzare le distribuzione stardizzata per trovare la probabilità di interesse. () Statistica 10 / 27
La v.c. sia inferiore a 16 minuti; la prima operazione da fare è standardizzare il problema 16 20 z = = 1.33 3 A questo punto è possibile utilizzare le distribuzione stardizzata per trovare la probabilità di interesse. P (Z 1.33) = P (Z 1.33) = 0.90824 () Statistica 10 / 27
La v.c. sia compreso tra 18 e 21 minuti; () Statistica 11 / 27
La v.c. sia compreso tra 18 e 21 minuti; la prima operazione da fare è standardizzare il problema 18 20 21 20 z 1 = = 0.66 e z 1 = = 0.33 3 3 A questo punto è possibile utilizzare le distribuzione stardizzata per trovare la probabilità di interesse. () Statistica / 27
La v.c. sia compreso tra 18 e 21 minuti; la prima operazione da fare è standardizzare il problema 18 20 21 20 z 1 = = 0.66 e z 1 = = 0.33 3 3 A questo punto è possibile utilizzare le distribuzione stardizzata per trovare la probabilità di interesse. () Statistica / 27
La v.c. sia compreso tra 18 e 21 minuti; la prima operazione da fare è standardizzare il problema 18 20 21 20 z 1 = = 0.66 e z 1 = = 0.33 3 3 A questo punto è possibile utilizzare le distribuzione stardizzata per trovare la probabilità di interesse. () Statistica / 27
La v.c. sia compreso tra 18 e 21 minuti; la prima operazione da fare è standardizzare il problema 18 20 21 20 z 1 = = 0.66 e z 1 = = 0.33 3 3 A questo punto è possibile utilizzare le distribuzione stardizzata per trovare la probabilità di interesse. P ( 0.66 Z 0.33) = P (Z 0.33) P (Z 0.66) = P (Z 0.33) [1 P (Z 0.66)] = 0.629 (1.745) = 0.37 () Statistica / 27
La v.c. Si consideri una variabile X distribuita secondo una con µ = 8 e σ = 3. indicare i quartili della distribuzione; indicare il 95 o percentile; () Statistica 13 / 27
La v.c. Primo quartile () Statistica 14 / 27
La v.c. Secondo quartile=mediana=media () Statistica 15 / 27
La v.c. Terzo quartile () Statistica 16 / 27
La v.c. indicare i quartili della distribuzione Con l aiuto delle tavole è necessario trovare i valori corrispondenti a Z 0.25 Z 0.5 Z 0.75 Essendo una distribuzione, la mediana coincide con la media quindi Z 0.5 = 0.Utilizzando le tavole della distribuzione stardizzata per trovare i valori di Z restanti, Quindi... per la simmetria della curva risulta essere inoltre Z 0.25 = 0.675. Per trovare i valori corrispondenti della variabile X si utilizza la formula inversa di standardizzazione () Statistica 17 / 27
La v.c. indicare i quartili della distribuzione Con l aiuto delle tavole è necessario trovare i valori corrispondenti a Z 0.25 Z 0.5 Z 0.75 Essendo una distribuzione, la mediana coincide con la media quindi Z 0.5 = 0.Utilizzando le distribuzione stardizzata per trovare i valori di Z restanti, () Statistica 17 / 27
La v.c. indicare i quartili della distribuzione Con l aiuto delle tavole è necessario trovare i valori corrispondenti a Z 0.25 Z 0.5 Z 0.75 Essendo una distribuzione, la mediana coincide con la media quindi Z 0.5 = 0.Utilizzando le tavole della distribuzione stardizzata per trovare i valori di Z restanti, Quindi... P (Z Z 0.75 ) = 0.75 da cui Z 0.75 = 0.67+0.68 2 = 0.675 per la simmetria della curva risulta essere inoltre Z 0.25 = 0.675. Per trovare i valori corrispondenti della variabile X si utilizza la formula inversa di standardizzazione X 0.5 = 8 X 0.25 = Z 0.25 σ + µ = 0.675 3 + 8 = 5.975 X 0.75 = Z 0.75 σ + µ = 0.675 3 + 8 = 10.025 () Statistica 17 / 27
La v.c. indicare il 95 o percentile () Statistica 18 / 27
La v.c. indicare il 95 o percentile Con l aiuto delle tavole è necessario trovare il valore corrispondente a 0.95 Ricorrendo alle tavole... () Statistica 19 / 27
La v.c. indicare il 95 o percentile Con l aiuto delle tavole è necessario trovare il valore corrispondente a 0.95 Quindi... Z 0.95 = 1.64+1.65 2 = 1.645 Per ottenere il valore della variabile X X 0.95 = Z 0.95 σ + µ = 1.645 3 + 8 =.935 () Statistica 19 / 27
della Binomiale alla Sia X una variabile distribuita secondo una Binomiale di parametri n = 25 e p = 0.6. E possibile approssimare X con una v.c. continua Y N(µ, σ 2 ) dove µ = n p = 25 0.6 = 15 σ 2 = n p (1 p) = 25 0.6 0.4 = 6 σ = 6 = 2.45 Si supponga di essere interessati a P (X 13). calcolo Per utilizzare l approssimazione è necessario standardizzare il problema calcolo Binomiale Z = X µ 13 15 Utilizzando il calcolo Binomiale si ha σ = = 0.82 dunque, 2.45 P (X 13) P (Y 13) = P (Z 0.82) = 0.206 13 ( ) 25 P (X 13) = 0.6 x 0.4 25 x = x=0 x Effettuando una correzione di continuità pari a 0.5 = 0.267 X + 0.5 µ 13.5 15 Z = σ = = 0.61 2.45 P (X 13) P (Y 13.5) = P (Z 0.61) = 0.271 Evidentemente 0.271 rappresenta un approssimazione migliore di 0.267 rispetto a 0.206. () Statistica 20 / 27
della Binomiale alla Probabilità calcolate con p.m.f. Binomiale e con al c.d.f. : l area in blue rappresenta la probabilità che si perderebbe approssimando senza correzione della continuità: in particolare l area vale 0.267 0.206=0.061 () Statistica 21 / 27
della Binomiale alla Si consideri l esperimento consistente nel lancio di una moneta 0 volte. Trovare la probabilità che esca testa tra il 40% e il 60% dei lanci; più di dei 5 del totale dei lanci. 8 () Statistica 22 / 27
della Binomiale alla tra il 40% e il 60% dei lanci; () Statistica 23 / 27
della Binomiale alla tra il 40% e il 60% dei lanci; È possibile determinare tale probabilità in due modi diversi. Il primo modo consiste nell utilizzare l approssimazione della binomiale alla. La v.c. numero di teste in 0 lanci si distribuisce come una binomiale di parametri (n = 0, p = 1 2 ). Il numero di successi corrispondenti al 40% del totale di 0 prove è 48, mentre il 60% corrisponde a 72. correzione della continuità La v.c. numero di teste è discreta,anche se approssimata da una v.c. continua. Si è interessati alla probabilità che essa assuma valori compresi nell interallo [47.5, 72.5] al fine di includere nel calcolo gli estremi 48 e 72. I parametri della cui si approssima la binomiale sono µ = np = 0 1 2 = 60 e σ = np(1 p) = 0 1 1 2 2 = 5.48. Standardizzando i valori z 1 = 47.5 60 5.48 = 2.28 e z 2 = 72.5 60 5.48 = 2.28 Dalla simmetria della, segue che P ( 2.28 <= X <= 2.28) = 2 P (0 <= X <= 2.28) = 2 0.4887 = 0.9774. () Statistica 24 / 27
della Binomiale alla Il secondo metodo consiste nel ricorrere alla distribuzione delle proporzioni p(1 p) campionarie, la cui media è data da µ p = p e σ p = N. Rispetto ai dati del problema µ p = p = 0.5 e σ p = 0.25 0 = 0.0456. Standardizzando il problema rispetto ai parametri della distribuzione campionaria z 1 = 0.4 0.5 0.0456 = 2.19 e z 0.6 0.5 2 = 0.0456 = 2.19 La probabilità corrispondente è P ( 2.19 <= X <= 2.19) = 2 P (0 <= X <= 2.19) = 2 0.4857 = 0.9714. correzione di continuità Il risultato non coincide con quanto ottenuto utilizzando l approssimazione della binomiale alla perchè la v.c. proporzione è una variabile discreta. Per tenere conto di questo bisogna sottrarre (1/2N) = 1/(2 0) = 0.00417 a 0.4 ed aggiungere la stessa quantità a 0.6. Pertanto gli estremi dell intervallo di valori standardizzati è z 1 = 0.4 0.00417 0.5 0.0456 = 2.28 e z 2 = Che porta alla coincidenza tra i risultati nei due metodi. 0.6 + 0.00417 0.5 0.0456 = 2.28 () Statistica 25 / 27
della Binomiale alla più di dei 5 8 del totale dei lanci. () Statistica 26 / 27
della Binomiale alla più di dei 5 del totale dei lanci. 8 La proporzione corrispondente a 5 = 0.6250. Standardizzando il problema 8 tenendo conto del fatto che la proporzione è una variabile discreta si ottiene z = 0.6250 0.00417 0.5 0.0456 = 2.65 La probabilità corrispondente è P (z >= 2.65) = 1 P (z < 2.65)=1-0.996=0.004 () Statistica 27 / 27