STATISTICA I modelli probabilistici e l inferenza
Linguaggio della probabilità Datida un campione casuale Modello probabilistico (binomiale e gaussiano)
Linguaggio della probabilità Datida un campione casuale Modello probabilistico (binomiale e gaussiano) parametri noti Clinica per figlie femmine Altezza delle donne esercito US Tempo d attesa della pizza Astronauti
Linguaggio della probabilità Datida un campione casuale Modello probabilistico (binomiale e gaussiano) parametri non noti Clinica per figlie femmine Altezza delle donne esercito US Tempo d attesa della pizza Astronauti
W la gaussiana! ~, =+~ +, ~, ~, + ~ +, +
W la gaussiana! ~, =+~ +, ~, ~, + ~ +, + ~, ~, ( ) + ~ 2,2 + 2 ~, 2
W la gaussiana! ~, =+~ +, ~, ~, + ~ +, +,,, ~, + + + ~!,! "' = " #+" $ + +" ~ %, &$
W la gaussiana! ~, =+~ +, ~, ~, campione casuale + ~ +, +,,, ~, + + + ~!,! "' = " #+" $ + +" ~ %, &$
un inciso importante se, / 1 =, /,(1) <,*< + si ha che, < e *< + =,(< ),(*< +)
Esempio all arsenico, II Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Sapendo che la legge impone una soglia massima per l arsenico di 10 g/l, si può affermare che l'acqua potabile di Milano non è a norma di legge?
Esempio all arsenico, II Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Sapendo che la legge impone una soglia massima per l arsenico di 10 g/l, si può affermare che l'acqua potabile di Milano non è a norma di legge? 5 = 15+12.5+7.0+13.0+7.5 5 =11 g/l>10g/l è un risultato attendibile per tutta l acqua di Milano?
Esempio all arsenico, II Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Sapendo che la legge impone una soglia massima per l arsenico di 10 g/l, si può affermare che l'acqua potabile di Milano non è a norma di legge? Sia la variabile che descrive la quantità di arsenico in un campione di acqua milanese. Supp. "~ %,& $ con % incognita e = 1.6 g/l (semplificazione momentanea)
Esempio all arsenico, II Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Sapendo che la legge impone una soglia massima per l arsenico di 10 g/l, si può affermare che l'acqua potabile di Milano non è a norma di legge? Sia la variabile che descrive la quantità di arsenico in un campione di acqua milanese. Supp. "~ %,& $ con % incognita e = 1.6 g/l (semplificazione momentanea) 1. Usiamo?' =## come stima di % ~ 11,1.6
Esempio all arsenico, II Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Sapendo che la legge impone una soglia massima per l arsenico di 10 g/l, si può affermare che l'acqua potabile di Milano non è a norma di legge? Sia la variabile che descrive la quantità di arsenico in un campione di acqua milanese. Supp. "~ %,& $ con % incognita e = 1.6 g/l (semplificazione momentanea) 1. Usiamo?' =## come stima di % ~ 11,1.6 2.,,, @ variabili i.i.d, ~" A @ ~ ##,#.B $ C
Esempio all arsenico, II Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Sapendo che la legge impone una soglia massima per l arsenico di 10 g/l, si può affermare che l'acqua potabile di Milano non è a norma di legge? Sia la variabile che descrive la quantità di arsenico in un campione di acqua milanese. Supp. "~ %,& $ con % incognita e = 1.6 g/l (semplificazione momentanea) 1. Usiamo?' =## come stima di % ~ 11,1.6 2.,,, @ variabili i.i.d. ~ A @ ~ ##,#.B $ C 3., A @ >10 =, F A G H > JH.I/ @.I/ @ =O.P$ =, K> 1.40 =1 Φ 1.40 =
Esempio all arsenico, II Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Sapendo che la legge impone una soglia massima per l arsenico di 10 g/l, si può affermare che l'acqua potabile di Milano non è a norma di legge? Sia la variabile che descrive la quantità di arsenico in un campione di acqua milanese. Supp. "~ %,& $ con % incognita e = 1.6 g/l (semplificazione momentanea) Se la stima 5 'di % è corretta, 1. Usiamo?' =## come stima di % ~ 11,1.6 il 92% dei campioni indica un contenuto 2.,,, @ variabili i.i.d. medio ~ A di As @ ~ fuori ##,#.B legge $ C 3., A @ >10 =, F A G H > JH.I/ @.I/ @ =O.P$ =, K> 1.40 =1 Φ 1.40 =
La media campionaria Siano,,, variabili casuali i.i.d A = + + +! media campionaria: v.c. chepredice il valore della media aritmetica dei dati nel campione
La media campionaria Siano,,, variabili casuali i.i.d A = + + +! media campionaria: v.c. chepredice il valore della media aritmetica dei dati nelcampione. E unostimatoredellamedia [(" ),,, successione di v.a. i.i.d con media Q = finita. 5 = 5 +5 + + 5! S TUVW *XYZ!Y
Legge (forte) dei grandi numeri Bern(0.5) 0.0 0.2 0.4 0.6 0 200 400 600 800
Legge (forte) dei grandi numeri Bern(0.5) Bern(0.5) 0 200 400 600 800 Bern(0.5) Bern(0.5) 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.0 0.2 0.4 0.6 0.0 0.2 0.4 0 200 400 600 800 0 200 400 600 800 0 200 400 600 800
La media campionaria Siano,,, variabili casuali i.i.d A = + + +! media campionaria Se ~, A ~ %, &$ A stimatore di % Se ~ \ A ~ 1! 1W!!,\ A stimatore di
La media campionaria Siano,,, variabili casuali i.i.d A = + + +! media campionaria Se ~, A ~ %, &$ Se ~ \ A ~ 1! 1W!!,\ Se C & (# ) C A ~, (# )
La media campionaria Siano,,, variabili casuali i.i.d A = + + +! media campionaria Se ~, A ~ %, &$ Se ~ \ A ~ 1! 1W!!,\ Teo. Centrale del Limite Se " ~???& >`O A ~ [(" # ), abc(" #)
Binomiale e Gaussiana Il Genetics and IVF Institute di Fairfax in Virginia ha sviluppato una tecnica in grado, sostengono, di aumentare la probabilità per una coppia di avere una figlia femmina. Di 140 coppie su cui è stata messa in atto, 90 hanno avuto una femmina. variabile casuale che dice il sesso del neonato: 1=F, 0=M, =1 =\,, =0 =T=1 \, *e! TUf*g Y*!W* è una variabile bernoulliana di parametro \ (0,1) + + + dj conta il numero di F nei 140 parti i = + + + è una variabile Binomiale: 1W!(!,\) Se \=0.5,!=140, i dj =90 = dj! lj! djhlj! 0.5lJ (1 0.5) djhlj =0.000213747
Binomiale e Gaussiana 1W!(140,0.5) 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0 20 40 60 80 100 120 140
un promemoria Quando! è grande, sono moltissimi i valori m tali che, =m =0, perché c è il vincolo della somma=1! Per questo è meglio guardare=m e \WU piuttosto che solo =m. 0.00 0.05 0.10 0.15 0.20!=14 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07!=140 0 2 4 6 8 10 12 14 0 20 40 60 80 100 120 140
Binomiale e Gaussiana 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 1W!(140,0.5) (140 0.5,140 0.5 0.5) 0 20 40 60 80 100 120 140
Binomiale e Gaussiana Il Genetics and IVF Institute di Fairfax in Virginia ha sviluppato una tecnica in grado, sostengono, di aumentare la probabilità per una coppia di avere una figlia femmina. Di 140 coppie su cui è stata messa in atto, 90 hanno avuto una femmina. Se \=0.5,!=140 o p #qo PO =, r stu dj lj dj =, A dj 0.64 A ~ O.C, O.C(# O.C) #qo, K 0.64 0.5 0.5 0.5 140 =, K 3.31 = =1, K<3.31 =1 0.9995=0.0005 La tecnica sembra funzionare: in condizioni naturali avere 90 o più F in 140 parti ha una probabilità bassissima.
Binomiale e Gaussiana Il Genetics and IVF Institute di Fairfax in Virginia ha sviluppato una tecnica in grado, sostengono, di aumentare la probabilità per una coppia di avere una figlia femmina. Di 140 coppie su cui è stata messa in atto, 90 hanno avuto una femmina. Se \=0.5,!=140, i dj 90 =, r stu dj lj dj =, A dj 0.64 A ~ O.C, O.C(# O.C) #qo, K 0.64 0.5 0.5 0.5 140 =, K 3.31 = =1, K<3.31 =1 0.9995=0.0005 La tecnica sembra funzionare: in condizioni naturali avere 90 o più F in 140 parti ha una probabilità bassissima. \ = 90 140 =0.643
Media campionaria come stimatore Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Abbiamo usato?' =## (xb bcxb) come stima di [(" # ) A stimatore di [(" # ), 5 stima di [(" # ) Il Genetics and IVF Institute di Fairfax in Virginia ha sviluppato una tecnica in grado, sostengono, di aumentare la probabilità per una coppia di avere una figlia femmina. Di 140 coppie su cui è stata messa in atto, 90 hanno avuto una femmina. Usiamo 5 ' = lj =0.64=64% (proporzione osservata) come stima dj della proporzione di F che si ottiene con l uso della tecnica del IVF. N.B. =[ " #
Media campionaria come stimatore Perchè ci serve uno stimatore, e Durante le verifiche sulla qualità dell'acqua non potabile ci basta di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, stima? 7.5 g/l. Abbiamo usato?' =## (xb bcxb) come stima di [(" # ) A stimatore di [(" # ), 5 stima di [(" # ) Il Genetics and IVF Institute di Fairfax in Virginia ha sviluppato una tecnica in grado, sostengono, di aumentare la probabilità per una coppia di avere una figlia femmina. Di 140 coppie su cui è stata messa in atto, 90 hanno avuto una femmina. Usiamo 5 ' =\ = lj =0.64=64% (proporzione osservata) come dj stima della proporzione di F che si ottiene con l uso della tecnica del IVF. N.B. =[ " #
Media campionaria come stimatore Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Abbiamo usato?' =## (xb bcxb) come stima di [(" # ) se fossimo andati a raccogliere i campioni in altri punti dell acquedotto, avremmo avuto altri valori, e una stima diversa
Media campionaria come stimatore Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Abbiamo usato?' =## (xb bcxb) come stima di [(" # ) se fossimo andati a raccogliere i campioni in altri punti dell acquedotto, avremmo avuto altri valori, e una stima diversa A @ ~ z.`,#.b $ C, A @ >10 =, F A G H{. > JH{..I/ @.I/ @ =, K>2.37 =1 Φ 2.37 =O.OOP!
Media campionaria come stimatore Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Abbiamo usato?' =## (xb bcxb) come stima di [(" # ) se fossimo andati a raccogliere i campioni in altri punti dell acquedotto, avremmo avuto altri valori, e una stima diversa A @ ~ z.`,#.b $ C Per dire qualcosa attorno all incertezza sulla stima ci serve la variabile casuale stimatore!, A @ >10 =, F A G H{. > JH{..I/ @.I/ @ =, K>2.37 =1 Φ 2.37 =O.OOP!
Inferenza sulla media di una popolazione 17/10/2016, su un quotidiano on-line: Sì: 33.8% No: 37.0% Indeciso: 29.2% «Ed è per questo che,, la sfida del 4 dicembre si giocherà sul filo dei decimali. Anche perché tutti i sondaggi che vengono pubblicati da giornali e tv in queste settimane hanno come sempre un margine d errore del 3 per cento.»
Inferenza sulla media di una popolazione 17/10/2016, su un quotidiano on-line: Sì: =33.8% No: =37.0% Indeciso: 29.2% ~ ( )(sì/ sì) «Ed è per questo che,, la sfida del 4 dicembre si giocherà sul filo dei decimali. Anche perché tutti i sondaggi che vengono pubblicati da giornali e tv in queste settimane hanno come sempre unmargine d errore del 3 per cento.» ~ (no/ no) No 37.0% 33.8% Sì
Inferenza sulla media di una popolazione 17/10/2016, su un quotidiano on-line: Sì: =33.8% No: =37.0% Indeciso: 29.2% ~ ( ) «Ed è per questo che,, la sfida del 4 dicembre si giocherà sul filo dei decimali. Anche perché tutti i sondaggi che vengono pubblicati da giornali e tv in queste settimane hanno come sempre unmargine d errore del 3 per cento.» ~ ( ) No 3% 37.0% +3% 3% 33.8% Sì +3%
Inferenza sulla media di una popolazione 17/10/2016, su un quotidiano on-line: Sì: =33.8% No: =37.0% Indeciso: 29.2% ~ ( ) «Ed è per questo che,, la sfida del 4 dicembre si giocherà sul filo dei decimali. Anche perché tutti i sondaggi che vengono pubblicati da giornali e tv in queste settimane hanno come sempre unmargine d errore del 3 per cento.» ~ ( ) No 3% 37.0% +3% 3% 33.8% Sì +3%
valore giornaliero di PM10 = 63 + 45 + 46 + 37 + 48 5 = 47.8 e il margine di errore?
Inferenza sulla media di una popolazione (,!,, ) {34,19,6,12, 24,12,20,27,33,29} campionecasuale 0 stimatore di, 0 ~+,, -!,!,, i.i.d possibili osservazioni ~+(,, -! ) modello, con. / nota Intervallo di confidenza di livello 9 6 Contiene il vero valore della media della popolazione,,, con probabilità 9 6 1 23 4 56 /. / 4, 2 3 4 +56 /. / 4 = 1 8
Inferenza sulla media di una popolazione 23 4 56 /. / 4, 2 3 4 +56 /. / 4 E ilmodellocheprevedetuttii possibili intervalli di confidenza di livello 1 8 100 campioni 100 intervalli di confidenza di liv. 1 8 = 0.95 95 contengono il vero valoredi, possiamoaverefiducia che il nostro intervallo sia uno di questi.
Inferenza sulla media di una popolazione (,!,, ) {34,19,6,12, 24,12,20,27,33,29} campionecasuale 0 stimatore di, 0 ~+,, -!,!,, i.i.d possibili osservazioni ~+(,, -! ) modello, con. / nota Intervallo di confidenza di livello 9 6 Contiene il vero valore della media della popolazione,,, con probabilità 9 6 1 23 4 56 /. / 4, 2 3 4 +56 /. / 4 = 1 8
Inferenza sulla media di una popolazione (,!,, ) {34,19,6,12, 24,12,20,27,33,29} campionecasuale 0 stimatore di, 0 ~+,, -!,!,, i.i.d possibili osservazioni ~+(,, -! ) modello, con. / nota Intervallo di confidenza di livello 9 6 Contiene il vero valore della media della popolazione,,, con probabilità 9 6 8 = 0.05 1 8 = 0.95 56 / = 5 :.:/; = 9. <= 1 23 4 56 /. / 4, 2 3 4 +56 /. / 4 = 1 8 56 / 8 = 0.001 1 8 = 0.999 = 5 :.:::; = >. /<:;
Inferenza sulla media di una popolazione (,!,, ) {34,19,6,12, 24,12,20,27,33,29} campionecasuale 0 stimatore di, 0 ~+,, -!,!,, i.i.d possibili osservazioni ~+(,, -! ) modello, con. / nota Intervallo di confidenza di livello 9 6 Contiene il vero valore della media della popolazione,,, con probabilità 9 6 1 23 4 56 /. / 4, 2 3 4 +56 /. / 4 = 1 8 margine d errore
Inferenza sulla media di una popolazione (? 9,? /,,? 4 ) {>@, 9<, =, 9/, /@, 9/, /:, /A, >>, /<}campionecasuale 0 stimatore di, 0 ~+,, -!,!,, i.i.d possibili osservazioni ~+(,, -! ) modello, con. / nota 1 23 4 56 /. / 4, 2 3 4 +56 /. / 4 = 1 8 = 10 -! = 100,B/D E! 8 = 0.05, F G.G!? 3 = /9. = HI/J > = 1.96 /9. = 9. <= 9:: 9:, /9. = + 9. <= 9:: 9: 9;. @:, /A. K: HI/J >
Inferenza sulla media di una popolazione (? 9,? /,,? 4 ) {>@, 9<, =, 9/, /@, 9/, /:, /A, >>, /<}campionecasuale 0 stimatore di, 0 ~+,, -!,!,, i.i.d possibili osservazioni ~+(,, -! ) modello, con. / nota 1 23 4 56 /. / 4, 2 3 4 +56 /. / 4 = 1 8 = 10 -! = 100,B/D E! 8 = 0.05, F G.G = 1.96! 3 = 21.6,,B/D E /9. = 9. <= 9:: 9:, /9. = + 9. <= 9:: 9: =. / HI/J > è il margine d errore