STATISTICA. I modelli probabilistici e l inferenza

Похожие документы
CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

STATISTICA ESERCITAZIONE

Esercitazione 8 maggio 2014

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

Verifica delle ipotesi

ESAME. 9 Gennaio 2017 COMPITO B

1.1 Obiettivi della statistica Struttura del testo 2

Intervalli di confidenza

Esempio (Azzalini, pp. 6-15)

Il campionamento e l inferenza. Il campionamento e l inferenza

Quanti soggetti devono essere selezionati?

Probabilità e Statistica

Statistica Metodologica

COGNOME.NOME...MATR..

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

Distribuzioni campionarie

LE DISTRIBUZIONI CAMPIONARIE

Esercizi riassuntivi di Inferenza

Statistica Inferenziale

Intervalli di confidenza

LEZIONI DI STATISTICA MEDICA

Tipi di variabili. Indici di tendenza centrale e di dispersione

Distribuzioni e inferenza statistica

05. Errore campionario e numerosità campionaria

STATISTICA. Regressione-2

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Cap. 7 Distribuzioni campionarie

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

PROBABILITÀ ELEMENTARE

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Campionamento La statistica media campionaria e la sua distribuzione

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

LEZIONI DI STATISTICA MEDICA

STATISTICA APPLICATA Prof.ssa Julia Mortera. INTRODUZIONE al STATISTICA

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Esercitazioni di statistica

C.I. di Metodologia clinica

a) 36/100 b) 1/3 c)

Probabilità e Distribuzione Normale Lezione 3

Statistica Inferenziale

5 - Esercizi: Probabilità e Distribuzioni di Probabilità (Uniforme, Gaussiana)

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

Statistica Inferenziale

Транскрипт:

STATISTICA I modelli probabilistici e l inferenza

Linguaggio della probabilità Datida un campione casuale Modello probabilistico (binomiale e gaussiano)

Linguaggio della probabilità Datida un campione casuale Modello probabilistico (binomiale e gaussiano) parametri noti Clinica per figlie femmine Altezza delle donne esercito US Tempo d attesa della pizza Astronauti

Linguaggio della probabilità Datida un campione casuale Modello probabilistico (binomiale e gaussiano) parametri non noti Clinica per figlie femmine Altezza delle donne esercito US Tempo d attesa della pizza Astronauti

W la gaussiana! ~, =+~ +, ~, ~, + ~ +, +

W la gaussiana! ~, =+~ +, ~, ~, + ~ +, + ~, ~, ( ) + ~ 2,2 + 2 ~, 2

W la gaussiana! ~, =+~ +, ~, ~, + ~ +, +,,, ~, + + + ~!,! "' = " #+" $ + +" ~ %, &$

W la gaussiana! ~, =+~ +, ~, ~, campione casuale + ~ +, +,,, ~, + + + ~!,! "' = " #+" $ + +" ~ %, &$

un inciso importante se, / 1 =, /,(1) <,*< + si ha che, < e *< + =,(< ),(*< +)

Esempio all arsenico, II Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Sapendo che la legge impone una soglia massima per l arsenico di 10 g/l, si può affermare che l'acqua potabile di Milano non è a norma di legge?

Esempio all arsenico, II Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Sapendo che la legge impone una soglia massima per l arsenico di 10 g/l, si può affermare che l'acqua potabile di Milano non è a norma di legge? 5 = 15+12.5+7.0+13.0+7.5 5 =11 g/l>10g/l è un risultato attendibile per tutta l acqua di Milano?

Esempio all arsenico, II Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Sapendo che la legge impone una soglia massima per l arsenico di 10 g/l, si può affermare che l'acqua potabile di Milano non è a norma di legge? Sia la variabile che descrive la quantità di arsenico in un campione di acqua milanese. Supp. "~ %,& $ con % incognita e = 1.6 g/l (semplificazione momentanea)

Esempio all arsenico, II Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Sapendo che la legge impone una soglia massima per l arsenico di 10 g/l, si può affermare che l'acqua potabile di Milano non è a norma di legge? Sia la variabile che descrive la quantità di arsenico in un campione di acqua milanese. Supp. "~ %,& $ con % incognita e = 1.6 g/l (semplificazione momentanea) 1. Usiamo?' =## come stima di % ~ 11,1.6

Esempio all arsenico, II Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Sapendo che la legge impone una soglia massima per l arsenico di 10 g/l, si può affermare che l'acqua potabile di Milano non è a norma di legge? Sia la variabile che descrive la quantità di arsenico in un campione di acqua milanese. Supp. "~ %,& $ con % incognita e = 1.6 g/l (semplificazione momentanea) 1. Usiamo?' =## come stima di % ~ 11,1.6 2.,,, @ variabili i.i.d, ~" A @ ~ ##,#.B $ C

Esempio all arsenico, II Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Sapendo che la legge impone una soglia massima per l arsenico di 10 g/l, si può affermare che l'acqua potabile di Milano non è a norma di legge? Sia la variabile che descrive la quantità di arsenico in un campione di acqua milanese. Supp. "~ %,& $ con % incognita e = 1.6 g/l (semplificazione momentanea) 1. Usiamo?' =## come stima di % ~ 11,1.6 2.,,, @ variabili i.i.d. ~ A @ ~ ##,#.B $ C 3., A @ >10 =, F A G H > JH.I/ @.I/ @ =O.P$ =, K> 1.40 =1 Φ 1.40 =

Esempio all arsenico, II Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Sapendo che la legge impone una soglia massima per l arsenico di 10 g/l, si può affermare che l'acqua potabile di Milano non è a norma di legge? Sia la variabile che descrive la quantità di arsenico in un campione di acqua milanese. Supp. "~ %,& $ con % incognita e = 1.6 g/l (semplificazione momentanea) Se la stima 5 'di % è corretta, 1. Usiamo?' =## come stima di % ~ 11,1.6 il 92% dei campioni indica un contenuto 2.,,, @ variabili i.i.d. medio ~ A di As @ ~ fuori ##,#.B legge $ C 3., A @ >10 =, F A G H > JH.I/ @.I/ @ =O.P$ =, K> 1.40 =1 Φ 1.40 =

La media campionaria Siano,,, variabili casuali i.i.d A = + + +! media campionaria: v.c. chepredice il valore della media aritmetica dei dati nel campione

La media campionaria Siano,,, variabili casuali i.i.d A = + + +! media campionaria: v.c. chepredice il valore della media aritmetica dei dati nelcampione. E unostimatoredellamedia [(" ),,, successione di v.a. i.i.d con media Q = finita. 5 = 5 +5 + + 5! S TUVW *XYZ!Y

Legge (forte) dei grandi numeri Bern(0.5) 0.0 0.2 0.4 0.6 0 200 400 600 800

Legge (forte) dei grandi numeri Bern(0.5) Bern(0.5) 0 200 400 600 800 Bern(0.5) Bern(0.5) 0.4 0.6 0.8 1.0 0.0 0.2 0.4 0.6 0.0 0.2 0.4 0.6 0.0 0.2 0.4 0 200 400 600 800 0 200 400 600 800 0 200 400 600 800

La media campionaria Siano,,, variabili casuali i.i.d A = + + +! media campionaria Se ~, A ~ %, &$ A stimatore di % Se ~ \ A ~ 1! 1W!!,\ A stimatore di

La media campionaria Siano,,, variabili casuali i.i.d A = + + +! media campionaria Se ~, A ~ %, &$ Se ~ \ A ~ 1! 1W!!,\ Se C & (# ) C A ~, (# )

La media campionaria Siano,,, variabili casuali i.i.d A = + + +! media campionaria Se ~, A ~ %, &$ Se ~ \ A ~ 1! 1W!!,\ Teo. Centrale del Limite Se " ~???& >`O A ~ [(" # ), abc(" #)

Binomiale e Gaussiana Il Genetics and IVF Institute di Fairfax in Virginia ha sviluppato una tecnica in grado, sostengono, di aumentare la probabilità per una coppia di avere una figlia femmina. Di 140 coppie su cui è stata messa in atto, 90 hanno avuto una femmina. variabile casuale che dice il sesso del neonato: 1=F, 0=M, =1 =\,, =0 =T=1 \, *e! TUf*g Y*!W* è una variabile bernoulliana di parametro \ (0,1) + + + dj conta il numero di F nei 140 parti i = + + + è una variabile Binomiale: 1W!(!,\) Se \=0.5,!=140, i dj =90 = dj! lj! djhlj! 0.5lJ (1 0.5) djhlj =0.000213747

Binomiale e Gaussiana 1W!(140,0.5) 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 0 20 40 60 80 100 120 140

un promemoria Quando! è grande, sono moltissimi i valori m tali che, =m =0, perché c è il vincolo della somma=1! Per questo è meglio guardare=m e \WU piuttosto che solo =m. 0.00 0.05 0.10 0.15 0.20!=14 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07!=140 0 2 4 6 8 10 12 14 0 20 40 60 80 100 120 140

Binomiale e Gaussiana 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0.07 1W!(140,0.5) (140 0.5,140 0.5 0.5) 0 20 40 60 80 100 120 140

Binomiale e Gaussiana Il Genetics and IVF Institute di Fairfax in Virginia ha sviluppato una tecnica in grado, sostengono, di aumentare la probabilità per una coppia di avere una figlia femmina. Di 140 coppie su cui è stata messa in atto, 90 hanno avuto una femmina. Se \=0.5,!=140 o p #qo PO =, r stu dj lj dj =, A dj 0.64 A ~ O.C, O.C(# O.C) #qo, K 0.64 0.5 0.5 0.5 140 =, K 3.31 = =1, K<3.31 =1 0.9995=0.0005 La tecnica sembra funzionare: in condizioni naturali avere 90 o più F in 140 parti ha una probabilità bassissima.

Binomiale e Gaussiana Il Genetics and IVF Institute di Fairfax in Virginia ha sviluppato una tecnica in grado, sostengono, di aumentare la probabilità per una coppia di avere una figlia femmina. Di 140 coppie su cui è stata messa in atto, 90 hanno avuto una femmina. Se \=0.5,!=140, i dj 90 =, r stu dj lj dj =, A dj 0.64 A ~ O.C, O.C(# O.C) #qo, K 0.64 0.5 0.5 0.5 140 =, K 3.31 = =1, K<3.31 =1 0.9995=0.0005 La tecnica sembra funzionare: in condizioni naturali avere 90 o più F in 140 parti ha una probabilità bassissima. \ = 90 140 =0.643

Media campionaria come stimatore Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Abbiamo usato?' =## (xb bcxb) come stima di [(" # ) A stimatore di [(" # ), 5 stima di [(" # ) Il Genetics and IVF Institute di Fairfax in Virginia ha sviluppato una tecnica in grado, sostengono, di aumentare la probabilità per una coppia di avere una figlia femmina. Di 140 coppie su cui è stata messa in atto, 90 hanno avuto una femmina. Usiamo 5 ' = lj =0.64=64% (proporzione osservata) come stima dj della proporzione di F che si ottiene con l uso della tecnica del IVF. N.B. =[ " #

Media campionaria come stimatore Perchè ci serve uno stimatore, e Durante le verifiche sulla qualità dell'acqua non potabile ci basta di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, stima? 7.5 g/l. Abbiamo usato?' =## (xb bcxb) come stima di [(" # ) A stimatore di [(" # ), 5 stima di [(" # ) Il Genetics and IVF Institute di Fairfax in Virginia ha sviluppato una tecnica in grado, sostengono, di aumentare la probabilità per una coppia di avere una figlia femmina. Di 140 coppie su cui è stata messa in atto, 90 hanno avuto una femmina. Usiamo 5 ' =\ = lj =0.64=64% (proporzione osservata) come dj stima della proporzione di F che si ottiene con l uso della tecnica del IVF. N.B. =[ " #

Media campionaria come stimatore Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Abbiamo usato?' =## (xb bcxb) come stima di [(" # ) se fossimo andati a raccogliere i campioni in altri punti dell acquedotto, avremmo avuto altri valori, e una stima diversa

Media campionaria come stimatore Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Abbiamo usato?' =## (xb bcxb) come stima di [(" # ) se fossimo andati a raccogliere i campioni in altri punti dell acquedotto, avremmo avuto altri valori, e una stima diversa A @ ~ z.`,#.b $ C, A @ >10 =, F A G H{. > JH{..I/ @.I/ @ =, K>2.37 =1 Φ 2.37 =O.OOP!

Media campionaria come stimatore Durante le verifiche sulla qualità dell'acqua potabile di Milano si è misurata la quantità presente nell'acqua di arsenico, ottenendo i seguenti valori campionari: 15, 12.5, 7.0, 13.0, 7.5 g/l. Abbiamo usato?' =## (xb bcxb) come stima di [(" # ) se fossimo andati a raccogliere i campioni in altri punti dell acquedotto, avremmo avuto altri valori, e una stima diversa A @ ~ z.`,#.b $ C Per dire qualcosa attorno all incertezza sulla stima ci serve la variabile casuale stimatore!, A @ >10 =, F A G H{. > JH{..I/ @.I/ @ =, K>2.37 =1 Φ 2.37 =O.OOP!

Inferenza sulla media di una popolazione 17/10/2016, su un quotidiano on-line: Sì: 33.8% No: 37.0% Indeciso: 29.2% «Ed è per questo che,, la sfida del 4 dicembre si giocherà sul filo dei decimali. Anche perché tutti i sondaggi che vengono pubblicati da giornali e tv in queste settimane hanno come sempre un margine d errore del 3 per cento.»

Inferenza sulla media di una popolazione 17/10/2016, su un quotidiano on-line: Sì: =33.8% No: =37.0% Indeciso: 29.2% ~ ( )(sì/ sì) «Ed è per questo che,, la sfida del 4 dicembre si giocherà sul filo dei decimali. Anche perché tutti i sondaggi che vengono pubblicati da giornali e tv in queste settimane hanno come sempre unmargine d errore del 3 per cento.» ~ (no/ no) No 37.0% 33.8% Sì

Inferenza sulla media di una popolazione 17/10/2016, su un quotidiano on-line: Sì: =33.8% No: =37.0% Indeciso: 29.2% ~ ( ) «Ed è per questo che,, la sfida del 4 dicembre si giocherà sul filo dei decimali. Anche perché tutti i sondaggi che vengono pubblicati da giornali e tv in queste settimane hanno come sempre unmargine d errore del 3 per cento.» ~ ( ) No 3% 37.0% +3% 3% 33.8% Sì +3%

Inferenza sulla media di una popolazione 17/10/2016, su un quotidiano on-line: Sì: =33.8% No: =37.0% Indeciso: 29.2% ~ ( ) «Ed è per questo che,, la sfida del 4 dicembre si giocherà sul filo dei decimali. Anche perché tutti i sondaggi che vengono pubblicati da giornali e tv in queste settimane hanno come sempre unmargine d errore del 3 per cento.» ~ ( ) No 3% 37.0% +3% 3% 33.8% Sì +3%

valore giornaliero di PM10 = 63 + 45 + 46 + 37 + 48 5 = 47.8 e il margine di errore?

Inferenza sulla media di una popolazione (,!,, ) {34,19,6,12, 24,12,20,27,33,29} campionecasuale 0 stimatore di, 0 ~+,, -!,!,, i.i.d possibili osservazioni ~+(,, -! ) modello, con. / nota Intervallo di confidenza di livello 9 6 Contiene il vero valore della media della popolazione,,, con probabilità 9 6 1 23 4 56 /. / 4, 2 3 4 +56 /. / 4 = 1 8

Inferenza sulla media di una popolazione 23 4 56 /. / 4, 2 3 4 +56 /. / 4 E ilmodellocheprevedetuttii possibili intervalli di confidenza di livello 1 8 100 campioni 100 intervalli di confidenza di liv. 1 8 = 0.95 95 contengono il vero valoredi, possiamoaverefiducia che il nostro intervallo sia uno di questi.

Inferenza sulla media di una popolazione (,!,, ) {34,19,6,12, 24,12,20,27,33,29} campionecasuale 0 stimatore di, 0 ~+,, -!,!,, i.i.d possibili osservazioni ~+(,, -! ) modello, con. / nota Intervallo di confidenza di livello 9 6 Contiene il vero valore della media della popolazione,,, con probabilità 9 6 1 23 4 56 /. / 4, 2 3 4 +56 /. / 4 = 1 8

Inferenza sulla media di una popolazione (,!,, ) {34,19,6,12, 24,12,20,27,33,29} campionecasuale 0 stimatore di, 0 ~+,, -!,!,, i.i.d possibili osservazioni ~+(,, -! ) modello, con. / nota Intervallo di confidenza di livello 9 6 Contiene il vero valore della media della popolazione,,, con probabilità 9 6 8 = 0.05 1 8 = 0.95 56 / = 5 :.:/; = 9. <= 1 23 4 56 /. / 4, 2 3 4 +56 /. / 4 = 1 8 56 / 8 = 0.001 1 8 = 0.999 = 5 :.:::; = >. /<:;

Inferenza sulla media di una popolazione (,!,, ) {34,19,6,12, 24,12,20,27,33,29} campionecasuale 0 stimatore di, 0 ~+,, -!,!,, i.i.d possibili osservazioni ~+(,, -! ) modello, con. / nota Intervallo di confidenza di livello 9 6 Contiene il vero valore della media della popolazione,,, con probabilità 9 6 1 23 4 56 /. / 4, 2 3 4 +56 /. / 4 = 1 8 margine d errore

Inferenza sulla media di una popolazione (? 9,? /,,? 4 ) {>@, 9<, =, 9/, /@, 9/, /:, /A, >>, /<}campionecasuale 0 stimatore di, 0 ~+,, -!,!,, i.i.d possibili osservazioni ~+(,, -! ) modello, con. / nota 1 23 4 56 /. / 4, 2 3 4 +56 /. / 4 = 1 8 = 10 -! = 100,B/D E! 8 = 0.05, F G.G!? 3 = /9. = HI/J > = 1.96 /9. = 9. <= 9:: 9:, /9. = + 9. <= 9:: 9: 9;. @:, /A. K: HI/J >

Inferenza sulla media di una popolazione (? 9,? /,,? 4 ) {>@, 9<, =, 9/, /@, 9/, /:, /A, >>, /<}campionecasuale 0 stimatore di, 0 ~+,, -!,!,, i.i.d possibili osservazioni ~+(,, -! ) modello, con. / nota 1 23 4 56 /. / 4, 2 3 4 +56 /. / 4 = 1 8 = 10 -! = 100,B/D E! 8 = 0.05, F G.G = 1.96! 3 = 21.6,,B/D E /9. = 9. <= 9:: 9:, /9. = + 9. <= 9:: 9: =. / HI/J > è il margine d errore