Richiami di Statistica

Documenti analoghi
Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi

Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità

Statistica Applicata all edilizia: Stime e stimatori

Richiami di inferenza statistica Strumenti quantitativi per la gestione

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

STATISTICA A K (60 ore)

STATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU)

SOLUZIONI PROVA SCRITTA DI STATISTICA (cod. 4038, 5047, 371, 377) 8 settembre 2005

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Tecniche di sondaggio

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1

VERIFICA DELLE IPOTESI

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi

Test d ipotesi. Monica Musio, Maria Luisa Targhetta

lezione 4 AA Paolo Brunori

LEZIONI DI STATISTICA MEDICA

La verifica delle ipotesi

STATISTICA A K (60 ore)

Esercitazioni di Statistica

Richiami di statistica

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D

Verifica di ipotesi. Parte VI. Verifica di ipotesi

Esercizi di statistica

Esercizi di Probabilità e Statistica

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.

LEZIONI DI STATISTICA MEDICA

Contenuto del capitolo

R - Esercitazione 5. Andrea Fasulo Venerdì 16 Dicembre Università Roma Tre

Contenuti: Capitolo 14 del libro di testo

STATISTICA ESERCITAZIONE

Intervallo di confidenza.

Corso in Statistica Medica

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B

Distribuzioni campionarie

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

Campionamento e stima di parametri

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1

STATISTICA (modulo II - Inferenza Statistica) Soluzione Esercitazione I

Fondamenti statistici : Test d Ipotesi (1)

Test d ipotesi Introduzione. Alessandra Nardi

Il modello di regressione lineare multipla con regressori stocastici

05. Errore campionario e numerosità campionaria

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

Analisi della varianza: I contrasti e il metodo di Bonferroni

Statistica Metodologica

Modelli descrittivi, statistica e simulazione

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. II Esonero - 10 Gennaio 2014

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 II Esonero - 15 Gennaio 2015

ECONOMETRIA: Laboratorio I

Dispensa di Statistica

Test per una media - varianza nota

Stima dei parametri. La v.c. multipla (X 1, X 2,.., X n ) ha probabilità (o densità): Le f( ) sono uguali per tutte le v.c.

P ( X n X > ɛ) = 0. ovvero (se come distanza consideriamo quella euclidea)

Il metodo statistico: prova dell ipotesi, intervallo di confidenza

Corso introduttivo di Epidemiologia e Biostatistica

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2016/2017 Appello A - 27 Gennaio 2017

INTRODUZIONE AL DOE come strumento di sviluppo prodotto Francesca Campana Parte 2 Concetti di base

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Verifica delle ipotesi. Verifica delle ipotesi

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

E n 1 n. n i. n 2. n 2 ( n

Proprietà asintotiche dello stimatore OLS

INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA

Test delle Ipotesi Parte I

Teoria della stima dei parametri:

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Statistica Inferenziale La verifica di ipotesi. Davide Barbieri

Corso di Statistica Esercitazione 1.8

Metodi statistici per le ricerche di mercato

Gli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana

II Esonero - Testo B

Statistica parametrica e non parametrica. Gli intervalli di confidenza

Intervallo di confidenza

Intervallo di confidenza

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

I modelli probabilistici

Stima Puntuale e per Intervallo. Stimatore e stima. Pietro Coretto Università degli Studi di Salerno

Fondamenti di Psicometria. La statistica è facile!!! VERIFICA DELLE IPOTESI

Elementi di Psicometria (con laboratorio software 1)

PROVA SCRITTA DI STATISTICA (COD COD ) 7 luglio 2005 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

Esercitazione 8 del corso di Statistica 2

Introduzione alla verifica d ipotesi

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 7: Basi di statistica

I appello di calcolo delle probabilità e statistica

Gli errori nella verifica delle ipotesi

Introduzione all inferenza statistica, III lezione

Introduzione all inferenza statistica, IV lezione

Metodi Statistici per il Marketing. #05 Elementi di statistica inferenziale e di teoria dei campioni

STATISTICA MULTIVARIATA SSD MAT/06

L indagine campionaria Lezione 3

STATISTICA. Inferenza: Stima & Intervalli di confidenza, 1

Z-test, T-test, χ 2 -test

Transcript:

Università di Pavia Richiami di Statistica Eduardo Rossi

Popolazione e campione casuale Un idea centrale della statistica è che un campione sia una rappresentazione della popolazione. Si possono sfruttare le analogie fra il campione e la popolazione per inferire da questo le caratteristiche della popolazione. Campione casuale Siano (Y 1, Y 2,...,Y N ) variabili casuali tali che le y i siano realizzazioni mutuamente indipendenti della variabile casuale Y con f.d.c., F Y (y). Allora (Y 1, Y 2,...,Y N ) è detto un campione casuale dalla popolazione con f.d.c. F Y (y). Eduardo Rossi c - Econometria 2

Inferenza statistica L inferenza statistica è l applicazione di modelli di probabilità all analisi dei dati e alla sua interpretazione. L inferenza classica stabilisce un modello di probabilistico per le informazioni campionarie, deriva modelli probabilistici per funzioni dei dati (statistiche) ed inferisce caratteristiche ignote (parametri) del modello probabilistico di partenza dai dati campionari. Sia (Y 1, Y 2,...,Y N ) un campione casuale da una densità f( ; θ), dove la forma della densità è nota ma il parametro θ è ignoto (scalare reale o vettore di numeri reali). L obiettivo è trovare statistiche, funzioni delle osservazioni (Y 1, Y 2,...,Y N ), da usare per la stima di θ. Eduardo Rossi c - Econometria 3

Procedure inferenziali Stima puntuale: la migliore valutazione di θ. Hypothesis test: stabilire se un particolare valore di θ è consistente con l evidenza campionaria Interval estimation: intervalli di confidenza per i parametri due approcci alla stima Inferenza Classica e Bayesiana. Eduardo Rossi c - Econometria 4

Stimatore Statistica: E una funzione di v.c. osservabili, essa stessa è una v.c. osservabile, che non contiene alcun parametro ignoto. Stimatore: Ogni statistica i cui valori sono usati per stimare τ(θ), dove τ(θ) è una funzione di θ, è uno stimatore di τ(θ). Stima: Un particolare valore realizzato dello stimatore. Eduardo Rossi c - Econometria 5

Stimatore Gli stimatori sono basati su diversi principi: non distorsione (correttezza), invarianza, sufficienza, ecc. Sia ϑ Θ R un parametro della populazione incognita P o θ se P è nella famiglia parametrica. Ogni stimatore di ϑ è soggetto ad un errore di stima T(y 1,...,y N ) ϑ quando osserviamo Y 1 = y 1,...,Y N = y N. Questo non solo perchè T(Y 1,...,Y N ) è casuale. In alcuni problemi T(y 1,...,y N ) non può eguagliare ϑ. Eduardo Rossi c - Econometria 6

Stimatore Esempio banale: T(Y 1,...,Y N ) ha una c.d.f. continua così che P[T(Y 1,...,Y N ) = ϑ] = 0 Esempio non banale: sia (Y 1,...,Y N ) una v.c. i.i.d. binaria (variabili bernoulliane) con P(Y i = 1) = p P(Y i = 0) = 1 p Y è un buon stimatore di ϑ = p, ma y non può eguagliare ϑ se ϑ non è uno dei j/n, j = 0, 1,...,N. Eduardo Rossi c - Econometria 7

Non distorsione La distorsione (bias) di uno stimatore T(Y ) di un parametro reale ϑ della popolazione incognita è definito come b T (P) = E[T(Y )] ϑ indicato con b T (θ) quando P appartiene alla famiglia parametrica indicizzata da θ. Uno stimatore è detto non distorto per ϑ se e solo se b T (P) = 0 P P. Uno stimatore T(Y ) può essere visto come uno stimatore senza errore sistematico. Eduardo Rossi c - Econometria 8

Non distorsione Uno stimatore non distorto può avere errori negativi e positivi ampi T(y) ϑ quindi per uno stimatore non distorto T(Y ) è preferibile che i valori di T(y) siano altamente concentrati intorno a ϑ. Eduardo Rossi c - Econometria 9

Stimatore non distorto Sia θ una funzione reale della f.d.c. e sia (Y 1, Y 2,...,Y N ) un campione casuale estratto dalla popolazione con f.d.c. F Y. La v.c. Z = h(y 1, Y 2,...,Y N ) è uno stimatore non distorto di θ se E[Z] = θ Consideriamo un campione casuale (Y 1, Y 2,...,Y N ) dalla popolazione con f.d.c. F Y, il momento primo campionario N µ = 1 N i=1 Y i è uno stimatore di µ = E[Y ] nel senso che E[ µ] = µ. Eduardo Rossi c - Econometria 10

Stimatore non distorto [ E[ µ] = 1 N ] N E Y i i=1 = 1 N N E[Y i ] = µ i=1 V ar( µ) = σ2 N La distribuzione della media Y 10 basata su un campione casuale di dimensione 10 ha la stessa media di Y 20 basata su un campione di 20. Nel secondo caso la dispersione delle stime intorno a µ è la metà del primo. Eduardo Rossi c - Econometria 11

Efficienza Si può scegliere tra stimatori non distorti sulla base del confronto delle loro varianze. Stimatore efficiente: Se T A e T B sono due stimatori non distorti di θ e V ar[t A ] < V ar[t B ] allora T A è efficiente relativamente a T B Eduardo Rossi c - Econometria 12

Mean Square Error MSE T [θ] = E[(T(Y ) ϑ) 2 ] = E[(T(Y ) E(T(Y ))+E(T(Y )) θ) 2 ] MSE T [θ] = E[(T(Y ) E(T(Y ))) 2 ] + [E(T(Y )) ϑ] 2 MSE T [θ] = V ar(t(y )) + [E(T(Y )) ϑ] 2 perchè E[(T(Y ) E(T(Y )))(E(T(Y )) ϑ)] = 0. Se il bias E(T(Y )) ϑ è zero, allora MSE T [θ] = V ar(t(y )) Eduardo Rossi c - Econometria 13

Mean Absolute Error Mean Absolute Error di uno stimatore T(Y ) E T(Y ) ϑ un altra misura della precisione dello stimatore è la probabilità di essere distante da ϑ: P[ T(Y ) ϑ ǫ] with fixed ǫ > 0 Eduardo Rossi c - Econometria 14

Esempio Consideriamo un campione casuale (Y 1, Y 2,...,Y N ) dalla popolazione con c.d.f. F Y, il momento primo campionario N Y = 1 N i=1 Y i è uno stimatore non distorto. Se la varianza di Y, σ 2, esiste lo stimatore non distorto è: [ ] N s 2 i=1 = (Y i Y ) 2 = N 1 N (Y i Y ) 2 = N N 1 N 1 N N 1 σ2 i=1 Eduardo Rossi c - Econometria 15

Esempio infatti E[s 2 ] = = = N N 1 E N N 1 E N N 1 [ ] 1 N (Y i Y ) 2 N i=1 [ ] 1 N (Yi 2 ) (Y ) 2 N i=1 [ N 1 N i=1 E(Y 2 i ) E(Y 2 ) con E(Yi 2) = σ2 + µ 2. ( E[s 2 ] = N 1 N 1 N N(σ2 + µ 2 ) E 1 N ] ) 2 N Y i i=1 Eduardo Rossi c - Econometria 16

Esempio E[s 2 ] = = = = = N N 1 N N 1 N N 1 N N 1 N N 1 ( (σ2 + µ 2 ) 1 N ) 2 N 2 E Y i i=1 (σ2 + µ 2 ) 1 N 2 E Y i Y j i j { (σ 2 + µ 2 ) 1 ( N(σ 2 N 2 + µ 2 ) + (N 2 N)µ 2) } { (σ 2 + µ 2 ) 1 ( Nσ 2 N 2 + N 2 µ 2) } (σ 2 1N ) σ2 = σ 2 Eduardo Rossi c - Econometria 17

Stima a intervalli Una stima puntuale non fornisce alcuna informazione sull intervallo dell errore associato alla stima. L idea della stima ad intervalli è usare i dati campionari per costruire un intervallo, tale che possiamo aspettarci che questo contenga il valore vero del parametro in una certa proporzione di campioni, o con un certo livello di confidenza. Più è ampio l intervallo maggiore è la probabilità che contenga il parametro. Eduardo Rossi c - Econometria 18

Stima a intervalli Intervallo di confidenza: Sia (Y 1, Y 2,...,Y N ) un campione casuale dalla densità f( ; θ). Siano T 1 = t 1 (Y 1,...,Y N ) e T 2 = t 2 (Y 1,...,Y N ) due statistiche che soddisfano T 1 T 2 per i quali Pr{T 1 < τ(θ) < T 2 } 1 α L intervallo (T 1, T 2 ) è detto un intervallo di confidenza di livello (1 α)100% per τ(θ); (1 α) è il livello di confidenza. Eduardo Rossi c - Econometria 19

Stima a intervalli Quantità pivotale: Sia (Y 1, Y 2,...,Y N ) un campione casuale dalla densità f( ; θ), dove θ è un vettore di parametri incogniti. La funzione Q = Q( ; θ) è una quantità pivotale se e solo la distribuzione non dipende da θ. Eduardo Rossi c - Econometria 20

Stima a intervalli Il metodo della quantità pivotale: Se Q = Q(Y 1, Y 2,...,Y N ; θ) è una quantità pivotale ed ha una f.d.p., allora per ogni 0 < (1 α) < 1 esistono q 1 e q 2 che dipendono da (1 α) tali che Pr{q 1 < Q < q 2 } = 1 α Se per ogni possibile valore del campione (y 1, y 2,...,y N ) se e solo se q 1 < Q(y 1,...,y N ; θ) < q 2 t 1 (y 1,...,y N ) < τ(θ) < t 2 (y 1,...,y N ) per funzioni t 1 e t 2 (che non dipendono da θ), allora (T 1, T 2 ) è un intervallo di confidenza per τ(θ), dove T i = t i (y 1,...,y n ) i = 1, 2. Eduardo Rossi c - Econometria 21

Stima a intervalli L essenziale caratteristica del metodo pivotale è che la diseguaglianza {q 1 < Q(y 1,...,y N ; θ) < q 2 } possa essere riscritta o invertita come {t 1 (y 1, y 2,...,y N ) < τ(θ) < t 2 (y 1, y 2,...,y N )} per ogni possibile realizzazione del campione y 1, y 2,...,y N. Due passaggi 1. trovare una quantità pivotale 2. invertirla Eduardo Rossi c - Econometria 22

Esempio. Intervallo di confidenza per la media Sia (Y 1,...,Y N ) un campione casuale Y µ σ2 /N Y i N(µ, σ 2 ) ) Y N (µ, σ2 N N(0, 1) V ar [ 1 N ] Y i = E[(Y µ) 2 ] = E i [ Y 2] µ 2 Eduardo Rossi c - Econometria 23

Esempio. Intervallo di confidenza per la media Eduardo Rossi c - Econometria 24

Esempio. Intervallo di confidenza per la media E [ Y 2] = E = 1 N 2 E = 1 N 2 E = 1 N 2 [ ( 1 ) ] 2 Yi N [ ( ) ] 2 Yi Y 2 i + i E [ Y 2 i ] + E Y i Y j j i =j Y i Y j i j i =j = 1 N 2 { N(σ 2 + µ 2 ) + N(N 1)µ 2} = σ2 N + µ2 Eduardo Rossi c - Econometria 25

Esempio. Intervallo di confidenza per la media V ar [ 1 N ] Y i i = σ2 N s 2 σ 2 χ2 N 1 N 1 Y µ σ2 /N e s2 σ 2 sono indipendenti. La quantità pivotale [ ] Y µ s 2 / σ2 /µ σ 2 = Y µ s/ N t N 1 Eduardo Rossi c - Econometria 26

Esempio. Intervallo di confidenza per la media Pr { } Y µ s/ N t N 1;α/2 = 1 α quantile t N 1;α : Pr{t N 1 t N 1;α } = 1 α. Possiamo scrivere { } s s Pr Y t N 1;α/2 µ Y + t N 1;α/2 = 1 α N N questo intervallo conterrà µ con probabilità 1 α. I limiti di questi intervalli sono v.c. perchè Y e s 2 sono v.c. in campioni ripetuti. L intervallo è centrato su uno stimatore non distorto Y. Eduardo Rossi c - Econometria 27

Esempio. Intervallo di confidenza per la varianza Un analogo intervallo per σ 2 è { [ ]} Pr σ 2 s 2 N 1 χ 2, s 2 N 1 N 1;1 α/2 χ 2 N 1;α/2 = 1 α quantile 1 α/2 = Pr{χ 2 N 1 χ 2 N 1;1 α/2 } χ 2 N 1;α è il quantile 1 α della distribuzione χ2 N 1. Poichè la distribuzione chi-quadrato è asimmetrica, questo intervallo di confidenza non è centrato sullo stimatore non-distorto s 2. Eduardo Rossi c - Econometria 28

Verifica delle ipotesi Ipotesi statistica: E un asserzione o congettura sulla distribuzione di una o più variabili casuali. Se l ipotesi statistica specifica completamente la distribuzione, allora è detta semplice; altrimenti è composta. Test: E una regola o procedura per decidere se rifiutare l ipotesi. Due ipotesi sono discusse: Ipotesi nulla: H 0 Ipotesi alternativa: H 1. Se l ipotesi nulla è falsa, allora l ipotesi alternativa è vera e viceversa. Se l ipotesi nulla non è rifiutata allora H 0 è accettata. Eduardo Rossi c - Econometria 29

Verifica delle ipotesi Gli elementi della verifica delle ipotesi: Test: τ(y ) Spazio dei possibili campioni: Y Regione critica: C τ, l insieme dei valori dello spazio campionario considerati significativamente diversi da quelli che si realizzerebbero in presenza di H 0. Regione di accettazione: C C τ, l insieme dei risultati campionari che sono coerenti con quanto stabilito sotto l ipotesi nulla. Un test di H 0 scompone Y in due regioni C τ e C C τ. Se (y 1, y 2,...,y N ) C τ, H 0 è rifiutata. Eduardo Rossi c - Econometria 30

Verifica delle ipotesi Due tipi di errori: 1. Errore di I tipo: Rifiutare H 0 quando è vera. 2. Errore di II tipo: Accettare H 0 quando è falsa. La dimensione dell errore di I tipo è Pr{ Rifiutare H 0 H 0 Vera}. α n (θ) = Pr[τ(Y ) C τ H 0 ] La dimensione dell errore di II tipo è Pr{ Accettare H 0 H 0 Falsa} β n (θ) = Pr[τ(Y ) C C τ H 1 ] dipendenza dalla numerosità campionaria (n) e dai valori parametrici (θ), come nel caso di ipotesi composta. Eduardo Rossi c - Econometria 31

Verifica delle ipotesi Ipotesi nulla semplice ed ipotesi alternativa semplice H 0 : θ = θ 0 H 1 : θ = θ 1 Ipotesi Nulla semplice ed ipotesi alternativa bilaterale H 0 : θ = θ 0 H 1 : θ θ 0 Ipotesi Nulla semplice ed ipotesi alternativa unilaterale H 0 : θ = θ 0 H 1 : θ > θ 0 Eduardo Rossi c - Econometria 32

Verifica delle ipotesi Nel caso in cui l ipotesi nulla non sia semplice ma composta H 0 : θ θ 0 H 1 : θ > θ 0 si può ricondurre a un sistema con ipotesi nulla semplice: H 0 : θ = θ 0. Il rifiuto dell ipotesi H 0 : θ = θ 0 implica il rifiuto dell ipotesi H 0 : θ θ 0. Eduardo Rossi c - Econometria 33

Verifica delle ipotesi Funzione di potenza: Se la distribuzione dalla quale è stato ottenuto il campione è parametrizzata da θ (il valore vero del parametro), dove θ Θ, allora associato ad ogni test esiste una funzione di potenza: π τ (θ) = Pr θ [(Y 1, Y 2,...,Y N ) C τ ] descrive la probabilità, al variare di θ, di rifiutare H 0. Una funzione di potenza ideale assegna 0, per quei valori di θ corrispondenti all ipotesi nulla e 1 per quei θ corrispondenti all ipotesi alternativa. π τ (θ) = 1 β n (θ) = Pr[τ(Y ) C τ H 1 ] descrive la probabilità che la statistica porti a rifiutare l ipotesi nulla H 0 quando è falsa. Eduardo Rossi c - Econometria 34

Esempio Distribuzione normale N(µ,1). µ ignoto. Campione casuale semplice di 10 elementi (Y 1, Y 2,...,Y 10 ) si vuole verificare il sistema di ipotesi: H 0 : µ = 0 H 1 : µ = 1 due ipotesi semplici. Si utilizza la statistica test τ = 1 10 10 i=1 Regione di rifiuto: Y i C τ = {τ τ 1, 65} Eduardo Rossi c - Econometria 35

Esempio Sotto H 0 sotto H 1 τ(y ) N(0, 1) τ(y ) N( 10, 1) Probabilità errore di primo tipo: α 10 = 1,65 1 exp { 12 } 2π τ2 dτ Probabilità errore di secondo tipo: β 10 = 1,65 1 2π exp { 12 (τ } 10) 2 dτ Eduardo Rossi c - Econometria 36

Esempio Sia α che β non dipendono dai valori parametrici trattandosi di ipotesi semplici. Potenza del test è 1 β, cioè la probabilità di rifiutare l ipotesi nulla µ = 0 quando il vero µ è pari a 1. Eduardo Rossi c - Econometria 37

Esempio Si consideri il sistema d ipotesi: H 0 : µ 0 H 1 : µ > 0 entrambe ipotesi composte. Statistica test τ = 1 10 10 Regione critica i=1 Y i C τ = {τ τ 1, 65} Eduardo Rossi c - Econometria 38

Esempio Probabilità errore di primo tipo α 10 (µ) = 1,65 Probabilità errore di secondo tipo: 1 exp { 12 (τ } 10µ) 2 dτ per µ 0 2π β 10 (µ) = 1,65 1 2π exp { 12 (τ } 10µ) 2 dτ per µ > 0 Potenza del test π 10 (µ) = 1 β 10 (µ) = 1,65 1 exp { 12 (τ } 10µ) 2 dτ per µ > 0 2π Eduardo Rossi c - Econometria 39

Esempio Queste probabilità dipendono dal valore di µ. α 10 (µ) è crescente con µ ed assume il valore massimo per µ = 0. π 10 (µ) assume valori vicini a 1 tanto più il valore di µ è lontano da quanto ipotizzato sotto H 0. Eduardo Rossi c - Econometria 40

Esempio (Y 1,...,Y N ) sia un campione casuale da f(y; µ) = φ µ,25 (y) H 0 : µ 17 τ : Rifiutare se e solo se Y > 17 + 5/ N π τ (µ) = Pr µ [Y > 17 + 5/ ] N = 1 Φ ( 17 + 5/ N θ 5/ N ) Eduardo Rossi c - Econometria 41

La dimensione del test (size) Sia τ un test dell ipotesi H 0 : θ Θ 0, Θ 0 Θ La dimensione del test è: sup θ Θ 0 τ(θ) Eduardo Rossi c - Econometria 42

Test più potente Per individuare il test ottimale fissiamo la dimensione delll errore di primo tipo e minimizziamo quello di secondo tipo. Test più potente: Un test τ per H 0 : θ = θ 0 H 1 : θ = θ 1 è detto test più potente se e solo se: 1. π τ (θ 0 ) = α, α livello di significatività 2. π τ (θ 1 ) π τ (θ 1 ) per ogni altro test τ per il quale π τ (θ 0 ) α. Eduardo Rossi c - Econometria 43

Test più potente E fissata la dimensione dell errore di I tipo (uguale ad α, livello di significatività) e minimizzata la dimensione la dimensione dell errore di II tipo. Un test è detto più potente di dimensione α se ha dimensione α e se fra tutti i test di dimensione α o inferiore ha la potenza maggiore. 1 - α Coefficiente di confidenza del test. Corrisponde alla probabilità di accettare l ipotesi nulla quando è vera. Eduardo Rossi c - Econometria 44

Test più potente Si fissa il livello di significatività e poi si cerca il test che minimizza la probabilità d errore del II tipo o che massimizza la potenza del test π(θ). Un test con livello di significatività pari a α e una funzione di potenza π (θ) è detto uniformemente più potente a livello α se: π (θ) π(θ) θ Θ 1 per ogni altro test con uguale livello di significatività α e funzione di potenza π(θ). Eduardo Rossi c - Econometria 45

Test corretto Un test con livello di significatività α e funzione di potenza π(θ) è corretto se: π(θ) α θ Θ 1 Il test è corretto se la probabilità di rifiutare l ipotesi nulla quando questa è falsa è maggiore della probabilità di rifiutarla quando è vera. Eduardo Rossi c - Econometria 46

Approccio Neyman Pearson La procedura di N-P è scegliere una C τ, cioè trovare un metodo per calcolare τ(y 1,...,Y N ) e scegliere il valore critico, tale per cui la dimensione del test non ecceda α. Per applicare tale teoria, il problema che deve essere risolto è costruire delle statistiche test τ(y 1,...,Y N ) che hanno una distribuzione nota sotto H 0. Eduardo Rossi c - Econometria 47

Metodo degli intervalli di confidenza Se H 0 : θ = θ 0 H 1 : θ θ 0 si può calcolare una stima basata su un intervallo di confidenza di θ dai dati, e se l intervallo contiene θ 0, accettare H 0, altrimenti rifiutare. Se l intervallo ha un coeffciente di confidenza pari a (1 α), allora il test risultante avrebbe un livello di significatività di α Eduardo Rossi c - Econometria 48