Politecnico di Milano Appunti delle lezioni del corso di Statistica (2L) per gli allievi INF e TEL, AA 2007/2008. Intervalli di confidenza

Documenti analoghi
Esercitazioni del Corso di Probabilitá e Statistica Lezione 6: Stime di parametri puntuali e per intervalli

Matematica con elementi di Informatica

Campionamento casuale da popolazione finita (caso senza reinserimento )

Stime puntuali. Statistica e biometria. D. Bertacchi. Stime puntuali. Intervalli di confidenza. Approfondiamo

1 Famiglia delle densità gamma

Appunti di STATISTICA

Appunti per l Orale di Statistica

Statistica. Lezione 5

Inferenza Statistica. L inferenza statistica cerca di risalire al modello del fenomeno sulla base delle osservazioni.

Seconda Prova Intermedia 28 Maggio 2019 Elementi di Probabilità e Statistica, Laurea Triennale in Matematica, M. Romito, M.

Una funzione delle osservazioni campionarie è una statistica che, nel contesto della stima di un parametro, viene definita stimatore.

Argomenti. Stima Puntuale e per Intervallo. Inferenza. Stima. Leonardo Grilli. Università di Firenze Corso di Laurea in Statistica Statistica

Popolazione e Campione

Metodi statistici per lo studio dei fenomeni biologici

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità D

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità B - Soluzione

Stimatori, stima puntuale e intervalli di confidenza Statistica L-33 prof. Pellegrini

L INTERVALLO DI CONFIDENZA

Statistica inferenziale, Varese, 25 novembre 2008 Prima parte - Modalità B - soluzione

COME CALCOLARE L INTERVALLO DI CONFIDENZA QUANDO E NECESSARIO STIMARE LA DEVIAZIONE STANDARD? (è quasi sempre così!)

Corso di Statistica Canale E Bini, Cutillo A.A. 2017/2018. Esercitazione di riepilogo n.8 Test di ipotesi Soluzioni

Università degli Studi di Cassino, Anno accademico Corso di Statistica 2, Prof. M. Furno

Politecnico di Milano - Anno Accademico Statistica Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo

Stima della media di una variabile X definita su una popolazione finita

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità A - Soluzioni

Statistica. Esercitazione 12. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice

Correzione Esercitazione 5. Esercizio 1. Per determinare l intervallo di confidenza scegliamo come quantità. x 2) I 2 (0,θ) (x), da cui 1 F X (x θ) =

Esercitazione sette: soluzioni. H 1 : θ > 0.48 ( =

Statistica Inferenziale Soluzioni 1. Stima puntuale

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità C

Statistica I - A.A

STATISTICA A K (63 ore) Marco Riani

STATISTICA INFERENZIALE

Popolazione e Campione

Statistica inferenziale, Varese, 25 novembre 2008 Prima parte - Modalità A - soluzione

Intervalli di Fiducia

ALCUNI ESERCIZI SUI TEST DI IPOTESI PARAMETRICHE PARTE 1

L INTERVALLO DI CONFIDENZA

Esperimentazioni di Fisica 1. Prova scritta del 1 febbraio 2016 SOLUZIONI

Soluzione CPS 22/6/04. I parte. (1). Chiamiamo C l evento l individuo scelto ha il colesterolo alto, V, O e NL rispettivamente

Corso di Statistica Facoltà di Economia

II Esonero - Testo A

Metodi di valutazione delle prestazioni di rete

Esercitazioni di Statistica

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 6

Argomenti trattati: Stima puntuale e stimatore Proprietà degli stimatori Stima puntuale della media della

Campionamento e distribuzioni campionarie

Legge Gamma e Legge Chi quadro

SOLUZIONE DI ESERCIZI DI ANALISI MATEMATICA IV ANNO 2015/16, FOGLIO 2. se x [n, 3n]

Distribuzione normale

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2013

Correzione Esercitazione 6

Lezione 14. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 14. A. Iodice. disuguaglianza di Markov

Stimatori corretti, stimatori efficaci e disuguaglianza di Cramer Rao

4. L ipotesi è falsa e la rifiuto bene. H 0 ) p = 0.5. Facciamo dunque n lanci. Otteniamo k teste ed n k croci:

4. Proprietà degli stimatori

Esercitazione ricapitolativa

Probabilità e Statistica (cenni)

PROVA SCRITTA DI STATISTICA CLEA-CLEFIN-CLELI (COD e 4038) 15 gennaio 2003

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A

7. Test d ipotesi. 2. L ipotesi è vera ma in base ai dati la rifiuto in questo caso si dice che si commette errore di prima specie

Esercizi 2 Pietro Caputo 14 dicembre se ξ n > log n

Distribuzione normale o gaussiana

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.

1.6 Serie di potenze - Esercizi risolti

SUCCESSIONI DI FUNZIONI

n=400 X= Km; s cor =9000 Km Livello di confidenza (1-α)=0,95 z(0,05)=1,96

Anemia. Anemia - percentuali

Corso di Statistica. Test per differenza tra medie e proporzioni. Prof.ssa T. Laureti a.a

Esercizi di Calcolo delle Probabilità e Statistica Matematica

6 Stima di media e varianza, e intervalli di confidenza

Corso di Laurea in Ingegneria Informatica Anno Accademico 2016/2017 Calcolo delle Probabilità e Statistica Matematica

Soluzioni quarta esercitazione

Probabilità e Statistica Laurea Triennale in Matematica 17/06/2014 Soluzioni traccia B

Università degli Studi di Salerno Pietro Coretto. Corso di Statistica FORMULARIO

Quesito 1. I seguenti dati si riferiscono ai tempi di reazione motori a uno stimolo luminoso, espressi in decimi di secondo, di un gruppo di piloti:

6. Intervalli di confidenza

Campionamento e Statistiche Campionarie. Inferenza. Pietro Coretto Università degli Studi di Salerno

3 Ricorrenze. 3.1 Metodo iterativo

SERIE NUMERICHE Esercizi risolti. (log α) n, α > 0 c)

ESERCIZI - FASCICOLO 1

Corso di Laurea Triennale in Matematica Calcolo delle Probabilità I (docenti G. Nappo, F. Spizzichino)

Sommario. Facoltà di Economia. Campionamento e inferenza statistica

SERIE DI POTENZE Esercizi risolti. Esercizio 1 Determinare il raggio di convergenza e l insieme di convergenza della serie di potenze. x n.

SERIE NUMERICHE FAUSTO FERRARI

Lezione 4 Corso di Statistica. Francesco Lagona

σ della variabile indagata sia nota. La logica dell intervallo di confidenza è allora sintetizzabile come segue:

Esercizi di Analisi II

Elementi di Probabilità e Statistica - 052AA - A.A

x n (1.1) n=0 1 x La serie geometrica è un esempio di serie di potenze. Definizione 1 Chiamiamo serie di potenze ogni serie della forma

Analisi Matematica Soluzioni prova scritta parziale n. 1

1 Esercizi tutorato 27/5

a n (x x 0 ) n. (1.1) n=0

Primo appello di Calcolo delle probabilità Laurea Triennale in Matematica 22/01/2018

Prova d esame di Calcolo delle Probabilità 02/07/2011

LEGGE DEI GRANDI NUMERI

k=0 f k(x). Un altro tipo di convergenza per le serie è la convergenza totale e si dice che la serie (0.1) converge totalmente in J I se

ANalysis. Analisi della Varianza - ANOVA. Aprile, Aprile, Nel linguaggio delle variabili le operazioni fondamentali sono tre

Serie di potenze / Esercizi svolti

Transcript:

Politecico di Milao Apputi delle lezioi del corso di Statistica L per gli allievi INF e TEL, AA 007/008 Itervalli di cofideza Ileia Epifai 5 maggio 010 Il coteuto di queste dispese è protetto dalle leggi sul copyright e dalle disposizioi dei trattati iterazioali. Il materiale qui coteuto può essere copiato o comuque riprodotto ed utilizzato liberamete dagli studeti, dagli istituti di ricerca, scolastici ed uiversitari affereti ai Miisteri della Pubblica Istruzioe e dell Uiversità e della Ricerca Scietifica e Tecologica per scopi istituzioali, o a fie di lucro. Ogi altro utilizzo o riproduzioe ivi icluse, ma o limitatamete a, le riproduzioi a mezzo stampa, su supporti magetici o su reti di calcolatori i toto o i parte è vietata, se o esplicitamete autorizzata per iscritto, a priori, da parte degli autori. L iformazioe coteuta i queste pagie è riteuta essere accurata alla data della pubblicazioe. Essa è forita per scopi meramete didattici. L iformazioe coteuta i queste pagie è soggetta a cambiameti seza preavviso. L autore o si assume alcua resposabilità per il coteuto di queste pagie ivi icluse, ma o limitatamete a, la correttezza, completezza, applicabilità ed aggiorameto dell iformazioe. I ogi caso o può essere dichiarata coformità all iformazioe coteuta i queste pagie. I ogi caso questa ota di copyright o deve mai essere rimossa e deve essere riportata ache i utilizzi parziali. Copyright 006 Ileia Epifai Prima versioe AA 003/004; Secoda versioe AA 004/005; Terza versioe AA 006/007; Edizioe riveduta e corretta AA 007/008 Gli sperabili migliorameti ella correte edizioe derivao da quelli sicuramete apportati dal Prof. Barchielli e dalla Dott.ssa Salvati alla versioe iglese 1

Idice 1 Itervalli di cofideza per media e variaza di popolazioe gaussiaa 3 1.1 Itervalli di cofideza per la media....................... 3 1. Itervalli di cofideza per la variaza...................... 7 1.3 Regioe di cofideza simultaea per media e variaza............. 9 Itervalli di cofideza 10.1 Metodo della quatità pivotale.......................... 11 3 Itervalli di cofideza per gradi campioi 1 4 Dualità fra verifica di ipotesi e stima itervallare 13 4.1 Dall itervallo di cofideza al test di ipotesi.................. 14 4. Dalla teoria delle ipotesi alla regioe di cofideza............... 15

1 Itervalli di cofideza per media e variaza di popolazioe gaussiaa I questa sezioe affrotiamo il problema della stima itervallare dei parametri media e variaza della popolazioe gaussiaa. Nella Sezioe defiiremo gli itervalli di cofideza i geerale per i parametri icogiti di u modello statistico qualuque. Nel seguito useremo le segueti otazioi per i quatili delle distribuzioi campioarie: z a idicherà il quatile di ordie a 0, 1 della f.d.r. gaussiaa stadard Φ, cioè z a = Φ 1 a; t a sarà il quatile di ordie a della f.d.r. t di Studet co gradi di libertà; ifie χ a sarà il quatile di ordie a della f.d.r. chiquadrato co gradi di libertà. 1.1 Itervalli di cofideza per la media Sia X 1,..., X u campioe casuale estratto dalla popolazioe di desità gaussiaa di parametri µ, σ X 1,..., X i.i.d. Nµ, σ. Suppoiamo che la deviazioe stadard σ sia ota e pari a 0.8. Abbiamo proposto e motivato elle lezioi passate l uso della media campioaria X come stimatore di µ. X è uo stimatore putuale di µ. Ma la ozioe di stima putuale o è completamete soddisfacete per il seguete motivo: qualuque sia il valore di µ, X è variabile aleatoria assolutamete cotiua e quidi P µ,σ X = c = 0, c R, µ R, σ > 0 I particolare è ulla la probabilità che X assuma il vero valore icogito di µ. Ma, possiamo forire i termii probabilistici ua misura dell errore che si commette sostituedo al valore del parametro µ il valore assuto dallo stimatore X per data realizzazioe campioaria. Sia ɛ > 0 tale che 1 P µ,σ ɛ < X µ σ/ < ɛ = 0.95 Assegati e σ, ɛ è uivocamete determiato dall equazioe Φɛ 1 = 0.95 e quidi Φɛ 1 = 0.95 sse Φɛ = 1 + 0.95 1 + 0.95 sse ɛ = Φ 1 = z 0.975 1.96 A priori, cioè prima di osservare il risultato dell esperimeto, e quidi, idipedetemete dalla realizzazioe campioaria, siamo abbastaza fiduciosi che l errore che commettiamo stimado µ co X è al più pari a 1.96σ/. Se, per esempio, la dimesioe del campioe è 4, questo errore è 1.96 0.8/ 4 = 0.784. Il grado di fiducia el verificarsi di ciò è misurato i termii di probabilità ed è pari a 95%. La relazioe 1 può essere riscritta come segue: dove P µ,σ T 1 < µ < T = 0.95 T 1 = X z 1+0.95/ σ e T = X + z 1+0.95/ σ I altri termii, a priori, c è ua possibilità pari a 95% che il valore icogito ma determiistico di µ cada ell itervallo aleatorio T 1, T. Gli estremi T 1, T soo statistiche 3

che dipedoo a dal campioe X 1,..., X, b da iformazioi ote sulla f.d.r. del campioe cioè σ e c dal grado di fiducia o livello o coefficiete di cofideza 95%. Ovviamete, essezialmete, T 1 < T. Se poi implemetiamo l esperimeto e osserviamo la realizzazioe campioaria x 1 = 4.87, x = 5.06, x 3 =.8, x 4 = 5.3 allora x = 4.515, t 1 = 4.515 0.784 = 3.785 e t = 4.515 + 0.784 = 5.965. L itervallo aperto t 1, t = 3.785, 5.965 è detto itervallo di cofideza per il parametro µ di livello 0.95. Il sigificato del livello di cofideza è il seguete: se ripetiamo l estrazioe di u campioe di dimesioe 4 dalla popolazioe gaussiaa u umero grade di volte e calcoliamo per oguo dei campioi l itervallo x 0.784, x + 0.784, ci aspettiamo che più o meo il 95% di questi itervalli cotega il valore della vera media µ. Il termie iglese cofidece che abbiamo tradotto come fiducia è usato dopo che l esperimeto è stato effettuato, riservado la parola chace possibilità all itervallo aleatorio prima di osservare l esperimeto campioario. Ifatti quado la realizzazioe campioaria è a ostra disposizioe o ha più seso parlare di possibilità o probabilità: a quel puto, il vero valore della media o cade o o cade ell itervallo umerico trovato e la probabilità coessa a questo eveto sarà zero o uo. I geerale abbiamo la seguete defiizioe. Defiizioe 1.1 Sia x 1,..., x ua realizzazioe del campioe casuale X 1,..., X dalla popolazioe Nµ, σ. Fissato γ 0, 1, se la variaza σ è ota, u itervallo di cofideza per la media µ di livello γ100% è dato da x z 1+γ σ, x + z 1+γ σ Suppoiamo ora che ache la variaza σ sia icogita. Per valutare a priori l errore che commettiamo approssimado µ co X cosideriamo P µ,σ ɛ < X µ/s < ɛ, dove S = S e S è la variaza campioaria e calcoliamo ɛ tale che P µ,σ ɛ < X µ S/ < ɛ = 0.95 Usado il fatto che X µ/s t 1 e che t 1 è ua desità di probabilità simmetrica itoro allo 0, aalogamete al caso di variaza ota, otteiamo che ɛ coicide co il quatile di ordie 1 + 0.95/ della f.d.r. t di studet co 1 gradi di libertà, cioè ɛ = t 1 1 + 0.95/. Suppoedo di avere acora u campioe di dimesioe 4: ɛ = t 3 0.975 3.18 e la relazioe può essere riscritta come X 3.18 S < µ < X + 3.18 S = 0.95 P µ,σ Nell ultima equazioe leggiamo che, prima di osservare le realizzazioi campioarie, è pari a 0.95 la probabilità che l itervallo aleatorio di estremi X 3.18S/ cotega µ. Se poi abbiamo osservato il campioe x 1 = 4.87, x = 5.06, x 3 =.8, x 4 = 5.3 4

allora j=1 x j / 1 8.4876, s = 8.4876 4/34.515 1.337 e s = 1.337 1.1565. Quidi, x 3.18s/ 3.4484 e x + 3.18s/ 5.5765 3.4484, 5.5765 è u itervallo di cofideza per µ di livello 95%. Notate che per calcolare S abbiamo usato la seguete decomposizioe: S = 1 j=1 X j X = j=1 X j 1 X = j=1 X j 1 1 X I geerale Defiizioe 1. Siao x 1,..., x ua realizzazioe del campioe casuale X 1,..., X estratto dalla popolazioe Nµ, σ e x e s le realizzazioi su questo campioe rispettivamete di media e variaza campioarie. Allora 1 + γ s x t 1, x + t 1 1 + γ s è u itervallo di cofideza per µ di livello γ100%, quado la variaza σ è icogita. Osservazioe 1.3 Credo o sia iutile sottolieare che µ è u parametro il cui valore è icogito ma determiistico; quidi, µ X 3.18S/, X + 3.18S/ è u eveto aleatorio i quato gli estremi dell itervallo soo aleatori e o µ. Osservazioe 1.4 U itervallo di cofideza stima µ tramite u itervallo; la lughezza dell itervallo aleatorio a partire dal quale costruiamo l itervallo di cofideza è u idice della precisioe di questa stima itervallare di µ. 1.1 Se σ è ota, la lughezza dell itervallo di cofideza è L = σ z 1+γ L o è aleatoria perché NON dipede dalla particolare realizzazioe campioaria, ma dipede da σ,, γ. I particolare: Fissati σ e, L è fuzioe crescete di γ. Quidi, l itervallo di cofideza è u compromesso fra precisioe e cofideza: più vogliamo essere sicuri che µ cada i u itervallo, meo precisa sarà la stima itervallare, ossia più lugo sarà l itervallo di cofideza cetrato i x. Fissati σ e γ, L è fuzioe decrescete di. All aumetare di, la variaza di X dimiuisce e quidi è sesato che più preciso cioè più corto sia l itervallo. Fissati γ e, L è fuzioe crescete di σ. Ifatti la variaza di X è fuzioe crescete di σ è quidi quato maggiore è σ, tato più grade è la probabilità che X assuma valori lotai da µ e quidi o è trascurabile la probabilità che l itervallo sia più lugo. 1. Se σ è icogita, la lughezza è: t 1+γ 1 L = S 5

Se σ è icogita, L è aleatoria, dipede dalla realizzazioe campioaria tramite S e ha media t 1+γ 1 3/ t 1+γ 1 Γ EL = ES = 1 Γ 1 σ Ifatti, se Y = S 1/σ, allora Y χ 1 e ES = E σ Y = 1 σ E Y 1/ 1 1 1 σ = y 1/ σ f 1 χ 1 y dy = 0 1 0 Γ 1 Γ = σ 1 Γ Γ 1 f χ y dy = σ 0 1 Γ 1 e y y 1 dy Osservazioe 1.5 La scelta di ua stima itervallare di µ simmetrica ella media campioaria o è del tutto arbitraria. Questa scelta è giustificata dal fatto che le variabili aleatorie da cui siamo partiti, X µ/σ se σ è ota e X µ/s se σ è icogita, hao etrambe desità di probabilità simmetriche itoro allo zero e quidi la loro moda cioè il puto i cui la desità è massima è zero. σ Segue per esempio che l itervallo di cofideza di estremi x z 1+γ/ forisce la stima itervallare più precisa di µ el caso di variaza ota e popolazioe gaussiaa fra tutte le stime itervallari del tipo x + a, x + b e di livello γ100%. Osservazioe 1.6 Se la variaza è icogita, per determiare EL abbiamo dovuto calcolare ES e abbiamo otteuto ES = σ 1 Γ Γ 1 I particolare ES σ =,..., qualuque sia il valore di σ. Per esempio, se = allora ES = σ /π < σ. Pertato, il fatto che S sia uo stimatore o distorto della variaza σ o implica che S sia uo stimatore o distorto della deviazioe stadard σ. Comuque, S è u esempio di stimatore asitoticamete o distorto. Ifatti: lim ES = lim σ 1 Γ Γ 1 = lim σ 1 e 1 1 1 = σ Osservazioe 1.7 Effettivamete S sottostima σ. aleatoria costate e quidi VarS > 0. Pertato Ifatti ES = σ, S o è variabile 0 < VarS = ES ES = σ ES da cui otteiamo che ES è strettamete miore di σ. 6

1. Itervalli di cofideza per la variaza Se µ è icogita, per costruire u itervallo di cofideza per σ partiamo dalla quatità aleatoria S 1/σ che dipede dal parametro icogito σ di cui cerchiamo ua stima itervallare ma la cui f.d.r. o dipede da essu parametro icogito, ifatti S 1/σ χ 1. Fissato γ 0, 1, dobbiamo determiare a, b tali che 3 P µ,σ a < S 1 σ < b = γ Per a, b abbiamo varie possibilità. Prediamo i cosiderazioe solo le segueti tre che porterao alla costruzioe di tre diversi itervalli di cofideza γ100% per σ. 1. [a = 0] Se a = 0, allora l equazioe 3 si riduce all equazioe S 1 4 P µ,σ < b = γ σ ell uica icogita b; ecessariamete b = χ 1 γ, quatile di ordie γ della f.d.r. χ 1. L Equazioe 4 è equivalete a P µ,σ σ > S 1 χ 1 γ = γ Se abbiamo la realizzazioe campioaria x 1 = 4.87, x = 5.06, x 3 =.8, x 4 = 5.3 e se γ = 0.95, allora s 4 1 1.337 3, χ 3 0.95 7.81478 e 1.337 3 7.8148, + 0.513, + è u itervallo di cofideza a ua coda superiore upper oe-side cofidece iterval di livello 95%. I geerale, Defiizioe 1.8 Sia γ 0, 1 e sia s il valore assuto da S i corrispodeza della realizzazioe campioaria x 1,..., x di u campioe casuale estratto dalla popolazioe Nµ, σ. Allora s 1 χ, + 1 γ è u itervallo di cofideza a ua coda superiore di livello γ100% per la variaza σ, quado µ è icogita. Ioltre, la statistica S 1/χ 1 γ è detta limite iferiore di cofideza per la variaza.. [b = + ] I questo caso l equazioe 3 diveta 5 P µ,σ a < S 1 σ = γ e abbiamo ua sola icogita a; ecessariamete a = χ 1 1 γ; 5 è equivalete a P µ,σ σ < S 1 χ = γ 1 1 γ 7

Se abbiamo osservato x 1 = 4.87, x = 5.06, x 3 =.8, x 4 = 5.3 e γ = 0.95, allora s 4 1 1.337 3, χ 3 0.05 0.3518; l itervallo 0, 1.337 3 0, 11.4 0.3518 è u itervallo di cofideza a ua coda iferiore lower oe-side cofidece iterval di livello 95%. I geerale, Defiizioe 1.9 Sia γ 0, 1 e sia s il valore assuto da S i corrispodeza della realizzazioe campioaria x 1,..., x di u campioe casuale estratto dalla popolazioe Nµ, σ. Allora s 1 0, 1 γ χ 1 è u itervallo di cofideza a ua coda iferiore di livello γ100% per la variaza σ, quado µ è icogita. Ioltre, la statistica S 1/χ 1 1 γ è detta limite superiore di cofideza per la variaza. 3. 0 < a < b < + Risolviamo l equazioe 3 elle icogite a, b i modo tale che la massa rimaete 1 γ sia uiformemete distribuita a siistra e a destra dell itervallo a, b. Necessariamete: a = χ 1 1 γ e b = χ 1 1 γ + γ = χ 1 Co questa scelta di a e b, riscriviamo l equazioe 3 el seguete modo: 6 P µ,σ S 1 < σ < S 1 = γ χ 1 1+γ χ 1 1 γ 1 + γ Defiizioe 1.10 Sia γ 0, 1 e sia s il valore assuto da S i corrispodeza della realizzazioe campioaria x 1,..., x di u campioe casuale estratto dalla f.d.r. Nµ, σ. Allora s 1, χ 1 1+γ s 1 χ 1 1 γ è u itervallo di cofideza bilatero per σ di livello γ100%, quado µ è icogita. Se abbiamo osservato il campioe x 1 = 4.87, x = 5.06, x 3 =.8, x 4 = 5.3 estratto dalla popolazioe Nµ, σ e γ = 0.95, allora χ 3 0.975 9.35, χ 3 0.05 0.16 e 1.337 3, 1.337 3 0.484, 18.57 9.35 0.16 è u itervallo di cofideza bilatero per σ di livello 95%. 8

Osservazioe 1.11 I dati usati erao stati simulati dalla f.d.r. N4.4, 0.8. Alla luce di questa iformazioe che ovviamete i ua vera applicazioe o abbiamo otiamo che l estremo superiore dell itervallo di cofideza bilatero per la variaza o è affidabile. D altro cato, ella scelta degli estremi o abbiamo seguito essu criterio di ottimalità, ma abbiamo solo semplificato il problema, impoedo ua codizioe di simmetria sulle code. Ifie, costruiamo ua stima itervallare per σ el caso di media µ ota. Se µ è ota, stimiamo σ co la statistica S0 j=1 := X j µ che rappreseta ua misura empirica della dispersioe del campioe itoro alla media teorica µ. Vedremo i seguito che S0 è lo stimatore di massima verosimigliaza di σ el caso di media ota. Notate che la variabile aleatoria S0 /σ ha desità χ e pertato, procededo aalogamete al caso di media µ icogita, troviamo i segueti itervalli di cofideza per σ di livello γ100% quado µ è ota: j=1 x j µ χ, + itervallo di cofideza a ua coda superiore; γ j=1 0, x j µ χ itervallo di cofideza a ua coda iferiore; 1 γ j=1 x j µ j=1, x j µ itervallo di cofideza bilatero. χ 1+γ χ 1 γ 1.3 Regioe di cofideza simultaea per media e variaza Usiamo ora i risultati precedeti per costruire ua regioe di cofideza per ua stima simultaea di µ e σ per popolazioi gaussiae. Partiamo dall osservazioe che X µ/σ e S 1/σ soo variabili aleatorie idipedeti. Allora gli eveti e { } X µ A = σ < z 1+ γ = B = X µ z 1+ γ S 1 < σ < S 1 χ 1 1+ γ χ 1 1 γ < σ soo eveti idipedeti. Ioltre, per quato discusso ella costruzioe dell itervallo di cofideza per µ quado σ è ota e per σ quado µ è icogita, abbiamo P µ,σ A = P µ,σ B = γ e quidi P µ,σ X µ z 1+ γ < σ, S 1 < σ < S 1 = χ 1 1+ γ χ 1 1 γ = P µ,σ A B = P µ,σ AP µ,σ B = γ 9

Segue che 7 µ, σ R 0, : x µ z 1+ γ < σ, s 1 < σ < s 1 χ 1 1+ γ χ 1 1 γ è ua regioe di cofideza per µ, σ di livello γ100%, per ogi realizzazioe campioaria x 1,..., x di X 1,..., X i.i.d. Nµ, σ tale che la media campioaria e la variaza campioaria hao valore rispettivamete x e s. Se abbiamo osservato x 1 = 4.87, x = 5.06, x 3 =.8, x 4 = 5.3 allora ua regioe di cofideza di livello 95% per µ, σ è la regioe del piao così delimitata: { µ, σ : σ > 1.0414.515 µ, 0.484 < σ < 18.57 } Itervalli di cofideza Estediamo la ozioe itervallo di cofideza al caso di u modello statistico o ecessariamete gaussiao. Sia X 1,..., X u campioe casuale estratto dalla popolazioe co desità fx, θ co θ Θ R m. Cosideriamo la famiglia di sottoisiemi di Θ, {Sx 1,..., x Θ : x 1,..., x R }, cioè otteuta al variare delle realizzazioi campioarie x 1,..., x di X 1,..., X. Ciascu isieme Sx 1,..., x può essere letto come realizzazioe dell isieme aleatorio SX 1,..., X. Defiizioe.1 Sia x 1,..., x ua realizzazioe del campioe casuale X 1,..., X estratto da fx, θ co θ Θ e sia γ 0, 1. Il sottoisieme di Θ dato da Sx 1,..., x è detto regioe o isieme di cofideza per θ di livello γ100% se P θ SX 1,..., X θ γ cioè se l isieme aleatorio SX 1,..., X cotiee il vero valore del parametro θ co probabilità almeo pari a γ. Se κθ è ua caratteristica della popolazioe uidimesioale ed esistoo due statistiche T 1 X 1,..., X e T X 1,..., X tali che P θ T 1 X 1,..., X < T X 1,..., X = 1 θ Θ e 8 P θ T 1 < κθ < T γ θ Θ allora l itervallo T 1 x 1,..., x, T x 1,..., x è detto itervallo di cofideza per κθ di livello γ100%. Osservazioe. È usuale assegare il ome itervallo di cofideza ache all itervallo aleatorio T 1 X 1,..., X, T X 1,..., X. Defiizioe.3 Sia κθ ua caratteristica della popolazioe. Se T U è ua statistica tale che 9 P θ [κθ < T U γ θ Θ allora T U è u limite superiore di cofideza di livello γ per κθ e l itervallo 0, t U è u itervallo a ua coda iferiore di livello γ per κθ. Se T L è ua statistica tale che 10 P θ [κθ > T L ] γ θ Θ 10

allora T L è u limite iferiore di cofideza di livello γ per κθ e t L, è u itervallo a ua coda superiore di livello γ per κθ. Se le statistiche T 1, T, T U, T L soo variabili aleatorie cotiue, allora per determiare gli itervalli di cofideza ci sarà l uguagliaza P θ = γ al posto di P θ γ elle equazioi 8, 9 e 10. Ivece, el caso discreto, potrebbe risultare impossibile sostituire P θ = γ a P θ γ elle equazioi 8, 9 e 10. Esempio.4 Sia X 1,..., X u campioe casuale estratto dalla popolazioe di desità fx, θ = 1/θe x/θ 1 0, x, θ > 0. 1. Determiate lo stimatore ML della caratteristica κθ = E θ X.. Sia T lo stimatore di κθ otteuto al puto 1. Determiate la desità di T/θ, θ > 0. 3. Suppoiamo ora = 10 e x = 3. Usado il risultato otteuto al puto., propoete u itervallo di cofideza uilatero della forma 0, u di livello 95% per la caratteristica κθ = E θ X. Soluzioe 1. κθ = E θ X = θ e T = X è stimatore ML di θ. Ifatti la fuzioe di verosimigliaza è L θ x 1,..., x = j=1 fx j, θ = 1/θ exp{ j=1 x j/θ} =....... j=1 X j è somma di variabili aleatorie i.i.d. co desità Γ1, θ; allora j=1 X j Γ, θ. Ioltre, se W Γa, b, allora cw Γa, cb, c > 0. I defiitiva 3. Osserviamo che T θ = j=1 X j θ P θ θ < T T = P θ k θ Γ, = χ > k = 0.95 se e solo se k = χ 0.05 = χ 0 0.05 10.9. Pertato, 0, 10 3/10.9] 0, 5.505] è u itervallo di cofideza di livello 95% per θ. I geerale, 0, è u itervallo di cofideza per θ di livello γ, co γ 0, 1. P j x j χ 1 γ Esercizio.5 Sia X 1,..., X u campioe casuale estratto dalla popolazioe di desità fx, θ = 1/θe x/θ 1 0, x, θ > 0. 1. Propoete u itervallo di cofideza γ100% a ua coda superiore per θ.. Propoete u itervallo di cofideza γ100% bilatero per θ..1 Metodo della quatità pivotale Tutti gli itervalli di cofideza foriti elle sezioi precedeti, da quello per la media e la variaza della popolazioe gaussiaa a quello per la media della desità espoeziale dell Esempio.4, soo stati costruiti a partire da ua quatità che dipede sia dal campioe che dai parametri icogiti, ma la cui distribuzioe o dipede dai parametri icogiti. Descriviamo i termii geerali il metodo usato, oto i letteratura come metodo della quatità pivotale. Defiizioe.6 Quatità pivotale Sia X 1,..., X u campioe casuale estratto dalla popolazioe di desità fx, θ e sia Q θ ua fuzioe di X 1,..., X e del parametro θ, cioè Q θ = qx 1,..., X, θ. Se la legge di Q θ o dipede da θ, Q θ è detta quatità pivotale. 11

Esempio.7 1. Se X 1,..., X è u campioe casuale estratto dalla popolazioe gaussiaa N µ, σ, esempi di quatità pivotali soo le segueti: Q 1 µ,σ = X µ/σ N 0, 1, Q µ = X µ/s t 1, Q 3 µ,σ = j=1 X j µ /σ χ, Q 4 σ = S 1/σ χ 1.. Se X 1,..., X i.i.d. Eθ, Q θ = X/θ χ è ua quatità pivotale. Osservate che ua quatità pivotale NON è ua statistica, perché ua statistica dipede solo dal campioe, ma la sua distribuzioe campioaria i geerale dipede dai parametri. Decriviamo ora come fuzioa il metodo della quatità pivotale per costruire u itervallo di cofideza per ua caratteristica κθ. Primo passo Sia Q θ = qx 1,..., X, θ ua quatità pivotale. Poiché la sua distribuzioe o dipede da θ, allora per ogi γ 0, 1 esistoo due umeri q 1, q dipedeti soltato da γ e o da θ tali che P θ q 1 < Q θ < q = γ. Come primo passo determiiamo delle soluzioi q 1, q dell equazioe P θ q 1 < Q θ < q = γ. Secodo passo Cotrolliamo se, per ogi realizzazioe campioaria x 1,..., x, la diseguagliaza q 1 < qx 1,..., x, θ < q può essere riscritta ivertita i t 1 x 1,..., x < κθ < t x 1,..., x, per qualche statistica T 1 = t 1 X 1,..., X e T = t X 1,..., X. Se ciò vale, allora γ = P θ q 1 < Q θ < q = P θ T 1 < κθ < T e t 1, t è u itervallo di cofideza 100γ% per κθ. Osservazioe.8 Notate che per ogi γ fissato possoo esserci diversi valori di q 1, q tali che P θ q 1 < Q θ < q = γ e quidi diversi itervalli di cofideza γ. Lo abbiamo già sperimetato ella costruzioe degli itervalli di cofideza della variaza di popolazioe gaussiaa, dove abbiamo descritto solo tre possibili scelte delle coppie q 1, q che hao portato a tre diversi itervalli di cofideza. 3 Itervalli di cofideza per gradi campioi I questa sezioe affrotiamo il problema della costruzioe di u itervallo di cofideza approssimato per ua caratteristica della popolazioe i preseza di u campioe umeroso. Itervallo approssimato per la media. Partiamo dal caso i cui la caratteristica per cui costruire u IC è la media teorica del modello µ = EX 1. Sia X 1,..., X u campioe casuale estratto da ua popolazioe che ha media µ e variaza σ e σ è o ulla. Sappiamo dal teorema cetrale del limite che la media campioaria X è asitoticamete gaussiaa co media µ e variaza σ /. Quidi, se abbiamo a disposizioe u umero sufficietemete X µ elevato di osservazioi, approssimativamete vale che σ / N 0, 1. Se σ o è ota, il risultato è preservato ache quado sostitutiamo σ co la variaza campioaria S, cioè X µ per grade, approssimativamete N 0, 1. Ripetedo quato già fatto ella S / costruzioe di u itervallo di cofideza per la media da popolazioe gaussiaa, otteiamo che s s x z 1+γ, x + z 1+γ 1

è u itervallo di cofideza per µ se la variaza è icogita, di livello approssimativamete pari a γ100% x e s rappresetao le realizzazioi campioarie di media e variaza campioarie. Itervallo approssimato per ua caratteristica κθ. Per costruire itervalli di cofideza approssimati per ua geerica caratteristica κθ, ua strada si basa sull uso dello stimatore di massima verosimigliaza per κθ, a patto che esista e la gaussiaità asitotica dello stimatore valga. Cosideriamo u campioe casuale umeroso X 1,..., X estratto da ua popolazioe di desità fx, θ e sia ˆκ lo stimatore di massima verosimigliaza della caratteristica della popolazioe κθ. Suppoiamo che siao soddisfatte tutte le ipotesi di regolarità che garatiscoo ˆκ κθ la gaussiaità asitotica di ˆκ. Segue che, per grade, N 0, 1, κ θ /Iθ dove Iθ è l iformazioe di Fisher. Allora, per otteere u itervallo di cofideza γ100% approssimato, dovremo a procedere a ivertire la seguete ˆκ κθ P θ z 1+γ < < z κ θ 1+γ = γ Iθ Se o riusciamo a ivertire, potremo procedere a sostituire all iformazioe di Fisher Iθ e a κ θ le rispettive stime di massima verosimigliaza date da Iˆθ e κ ˆθ. Otterremo così il seguete itervallo di cofideza γ100% approssimato: ˆκ z 1+γ κ ˆθ, ˆκ + z 1+γ Iˆθ κ ˆθ Iˆθ Esempio 3.1 Sia X 1,... X u campioe casuale estratto da ua popolazioe di desità geometrica di parametro θ 0, 1. Lo stimatore di massima verosimigliaza di θ è dato da 1/ X, 1 l iformazioe di Fisher del modello è Iθ = θ e lo stimatore di massima 1 θ X verosimigliaza di Iθ è 1 1/ X. Segue che u itervallo di cofideza bilatero asitotico di livello approssimativamete γ100% per θ è dato da 1 x z 1+γ 1 x 1 1 x, + z 1+γ 1 x 1 x 1 1 x 4 Dualità fra verifica di ipotesi e stima itervallare Esiste ua stretta relazioe fra la teoria della verifica di ipotesi e degli itervalli di cofideza. Diamoe qui u idea facedo vedere che i u itervallo di cofideza bilatero di livello γ per u parametro uidimesioale θ può essere usato per costruire u test di ipotesi di livello α = 1 γ per verificare H 0 = θ 0 e, viceversa, che 13

Solo iformalmete faremo vedere ache come usare u itervallo di cofideza uilatero per verificare ipotesi uilatere sulla variaza da popolazioe gaussiaa. ii ua famiglia di test: {X 1,..., X ; H 0 = θ 0, H 1 : θ θ 0 ; G θ0 } θ0 Θ può essere usata per costruire ua regioe di cofideza per θ. 4.1 Dall itervallo di cofideza al test di ipotesi Sia x 1,..., x la realizzazioe di u campioe casuale X 1,..., X estratto da fx, θ e sia ICx 1,..., x u itervallo di cofideza per θ di livello γ, cioè tale che P θ θ ICX 1,..., X = γ. Siamo iteressati a verificare: H 0 = θ 0 cotro H 1 : θ θ 0. Cosideriamo il sottoisieme di R 11 A 0 = {x 1,..., x R : θ 0 ICx 1,..., x } Allora x 1,..., x A 0 se e solo se θ 0 ICx 1,..., x e quidi P θ0 A 0 = P θ0 θ 0 ICX 1,..., X = γ Segue che G := A c 0 è ua regioe critica per H 0 = θ 0 cotro H 1 : θ θ 0 di ampiezza α = 1 γ. Praticamete, per verificare H 0 : θ = θ 0 cotro H 1 : θ θ 0 a u livello di sigificatività α, determiiamo u itervallo di cofideza bilatero 1 α100% per θ. Se l itervallo cotiee θ 0 accettiamo H 0, altrimeti la rifiutiamo. Esempio 4.1 Test bilatero sulla media da popolazioe gaussiaa co σ ota Sia X 1,..., X i.i.d. Nµ, σ. Se la variaza è ota, u itervallo di cofideza bilatero γ100% per la media µ è σ σ ICx 1,..., x = x z 1+γ, x + z 1+γ Procededo come i 11, defiiamo G = { x 1,..., x R : µ 0 = x 1,..., x R : x µ 0 σ σ z 1+γ, x + z 1+γ x σ z 1+γ Ritroviamo la regioe critica del test del rapporto di verosimigliaza di livello α = 1 γ per H 0 : µ = µ 0 cotro H 1 : µ µ 0, per popolazioe gaussiaa co variaza ota. } Esempio 4. Test bilatero sulla media da popolazioe gaussiaa co σ icogita Sia X 1,..., X i.i.d. Nµ, σ. Se σ è icogita, u IC bilatero γ100% per la media µ è s s ICx 1,..., x = [ x t 1+γ 1, x + t 1+γ 1] 14

Defiiamo ora { s G = x 1,..., x R s : x t 1+γ 1 < µ 0 < x + t 1+γ 1 = x 1,..., x R x µ 0 : t 1+γ 1 s } c Scopriamo che G è la regioe critica del test del rapporto di verosimigliaza di livello α = 1 γ per H 0 : µ = µ 0 cotro H 1 : µ µ 0, per popolazioe gaussiaa co variaza icogita. Esempio 4.3 Test bilatero sulla variaza da popolazioe gaussiaa co µ icogita Sia X 1,..., X i.i.d. Nµ, σ. Se la media µ è icogita, u IC bilatero 1 α100% per la variaza σ è ICx 1,..., x = s 1 χ 1 1 α, s 1 χ α 1 Defiiamo ora { } G = x 1,..., x R : σ0 s 1 χ 1 1 α, s 1 χ α 1 { = x 1,..., x R : or s 1 α σ0 χ 1 or s 1 σ0 χ 1 1 α } Allora G è ua regioe critica di livello α per H 0 : σ = σ 0 cotro H 1 : σ σ 0, per popolazioe gaussiaa co media icogita. Esempio 4.4 Test uilatero sulla variaza da popolazioe gaussiaa co µ ota Costruiamo u test di ipotesi per H 0 : σ σ0 cotro H 1 : σ < σ0, quado la media è ota. s 0 Sappiamo che 0, χ è u itervallo di cofideza a ua coda iferiore per σ. Qui- 1 γ di abbiamo alta cofideza γ che il vero valore di σ sia miore o uguale di s 0 χ 1 γ. Cioè, stado ai dati, u valore di σ s 0 χ 1 γ è altamete implausibile. Pertato, se σ 0 s 0 χ 1 γ, allora ogi σ compatibile co H 0 o è plausibile. Rifiutare H 0 : σ σ0 a favore di H 1 : σ < σ0 se σ 0 s 0 χ 1 γ è allora ua regola decisioale sesata. Il test per la variaza da popolazioe gaussiaa co media ota, costruito sulla base di questa regola, ha regioe critica G = {x 1,..., x : s 0 χ σ 1 γ} di sigificatività α = 1 γ. 0 4. Dalla teoria delle ipotesi alla regioe di cofideza Viceversa, cosideriamo ua famiglia di test di ipotesi tutti di livello α: {X 1,..., X ; H 0 = θ 0, H 1 : θ θ 0 ; G θ0 } θ0 Θ, cioè abbiamo u test di ipotesi per ogi possibile specificazioe di θ 0 i Θ. Allora 1 SCx 1,..., x := {θ 0 Θ : x 1,..., x G θ0 } 15

è u sottoisieme di Θ aleatorio perché varia al variare delle realizzazioi campioarie tale che P θ0 θ 0 SCX 1,..., X = P θ0 x 1,..., x G θ0 = 1 P θ0 G θ0 = 1 α. Quidi, se x 1,..., x è ua realizzazioe del campioe casuale, allora SCx 1,..., x è ua regioe di cofideza 1 α100% per θ. Esempio 4.5 Test bilatero sulla media da popolazioe gaussiaa co σ icogita Sia X 1,..., X i.i.d. Nµ, σ co σ oto. Allora Aµ 0 = x 1..., x R x µ 0 : < z 1 α σ è la regioe di accettazioe di ampiezza α del test del rapporto di verosimigliaza per H 0 : µ = µ 0 cotro H 1 : µ µ 0. Procededo come i 1 possiamo defiire: ICx 1,..., x := µ x µ 0 σ 0 R : < z 1 α σ = σ x z 1 α, x + z 1 α riotteedo così l itervallo di cofideza per la media di ua popolazioe gaussiaa di variaza ota, di livello γ = 1 α e di miima lughezza. 16