UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 II Esonero - 15 Gennaio 2015

Documenti analoghi
UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2016/2017 Appello A - 27 Gennaio 2017

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. I Esonero - 29 Ottobre Tot.

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. II Esonero - 10 Gennaio 2014

II Esonero - Testo B

Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D

I appello di calcolo delle probabilità e statistica

UNIVERSITÀ DEGLI STUDI DI PERUGIA

Statistica Metodologica

Gli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana

PROVA SCRITTA DI STATISTICA (COD COD ) 7 luglio 2005 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A

Esercizi di Probabilità e Statistica

9. Test del χ 2 e test di Smirnov-Kolmogorov. 9.1 Stimatori di massima verosimiglianza per distribuzioni con densità finita

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi

ESERCITAZIONE N. 7 corso di statistica

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Esercizi di statistica

Test d ipotesi. Monica Musio, Maria Luisa Targhetta

Probabilità e Statistica

Soluzioni ottava esercitazione

Corso di Statistica - Prof. Fabio Zucca IV Appello - 5 febbraio Esercizio 1

Elementi di Probabilità e Statistica - 052AA - A.A

Esercitazione 8 maggio 2014

E n 1 n. n i. n 2. n 2 ( n

4. Stime & Test. Corso di Simulazione. Anno accademico 2008/09

(a) Determinare lo stimatore di massima verosimiglianza θ di θ. (b) Calcolare la funzione di score e l informazione di Fisher.

Stima puntuale di parametri

Probabilità e Statistica

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi

PROBABILITÀ E STATISTICA - 23 Giugno 2017 Scrivere le risposte negli appositi spazi. Motivare dettagliatamente le risposte su fogli allegati

Statistica di base (Canale E-M) Istruzioni (da leggere bene prima dell esame):

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07

STATISTICA AZIENDALE Modulo Controllo di Qualità

Statistica Applicata all edilizia: Stime e stimatori

Problema 1. Cognome, Nome: Facoltà di Economia Statistica Esame 1-20/01/2010: A. Matricola: Corso:

MODELLI PROBABILISTICI E STATISTICI

Test per una media - varianza nota

Intervalli di confidenza

Probabilità e Statistica

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

Stima puntuale di parametri

STATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE

Probabilità e Statistica

Esercitazione del 29 aprile 2014

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E

R - Esercitazione 5. Andrea Fasulo Venerdì 16 Dicembre Università Roma Tre

Corso di Statistica - Prof. Fabio Zucca V Appello - 19 febbraio 2015

Disuguaglianza di Cramér-Rao

ESAME. 9 Gennaio 2017 COMPITO A

Verifica di ipotesi. Parte VI. Verifica di ipotesi

Esercitazione del 16/04/2019 Istituzioni di Calcolo delle Probabilità

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2008/09

Statistica Inferenziale

Un tipico esame consiste di tre domande del tipo sottostante:

Gli intervalli di Confidenza. Lezione 9- Inervalli di Confidenza 1

Esercitazioni di Statistica

Corso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 2007

Statistica Matematica A Docente: Dott. F. Zucca. II prova in itinere

Lezione 17. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 17. A. Iodice

ESAME. 9 Gennaio 2017 COMPITO B

Esercitazione del 04/06/2015 Probabilità e Statistica Foglio 14

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica CR410 - Crittografia - A.A. 2010/2011. II Esonero - 6 Giugno Tot.

Facoltà di Ingegneria Calcolo delle Probabilità e Statistica Ingegneria Civile e A&T e Informatica

Esercitazione del 28/02/2012 Istituzioni di Calcolo delle Probabilità

Probabilità e Statistica

Esercitazione del 21/02/2012 Istituzioni di Calcolo delle Probabilità

Facoltà di ECONOMIA Corso di Statistica a.a. 2005/2006 Esame del 27/09/2006 Calcolo delle Probabilità e Inferenza

Regressione lineare. Lucio Demeio Dipartimento di Ingegneria Industriale e Scienze Matematiche Università Politecnica delle Marche.

Intervalli di confidenza

Scritto del

4. Si supponga che il tempo impiegato da una lettera spedita dall Italia per arrivare a destinazione segua una distribuzione normale con media

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

Corso di probabilità e statistica

Statistica Inferenziale

Laboratorio di Probabilità e Statistica

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Esperimentazioni di Fisica 1. Prova in itinere del 12 giugno 2018

Probabilità 1, laurea triennale in Matematica Prova scritta sessione invernale a.a. 2008/09 del 26/01/2010

UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a.

Outline. 1 v.c. continue. 2 v.c. Normale. 3 v.c. Esponenziale. Lezione 13. A. Iodice. v.c. continue. v.c. Normale. v.c.

Scritto del

Distribuzione Normale

Problema 1. Cognome, Nome: Facoltà di Economia Statistica Esame 5-19/11/2009: A. Matricola: Corso:

Corso in Statistica Medica

Statistica I. Ingegneria Gestionale. Scritto del 17/07/2012

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 8/04/2016

Esercizi 6 - Variabili aleatorie vettoriali, distribuzioni congiunte

Analisi e scelta dei dati di input

Esercitazione del 19/02/2013 Istituzioni di Calcolo delle Probabilità

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 3

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.

STATISTICA (modulo II - Inferenza Statistica) Soluzione Esercitazione I

Transcript:

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 014/015 II Esonero - 15 Gennaio 015 1 3 4 5 6 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato, senza consegnare altri fogli e accompagnando le risposte con spiegazioni complete, chiare ed essenziali. Scrivere il proprio nome su ogni foglio nello spazio predisposto. Non è consentito l utilizzo di libri o appunti; non è consentito l uso di calcolatrici. Tempo: h. COGNOME:........................... NOME:........................... MATRICOLA:...............

Esercizio 1. Sia X 1,..., X n un campione casuale di ampiezza n estratto da una popolazione con densità f(x; θ), θ Θ. Sia T = T (X 1,..., X n ) stimatore non distorto di θ. 1. (pt) Definire cosa si intende col dire che T è una statistica completa.. (pt) Sia S = S(X 1,..., X n ) un altro stimatore non distorto di θ. Supponendo che T sia una statistica sufficiente e completa, dimostrare che E(S T ) = T (con probabilità 1). 3. (3pt) Sia n = e f(x; θ) la densità di una variabile aleatoria discreta, con θ N \ {0} e f(x; θ) = 1/θ se x {1,..., θ}, f(x; θ) = 0 altrimenti. Sia M = max{x 1, X }. Dimostrare che M è una statistica completa. (sugg.: calcolare prima di tutto la densità discreta di M, i.e., h(m; θ) = P θ (M = m) =... e poi verificare la definizione). 1. Cfr. lezione del 0 novembre 014 o Mood Graybill Boes par. 7.5.. Per il teorema di Lehmann Scheffé T è stimatore UMVUE per θ. Siccome T è sufficiente, allora per il teorema di Rao Blackwell anche S = E(S T ) è stimatore non distorto di θ e V ar θ (S ) V ar θ (T ) per ogni θ, dove la disuguaglianza deve essere stretta per almeno un valore di θ a meno che S = T con probabilità 1. Ma T è UMVUE, quindi V ar θ (S ) = V ar θ (T ) per ogni θ e perciò E(S T ) = T con probabilità 1. Oppure: S := E(S T ) è funzione di T ; siccome T è una statistica sufficiente allora, per il teorema di Rao Blackwell, anche S è uno stimatore non distorto di θ. quindi S T è funzione di T e E(S T ) = 0 indipendentemente da θ. Siccome T è una statistica completa allora P (S = T ) = 1 per ogni θ Θ, i.e., E(S T ) = T. 3. P θ (M = m) = P θ (X 1 = m, X m 1) + P θ (X 1 m, X = m). Quindi P θ (M = m) = 0 se m > θ, mentre è pari a 1 m 1 θ θ + m 1 θ θ = m 1 θ se m θ. Sia g funzione t.c. g(m) sia una statistica. Assumiamo per ipotesi che E θ (g(m)) = 0 per ogni θ. θ θ E θ (g(m)) = g(m)p θ (M = m) = g(m) m 1 θ. m=1 Quindi E θ=1 (g(m)) = 0 g(1) = 0, E θ= (g(m)) = 0 g() = 0 etc. Per induzione g(m) = 0 per ogni m. Perciò g(m) = 0 e quindi P θ (g(m) = 0) = 1 per ogni θ. Quindi M è una statistica completa. m=1

Esercizio. Sia X campione casuale di ampiezza 1 estratto da una densità esponenziale di parametro λ > 0, i.e. f(x; λ) = λe λx con x > 0. 1. (pt) Dimostare che Q = λx è una quantità pivotale.. (pt) Utilizzare la Q del punto precedente per costruire un intervallo di confidenza al 100γ percento per λ e con estremo inferiore pari a 0. 3. (pt) Calcolare esplicitamente l estremo superiore dell intervallo nel caso in cui la realizzazione campionaria sia x = 10 e γ = 1 1 e. 1. Per definizione una quantità pivotale è una variabile aleatoria funzione di X e λ ma la cui distribuzione non dipende dal parametro incognito λ. La funzione di distribuzione F Q (x) = P λ (λx x) = P λ (X x/λ) = F X (x/λ), quindi f Q (x) = f(x/λ; λ) 1 λ = e x, perciò la distribuzione di Q non dipende da λ, i.e., Q è una quantità pivotale.. Q è un esponenziale di parametro 1. Siano a 0 e b > 0 tali che P (a < Q < b) = γ. Allora P ( a X < λ < ) ( b X = γ, quindi a X, ) b X è un intervallo di confidenza al 100γ percento per λ. Poniamo a = 0. Per ipotesi vogliamo che P (0 < Q < b) = γ, cioè che b 0 e x dx = γ, da cui ( b = log(1 γ). Quindi 0, log(1 γ) X ) è l intervallo (aleatorio) di confidenza cercato. 3. Sostituendo nella formula precedente: log(1 γ) = log(1/e) = 1, quindi l intervallo di confidenza (osservato) è ( 0, 1 10).

Esercizio 3. Il tempo totale necessario a fabbricare una banconota ha distribuzione normale di media µ incognita e varianza σ. In un esperimento in cui sono state prodotte 9 banconote, il tempo medio per la loro fabbricazione è risultato di 60 minuti, e la deviazione standard (campionaria) dei tempi è risultata pari a 3 minuti. 1. (pt) Nel caso in cui non si hanno informazioni su σ, si determini un intervallo di confidenza al 95% per la media µ.. (pt) Si supponga di sapere che σ = 9. Si determini anche in questo caso un intervallo di confidenza al 95% per la media µ. Per lo svolgimento dell esercizio può essere utile conoscere alcuni di questi valori: t 9,0.975 =.3; t8,0.975 =.3; t9,0.95 = 1.8; t8,0.95 = 1.9; z 0.975 =.0; z0.95 = 1.6; χ 9,0.975 =.7; χ 8,0.975 =.; χ 9,0.95 = 3.3; χ 8,0.95 =.7; χ 9,0.05 = 16.9; χ 8,0.05 = 15.5; χ 9,0.05 = 19.0; χ 8,0.05 = 17.5 dove, come al solito, t n,α è il quantile di ordine 1 α di una t di Student con n gradi di libertà; z α è il quantile di ordine 1 α di una normale standardizzata e χ n,α è il quantile di ordine 1 α di una chi-quadro con n gradi di libertà. 1. Per quanto visto nella lezione del dicembre 014, un intervallo di confidenza al 100γ percento per la media di una popolazione normale, se la varianza è incognita, è ( X t n 1, 1 γ S, X + t n n 1, 1 γ ) S, n dove n è l ampiezza del campione, X la media campionaria, S = S la deviazione standard campionaria (i.e., la radice della varianza campionaria). Nel nostro caso n = 9 e, sulla realizzazione campionaria, X vale 60 e S vale 3. Inoltre γ = 95%, perciò ci interessa conoscere t 8,0.05. Per la simmetria della distribuzione t di Student, t 8,0.05 = t 8,0.975, quindi l intervallo di confidenza cercato è, svolgendo i calcoli, (57.7, 6.3).. Per quanto visto nella lezione del 7 novembre 014, un intervallo di confidenza al 100γ percento per la media di una popolazione normale, con varianza nota σ, è ( X z 1 γ σ, X + z 1 γ n ) σ, n dove n è l ampiezza del campione e X la media campionaria. Nel nostro caso n = 9 e, sulla realizzazione campionaria, X vale 60. Inoltre γ = 95%, perciò ci interessa conoscere z 0.05. Per la simmetria della distribuzione normale, z 0.05 = z 0.975, quindi l intervallo di confidenza cercato è, svolgendo i calcoli, (58, 6).

Esercizio 4. Sia e 4x se 0 < x < 1 f 0 (x) = 4 4x se 1 x < 1 0 se x 0 o x 1 f 1 (x) = 1 se 0 < x < 1 (0 altrimenti). Sia f(x; θ) (con θ {0, 1}) pari a f 0 (x) se θ = 0 e pari a f 1 (x) se θ = 1. Sia X un campione casuale di ampiezza 1 estratto da una popolazione di densità f(x; θ). Attraverso il campione si vuole verificare l ipotesi H 0 : θ = 0 in alternativa all ipotesi H 1 : θ = 1. 1. (pt) Determinare il rapporto di verosimiglianza semplice λ(x).. (pt) Sia k > 0. Sia Y il test del rapporto di verosimiglianza semplice, di ampiezza α, così concepito: si rifiuti H 0 se λ(x) < k, si accetti H 0 altrimenti. Y è un test uniformemente più potente di ampiezza α? 3. (3pt) Determinare k in modo che α sia pari all 81%. 1. Per definizione il rapporto di verosimiglianza semplice è il rapporto tra la funzioni di verosimiglianza { L 0 (x),(i.e., L(θ; x) con θ = 0) e L 1 (x) (i.e., L(θ; x) con θ = 1). Quindi 4x se 0 < x < 1 λ(x) = 4 4x se 1, non è definito altrimenti. x < 1. Sia C = {x t.c. 0 < x < 1 e λ(x) < k}. Per definizione C (0, 1) è la regione critica del test Y e x C λ(x) < k. Quindi, banalmente, Y è un UMP-test per il lemma di Neyman Pearson. 3. Per definizione l ampiezza del test Y è P θ=0 (λ(x) < k) = P θ=0 (4X < k, X < 1/) + P θ=0 (4 4X < k, X 1/) = P θ=0 (X < min{k/4, 1/}) + P θ=0 (X > max{1 k/4, 1/}). Supponiamo (come ragionevole) che k : abbiamo quindi che l ampiezza del test è pari a P θ=0 (X < k/4) + P θ=0 (X > 1 k/4), cioè k/4 4xdx + 1 (4 4x)dx. Svolgendo i calcoli, 0 1 k/4 l ampiezza (in funzione di k) risulta k 4, quindi il k cercato è k = 1.8.

Esercizio 5. Sia {g(t; θ)}, al variare di θ Θ, una famiglia di densità di probabilità per una variabile aleatoria univariata T (Θ intervallo R). 1. (pt) Definire cosa si intende col dire che T ha rapporto di verosimiglianza monotono non decrescente.. (3pt) Siano X 1, X variabili aleatorie Bernoulliane, indipendenti e identicamente distribuite, di parametro p [0, 1]. Dimostrare che T = X 1 +X ha rapporto di verosimiglianza monotono non decrescente. 3. (3pt) Si enunci il teorema di Karlin Rubin per la determinazione di test uniformemente più potenti per ipotesi composte unilaterali. 1. Cfr. lezione del 9 dicembre 014 o Mood Graybill Boes par. 9.3... T ha distribuzione binomiale di parametri n = e p. Quindi T ha famiglia di densità g(x; p) = ( x) p x (1 p) x con x {0, 1, } e p [0, 1]. Per p > p 1 calcoliamo r(x) = g(x;p) g(x;p 1) = p x (1 p) x p. x 1 (1 p1) x 1 p 1 p 1 Quindi r(0) = (1 p) (1 p 1), r(1) = p(1 p) p, r() = p 1(1 p 1). Dato che p p > p 1 allora 1 < p p 1, perciò r(0) r(1) r() e quindi T ha rapporto di verosimiglianza monotono non decrescente. 3. Cfr. lezione del 9 dicembre 014 o Mood Graybill Boes par. 9.3..

Esercizio 6. La quantità di liquido erogata, ad ogni attivazione, da due distributori A e B di una stessa bevanda, si assume avere distribuzione normale di media µ A e varianza σa (per il distributore A) e di media µ B e varianza σb (per il distributore B). I parametri sono tutti incogniti. Si mettono in funzione i due distributori: su 10 bevande versate dal distributore A si ha un volume medio di 03 ml e una deviazione standard campionaria di 3 ml. Su 15 bevande versate dal distributore B si ha un volume medio di 06 ml e una deviazione standard campionaria di 5 ml. Si vuole testare l ipotesi H 0 : σa = σ B in alternativa all ipotesi H 1 : σa σ B. 1. (pt) Utilizzando i dati raccolti, si può rigettare l ipotesi nulla ad un livello di significatività del 5%? (Descrivere il test di ipotesi utilizzato).. (pt) Calcolare il p-value dei dati per il test del punto precedente. Per lo svolgimento dell esercizio può essere utile conoscere alcuni di questi valori: F 10,15,0.975 = 0.8; F10,15,0.95 = 0.35; F10,15,0.05 =.54; ; F10,15,0.05 = 3.06; F9,14,0.975 = 0.6; F 9,14,0.95 = 0.33; F9,14,0.05 =.65; F9,14,0.05 = 3.1; P (F 10,15 0.36) = 0.05; P (F 9,14 0.36) = 0.06; P (F 10,15 0.6) = 0.1; P (F 9,14 0.6) = 0.; t 5,0.05 = 1.71; t5,0.05 =.06; t3,0.05 = 1.71; t3,0.05 =.07; P (t 5 1.7) = 0.95; P (t 3 1.7) = 0.95; dove, come al solito, F n,m ha distribuzione F con n e m gradi di libertà e F n,m,α è il quantile di F n,m di ordine 1 α; t n ha distribuzione t di Student con n gradi di libertà e t n,α è il quantile di t n di ordine 1 α. 1. Per quanto visto a lezione (16 dicembre 014, oppure Mood-Graybill-Boes, par. 9.4.4) un possibile test di ampiezza α per verificare l uguaglianza delle varianze delle due popolazioni è il seguente: si rifiuti H 0 se la statistica test S X S, calcolata sui campioni, è maggiore di Y F n 1,m 1,α/ o è minore di F n 1,m 1,1 α/, dove SX e S Y sono le varianze (campionarie) del primo e del secondo campione, n è l ampiezza del primo campione, m è l ampiezza del secondo campione. Nel caso specifico: SX = 9, S Y = 5, n = 10, m = 15, perciò la stastistica test vale 0.36, e tale valore va confrontato con F 9,14,0.05 = 3.1 e F9,14,0.975 = 0.6, quindi l ipotesi nulla non si può rifiutare (ad un livello di significatività del 5%).. Il valore p dei dati è il livello di significatività α per cui, in base ai dati raccolti, si passa dall accettazione al rifiuto dell ipotesi nulla. È perciò quel valore α per cui F 9,14,α/ = 0.36 o F 9,14,1 α/ = 0.36. Sia P := P (F 9,14 0.36) = 0.06, allora il p-value è uguale a min{p, P } = 0.1.