Statistica Inferenziale Soluzioni 3. Verifica di ipotesi

Documenti analoghi
Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

Corso di Statistica Esercitazione 1.8

Contenuti: Capitolo 14 del libro di testo

STATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU)

Lezione 17. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 17. A. Iodice

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Esercitazione 8 del corso di Statistica 2

La verifica delle ipotesi

Argomenti della lezione:

Esercizi di statistica

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi

Analisi della varianza: I contrasti e il metodo di Bonferroni

LEZIONI DI STATISTICA MEDICA

Test d ipotesi Introduzione. Alessandra Nardi

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Introduzione alla statistica per la ricerca in sanità

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +

Esercizi di Probabilità e Statistica

Test d ipotesi: confronto fra medie

STATISTICA (modulo II - Inferenza Statistica) Soluzione Esercitazione I

STATISTICA (II modulo - Inferenza Statistica) Soluzione Esercitazione I

ESERCITAZIONE N. 7 corso di statistica

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 II Esonero - 15 Gennaio 2015

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

Statistica Inferenziale La verifica di ipotesi. Davide Barbieri

Metodi statistici per lo studio dei fenomeni biologici

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

Verifica di ipotesi. Parte VI. Verifica di ipotesi

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015

Effettuazione di un TEST D IPOTESI. = stima del parametro di interesse calcolata sui dati campionari

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

Statistica inferenziale per variabili quantitative

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.

Slide Set #5 Tests delle Ipotesi

Metodi statistici per le ricerche di mercato

Esercizi di statistica inferenziale

Teoria della stima dei parametri:

II Esonero - Testo B

STATISTICA A K (60 ore)

UNIVERSITÀ DEGLI STUDI DI PERUGIA

Statistica (parte II) Esercitazione 4

Statistica Inferenziale

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. II Esonero - 10 Gennaio 2014

Distribuzioni campionarie

S 2 p n X. + S2 p. n Y

Statistica 1- parte II

Test per una media - varianza nota

Gli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana

Fondamenti statistici : Test d Ipotesi (1)

Lezione VII: Z-test. Statistica inferenziale per variabili quantitative. Statistica inferenziale per variabili quantitative. Prof.

Statistica Descrittiva Soluzioni 4. Medie lasche

Approssimazione normale alla distribuzione binomiale

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.

Esercitazione 8 maggio 2014

1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2

Occorre trovare la distribuzione di DM

Statistica. Lauree Triennali in Biologia e Biologia Molecolare Nome: 13 luglio 2010 Matricola: Cognome: Tema C

Statistica Metodologica

Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Test di ipotesi 2/5/2005

STATISTICA ESERCITAZIONE 13

Problema 1. Cognome, Nome: Facoltà di Economia Statistica Esame 5-19/11/2009: A. Matricola: Corso:

Introduzione alla verifica d ipotesi

COGNOME.NOME...MATR..

Verifica di ipotesi: approfondimenti

05. Errore campionario e numerosità campionaria

STATISTICA A K (60 ore)

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno 1

10 TEST STATISTICI PER LA VERIFICA DI IPOTESI

VERIFICA DELLE IPOTESI

STATISTICA APPLICATA Prof.ssa Julia Mortera. INTRODUZIONE al STATISTICA

Intervalli di confidenza

Statistica Applicata all edilizia: Stime e stimatori

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

R - Esercitazione 5. Andrea Fasulo Venerdì 16 Dicembre Università Roma Tre

Capitolo 9 Verifica di ipotesi: test basati su un campione

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Il Test di Ipotesi Lezione 5

Statistica 1- parte II

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

1. Quali sono i possibili campioni di numerosità 2 senza reimmissione? X 1 e X 2 sono indipendenti?

Elaborazione statistica di dati

STATISTICA A K (63 ore) Marco Riani

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Z-test, T-test, χ 2 -test

Capitolo 10 Test delle ipotesi

Intervalli di confidenza

L Analisi della Varianza (ANOVA)

Tecniche di sondaggio

I appello di calcolo delle probabilità e statistica

Transcript:

ISTITUZIONI DI STATISTICA A. A. 007/008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona sede di Vicenza Statistica Inferenziale Soluzioni 3. Verifica di ipotesi Introduzione. Siano X 1... X n v.a. indipendenti e con identica distribuzione. Sia fx 1...x n ; θ la densità o la distribuzione di probabilità congiunta di X 1... X n con parametro incognito θ appartenente allo spazio parametrico Θ IR p. Sia {Θ 0 Θ 1 } una partizione di Θ e sia dato in corrispondenza il sistema di verifica d ipotesi H 0 : θ Θ 0 ipotesi nulla contro H 1 : θ Θ 1 ipotesi alternativa. Data una statistica T condurre la verifica d ipotesi per valutare l appartenenza o meno di θ a Θ 0 consiste nella divisione dello spazio campionario in una zona di rifiuto R nella quale H 0 viene rifiutata ed in una zona di accettazione A nella quale H 0 viene accettata. Nel condurre la procedura si possono compiere due tipi di errore: errore di primo tipo: si rifiuta H 0 quando in realtà è vera. La probabilità di compiere l errore di primo tipo si indica solitamente con α livello di significatività; errore di secondo tipo: si accetta H 0 quando in realtà è falsa. La probabilità di compiere questo errore si indica solitamente con β. La quantità 1 β è nota come potenza del test. Non è possibile annullare le probabilità di commettere entrambi gli errori. Solitamente si procede cercando la regione di rifiuto o la soglia critica che la definisce in modo che l errore di primo tipo il livello di significatività del test sia pari ad un valore prefissato spesso 005. Esemplificazioni. Verifica d ipotesi sulla media di una popolazione normale con varianza nota - ipotesi semplici. Siano X 1...X n v.a. indipendenti ed identicamente distribuite come Nµ σ. Sia dato il sistema di verifica d ipotesi H 0 : µ = µ 0 contro H 1 : µ = µ 1 ipotesi semplici con µ 0 < µ 1. Consideriamo la statistica X che sotto H 0 vale a dire quando µ = µ 0 ha distribuzione X Nµ 0 σ /n. Il test rifiuta H 0 in favore di H 1 per valori grandi della statistica X vale a dire che la regione di rifiuto è formata dai valori di X tali che x > k R = {x : x > k}. Il valore k si determina in modo che il livello del test sia pari ad α vale a dire in modo che P X > k; µ = µ 0 = α. Considerando la distribuzione di X sotto H 0 si ha che k = µ 0 + z α σ /n dove z α è il quantile di una normale standard che lascia alla propria destra una probabilità pari a α. Verifica d ipotesi sulla media di una popolazione normale con varianza nota - ipotesi alternativa composta. Si considerino le v.a. distribuite come Nµ σ del punto precedente. Sia ora H 0 : µ = µ 0 contro H 1 : µ µ 0 ipotesi alternativa composta. Il test in questione è un test bilaterale o a due code. Consideriamo la statistica test Z = X µ 0 σ /n 1

M. Minozzo e A. Guolo Statistica Inferenziale: Soluzioni 3 che sotto H 0 ha distribuzione normale standard. Allora la regione di rifiuto è R = {z : z > z α/ } ovvero R = {x : x < µ 0 z α/ σ /n} {x : x > µ 0 + z α/ σ /n}. Nel caso di ipotesi H 0 : µ = µ 0 contro H 1 : µ < µ 0 test unilaterale o ad una coda si ha R = {z : z < z α }. Nel caso di ipotesi H 0 : µ = µ 0 contro H 1 : µ > µ 0 si ha R = {z : z > z 1 α }. Verifica d ipotesi sulla media di una popolazione normale con varianza incognita - ipotesi alternativa composta. Nelle ipotesi dei casi precedenti sia dato il sistema di verifica d ipotesi H 0 : µ = µ 0 contro H 1 : µ µ 0. Consideriamo la statistica test t = X µ 0 S /n che sotto H 0 ha distribuzione t n 1. Allora la regione di rifiuto è R = {t : t > t n 1;α/ } dove t n 1;α/ è il quantile di una t n 1 che lascia alla propria destra una probabilità pari a α/. Nel caso di ipotesi H 0 : µ = µ 0 contro H 1 : µ < µ 0 si ha R = {t : t < t α }. Nel caso di ipotesi H 0 : µ = µ 0 contro H 1 : µ > µ 0 si ha R = {t : t > t α }. Verifica d ipotesi sulla varianza di una popolazione normale con media incognita - ipotesi alternativa composta. Nelle ipotesi dei casi precedenti sia dato il sistema di verifica d ipotesi H 0 : σ = σ 0 contro H 1 : σ σ 0. Consideriamo la statistica test χ c = S n 1 che sotto H 0 ha distribuzione χ n 1. Allora la regione di rifiuto risulta pari a R = {χ c : χ c < χ n 1;1 α/ } {χ c : χ c > χ n 1;α/ }. Verifica d ipotesi sull uguaglianza delle medie di due popolazioni normali con uguale varianza incognita. Siano X 1...X n v.a. indipendenti ed identicamente distribuite come Nµ X σ X e siano Y 1...Y m v.a. indipendenti ed identicamente distribuite come Nµ Y σ Y. Si considerino un campione di dimensione n da X 1...X n e un campione di dimensione m da Y 1... Y m. Sia dato il sistema di verifica d ipotesi H 0 : µ X = µ Y contro H 1 : µ X µ Y. Si supponga che le due varianze siano uguali σ X = σ Y. Siano S X e S Y le varianze campionarie corrette di X e Y. Consideriamo la statistica test D = X Y Sxn 1+S Y m 1 1/n + 1/m n+m che sotto H 0 ha distribuzione t n+m. La regione di rifiuto è R = {d : d > t n+m ;α/ }. Verifica d ipotesi sull uguaglianza delle varianze di due popolazioni normali con medie ignote. Nelle ipotesi del punto precedente si consideri il sistema di verifica d ipotesi H 0 : σx = σy contro H 1 : σx σ Y. Consideriamo la statistica test F data dal rapporto tra le varianze campionarie corrette F = S X. SY Allora sotto H 0 F F n 1m 1. La regione di rifiuto del test è R = {F : F > F n 1m 1;α/ } dove F n 1m 1;α/ è il quantile di una F n 1m 1 che lascia alla propria destra una probabilità pari a α/. Nel caso di ipotesi H 0 : σx = σ Y contro H 1 : σx < σ Y si ha R = {F : F < F α }. Nel caso di ipotesi H 0 : σx = σy contro H 1 : σx > σy si ha R = {F : F > F α }.

M. Minozzo e A. Guolo Statistica Inferenziale: Soluzioni 3 3 Verifica d ipotesi per il confronto di proporzioni. Si considerino due campioni casuali da X 1...X n v.a. indipendenti distribuite come Berp 1 e Y 1...Y m distribuite come Berp. Siano ˆp 1 e ˆp le frequenze relative derivate dai due campioni. Supponendo che n e m siano sufficientemente grandi si ha che ˆp 1 ˆp N p 1 p ˆp1 ˆp1/n + 1/m dove ˆp = nˆp 1 + mˆp /n + m. Allora per la verifica d ipotesi H 0 : p 1 = p contro H 1 : p 1 p facciamo riferimento alla statistica test Z = ˆp 1 ˆp ˆp1 ˆp1/n + 1/m che sotto H 0 tende ad una normale standard. Allora la regione di rifiuto è R = {z : z > z α/ }. Nel caso di ipotesi H 0 : p 1 = p contro H 1 : p 1 < p si ha R = {z : z < z α/ }. Nel caso di ipotesi H 0 : p 1 = p contro H 1 : p 1 > p si ha R = {z : z > z α/ }.

M. Minozzo e A. Guolo Statistica Inferenziale: Soluzioni 3 4 Esercizio A. a Dai 10 valori campionari osservati si ottiene una media campionaria pari a x = 14 e una varianza campionaria corretta pari a S = 11 63. Si rifiuta H 0 per valori di X maggiori di x α dove x α è tale che P X x α ; H 0 = α = PT xα 8 S/ n dove T ha distribuzione t di Student con 9 g.d.l. Dalle tavole si trova che xα 8 S/ = 81 da cui x n α = 81 3 356 + 8 = 17 467. Essendo x = 14 minore del valore soglia si accetta H 0. b La probabilità richiesta è data da P X > 15 59; µ = 8 = P T > 15 59 8 11 63/10 ; µ = 8 = PT > 6 = 0 05 dove T = X 8/ 11 63/10 ha distribuzione t di Student con 9 g.d.l. c Si rifiuta l ipotesi nulla per valori osservati di S maggiori di s α dove s α è tale che PS s α; H 0 = α = P [ n 1S σ 0 ] n 1s α; H 0 dove è il valore di σ sotto l ipotesi nulla e n 1S = 16 919 da cui s α = si distribuisce come una χ con 9 g.d.l. Dalle tavole si trova che n 1s α 16 919 10/9 = 18 8 ed essendo S pari a 11 63 si rifiuta H 0. Esercizio B. La v.a. media campionaria X risulta distribuita come una normale di media µ e varianza σ /n. Sulla base del test di verifica d ipotesi indicato si ha che da cui si ricava che Da qui risulta che σ = 44 6. b La potenza del test è data P α = 0 05 = P X > 147 x 145 Φ σ/ = 0 05. 30 X 150 σ/ 0 147 150 > σ/ = 0 993. 0 Esercizio C. a Si rifiuta l ipotesi nulla per valori osservati della differenza D = X Ȳ superiori a D α/ oppure D inferiori a D α/ dove D α/ è tale che P D D α/ ; H 0 = α = P Z α/ S p 1/n1 +1/n e dove Sp = SXn 1 1 + SY n 1/n 1 + n e Z ha approssimativamente distribuzione normale standardizzata. Dalle tavole si trova che α/ D = 576 da cui D α/ = S p 1/n1 +1/n 576 S p 1/n 1 + 1/n. Ed essendo S p = 1 1 si ha che D α/ = 0 178. Per cui avendo ossevato un valore di D pari a 0 si rifiuta H 0. Si noti che mancando l assunzione di normalità dei dati di partenza ed essendo n 1 e n sufficientemente grandi abbiamo assunto che Z fosse approssimativamente distribuita come una normale standardizzata in base all estensione del teorema del limite centrale. b Per questa verifica di ipotesi si rifiuta l ipotesi nulla H 0 : µ X = µ Y per valori di D maggiori di D α = z α σ 1/n 1 + 1/n = 0 1607 dove z α = 36. Quindi la potenza del test è data da PD > D α ; H 1 = P Z > = PZ > 4 93 = 1 dove Z ha 01607 05 151/n1 +1/n approssimativamente distribuzione normale standardizzata.

M. Minozzo e A. Guolo Statistica Inferenziale: Soluzioni 3 5 c Si rifiuta l ipotesi nulla per valori osservati della differenza D = ˆp 95 ˆp 96 inferiori a D α con D α tale che PD D α ; H 0 = α = P Z Dα dove Sˆp95 ˆp Sˆp95 ˆp 96 = ˆp1 ˆp 1 96 n 1 + 1 n ˆp = ˆp 95 n 1 +ˆp 96 n /n 1 +n n 1 = 80 n = 90 e Z ha approssimativamente distribuzione normale standardizzata. Dalle tavole si trova che il percentile che lascia alla sua destra una probabilità del D 95% è pari a 1 645 per cui α = 1 645 ed essendo ˆp Sˆp95 ˆp 95 = 0 64 ˆp 96 = 0 645 ˆp = 0 635 96 Sˆp95 ˆp 96 = 0 0740 D α = 1 645 0 0740 = 0 1. Perciò avendo osservato un valore di D pari a 0 01 si accetta H 0. Esercizio D. Sia X Nµ X σx la v.a. che descrive il peso dei prodotti del macchinario A e sia Y Nµ Y σy la v.a. che descrive il peso dei prodotti del macchinario B. L interesse è su H 0 : σx = σy contro H 1 : σx σ Y. Sia n = 8 la numerosità del campione da X e m = 6 la numerosità del campione da Y. Consideriamo la statistica F data dal rapporto tra le varianza campionarie corrette F = S X S Y = ni=1 X i X /n 1 mi=1 Y i Y /m 1 che sotto H 0 ha distribuzione F n 1m 1. Sulla base dei dati campionari si ha che F = 0.860. Tale valore risulta essere minore del quantile F n 1m 1;α pari a 4876 e ciò conduce all accettazione dell ipotesi nulla di uguaglianza tra le varianze σ X e σ Y.