Esercitazioni di Statistica



Documenti analoghi
Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)


1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

VERIFICA DELLE IPOTESI

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

E naturale chiedersi alcune cose sulla media campionaria x n

Statistiche campionarie

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica

Inferenza statistica. Statistica medica 1

Statistica. Lezione 6

Metodi statistici per le ricerche di mercato

3. Confronto tra medie di due campioni indipendenti o appaiati

Istituzioni di Statistica e Statistica Economica

1. Distribuzioni campionarie

Temi di Esame a.a Statistica - CLEF

VERIFICA DELLE IPOTESI

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

Verifica di ipotesi

Il confronto fra proporzioni

Istituzioni di Statistica e Statistica Economica

Analisi di dati di frequenza

La variabile casuale Binomiale

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010

Corso di Psicometria Progredito

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Politecnico di Milano - Anno Accademico Statistica Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo

Elementi di Psicometria con Laboratorio di SPSS 1

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

Tema A Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

STATISTICA IX lezione

Esercitazione n.4 Inferenza su varianza

Elementi di Psicometria con Laboratorio di SPSS 1

Inferenza statistica I Alcuni esercizi. Stefano Tonellato

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Prova di autovalutazione Prof. Roberta Siciliano

STATISTICA INFERENZIALE

Metodi statistici per le ricerche di mercato

Carte di controllo per attributi

Esercitazioni di Statistica

LEZIONE n. 5 (a cura di Antonio Di Marco)

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Facoltà di Psicologia Università di Padova Anno Accademico

Esercizio 1. Proprietà desiderabili degli stimatori (piccoli campioni)

ANALISI DELLE FREQUENZE: IL TEST CHI 2

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Concetto di potenza statistica

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

Facciamo qualche precisazione

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Capitolo 11 Test chi-quadro

La distribuzione Normale. La distribuzione Normale

La logica statistica della verifica (test) delle ipotesi

ELEMENTI DI STATISTICA

Esercizi riassuntivi di probabilità

Appunti: Teoria Dei Test

Test statistici di verifica di ipotesi

Facoltà di Psicologia Università di Padova Anno Accademico

Esercitazione n.2 Inferenza su medie

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

Elementi di Psicometria con Laboratorio di SPSS 1

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni

Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

La distribuzione Gaussiana

SPC e distribuzione normale con Access

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

Capitolo 12 La regressione lineare semplice

Inferenza statistica

IL COLLAUDO DI ACCETTAZIONE

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Esercizi del Corso di Statistica. Parte I - Variabili Aleatorie Continue

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Rapporto dal Questionari Insegnanti

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

risulta (x) = 1 se x < 0.

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Esercitazione n.1 (v.c. Binomiale, Poisson, Normale)

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

11. Analisi statistica degli eventi idrologici estremi

LE FUNZIONI A DUE VARIABILI

Lineamenti di econometria 2

Servizi di consulenza specialistica per IGRUE

Statistical Process Control

DISTRIBUZIONI DI PROBABILITÀ

Il campionamento statistico

1 Modelli di variabili aleatorie continue

Corso di Informatica Generale (C. L. Economia e Commercio) Ing. Valerio Lacagnina Rappresentazione in virgola mobile

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA

Controllo Statistico della Qualità. Qualità come primo obiettivo dell azienda produttrice di beni

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

APPUNTI DI MATEMATICA LE FRAZIONI ALGEBRICHE ALESSANDRO BOCCONI

Statistical Process Control

CAPITOLO 7 LE DISTRIBUZIONI CAMPIONARIE E GLI INTERVALLI DI CONFIDENZA

TEST DI AUTOVALUTAZIONE INTERVALLI DI CONFIDENZA E TEST

Transcript:

Esercitazioni di Statistica Test d ipotesi sul valor medio e test χ 2 di adattamento Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Si supponga che il diametro degli anelli metallici prodotti in un industria meccanica sia una variabile aleatoria normale con valore atteso non noto µ, e varianza σ 2 256. Si supponga, inoltre, che il valore medio del diametro degli anelli prodotti riscontrato nel tempo sia 100 (pollici). Il direttore di produzione sospetta che una variazione del tasso di umidità alteri il processo produttivo fecendo aumentare il diametro degli anelli prodotti. Dopo aver selezionato casualmente 64 anelli prodotti in condizioni di elevata umidità e misurato il loro diametro, il direttore riscontra un valore medio di 106. Si assuma che egli decida di verificare l ipotesi nulla H 0 : µ 100 contro l alternativa H 1 : µ > 100, avendo fissato un valore di significatività α 0.05. a) Si determini la regione di accettazione e la regione critica corrispondenti a tale test. b) Può il direttore concludere che il diametro medio degli anelli prodotti sia aumentato? Soluzione X diametro di un anello, X N(µ, 256), x 106, n64, α 0.05 Ipotesi H 0 : µ 100 H 1 : µ > 100, 1

a) Per risolvere il problema dobbiamo costruire una statistica test, che sia funzione dei dati campionari. Poiché la deviazione standard è nota si può utilizzare come statistica test, sotto l ipotesi nulla, la media campionaria standardizzata, statistica ottimale (di massima verosimiglianza) per questo tipo di test (l unico valore che ci fornisce il problema è infatti la media campionaria): T n X µ 0 σ/ n N(0, 1) dnorm(x, ) 0.0 0.1 0.2 0.3 0.4 1.645 4 2 0 2 4 x Il test è un test unidirezionale, con ipotesi alternativa composita. Dato il sistema di ipotesi, respingiamo l ipotesi nulla per valori elevati della statistica test. Per scegliere il valore critico z α dobbiamo tenere in considerazione il valore di α richiesto. Poiché α 0.05 Φ(z 0.05 ) 1 0.05 0.95 z α 1.645, allora le regioni di accettazione e critica saranno: R.A. : x µ 0 σ/ n 1.645 R.C. : x µ 0 σ/ n > 1.645. b) Il valore osservato della statistica test, sotto l ipotesi nulla, risulta t n x µ 0 σ/ n 106 100 256/64 6 2 3 2

Il valore osservato della media campionaria standardizzata appartiene alla regione critica: 3 R.C. e quindi possiamo rifiutare l ipotesi nulla, data l evidenza contenuta nel campione. Il livello di significatività osservato (p-valore o p-dei-dati) risulta molto inferiore a 0.05. Infatti: x 100 P r( x > 106/µ 100) P r( > 256/64 106 100 256/64 ) P r(z > 3) 0.0013. Esercizio 2 Sia X una variabile aleatoria distribuita come una v.a. gaussiana con parametri E(X) µ e V ar(x) 3. Sia estratto, inoltre, un campione casuale i.i.d. (X 1, X 2, X 3 ), per verificare l ipotesi nulla rispetto all alternativa H 0 : µ 2 Data la seguente regione critica: H 1 : µ 1. R.C. : (x 1, x 2, x 3 ) : 2x 1 2x 2 x 3 < 1.2}, a) calcolare α (la probabilità di commettere un errore di primo tipo), b) calcolare β (la probabilità di commettere un errore di secondo tipo). Soluzione La regione critica è definita in funzione di una statistica test, quindi il primo passo da effettuare determinare la distribuzione della statistica test (T (x) 2X 1 2X 2 X 3 ). Poiché X si distribuisce come una normale, e il campione è estratto in modo casuale, per la proprietà riproduttiva della normale: T (X) 2X 1 2X 2 X 3 N(µ; 27), poiché e E(T (X)) 2µ 2µ µ µ, Var(T (X)) Var(2X 1 2X 2 X 3 ) 4Var(X 1 ) 4Var(X 2 ) Var(X 3 ) 9Var(X) 27. 3

a) La probabilità α di commettere un errore di primo tipo (rifiutare un ipotesi nulla vera) è data da: α P (errore di I tipo) P (respingere H 0 H 0 ) P (2X 1 2X 2 X 3 < 1.2 µ 2) ( 2X1 2X 2 X 3 µ P < 1.2 µ ) µ 2 27 27 P (Z < 1.2 2 5.2 ) P (Z < 0.15) Φ( 0.15) 1 Φ(0.15) 0.4404. b) Poiché la regione critica è la regione di accettazione sarà: R.C. : (x 1, x 2, x 3 ) : 2x 1 2x 2 x 3 < 1.2}, R.A. : (x 1, x 2, x 3 ) : 2x 1 2x 2 x 3 1.2}. La probabilità β di commettere un errore del secondo tipo (non respingere un ipotesi di base che è falsa) è data da: β P (errore di II tipo) P (non respingere H 0 H 1 ) P (2X 1 2X 2 X 3 1.2 µ 1) P r( 2X 1 2X 2 X 3 µ 1.2 µ µ 1) 27 27 P r(z 1.2 1 5.2 ) P r(z 0.038) 1 Φ(0.038) 0.484. Esercizio 3 In un campione di 15 cavi elettrici la resistenza media risulta di 28.5 (ohm), con varianza campionaria pari a 16. Il responsabile della produzione afferma che un innovazione nel processo produttivo abbia fatto aumentare la resistenza media, fino ad allora valutata 25 (ohm). Assumendo una probabilità di errore di primo tipo 0.025, si verifichi l ipotesi del responsabile. Si assuma che la resistenza sia distribuita secondo una normale. Soluzione X resistenza, ˆσ S 4, x 28.50, n15, α 0.025 Ipotesi H 0 : µ 25 H 1 : µ > 25 4

Per risolvere il problema dobbiamo costruire una statistica test, che sia funzione dei dati campionari. Poiché la deviazione standard non nota si può utilizzare come statistica test la media campionaria studentizzata, che utilizza una stima non distorta della varianza (S 2 ): T n X µ 0 S/ n t n 1 dt(x, 14) 0.0 0.1 0.2 0.3 0.4 2.145 4 2 0 2 4 x Il test è un test unidirezionale, con ipotesi nulla e alternativa composite. L ipotesi nulla composita non comporta un cambiamento della regola di decisione, ma solo che il livello di significatività α, diventa la massima probabilità di commettere un errore del I tipo. Poiché i valori del parametro assunti sotto l ipotesi alternativa si trovano a destra dei valori del parametro sotto l ipotesi nulla, respingiamo l ipotesi nulla per valori elevati della statistica test, in particolare per valori superiori al valore critico t 14,α. Poiché α 0.025 P (t 14 t 14,α ) 0.025 t 14,α 2.145, allora le regioni di accettazione e critica saranno: R.A. : x µ 0 S/ n 2.145 R.C. : x µ 0 S/ n > 2.145. 5

Il valore osservato della statistica test, sotto l ipotesi nulla, risulta t n x µ 0 S/ n 28.5 25 4/ 15 3.39 Essendo 3.39 > 2.145, la statistica test campionaria cade nella regione critica, quindi, data l evidenza campionaria si può rifiutare l ipotesi nulla con un livello di significatività del 2.5%. Il responsabiledella produzione non andrà smentito. Esercizio 4 Il tempo X che un lavoratore impiega per raggiungere il luogo di lavoro segue la legge Normale con media µ e varianza σ 2 entrambe incognite. Si estrae un campione di ampiezza n 10 avente media x 12 e varianza S 2 16. a) Trovare un intervallo di confidenza per µ al livello 1 α 0.95. b) Verificare l ipotesi H 0 : µ 13 contro l alternativa H 1 : µ 13, al livello α 0.05. c) Cambierebbe la decisione precedente se il livello diventasse α 0.01? Soluzione a) Il primo punto dell esercizio richiede di costruire un intervallo di confidenza per la media della popolazione in cui la varianza ignota. La distribuzione di riferimento è una t di student con n 1 gradi di libertà. In questo caso non si può utilizzare l approssimazione alla distribuzione Normale poiché n non è sufficientemente elevato. ] S S 95%CI [l 1, l 2 ] [ x t n 1;α/2 n ; x t n 1;α/2 n ] S S [ x t 9;0.025 n ; x t 9;0.025 n [ 12 2.262 4 ; 12 2.262 4 ] [9.14; 14.86]. 10 10 Ciò significa che il tempo medio che impiega un lavoratore è compreso nell intervallo [9.14;14.86] con un livello di confidenza del 95%. b) Il secondo punto del problema propone il seguente test statistico H 0 : µ 13 H 1 : µ 13. 6

Il test sopra è un test bidirezionale, quindi dal confronto tra ipotesi nulla e ipotesi alternativa possiamo dire che la regione critica sarà del tipo: R.C. : x µ 0 S/ n > t 9,0.025, quindi, in caso di test bidirezionale, abbiamo due regioni critiche, che si trovano nelle code della statistica test, corrispondenti a valori molto piccoli, o molto grandi della statistica. Il valore critico si trova risolvendo l uguaglianza sotto: P (t n 1 < t n 1,α/2 ) P (t n 1 > t n 1,α/2 ) α/2 0.025 t n 1,α/2 2.262 Quindi la regione di rifiuto è data da: x µ0 S/ R.C. : > 2.262 n x µ 0 S/ < 2.262 n Si può ora calcolare il valore della statistica test sotto l ipotesi nulla: t n x µ 0 S/ n 12 13 4/ 10 0.79 Visto che il valore osservato della statistica test non appartiene alla regione critica, si può concludere affermando che il campione non offre una sufficiente evidenza per rigettare l ipotesi nulla H 0. La stessa risposta si sarebbe potuta dare senza eseguire ulteriori calcoli, ma solo utilizzando l intervallo di confidenza calcolato sopra, al livello del 95%. Poiché l intervallo contiene il valore 13, il campione non offre una sufficiente evidenza per rigettare l ipotesi nulla che la media sia 13. c) La risposta del test non cambia, poiché, se si diminuisce il livello dell errore di primo tipo, si ha come risultato che la regione di accettazione aumenta e, quindi, quella di rifiuto si contrae. In altre parole, se il test non rifiutava l ipotesi nulla per un livello α 0.05, a maggior ragione non lo rifiuterà ad un livello α 0.01. Esercizio 5 Un agenzia di disoccupazione sostiene che l età media di quelli che ricevono un sussidio di disoccupazione è di 37 anni con una deviazione standard di 10 anni. Un associazione di consumatori vuole testare questa ipotesi, dato che sospetta che l età media sia differente. Vengono intervistati in modo casuale 400 individui che ricevono il sussidio, e si ottiene un età media di 36 anni. Usando un livello di significatività dell 1% può l unione dei consumatori respingere l ipotesi fatta dall agenzia di disoccupazione? 7

Soluzione X età dei sussidiati, σ 10, x 36, n400, α 0.01 Ipotesi H 0 : µ 0 37 H 1 : µ 0 37 Il test èun test bidirezionale, quindi la regione di rifiuto sarà data dall unione di due regioni, quelle corrispondenti a valori molto alti o molto bassi della statistica test. La statistica test utilizzata in questo caso è la media campionaria standardizzata. Poich X non è distribuita secondo una normale, anche la media campionaria X non sarà distribuita secondo una normale, ma si può applicare il Teorema del Limite Centrale, dato che: Le n osservazioni X i sono indipendenti ed identicamente distribuite, derivando da un campionamento casuale semplice; E[X i ] 37 < ; V ar[x i ] 100 <. e quindi: T n X µ 0 σ/ n N(0, 1) al crescere di n. (Si noti che, anche se non avessimo conosciuto la varianza nella popolazione di riferimento (σ 2 ), e avessimo dovuto utilizzare una sua stima corretta (S 2 ), la distribuzione della statistica test sopra sarebbe stata ugualmente approssimativamente normale, per il Teorema del Limite Centrale.) Nel caso sopra, di un sistema di ipotesi bidirezionale, la regione critica sarà: Poiché R.C. : x µ 0 σ/ n > z α/2, α 0.01 α/2 0.005 Φ(z 0.005 ) 1 0.005 0.995 z α/2 2.575, allora la regione di critica sarà: R.C. : x µ 0 σ/ n > 2.575, 8

Il valore della statistica test nel campione, sotto l ipotesi nulla, è : t n x µ 0 σ/ n 36 37 10/ 400 2 Dato che il valore della statistica test non ricade nella regione critica, l evidenza campionaria non permette di rifiutare l ipotesi nulla che l età media di coloro che ricevono un sussidio sia uguale a 37, con un livello di significatività effettivo di circa l 1%. Esercizio 6 Si vuole indagare sulla proporzione π di pezzi difettosi prodotti in un processo produttivo. A tale scopo si osservano 400 pezzi, 240 dei quali risultano difettosi. a) Si proponga una opportuna regione critica per verificare l ipotesi nulla H 0 : π 0.5 contro l ipotesi alternativa H 1 : π < 0.5, ponendo α 0.01. b) Si decida a favore o contro H 0 sulla base della realizzazione campionaria osservata. Soluzione Xdifettosità Ber(π); ˆp 240/400 0.6; α 0.01; n400. Il problema propone il seguente test statistico H 0 : π 0.5 H 1 : π < 0.5. a) Per testare questa ipotesi si utilizza la statistica test T n ˆp π 0 π0 (1 π 0 )/n N(0, 1), ossia la media campionaria standardizzata per una popolazione di Bernoulli. Per il teorema del limite centrale, per n sufficientemente elevato, quando π π 0, la statistica test avrà una distribuzione approssimativamente normale. Il test è unidirezionale, quindi dal confronto tra ipotesi nulla e ipotesi alternativa, poiché i valori ipotizzati sotto l ipotesi nulla si trovano a destra, rispetto ai valori sotto l alternativa, possiamo dire che la regione critica, e la regione di accettazione saranno del tipo: R.C. : ˆp π 0 π0 (1 π 0 )/n < z α 9

R.A. : ˆp π 0 π0 (1 π 0 )/n z α Il valore di z 0.01 è determinabile attraverso la seguente relazione:. α 0.01 Φ(z 0.01 ) 1 0.01 0.99 z α 2.33, z α 2.33 Riassumendo si è trovato che la regione critica R.C. è data da: R.C. ˆp π 0 π0 (1 π 0 )/n < 2.33, e la regione di accettazione R.A. : ˆp π 0 π0 (1 π 0 )/n 2.33 b) Per decidere a favore o contro l ipotesi nulla si calcoli il valore della statistica test, dato il nostro campione, sotto l ipotesi nulla: t n ˆp π 0 π0 (1 π 0 )/n 0.6 0.5 0.5(1 0.5)/400 4 Dato che il valore osservato della media campionaria standardizzata appartiene alla regione di accettazione, non si può rigettare l ipotesi nulla in favore di quella alternativa, data l evidenza empirica. Esercizio 7 Il direttore dell Ospedale ABC, situato in un quartiere molto povero nei sobborghi di New York, sospetta che i neonati che nascono l abbiano un peso inferiore rispetto alla media nazionale (pari a 3.2 Kg), tale da dover richiedere un intervento di prevenzione sulla malnutrizione delle donne del quartiere. Il direttore decide allora di verificare l ipotesi nulla H 0 : µ 3.2 in alternativa all ipotesi H 1 : µ < 3.2. Il direttore misura, quindi, il peso (x 1, x 2,..., x 81 ) di 81 bambini scelti casualmente tra i neonati nell ultimo anno e riscontra che 81 i1 x i 234.9 81 i1 x 2 i 1001.21. a) Proporre un opportuno stimatore non distorto per il parametro σ 2 e fornirne una stima. b) Calcolare l intervallo di confidenza a livello 1 α 0.9 per il parametro µ. 10

c) Scrivere l espressione analitica del p-valore corrispondente alla realizzazione campionaria osservata, per il set di ipotesi: H 0 : µ 3.2 e H 1 : µ < 3.2. Decidere, inoltre, se il direttore riterrà necessario un intervento di sanità pubblica contro la malnutrizione, avendo fissato α, il livello di significatività del test uguale a 0.1, o a 0.05. Soluzione a) Il primo punto dell esercizio può essere risolto utilizzando come stimatore per σ 2 la varianza campionaria S 2. Calcoliamo prima la media campionaria x: x 1 81 x i 234.9/81 2.9, n i1 e poi lo stimatore per la varianza: S 2 1 n 1 [ n ] Xi 2 n X 2 e la corrispondente stima: S 2 [ n ] 1 x 2 i n x 2 n 1 i1 1 [ ] 1001.21 81 2.9 2 80 i1 1 (1001.21 681.21) 80 1 (320) 4. 80 b) Il secondo punto dell esercizio richiede di costruire un intervallo di confidenza per la media della popolazione in cui la varianza ignota. Poiché la distribuzione delle popolazione non è nota, per n sufficientemente grande, possiamo utilizzare come distribuzione di riferimento per la quantità pivot una normale standard. 90%CI [l 1, l 2 ] [ x z α/2 S n ; x z α/2 S n ] [ 2.9 1.645 2 ] 9 ; 2.9 1.6452 [2.535; 3.265]. 9 11

c) L esercizio richiede anche il calcolo del p-valore. Il p-valore può essere interpretato come il più piccolo livello di confidenza che conduce a rifiutare l ipotesi nulla (assumendo quest ultima come vera). Il p-valore è dato dalla probabilità che, quando µ µ 0, la statistica test assuma valori minori del valore osservato nel campione, P (T n < t n µ µ 0 ), dove T n una generica statistica test X µ 0 S/, e t n n il particolare valore assunto dalla statistica test nel campione estratto, sotto l ipotesi nulla, ossia quel valore che si ottiene sostituendo alla media campionaria il valore realizzato (2.9), a µ il valore ipotizzato sotto l ipotesi nulla, e alla varianza campionaria il valore ottenuto nel campione: P (T n < t n µ 3.2) ( ) X µ0 P S/ 2.9 3.2 < n 2/9 P (Z < 1.35) 1 Φ(1.35) 0.09, Da notare che il risultato p 0.09 < α 0.1 implica che ci troviamo nella regione critica per un test al livello del 10%, mentre p 0.09 > α 0.05 implica che ci troviamo nella regione di accettazione di H 0 ad un livello di significatività del 5%. p 0.09, infatti, il minimo livello di significatività per il quale l ipotesi nulla può essere respinta. Esercizio 8 (Cicchitelli) Per la generica voce di un inventario di un impresa mercantile sia X la variabile casuale valore inventariato - valore certificato. Un certificatore contabile estrae a sorte un campione di 120 voci ottenendo x 25.3, S 2 13240. Sia µ la media di X nella popolazione. a) Si sottoponga a verifica l ipotesi che µ 0 contro l alternativa µ > 0, cioè che l inventario è gonfiato, con α 0.01; b) Si calcoli il p-valore; c) Si calcoli la probabilità di errore di secondo tipo β nel caso di ipotesi alternativa H 1 : µ 10. Soluzione a) Trattandosi di un campione di dimensione elevata, si può ricorrere all approssimazione normale e considerare S 2 una buona stima della varianza della 12

popolazione. Il test è unilaterale del tipo con ipotesi alternativa Dunque H 1 µ > µ 0 nel nostro caso Standardizziamo x: R.C. z : z z α }, R.C. z : z z 0.99 2.326}. t n (25.3 0) 13240/120 2.41 Dato che 2.41 > 2.326, l ipotesi nulla è da rifiutare. b) Il livello di significatività effettivo (p-valore), è ( ) X p P ( X µ0 25.3 µ 0) P S/ n 25.3 0 13240/120 P (Z 2.41) 1 0.9920 0.008 L ipotesi nulla infatti è stata rifiutata al livello α 0.01, perchè p < α. c) Per determinare la probabilità di errore di seconda specie conviene esprimere la zona di rifiuto in unità originarie, ossia in termini di x. La zona di rifiuto in unità standardizzate è R.C. z : z 2.326}, possiamo quindi scrivere ( x 0) 13240/120 2.326, da cui si ottiene x c 24.4. La zona di rifiuto è dunque R.C. x : x 24.4}. La probabilità di errore di seconda specie β è allora data da 13

( X P ( X R.A. H 1 ) P ( X µ1 24.4 µ 10) P ) P ( Z 24.4 10 10.5 S/ n 24.4 µ 1 S/ n P (Z 1.37) 0.915. ) Esercizio 9 Supponiamo di effettuare un test sul parametro media µ di una popolazione normale. Consideriamo i due casi A) H0 : µ 3 H 1 : µ 4 B) H0 : µ 3 H 1 : µ 6 Una volta fissato il livello di significatività α, a) la regione di rifiuto dell ipotesi nulla è la stessa nei due casi; è più ampia nel caso A è più ampia nel caso B. b) la probabilità di commettere un errore di seconda specie β è la stessa nei due casi; maggiore nel caso A; maggiore nel caso B. Soluzione a) è la stessa nei due casi. b) maggiore nel caso A. Esercizio 10 In un test delle ipotesi il p-valore risulta pari a 0.032. Vuol dire che rifiutiamo l ipotesi nulla se il livello di significatività è α 0.01, ma non se è α 0.05; se il livello di significatività è α 0.05, ma non se è α 0.01; ad entrambi i livelli di signficatività α 0.01 e α 0.05 Soluzione Se il livello di significatività è α 0.05, ma non se è α 0.01. 14

Esercizio 11 Su 100 imprese è stata rilevato il numero di anni di attività: Anni 1 2 3-5 6-10 11-15 Totale Imprese 5 15 30 20 30 100 1) Verificare se, a livello α 0.05, la proporzione di imprese con meno di 6 anni sia pari al 45% e quelle con più di 10 anni sia pari al 25%. 2) Cosa si conclude a livello α 0.1? Soluzione 1) Possiamo riscrivere la tabella come Anni 1-5 6-10 11-15 Totale Imprese 50 20 30 100 Il sistema di ipotesi è il seguente: 0.45 se A < 6 H 0 : P (A) 0.30 se 6 A 10 0.25 se A > 10 H 1 : altrimenti Sotto l ipotesi nulla, le frequenze attese ˆn i sono pari a Quindi, la statistica Q vale Anni 1-5 6-10 11-15 Totale n p(x i ) 45 30 25 100 Q k (n i n p(x i )) 2 i1 n p(x i ) (50 45)2 45 (20 30)2 30 (30 25)2 25 44 9 4. 8 La regione critica e di accettazione sono: R.C. Q > χ 2 (k 1),α, R.A. Q χ 2 (k 1),α, Mettendo a confronto questo valore con il quantile χ 2 k 1,α χ2 2,0.05 5.99 si conclude che non si può escludere l ipotesi nulla. 2) il quantile χ 2 2,0.1 è pari a 4.61, quindi si rifiuta l ipotesi nulla. 15

Esercizio 12 Si ritiene che una variabile casuale X sia Normale con valor medio µ 174 e varianza σ 2 16. Verificare l ipotesi con il test χ 2 con α 0.01 sulla base del seguente campione di numerosità n 400: X f requenza osservata f requenza attesa X < 165 7 0.012 165 X < 170 51 0.146 170 X < 175 190 0.44 175 X < 180 124 0.334 X 180 28 0.068 Soluzione Le ipotesi sono: H 0 : XNormale(174, 16) H 1 : XnonNormale(174, 16). La frequenza attesa per ciascun intervallo è determinata mediante standardizzazione. Ad esempio: 165 174 P (165 X < 170) P ( Z < 16 La regione critica e di accettazione sono: R.C. Q > χ 2 4,0.01 13.227 χ 2 (k 1),α, 170 174 16 ) P ( 2.25 Z < 1) 0.146 La statistica Q vale k (n i ˆn i ) 2 Q ˆn i i1 R.A. Q χ 2 4,0.01 13.227 χ 2 (k 1),α (7 4.8)2 4.8 (51 58.4)2 58.4 (190 176)2 176 (124 133.6)2 (28 27.2)2 133.6 27.2 Mettendo a confronto questo valore con il quantile χ 2 k 1,α χ2 4,0.01 13.227 si conclude che non si può rifiutare l ipotesi nulla. Esercizio 13 Si sono prelevati 100 campioni di acqua e si è proceduto al conteggio del numero di esemplari di un certo microorganismo, ottenendo la seguente distribuzione: Esemplari 0 1 2 3 4 5 6 Campioni 15 30 25 20 5 4 1 Verificare la conformità della distribuzione ottenuta ad una distribuzione di Poisson con una probabilità di errore di primo tipo α 0.05. 16 3.77

Soluzione La variabile casuale di Poisson ha funzione di probabilità p(x, λ) e λ λx x!. Poiché il parametro λ da cui dipende la distribuzione di Poisson non è noto lo si stima con il corrispondente stimatore di massima verosimiglianza, ˆλ n i1 x i n X 186/100 1.86. Le ipotesi sono: H 0 : XP oisson(1.8) H 1 : XnonP oisson(1.8) Le probabilità attese, nell ipotesi che la variabile casuale X che genera il campione sia una variabile casuale di Poisson, sono: e le numerosità attese: x i 0 1 2 3 4 5 6 p(x i ) 0.156 0.290 0.270 0.167 0.078 0.029 0.01 x i 0 1 2 3 4 5 6 n p(x i ) 15.6 29 27 16.7 7.8 2.9 1 Le ultime due frequenze risultano inferiori a 5 per cui le frequenze dei valori 5 e 6 vengono accorpate alla frequenza del valore 4. Le distribuzioni da confrontare, osservata e teorica, risultano: La statistica test vale: x i 0 1 2 3 4-6 n(x i ) 15 30 25 20 10 n p(x i ) 15.6 29 27 16.7 11.7 Q k i1 (n i ˆn i ) 2 ˆn i (15 15.6)2 15.6 (30 29)2 29 (25 27)2 27 (20 16.7)2 (10 11.7)2 16.7 11.7 1.078 Mettendo a confronto questo valore con il quantile χ 2 k 1 1,α χ2 3,0.05 7.815 si conclude che l ipotesi nulla di conformità della distribuzione osservata ad una variabile casuale di Poisson può essere accettata. 17

dchisq(x, 3) 0.00 0.05 0.10 0.15 0.20 0.25 7.815 0 1 2 3 4 5 6 7 8 9 10 12 14 15 x 18