LA VERIFICA DELLE IPOTESI SUI PARAMETRI E u problema di ifereza per molti aspetti collegato a quello della stima. Rispode ad u esigeza di carattere pratico che spesso si preseta i molti campi dell attività umaa e che cosiste el dover scegliere fra due sole possibilità sulla base di iformazioi di atura campioaria. IPOTESI STATISTICA: assuzioe su u parametro; la distribuzioe di ua variabile casuale; la relazioe itera fra le compoeti di ua variabile casuale doppia o di ordie superiore. La teoria della verifica delle ipotesi cosiste ello stabilire se l assuzioe fatta si possa cosiderare esatta o meo, sulla base delle osservazioi codotte su u campioe. TEST: è u criterio od ua regola che cosete di accettare o respigere l ipotesi i base alle risultaze di u determiato campioe. 1
Ipotesi parametriche Soo le ipotesi su u parametro θ di ua popolazioe distribuita secodo ua fuzioe di probabilità o di desità ota. L ipotesi statistica idividua u sottoisieme dello spazio dei parametri Θ i cui è defiito θ, cioè cosiste ell affermare che θ Θ, co Θ sottoisieme di Θ. Le ipotesi parametriche soo dette semplici se specificao completamete P(x) o f(x), e composte i caso cotrario. Quidi, se l ipotesi è semplice Θ si riduce ad u solo valore. L ipotesi sottoposta a verifica viee geeralmete idicata co H e viee chiamata ipotesi ulla. Ad essa verrà cotrapposta u ipotesi detta alterativa ed idicata co H 1. Se l ipotesi ulla specificata è H :θ Θ, si avrà geeralmete che H 1 :θ Θ C, dove C Θ è il sottospazio dei parametri complemetare a Θ. Le decisioi su H e H 1 si prederao, dopo aver osservato il campioe, seguedo ua regola che specifica: 1. per quali campioi si accetta H come vera;. per quali campioi si rifiuta H e si accetta H 1.
Il sottoisieme dello spazio dei campioi χ per cui H è rifiutata è detto regioe di rifiuto o regioe critica, metre lo spazio ad esso complemetare è detto regioe di accettazioe. Tipicamete, u test d ipotesi viee specificato i termii di ua statistica del test T = t(,x,..., ) X che è ua statistica 1 X campioaria. I metodi per costruire test d ipotesi portao alla scelta delle statistiche del test e delle regioi di rifiuto. Il giudizio di accettazioe o di rifiuto dell ipotesi ulla, essedo basato sui dati di u campioe, è di atura iduttivo, per cui o può essere espresso i termii di certezza, ma solo di probabilità. Ne cosegue che o si può evitare il rischio di commettere due tipi di errori: - errore di prima specie, che cosiste el rifiutare l ipotesi ulla quado è vera; - errore di secoda specie, che cosiste ell accettare l ipotesi ulla quado è falsa, cioè è vera l ipotesi alterativa. 3
Le opzioi soo illustrate el seguete prospetto. IPOTESI GIUDIZIO ALTERNATIVO H Accettazioe Rifiuto Vera Falsa GIUDIZIO CORRETTO Probabilità = ERRORE DI ª SPECIE Probabilità = ERRORE DI 1ª SPECIE Probabilità = GIUDIZIO CORRETTO Probabilità = Covezioalmete si idicao co α la probabilità di compiere u errore di primo tipo e co β la probabilità di compiere u errore del secodo tipo, ovvero: α = P(Rifiutare H H è vera) β = P(Accettare H H 1 è vera) Di cosegueza: P(Accettare H H è vera) = P(Rifiutare H H 1 è vera) = POTENZA DEL TEST I geerale vorremmo che etrambe le probabilità di commettere errori, α e β, siao basse. Tuttavia, come vedremo meglio i seguito, le due probabilità soo iversamete legate: se dimiuisce la probabilità di commettere u tipo di errore ecessariamete aumeta la probabilità di commettere l altro. 4
La strategia che si sceglie è quella di fissare a priori la probabilità di compiere u errore di primo tipo (i geerale uguale a,5 o,1) e miimizzare l ampiezza dell errore di secodo tipo. La giustificazioe deriva dal fatto che, di solito, l errore di primo tipo è riteuto più grave. Riassumedo, i passi decisioali che soo comui a tutte le situazioi i cui si verificao ipotesi soo: 1. Scelta della statistica T = t(,x,..., ) X da utilizzare. Ua 1 X scelta aturale è lo stimatore di θ di cui si è parlato ell ambito della teoria della stima, la cui distribuzioe sarà fuzioe di θ.. Scelta della regola di decisioe su H, sulla base del comportameto di T sotto l ipotesi ulla (se è vera H ) e sotto l ipotesi alterativa (se è vera H 1). 3. Uso di α per determiare i valori di T che portao a rifiutare H e quelli che portao ad accettare H. 5
Verifica di ipotesi su µ Possiamo trovarci i diverse situazioi. Partiamo da alcue ipotesi per vedere u primo caso. Suppoiamo: X N(µ;σ ) σ ota H :µ = µ (ipotesi semplice) Alterativa a destra cioè: H 1 :µ = µ 1 coµ 1 > µ, oppure, H1 :µ > µ (ipotesi composta) Quale statistica del test scegliamo? Come si distribuisce sotto H? Se H è vera, tederà ad assumere valori vicii a µ ; se è vera H 1, tederà ad assumere valori superiori a µ rifiuteremo H per valori elevati della statistica. Dobbiamo fissare ua soglia tale che, se la statistica assume u valore superiore, rifiuteremo H. Ma come? 6
La determieremo tramite α, la probabilità di rifiutare H quado questa è vera. Cioè cercheremo quel valore x α tale che: α = P( X xα H è vera) GRAFICO Come trovo il valore umerico di x α? Stadardizzo X : α = P( X xα H è vera) = 7
x co Z ~ N(;1). Il valore α µ = z σ α corrispoderà al quatile o ascissa della Z che lascia a destra ua probabilità pari ad α. Lo trovo sulle tavole della N(;1). GRAFICO Trovato z α posso calcolare il valore di x α che cercavo: Di cosegueza accettiamo H se il valore otteuto dal campioe x (valore empirico) è iferiore a x α (valore critico), e rifiutiamo H altrimeti: - se - se σ x < µ + zα accetto H ; σ x µ + zα rifiuto H. 8
I questo modo abbiamo ua probabilità bassa, pari ad α, di rifiutare H quado questa è vera. Il valore x α è detto valore critico e l itervallo { x : x } A = < x α è detto zoa di accettazioe, metre l itervallo B = { x : x } x α è detto zoa di rifiuto. Alterativa a siistra H :µ = µ H1 :µ = µ 1 coµ 1 (ipotesi semplice) < µ, oppure, H1 :µ < µ (ipotesi composta) Si usa la stessa statistica del test, che sotto H si distribuirà come segue: GRAFICO 9
I questo caso si tede a rifiutare per valori di X piccoli, iferiori a µ. Si cerca pertato quel valore x1 α tale che α = P( X x1 α H è vera ). Ache questo valore si trova attraverso le tavole della ormale stadardizzata: α = P( X x1 α H è vera )= x Il valore 1 α µ = z σ α si trova sulle tavole della ormale stadardizzata: corrispode al quatile o ascissa che lascia a siistra ua probabilità pari ad α. GRAFICO 1
Trovato zα, posso calcolare il valore x1 α che cercavo: VALORE CRITICO Di cosegueza accettiamo H se il valore otteuto dal campioe x (valore empirico) è superiore a rifiutiamo H altrimeti: x1 α (valore critico), e - se σ x > µ zα accetto H ; - se σ x µ zα rifiuto H. GRAFICO Alterativa bidirezioale H :µ = µ H1 :µ µ I questo caso rifiutiamo per valori di X sia elevati maggiori di µ che bassi iferiori a µ. 11
Essedo α la probabilità di compiere u errore di primo tipo, si cercherao due valori x α 1 e x α tali che: 1 - α = P( x α 1 < X xα ) = Per cui si avrao due valori critici: E accettiamo H se il valore otteuto dal campioe x (valore empirico) è itero all itervallo x α ;xα : 1 σ µ zα < x < µ + zα σ metre rifiutiamo H per valori esteri all itervallo: 1
13 σ z µ x σ z µ x α α + GRAFICO Vediamo come si modifica il procedimeto quado la variaza σ è icogita. σ icogita Si procede come prima ma occorre sostituire σ co ( ) 1 X X S 1 i i = = (o ache ( ) X X S 1 i i = = se è elevato).
Sappiamo che la statistica X µ ha ua distribuzioe t di Studet co 1 gradi di libertà, per cui useremo i valori delle ascisse della t ( 1) per calcolare i valori critici. Tuttavia per elevato ( > 3) la t ( 1) può essere approssimata co la N(;1). Quidi distiguiamo due casi: 1. σ icogita, piccoli campioi ( 3) Alterativa a destra H :µ = µ H1 :µ > µ accetto H per rifiuto H per x < µ + tα, 1 ; x µ + tα, 1. Alterativa a siistra H :µ = µ H1 :µ < µ accetto H per rifiuto H per x > µ tα, 1 ; x µ tα, 1. 14
Alterativa bidirezioale H :µ = µ H1 :µ µ accetto H per µ tα, 1 < x < µ + tα, 1 ; rifiuto H per x µ x µ tα, + tα, 1 1.. σ icogita, gradi campioi ( > 3) Alterativa a destra H :µ = µ H1 :µ > µ accetto H per x < µ + zα ; rifiuto H per x µ + zα. Alterativa a siistra H :µ = µ H1 :µ < µ accetto H per x > µ zα ; rifiuto H per x µ zα. 15
16 Alterativa bidirezioale 1 µ :µ H µ :µ H = accetto H per S z µ x S z µ α α + < < ; rifiuto H per + S z µ x S z µ x α α.
P-VALUE O LIVELLO DI SIGNIFICATIVITA OSSERVATO Otteuta ua stima x dal campioe, il p-value è il livello di sigificatività osservato associato a tale valore. Si cosideri ad esempio il caso della verifica di ipotesi sulla media di ua popolazioe ormale co alterativa a destra. Abbiamo defiito il livello di sigificatività α come: x µ X α = P Z α σ α = P( x H è vera) metre il p-value è dato da: x µ X = P Z σ p-value = P( x H è vera) e si desume ach esso dalle tavole della ormale stadardizzata. Se il p-value è superiore ad α siamo ella zoa di accettazioe, altrimeti siamo ella zoa di rifiuto. GRAFICO 17
ESERCIZIO Su u campioe casuale di uità di u tipo di batterie per auto soo state rilevate le segueti durate i ai:,1, 1,8 1,6 3,,9 1,,5,5,,9 1,1 3, 3,1,4,7,8,7, 1,5 Si verifichi ad u livello di sigificatività del 5% l affermazioe del produttore che garatisce, per quel tipo di batterie, ua durata media pari a,5 ai cotro l alterativa che sia iferiore, suppoedo che tale durata possa riteersi distribuita ormalmete ella popolazioe. 18
ESERCIZIO Si suppoga di sapere che il voto medio preso all esame di Statistica dagli studeti di tutte le Facoltà di Ecoomia d Italia sia 3. Da u campioe casuale di 4 studeti della Facoltà di Ecoomia dell Uiversità di Bologa la media dei voti presi all esame di Statistica è risultata pari a 7 e la variaza campioaria corretta pari a 9. Assumedo che i voti si distribuiscao ormalmete, si verifichi l ipotesi che il voto medio di Statistica per la popolazioe degli studeti bologesi sia 3, cotro l alterativa che sia superiore a 3, per u livello di sigificatività del 5%. 19
ESERCIZIO Per u campioe di 8 siistri registrati per icideti stradali i ua provicia ua compagia di assicurazioe ha pagato u risarcimeto medio di 4 euro, co uo scarto quadratico medio di 15 euro. Si verifichi l ipotesi che tale campioe provega da ua popolazioe a cui corrispode u risarcimeto medio di 3 euro, fissado u livello di sigificatività pari al 5%.
ESERCIZIO Da u campioe casuale di 34 portieri che hao giocato el campioato di calcio di serie A del 1991/9 è stato rilevato il peso corporeo i kg, dado luogo ai segueti risultati: Peso i kg. di portieri 68 1 7 1 71 3 7 3 73 4 74 75 5 76 77 78 3 79 3 8 81 1 8 a) Si calcolio ua stima corretta della media ed ua stima corretta della variaza del peso ella popolazioe dei portieri. b) Si sottopoga a verifica l ipotesi che il peso medio ella popolazioe sia uguale a 76 kg cotro l alterativa che sia iferiore a 76 kg, scegliedo u ragioevole livello di sigificatività e specificado l assuzioe che è ecessario effettuare per procedere co tale verifica. c) Si calcoli ua stima dello scarto quadratico medio dello stimatore impiegato per la media della popolazioe. 1