TEST STATISTICI. indica l ipotesi che il parametro della distribuzione di una variabile assume il valore 0

Documenti analoghi
14. TEORIA DEI TEST STATISTICI

Corso di Statistica. Test per differenza tra medie e proporzioni. Prof.ssa T. Laureti a.a

Campionamento casuale da popolazione finita (caso senza reinserimento )

Università degli Studi di Cassino, Anno accademico Corso di Statistica 2, Prof. M. Furno

ALCUNI ESERCIZI SUI TEST DI IPOTESI PARAMETRICHE PARTE 1

Anemia. Anemia - percentuali

COME CALCOLARE L INTERVALLO DI CONFIDENZA QUANDO E NECESSARIO STIMARE LA DEVIAZIONE STANDARD? (è quasi sempre così!)

Corso di Statistica Canale E Bini, Cutillo A.A. 2017/2018. Esercitazione di riepilogo n.8 Test di ipotesi Soluzioni

Test Statistici. In termini statistici, agli eventi appena indicati viene attribuita una probabilità ed una specifica definizione:

L INTERVALLO DI CONFIDENZA

Alcuni concetti di statistica: medie, varianze, covarianze e regressioni

Appunti di STATISTICA

Titolo della lezione. Dal campione alla popolazione: stima puntuale e per intervalli

Poiché n<30 e la deviazione standard non era nota a priori ma è stata stimata (s=14.4), la statistica test da utilizzare è t:

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A

Stime puntuali. Statistica e biometria. D. Bertacchi. Stime puntuali. Intervalli di confidenza. Approfondiamo

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità B - Soluzione

Le principali procedure inferenziali: nozioni, schemi di procedimento ed esempi di applicazione

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità D

= ed è: n. 2 2 x. tra ns x

STATISTICA INFERENZIALE

Costo manutenzione (euro)

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità C

Statistica inferenziale, Varese, 5 febbraio 2009 Prima parte - Modalità A - Soluzioni

ESERCITAZIONE VII. H 0 : μ = 500. H 1 : μ > /3.16 = = 3.403

La stima per intervalli

Esercitazione 6 del corso di Statistica 2

Esercitazioni del corso: ANALISI MULTIVARIATA

Esercitazioni di Statistica

Test di Ipotesi. La distribuzione gaussiana delle medie consente anche di sottoporre ad esame critico ipotesi effettuate su una popolazione.

Inferenza Statistica. L inferenza statistica cerca di risalire al modello del fenomeno sulla base delle osservazioni.

Senza reimmissione. Le n v.a. non sono più indipendenti e identicamante distribuite. Campionamento da universo

APPROSSIMAZIONE NORMALE. 1. Si tirano 300 dadi non truccati. Sia X la somma dei punteggi. Calcolare approssimativamente le probabilità seguenti.

7. Test d ipotesi. 2. L ipotesi è vera ma in base ai dati la rifiuto in questo caso si dice che si commette errore di prima specie

Statistica. Lezione 5

ESERCITAZIONE N. 6 corso di statistica

VERIFICA DI IPOTESI SULLA DIFFERENZA TRA DUE MEDIE. Psicometria 1 - Lezione 12 Lucidi presentati a lezione AA 2000/2001 dott.

Lezione 15. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 15. A. Iodice

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2013

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

Esame di Statistica A-Di Prof. M. Romanazzi

Matematica con elementi di Informatica

Quesito 1. I seguenti dati si riferiscono ai tempi di reazione motori a uno stimolo luminoso, espressi in decimi di secondo, di un gruppo di piloti:

Caso studio 9. Distribuzioni doppie. Esempi

Argomenti. Stima Puntuale e per Intervallo. Inferenza. Stima. Leonardo Grilli. Università di Firenze Corso di Laurea in Statistica Statistica

Gli Indici di VARIABILITA

Confronto di due misure Campioni indipendenti

UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA

Inferenza II. Inferenza: tipologie di approcci. Test di ipotesi: ipotesi alternativa. Test di ipotesi: ipotesi nulla.

Esercitazione sette: soluzioni. H 1 : θ > 0.48 ( =

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.

Metodi statistici per lo studio dei fenomeni biologici

Università degli Studi di Napoli Parthenope. STATISTICA per il Turismo

L INTERVALLO DI CONFIDENZA

6 Stima di media e varianza, e intervalli di confidenza

4. Proprietà degli stimatori

Inferenza II. Inferenza: tipologie di approcci. Test di ipotesi: ipotesi alternativa. Test di ipotesi: ipotesi nulla.

Università di Napoli Federico II, DISES, A.a , CLEC, Corso di Statistica (L-Z) Lezione 22 La verifica delle ipotesi. Corso di Statistica (L-Z)

Stima della media di una variabile X definita su una popolazione finita

4. L ipotesi è falsa e la rifiuto bene. H 0 ) p = 0.5. Facciamo dunque n lanci. Otteniamo k teste ed n k croci:

Distribuzione normale o gaussiana

Metodi quantitativi per l analisi dello sviluppo

ANalysis. Analisi della Varianza - ANOVA. Aprile, Aprile, Nel linguaggio delle variabili le operazioni fondamentali sono tre

PROBLEMI DI INFERENZA SU MEDIE

Stimatori, stima puntuale e intervalli di confidenza Statistica L-33 prof. Pellegrini

Tecnica delle misurazioni applicate LM - Esame del 26 febbraio 2013

Politecnico di Milano - Anno Accademico Statistica Docente: Alessandra Guglielmi Esercitatore: Stefano Baraldo

Statistica Inferenziale Soluzioni 1. Stima puntuale

STATISTICA A K (63 ore) Marco Riani

Distribuzione normale

Una funzione delle osservazioni campionarie è una statistica che, nel contesto della stima di un parametro, viene definita stimatore.

STUDIO DEL LANCIO DI 3 DADI

Appunti di Probabilità e Statistica. a.a. 2014/2015 C.d.L. Informatica Bioinformatica I. Oliva. 1 Statistica Inferenziale.

Statistica. Esercitazione 12. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

II Esonero - Testo A

Statistica I - A.A

TECNICA DELLE MISURAZIONI APPLICATE 17 OTTOBRE 2012

Titolo della lezione. Campionamento e Distribuzioni Campionarie

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

PROVA SCRITTA DI STATISTICA CLEA-CLEFIN-CLELI (COD e 4038) 15 gennaio 2003

Probabilità e Statistica (cenni)

Lezioni del Corso di Fondamenti di Metrologia Meccanica

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2009/10

SDE Marco Riani

Corso di Laurea in Ingegneria Informatica Anno Accademico 2016/2017 Calcolo delle Probabilità e Statistica Matematica

Prova d esame di Calcolo delle Probabilità 02/07/2011

IL CAMPIONAMENTO. POPOLAZIONE un insieme finito o infinito di unità statistiche

Popolazione e Campione

Primo appello di Calcolo delle probabilità Laurea Triennale in Matematica 22/01/2018

Dispense Inferenza PRELIMINARY DRAFT

Daniela Tondini

Statistica inferenziale, Varese, 25 novembre 2008 Prima parte - Modalità B - soluzione

Statistica inferenziale, Varese, 25 novembre 2008 Prima parte - Modalità A - soluzione

Legge Gamma e Legge Chi quadro

LE MISURE DI TENDENZA CENTRALE

La verifica delle ipotesi

σ 2 = σ = α = 0.95 α = = 0.05 α / 2 = SOLUZIONE VI ESERCIZIO 1

Statistica. Capitolo 9. Stima: Ulteriori Argomenti. Cap. 9-1

Transcript:

TEST STATISTICI I dati campioari possoo essere utilizzati per verificare se ua certa ipotesi su ua caratteristica della popolazioe può essere riteuta verosimile o meo. Co il termie ipotesi statistica si idica ua cogettura su u parametro i ua popolazioe (si può voler verificare se u macchiario produce pezzi che rispettao caratteristiche prestabilite, se u dado o ua moeta soo equilibrati, se u farmaco è efficace). Le ipotesi soo sottoposte a verifica sulla base di u campioe e la procedura utilizzata per la verifica di queste ipotesi costituisce il cosiddetto test statistico. Per verificare se ua moeta è equilibrata si può laciare più volte la moeta e registrare il umero di teste e di croci. Si riterrà plausibile l ipotesi che la moeta sia equilibrata se il umero di teste e di croci o risultao molto diversi, ma o si può stabilire co certezza se u'ipotesi è vera o falsa, dato che uo stesso risultato può derivare da popolazioi co strutture diverse (el lacio di ua moeta equilibrata 00 volte il umero di teste va da 0 a 00, ache se alcui risultati soo improbabili) U qualsiasi criterio di decisioe comporterà ecessariamete il rischio di commettere u errore che cosiste el rifiutare l ipotesi quado è vera oppure ell accettarla quado è falsa. Nel caso della moeta il risultato campioario potrebbe segalare che la moeta è equilibrata ache se o lo è realmete, oppure potrebbe idicare che la faccia testa ha ua probabilità molto maggiore di croce ache se la moeta fosse equilibrata o, se la faccia croce avesse ua probabilità maggiore. Prederemo i cosiderazioe solo la probabilità di rifiutare u'ipotesi quado è vera e faremo riferimeto, quidi, ai cosiddetti tests di sigificatività. I geerale l ipotesi che si vuole verificare è detta ipotesi ulla ed è idicata co la otazioe H0: seguita dal suo euciato formale. H0: = 0. idica l ipotesi che il parametro della distribuzioe di ua variabile assume il valore 0 Nel caso della moeta, se idichiamo co la probabilità associata alla faccia testa, l ipotesi che la moeta sia bilaciata può essere quidi espressa da H0 : =0.5 U ipotesi su è cosiderata tato più verosimile quato più la stima campioaria risulta probabile se si assume come vera l ipotesi H0 e la regola di decisioe cosiste ell accettare H0 se la stima campioaria rietra ell isieme dei risultati più probabili sotto H0 e el rifiutarla i caso cotrario. Per cotrollare se il risultato campioario è u risultato probabile quado il parametro è uguale a 0 si utilizza la distribuzioe di probabilità dello stimatore T del parametro sotto ipotesi ulla. L isieme dei possibili risultati campioari viee suddiviso ella regioe di accettazioe di H0 (quelli probabili) e i ua regioe di rifiuto o regioe critica (quelli poco probabili). C è ua probabilità di rifiutare l ipotesi ulla quado è vera, perché si può otteere u risultato campioario improbabile ache quado H0 è vera. La probabilità dell errore che cosiste el rifiutare l ipotesi ulla quado è vera viee idicata co e viee detta errore di prima specie o livello di sigificatività: corrispode alla probabilità di otteere, quado è vera H0, u risultato compreso ella regioe di rifiuto dell ipotesi.

Cosiderata la distribuzioe dello stimatore sotto ipotesi ulla e scelto il livello di probabilità, gli estremi dell itervallo di accettazioe, detti valori critici, corrispodoo i geere ai due quatili che i questa distribuzioe isolao il primo sulla sua siistra ed il secodo sulla sua destra ua probabilità pari ad /. Se il valore campioario t di T risulta compreso ella regioe critica si dice che il valore della statistica è sigificativo. La probabilità viee scelta i modo da essere quasi sicuri di o respigere H0 quado è vera e sul suo valore si possoo fare cosiderazioi aaloghe a quelle relative ai livelli di probabilità degli itervalli di cofideza. Il suo valore viee fissato teedo preseti le cosegueze che derivao dal rifiutare u'ipotesi vera. Al dimiuire di aumeta l ampiezza dell itervallo di accettazioe per cui si fiisce per o respigere H0 ache i preseza di risultati molto improbabili. Se il valore t dello stimatore T è compreso ell itervallo di accettazioe dell ipotesi ulla ciò o implica che l ipotesi sia ecessariamete vera. Se, per esempio, si fosse otteuto u umero di teste pari a 503 su 000 laci o si rifiuterebbe l ipotesi che la moeta sia equilibrata ma ovviamete o si rifiuterebbe mai l ipotesi che fosse uguale a 0.503. Ogi stima t rietra ache ell isieme dei risultati più probabili sotto altre ipotesi diverse da H0 ed è quidi compreso ell itervallo di accettazioe associato a queste ipotesi. VERIFICA DI IPOTESI SULLA MEDIA H0 : 0 CASO ) Se X ; ~ N oto X ~ N ; L itervallo di accettazioe dell ipotesi sarà cetrato su 0 e delimitato dai due quatili 0 u /, 0 u / che isolao a siistra e a destra della distribuzioe u area pari ad /. Gli itervalli a siistra e a destra costituiscoo ivece l area di rifiuto dell'ipotesi o regioe critica, e i valori 0 u / e 0 u / soo i valori critici. La regioe di accettazioe cotiee l isieme dei valori più probabili sotto ipotesi ulla. Se la media risulta compresa ella regioe di accettazioe si coclude affermado che, al livello di sigificatività prestabilito, o si ha motivo di rifiutare l ipotesi ulla o che l ipotesi è compatibile co il risultato campioario. Se, ivece, la media campioaria cade i ua delle due regioi critiche l ipotesi viee rifiutata al livello di sigificatività. Il risultato campioario x 0 di X è coteuto egli itervalli di accettazioe di tutto u isieme di ipotesi diverse. La verifica dell'ipotesi si può effettuare i modo più semplice, cofrotado il valore assoluto di X μ0 co il valore z/ della ormale stadardizzata. σ

Se X μ0 σ > z/ il valore della statistica è sigificativo e l'ipotesi ulla è rifiutata al livello di sigificatività, i caso cotrario l'ipotesi è compatibile co i risultati campioari e o vi soo motivi per rifiutarla. I modo più accurato si può calcolare il p-valore (o p-value) associato al valore della statistica test calcolata sul campioe, ossia la probabilità che la statistica assuma u valore più estremo di quello osservato sotto l ipotesi che H0 sia vera. Quato più il p-valore è piccolo, tato meo verosimile appare l ipotesi ulla. Su u campioe di 0 elemeti estratto da ua popolazioe ormale di variaza ota pari a 60 si è otteuta ua media campioaria pari a 0. Si vuole verificare l ipotesi che la media ella popolazioe sia 5 al livello =0.. H0: = 5 05. 5 z 0. 05. 645 No si ha motivo di rifiutare 60/ 0 Il p-valore associato a.5 è uguale all area isolata alla destra di tale valore più l area alla siistra dello stesso valore preso co sego egativo, ossia. 5 0. 8944 0. CASO ) Se la variaza della popolazioe o è ota e il campioe è piccolo, per la verifica della stessa ipotesi si cotrolla se risulta X μ0 t α/ S Su u campioe casuale di 8 elemeti estratto da ua popolazioe ormale soo state rilevate le segueti itesità della variabile oggetto di studio. 3. 4. 4.6 5.0 5. 5.3 6.5 Verificare le ipotesi che la media della popolazioe sia pari a 5 al livello di sigificatività=0.0. Dai dati campioari risulta E X 4375. EX 5. σˆ 359375, S σˆ. 6964 Per la verifica dell ipotesi H0: = 5 si utilizza la statistica X μ t- S 4. 3755. 0770 t7 0. 005 3. 4995. 6964/ 8 No si ha motivo di rifiutare l ipotesi ulla al livello di sigificatività prefissato. 8 7

CASO 3) Se il campioe è sufficietemete umeroso, la verifica di ipotesi si basa sulla distribuzioe asitotica, così come si è visto a proposito degli itervalli di cofideza. X μ0 z α/ S Su u campioe di 65 uova è stato rilevato lo "spessore del guscio (i millimetri) otteedo ua media e la radice quadrata della variaza corretta. I base a queste iformazioi si vuole verificare l'ipotesi che lo spessore medio del guscio sia pari a 0.3 millimetri al livello di sigificatività = 0.05. H 0 : 0. 3 x 0. 3 S 0. 08 03, 030,. 0u0,05. 96, l'ipotesi viee rifiutata al livello di sigificatività = 0.05. 008, 65. 0 0. 9783 0. 0434 Si rifiuta per = 0.05 No si rifiuta per = 0.0 P-valore: VERIFICA DI IPOTESI SULLA PROPORZIONE Data ua popolazioe co distribuzioe Zero-Uo (o di Beroulli), la verifica di ipotesi sul parametro assume al forma H0 : = 0 Se il campioe è sufficietemete umeroso, la media campioaria si distribuisce i modo ormale π ( π ) co valore atteso 0 e variaza 0 0. L ipotesi si rifiuta se X 0 0( 0) z / Si vuole verificare al livello di sigificatività dell % l ipotesi che il tasso di disoccupazioe dei laureati co ua votazioe fiale superiore o uguale a 00 sia pari al 5% sapedo che dalla popolazioe è stato estratto u campioe casuale di 5000 idividui sui quali 300 soo risultati disoccupati. H0 : = 0.05 La media campioaria di idividui disoccupati è pari al 6%, per cui l ipotesi viee rifiutata 0.06 0.05 3. 4 z 0. 005. 576 0.05 0.95 5000 P-valore: 3. 4 0. 9994 0. 00

VERIFICA DELL UGUAGLIANZA FRA LE MEDIE DI DUE POPOLAZIONI I molte situazioi reali lo scopo dell idagie cosiste el cofroto fra due o più popolazioi, come el caso i cui si volesse verificare se due diversi fertilizzati portao a risultati diversi ella produttività per ettaro o se due diversi farmaci possoo essere cosiderati equivaleti ella cura di ua determiata malattia. I casi come questi si vuole verificare l ipotesi che o esistoo differeze sigificative fra le produttività o fra i tempi di guarigioe. Questa ipotesi è particolarmete rilevate dato che la sua accettazioe porterebbe a cocludere che fra i due fertilizzati e fra i due mediciali o esiste alcua reale differeza. Se ivece le differeze otteute ei due diversi gruppi soo così gradi da o poter essere imputate al solo effetto di fattori casuali, si potrebbe cocludere che uo dei due fertilizzati cosete di otteere u risultato migliore rispetto all altro e che il tempo di guarigioe rilevato el gruppo di pazieti trattati co u farmaco è sigificativamete diverso del tempo di guarigioe el gruppo di pazieti trattato co l altro. I geere l ipotesi che si vuole verificare riguardao i valori medi di ua variabile Z esamiata i due (o più) popolazioi distite, come quado si verifica se esiste ua differeza sigificativa el redimeto di titoli diversi, ei puteggi otteuti ad u esame da gruppi di studeti che hao utilizzato testi differeti, ella durata di fuzioameto di prodotti otteuti co macchiari diversi. Per semplicità ci occuperemo del caso i cui i gruppi presi i esame soo soltato due e supporremo ioltre che siao verificate le codizioi stadard che ipotizzao che la variabile abbia ua distribuzioe ormale co uo stesso valore della variaza i etrambe le popolazioi. Quest ultima ipotesi costituisce la cosiddetta codizioe di omoschedasticità, sotto la quale si ottegoo abbastaza facilmete le distribuzioi della statistica test (se i valori delle variaze soo ivece diversi fra di loro, si parla di codizioe di eteroschedasticità). Idicate co X e co X la variabile di iteresse rilevata ella prima e ella secoda popolazioe, le codizioi stadard soo le due v.c. siao ormali co medie e e variaza comue ota. La verifica dell ipotesi o H0 : = si basa sulla differeza fra le medie campioarie che si distribuisce i modo ormale co media pari alla differeza delle medie e variaza pari alla somma delle variaze. X X σ / σ dove è stimata da μ μ X X μ μ σ / / S S S p variaza pooled. Teedo coto che sotto ipotesi ulla le medie e soo uguali fra di loro, la verifica dell ipotesi si basa sulla statistica test S p X X / che, sotto ipotesi ulla, si distribuisce come ua t di Studet co + gdl.

Su due campioi, etrambi di umerosità, soo state rilevate le altezza di piatie sottoposte a due diversi metodi di coltura. Sulla base dei segueti risultati x 96. 58 x 90. 9 s s 5. 7 8. 99 la variaza pooled è pari a 57. 899. S p 708. La statistica test risulta quidi 9658. 909.. 67. 5, 0 / 44 Per =0.0 il quatile di ordie 0.995 della t co g.d.l. è.888. Si coclude che l ipotesi è compatibile co i dati campioari raccolti al livello di sigificatività dell %. Se i gradi di libertà della t soo molto elevati, si usao le tavole della ormale stadard e si può calcolare il p-valore VERIFICA DELL UGUAGLIANZA FRA LE PROPORZIONI DI DUE POPOLAZIONI Nel caso i cui le popolazioi abbiao distribuzioe Beroulliaa di parametri e l ipotesi che si vuole sottoporre a verifica è l uguagliaza dei parametri H0 : = Per ua umerosità campioaria sufficietemete elevata la statistica X X X p X p ~N(0,) dove X X X p è la media delle medie campioarie poderata co le umerosità. Teedo coto che sotto ipotesi ulla le proporzioi e soo uguali fra di loro, la verifica dell ipotesi si basa sulla statistica test X Se risulta X X X p p z / si rifiuta l ipotesi ulla

Ai fa vee codotto uo studio per aalizzare gli effetti positivi dell uso di aspiria sulla prevezioe degli attacchi cardiaci. Su u isieme di 07 idividui veero formati due gruppi: il gruppo di trattameto e quello di cotrollo. Gli idividui del gruppo di trattameto ricevevao ua dose quotidiaa di aspiria metre quelli di cotrollo u farmaco placebo. Lo studio vee codotto per u periodo di 5 ai osservado il umero di decessi per ifarto. Si otteero i segueti risultati Farmaco\Esito Ifartuati No ifartuati Placebo 39 0795 034 Aspiria 39 0898 037 378 693 07 39 La proporzioe dei colpiti da ifarto el gruppo di cotrollo è X 0. 07 034 39 La proporzioe dei colpiti da ifarto el gruppo sottoposto a trattameto è X 0. 06 037 3939 X p 0. 07 07 0. 07 0. 07 034 037 Il p-valore è praticamete ullo 0. 07 0. 06 5. 5 z 0. 576. 995 TEST DI INDIPENDENZA Abbiamo utilizzato l idice chi-quadrato per misurare l idipedeza fra due variabili. Suppoedo che l idice sia stato calcolato su u campioe, si vuole verificare se si può accettare o meo l ipotesi che le due variabili ella collettività soo idipedeti o meo. Sotto l ipotesi ulla e per sufficietemete elevato la statistica H K ' ij ij ' i j ij tede ad ua chi-quadrato co (H)(K) gdl sempre che ciascua delle frequeze assolute cogiute (riportate all itero della tabella a doppia etrata) sia almeo pari a 5. La regioe di H K. rifiuto è posizioata alla destra del quatile Suppoiamo che si voglia verificare l ipotesi di idipedeza fra due variabili al livello di sigificatività =0.05 sapedo che su u campioe di 90 elemeti si soo otteuti i risultati riportati ella tabella successiva X\Y A B a 30 3 6 b 6 8 36 54 90

546 3-90 546 90 36 6 30-90 366 90... 5 840 ( )( ). e l ipotesi di idipedeza va quidi rifiutata perché la statistica risulta maggiore del quatile 3.845 che ella chi-quadrato co gradi di libertà isola alla sua destra u area pari a 0.05.