Introduzione alla verifica d ipotesi

Documenti analoghi
Test d ipotesi Introduzione. Alessandra Nardi

Test di ipotesi (a due code, σ nota)

La verifica delle ipotesi

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B

Esercizi di statistica inferenziale

VERIFICA DELLE IPOTESI

R - Esercitazione 5. Andrea Fasulo Venerdì 16 Dicembre Università Roma Tre

Contenuti: Capitolo 14 del libro di testo

Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità

Test d ipotesi: confronto fra medie

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

STATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU)

STATISTICA A K (60 ore)

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Richiami di inferenza statistica Strumenti quantitativi per la gestione

Esercitazione 8 del corso di Statistica 2

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +

ESERCITAZIONE N. 7 corso di statistica

Argomenti della lezione:

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi

PROVA SCRITTA DI STATISTICA (COD COD ) 7 luglio 2005 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1

Test delle Ipotesi Parte I

Distribuzioni campionarie

lezione 4 AA Paolo Brunori

STATISTICA VERIFICA D IPOTESI - 1

Corso di Statistica Esercitazione 1.8

STATISTICA MULTIVARIATA SSD MAT/06

Gli errori nella verifica delle ipotesi

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.

Laboratorio di ST1 - Lezione 6. Antonietta di Salvatore. Dipartimento di Matematica Universitá degli Studi Roma Tre

Laboratorio di ST1 - Lezione 7. Antonietta di Salvatore. Dipartimento di Matematica Universitá degli Studi Roma Tre

Statistica Applicata all edilizia: Stime e stimatori

Lezione VII: t-test. Prof. Enzo Ballone

Analisi della varianza: I contrasti e il metodo di Bonferroni

ECONOMETRIA: Laboratorio I

Esercizi di statistica

Il Test di Ipotesi Lezione 5

Introduzione alla statistica per la ricerca in sanità

INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA

Caratterizzazione dei consumi energetici (parte 3)

LEZIONI DI STATISTICA MEDICA

Statistica 1- parte II

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015

Campionamento e stima di parametri

Cenni all interpretazione di un Test d ipotesi

Verifica delle ipotesi. Verifica delle ipotesi

OD TEST DI IPOTESI 50

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Il metodo statistico: prova dell ipotesi, intervallo di confidenza

Teoria della stima dei parametri:

STATISTICA A K (60 ore)

Elementi di Psicometria con Laboratorio di SPSS 1

Distribuzioni campionarie

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 II Esonero - 15 Gennaio 2015

Lezione 17. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 17. A. Iodice

STATISTICA A K (60 ore)

Statistica Inferenziale La verifica di ipotesi. Davide Barbieri

Test per una media - varianza nota

Esercizi di Probabilità e Statistica

Metodi statistici per lo studio dei fenomeni biologici

Approssimazione normale alla distribuzione binomiale

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

Esercitazione 8 maggio 2014

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Argomenti della lezione: Campionamento Stima Distribuzione campionaria Campione Popolazione Sottoinsieme degli elementi (o universo) dell '

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. II Esonero - 10 Gennaio 2014

Richiami di Statistica

Statistica Inferenziale

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

Confronto tra due popolazioni Lezione 6

Modelli descrittivi, statistica e simulazione

Fondamenti di Psicometria. La statistica è facile!!! VERIFICA DELLE IPOTESI

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Modelli Statistici per l Economia. Regressione lineare con un singolo regressore (terza parte)

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

L Analisi della Varianza (ANOVA)

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

RIFICA DI IPOTESI IPOTES PE

05. Errore campionario e numerosità campionaria

Elementi di Psicometria (con laboratorio software 1)

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Tecniche di sondaggio

Gli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie.

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

II Esonero - Testo B

Statistica inferenziale per variabili quantitative

Statistica inferenziale

Intervallo di confidenza

Verifica delle ipotesi

SOLUZIONI PROVA SCRITTA DI STATISTICA (cod. 4038, 5047, 371, 377) 8 settembre 2005

ESAME. 9 Gennaio 2017 COMPITO A

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.

Transcript:

Introduzione alla verifica d ipotesi Dipartimento di Matematica Università di Roma Tor Vergata 17 dicembre 2017

Consideriamo il caso in cui la nostra variabile risposta sia continua Immaginiamo che obiettivo del nostro studio sia valutare l efficacia di un farmaco sperimentale per la riduzione del livello di colesterolo totale in pazienti affetti da ipercolesterolemia. Ipotizziamo di misurare l efficacia del farmaco sulla base della variazione del livello di colesterolo dopo 30 giorni di trattamento (Delta:=valore basale - valore post-trattamento). Assumiamo che tale variazione segua nella popolazione un modello Normale di valore atteso µ e varianza σ 2 Vogliamo valutare il sistema d ipotesi H 0 : µ = 0 mg/dl Ipotesi nulla: nessuna efficacia in media H 1 : µ = 40 mg/dl Ipotesi alternativa: efficacia attesa sempre in media Ipotizziamo di conoscere il valore di σ = 40 a priori L unico elemento incognito resta il valore atteso della variazione (ma la nostra incertezza e limitata alle due possibili ipotesi) Questa incertezza residua dovrà essere risolta attraverso l osservazione dei nostri dati sperimentali

Density 0.000 0.002 0.004 0.006 0.008 0.010 100 50 0 50 100 150

Ipotizziamo di aver estratto casualmente un campione di 10 pazienti su ciascuno dei quali è stato osservata la variazione del livello di colesterolo dopo 30 giorni di terapia In simboli (X 1,..., X 10 ) dove X i i.i.d. con X i N(µ, σ 2 ) Scegliamo come statistica test la media campionaria, stimatore naturale di µ che assume adesso il ruolo di statistica test Come lo stimatore, la statistica test è una funzione delle sole nostre osservazioni chiamata a darne una sintesi. Dall assunzione di un modello normale segue che la distribuzione campionaria della nostra statistica test sarà ancora normale, in simboli dove σ = 40. X N(µ, σ 2 /n)

Confrontiamo la distribuzione della singola osservazione (linea continua) e quella della media campionaria delle nostre 10 osservazioni (linea tratteggiata) sotto l ipotesi nulla Density 0.000 0.005 0.010 0.015 0.020 0.025 0.030 100 50 0 50 100

Le distribuzioni campionarie della statistica test sotto l ipotesi nulla e l ipotesi alternativa sono la base su cui definire la regione di rifiuto del nostro test.... Density 0.000 0.005 0.010 0.015 0.020 0.025 0.030 20 0 20 40 60

Un test d ipotesi infatti è formalmente una regola di decisione che associa ad ogni possibile risultato la scelta di una delle due ipotesi. Dovremo pertanto individuare la regione di rifiuto del test, R, definita come l insieme dei valori osservabili della nostra statistica test per i quali andremo a rifiutare H 0. Nel nostro esempio potremmo assumere R = (x : x > 20) (quale regola di decisione abbiamo utilizzato?) Una volta definita R non resta che osservare i nostri dati e decidere di conseguenza. Resta tuttavia da definire l errore associato al notrso test: probabilità di un errore di prima specie o dimensione del test α = P rob{x ɛ R H 0 } probabilità di un errore di seconda specie è 1 β = P rob{x ɛ A H 1 } dove A è la regione di accettazione del test (complemento di R). NB la probabilità β = P rob{x ɛ R H 1 } è nota come potenza del test

Nel nostro esempio abbiamo α = 0.057 e 1 β = 0.057 Sarebbe possibile ridurre queste probablità di errore scegliendo diversamente la regione di rifiuto? Potremmo facilmente ridurre α scegliendo R = (x : x > 30), cioè diventando più conservativi. La diretta conseguenza sarebbe tuttavia un aumento della probabilità di errore di seconda specie; diventando molto conservativi rischieremmo di non riconoscere H 1 anche quando è vera.

L unico modo effettvo di ridurre l errore è aumentare la dimensione campionaria, di fatto seprando le due distribuzioni campionarie della nostra statistica test. Density 0.00 0.01 0.02 0.03 0.04 20 0 20 40 60

Nella realtà la situazione si complica in primo luogo perché l ipotesi alternativa è spesso composta H 0 : µ = 0 mg/dl Ipotesi nulla: nessuna efficacia in media H 1 : µ > 0 mg/dl Ipotesi alternativa: efficacia attesa sempre in media Questo implica che avremo un insieme di distribuzioni campionarie per la nostra statistica test sotto l ipotesi alternativa, una per ogni possibile valore di µ > 0 e la potenza del test (e la probablità di errore di seconda specie) diventerà una funzione di µ Density 0.000 0.005 0.010 0.015 0.020 0.025 0.030 20 0 20 40 60

Inoltre generalmente σ 2 non è noto e sarà necessario ricorrere al suo stimatore S 2 (Xi X) 2 = n 1

La costruzione della nostra statistica test partirà dalla media campionaria che andremo a standardizzare assumendo vera l ipotesi nulla Z = X 0 σ/ n per poi sotituire σ con il suo stimatore T = X 0 S/ n T dipende adesso da due quantità aleatorie e la sua distribuzione campionaria sarà la distribuzione t di Student con n-1 gradi di libertà

Il test ottimale sarà caratterizzato dalla regione di rifiuto R = {t tali che t > t α } dove t α si ricava dall uguaglianza + t α f T (t)dt = α. Nel nostro caso t α = 1.83. Density 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4