Test d ipotesi Introduzione. Alessandra Nardi

Documenti analoghi
Introduzione alla verifica d ipotesi

Statistica Inferenziale Soluzioni 3. Verifica di ipotesi

La verifica delle ipotesi

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B

Test di ipotesi (a due code, σ nota)

Distribuzioni campionarie

Statistica Applicata all edilizia: Stime e stimatori

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Contenuti: Capitolo 14 del libro di testo

ESERCITAZIONE N. 7 corso di statistica

Test d ipotesi: confronto fra medie

Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

STATISTICA A K (60 ore)

VERIFICA DELLE IPOTESI

Esercitazione 8 del corso di Statistica 2

Test per una media - varianza nota

STATISTICA. Federico M. Stefanini. e.mail: a.a (3 CFU)

STATISTICA A K (60 ore)

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Richiami di inferenza statistica Strumenti quantitativi per la gestione

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +

Esercizi di statistica

PROVA SCRITTA DI STATISTICA (COD COD ) 7 luglio 2005 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A

Argomenti della lezione:

Test delle Ipotesi Parte I

Approssimazione normale alla distribuzione binomiale

Analisi della varianza: I contrasti e il metodo di Bonferroni

Confronto tra due popolazioni Lezione 6

Statistica 1- parte II

R - Esercitazione 5. Andrea Fasulo Venerdì 16 Dicembre Università Roma Tre

Introduzione alla statistica per la ricerca in sanità

STATISTICA VERIFICA D IPOTESI - 1

Statistica Inferenziale La verifica di ipotesi. Davide Barbieri

Metodi statistici per lo studio dei fenomeni biologici

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

I modelli probabilistici

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

Laboratorio di ST1 - Lezione 6. Antonietta di Salvatore. Dipartimento di Matematica Universitá degli Studi Roma Tre

Test delle ipotesi sulla media.

Gli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana

Laboratorio di ST1 - Lezione 7. Antonietta di Salvatore. Dipartimento di Matematica Universitá degli Studi Roma Tre

ECONOMETRIA: Laboratorio I

Caratterizzazione dei consumi energetici (parte 3)

05. Errore campionario e numerosità campionaria

lezione 4 AA Paolo Brunori

Verifica di ipotesi: approfondimenti

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.

Verifica delle ipotesi. Verifica delle ipotesi

Il Test di Ipotesi Lezione 5

INTERVALLI DI CONFIDENZA e TEST D IPOTESI 1 / 30

Statistica Metodologica

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 II Esonero - 15 Gennaio 2015

Intervalli di confidenza

Distribuzioni campionarie

II Esonero - Testo B

Stima dei parametri. La v.c. multipla (X 1, X 2,.., X n ) ha probabilità (o densità): Le f( ) sono uguali per tutte le v.c.

Richiami di Statistica

Elementi di Psicometria (con laboratorio software 1)

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

Gli errori nella verifica delle ipotesi

Esercizi di statistica inferenziale

R - Esercitazione 3. Lorenzo Di Biagio Venerdì 25 Ottobre Università Roma Tre

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Test d Ipotesi

Prova d esame di Istituzioni di Calcolo delle Probabilità Laurea Triennale in Scienze Statistica. 09/09/2013

Esercizi di Probabilità e Statistica

Teoria della stima dei parametri:

Cenni di statistica statistica

INTRODUZIONE AL DOE come strumento di sviluppo prodotto Francesca Campana Parte 2 Concetti di base

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Esercitazione 8 maggio 2014

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 7: Basi di statistica

Esercitazioni di Statistica Matematica A Esercitatori: Dott. Fabio Zucca - Dott. Maurizio U. Dini Lezioni del 7/1/2003 e del 14/1/2003

Lezione VII: Z-test. Statistica inferenziale per variabili quantitative. Statistica inferenziale per variabili quantitative. Prof.

Corso di Statistica Esercitazione 1.8

si tratta del test del chi-quadro di adattamento e di quello di indipendenza. 1 l ipotesi che la popolazione segua una legge fissata;

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. II Esonero - 10 Gennaio 2014

Lezione VII: t-test. Prof. Enzo Ballone

Statistica inferenziale per variabili quantitative

Corso di Statistica - Prof. Fabio Zucca IV Appello - 5 febbraio Esercizio 1

deve utilizzarsi la variabile t ν,α/2 , dove n è il numero di gradi di libertà pari al numero delle misure diminuito di 1 (ν=n-1).

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie.

Università del Piemonte Orientale. Corsi di laurea di area tecnica. Corso di Statistica Medica. Analisi dei dati quantitativi :

Introduzione ai test statistici

Test d ipotesi. Monica Musio, Maria Luisa Targhetta

Esercitazione del 16 maggio 2014

SOLUZIONE. a) Calcoliamo il valore medio delle 10 misure effettuate (media campionaria):

Intervalli di confidenza

Test di ipotesi su due campioni

Corso in Statistica Medica

Statistica (parte II) Esercitazione 4

Modelli descrittivi, statistica e simulazione

Campionamento e stima di parametri

Fondamenti statistici : Test d Ipotesi (1)

Transcript:

Test d ipotesi Introduzione Alessandra Nardi alenardi@mat.uniroma2.it 1

Consideriamo il caso in cui la nostra variabile risposta sia continua Immaginiamo che obiettivo del nostro studio sia valutare il livello di espressione di un gene in pazienti affetti da leucemia mieloide acuta Assumiamo che in questi pazienti il livello di espressione del gene in esame segua un modello Normale di valore atteso µ e varianza σ 2 Vogliamo valutare il sistema d ipotesi H 0 : µ = 0 Ipotesi nulla: gene non espresso (curve di Andrews) H 1 : µ = 40 Ipotesi alternativa: gene sovraespresso Ipotizziamo di conoscere il valore di σ = 20 a priori L unico elemento incognito resta il valore atteso dell espressione genica (ma la nostra incertezza e limitata alle due possibili ipotesi) 2

Density 0.000 0.005 0.010 0.015 0.020 50 0 50 100 3

Ipotizziamo poi di aver estratto casualmente un campione di 10 pazienti su ciascuno dei quali è stato osservato il livello di espressione del gene In simboli (X 1,..., X 10 ) dove X i i.i.d. con X i N(µ, σ 2 ) Scegliamo come statistica test la media campionaria, stimatore naturale di µ Dall assunzione di un modello normale segue che la distribuzione campionaria della nostra statistica test sarà ancora normale, in simboli X N(µ, σ 2 /n) 4

Confrontiamo la distribuzione della singola osservazione (linea continua) e quella della media campionaria delle nostre 10 osservazioni (linea tratteggiata) sotto l ipotesi nulla Density 0.00 0.01 0.02 0.03 0.04 0.05 0.06 60 40 20 0 20 40 60 5

Le distribuzioni della statistica test sotto l ipotesi nulla e l ipotesi alternativa sono adesso ben separate... Density 0.00 0.01 0.02 0.03 0.04 0.05 0.06 20 0 20 40 60 6

Ricordiamo che un test d ipotesi è formalmente una regola di decisione che associa ad ogni possibile risultato la scelta di una delle due ipotesi. Dovremo pertanto individuare la regione di rifiuto del test, R, definita come l insieme dei valori osservabili della nostra statistica test per i quali andremo a rifiutare H 0. La determinazione di R è legata alle probabilità di errore associate al test: probabilità di un errore di prima specie o dimensione del test α = P rob{x ϵ R H 0 } probabilità di un errore di seconda specie è 1 β = P rob{x ϵ A H 1 } dove A è la regione di accettazione del test (complemento di R). NB la probabilità β = P rob{x ϵ R H 1 } è nota come potenza del test 7

La regione di rifiuto ottimale dovrebbe corrispondere a quella che rende minime la probabilità di entrambi gli errori. Tuttavia, fissato n, minimizzare contemporaneamente le due probabilità di errore non è possibile essendo legate da un una relazione inversa per cui al diminuire dell una aumenta l altra. L idea è quindi quella di fissare il livello di α e scegliere la regione R che rende minimo il valore di 1 β Nel nostro esempio, fissato α = 0.05 il test ottimale è quello la cui regione di rifiuto corrisponde ai valori di X > z α dove z α il percentile della densità N(0, 20 2 /10) che taglia un area pari a 0.05 sulla coda destra della distribuzione. Nel nostro esempio R = {x tali che x > 10.41} Quanto vale l errore di seconda specie? 8

Density 0.00 0.01 0.02 0.03 0.04 0.05 0.06 0 10 20 30 40 9

Nella realtà la situazione si complica in primo luogo perché l ipotesi alternativa è spesso composta H 0 : µ = 0 Ipotesi nulla: gene non espresso H 1 : µ > 0 Ipotesi alternativa: gene espresso Questo implica che avremo un insieme di distribuzioni campionarie per la nostra statistica test sotto l ipotesi alternativa, una per ogni possibile valore di µ > 0 e la potenza del test (e la probablità di errore di seconda specie) diventerà una funzione di µ Inoltre generalmente σ 2 non è noto e sarà necessario ricorrere al suo stimatore S 2 = (Xi X) 2 n 1 10

La costruzione della nostra statistica test partirà dalla media campionaria che andremo a standardizzare assumendo vera l ipotesi nulla Z = X 0 σ/ n per poi sotituire σ con il suo stimatore T = X 0 S/ n T dipende adesso da due quantità aleatorie e la sua distribuzione campionaria sarà la distribuzione t di Student con n-1 gradi di libertà 11

Il test ottimale sarà caratterizzato dalla regione di rifiuto R = {t tali che t > t α } dove t α si ricava dall uguaglianza + t α f T (t)dt = α Density 0.0 0.1 0.2 0.3 0.4 4 2 0 2 4 12