Concetto di potenza statistica



Documenti analoghi
Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

Statistiche campionarie

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Elementi di Psicometria con Laboratorio di SPSS 1

STATISTICA IX lezione


Statistica. Lezione 6

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Inferenza statistica. Statistica medica 1

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)

Capitolo 11 Test chi-quadro

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010

Elementi di Psicometria con Laboratorio di SPSS 1

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

METODOLOGIA CLINICA Necessita di: Quantificazione Formalizzazione matematica

Metodi statistici per le ricerche di mercato

Il confronto fra proporzioni

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Corso di Psicometria Progredito

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

3. Confronto tra medie di due campioni indipendenti o appaiati

IL TEST CHI QUADRATO χ 2

Statistica inferenziale

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

VERIFICA DELLE IPOTESI

L analisi statistica

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

Tema A Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Seconda Parte Specifica di scuola - Statistica sanitaria e Biometria - 31/07/2015

Verifica di ipotesi

Relazioni tra variabili

Capitolo 12 La regressione lineare semplice

Istituzioni di Statistica e Statistica Economica

Esercitazione n.2 Inferenza su medie

LEZIONE n. 5 (a cura di Antonio Di Marco)

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

Il test del Chi-quadrato

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Elementi di Psicometria con Laboratorio di SPSS 1

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

1. Distribuzioni campionarie

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

Servizi di consulenza specialistica per IGRUE

Metodi statistici per le ricerche di mercato

E naturale chiedersi alcune cose sulla media campionaria x n

CAPACITÀ DI PROCESSO (PROCESS CAPABILITY)

ANALISI DEI DATI EPIDEMIOLOGICI

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

ANALISI DELLE FREQUENZE: IL TEST CHI 2

LE CARTE DI CONTROLLO (4)

è decidere sulla verità o falsità

Esercitazione n.4 Inferenza su varianza

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Analisi di dati di frequenza

Rapporto dal Questionari Insegnanti

Lineamenti di econometria 2

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale

STATISTICA INFERENZIALE

Gli studi epidemiologici

Esercitazioni di Statistica

Istituzioni di Statistica e Statistica Economica

ELEMENTI DI STATISTICA

Elementi di Psicometria

Facoltà di Psicologia Università di Padova Anno Accademico

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

Inferenza statistica

CAPITOLO 7 LE DISTRIBUZIONI CAMPIONARIE E GLI INTERVALLI DI CONFIDENZA

GESTIONE INDUSTRIALE DELLA QUALITÀ A

Appunti: Teoria Dei Test

TEST DI AUTOVALUTAZIONE INTERVALLI DI CONFIDENZA E TEST

Il coefficiente di correlazione di Spearman per ranghi

ARTICOLO SCIENTIFICO: ANALISI E VALUTAZIONE CRITICA DELLE INFORMAZIONI. critical appraisal BOSCARO GIANNI 1

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Corso di Laurea Magistrale in Chimica e Tecnologia Farmaceutiche E25

VERIFICA DELLE IPOTESI

Temi di Esame a.a Statistica - CLEF

Test d ipotesi: confronto fra medie

IL COLLAUDO DI ACCETTAZIONE

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica

PRODUZIONE DI LENTI A CONTATTO

Teoria della Stima. Stima della Media e di una Porzione di Popolazione. Introduzione. Corso di Laurea in Scienze Motorie AA2002/03 - Analisi dei Dati

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

La distribuzione Gaussiana

La logica statistica della verifica (test) delle ipotesi

Corso di Psicometria Progredito

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

Abilitazione scientifica nazionale la normalizzazione degli indicatori per l età accademica

Transcript:

Calcolo della numerosità campionaria Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Concetto di potenza statistica 1

Accetto H 0 Rifiuto H 0 Ipotesi Nulla (H 0 ) vera Va bene Errore del I tipo falsa Errore del II tipo Va bene P(errore del I tipo) = α (alfa) P(errore del II tipo) = β (beta) In genere, nel test d ipotesi la probabilità di errore del I tipo viene fissata al 5% (0,05). Pertanto in un caso su 20 si rifiuterà H 0 (ovvero il test risulterà significativo) per semplice effetto del caso, anche quando H 0 è vera. In termini statistici si sceglie un livello di significatività del 5%. Ad esempio, se in un test d ipotesi P<0,01, vuol dire che posso rifiutare H 0 con una probabilità di errore del I tipo inferiore all 1%; in altre parole la probabilità che le differenze osservate siano dovute al caso è inferiore all 1%. POTENZA di un test = 1- beta = 1 - P(errore del II tipo) E la probabilità che un test statistico ha di falsificare l ipotesi nulla quando l ipotesi nulla è effettivamente falsa. In altre parole, la Potenza di un test è la sua capacità di cogliere delle differenze, quando queste differenze esistono. Il test statistico è costruito in modo da mantenere costante il livello di significatività, indipendentemente dalla numerosità campionaria. Ma questo risultato viene raggiunto a spese della potenza del test, che aumenta all aumentare della numerosità campionaria. 2

3

SIGNIFICATIVITA STATISTICA e RILEVANZA CLINICA Un'indagine epidemiologica, condotta su un gran numero di persone, ha messo in luce che i fumatori dormono meno della popolazione generale. La differenza aveva una significatività elevata (P<0.001), ovvero ben difficilmente poteva essere attribuita al caso. La differenza consisteva in 3 minuti di sonno in meno nei fumatori rispetto ai non-fumatori. La POTENZA di un test dipende: 1) dalla numerosità del campione 2) dalla variabilità del fenomeno in studio 3) dalla differenza minima che si vuole mettere in evidenza 4) dal livello di significatività adottato. Il modo principale per raggiungere un adeguata potenza è pianificare un adeguata numerosità campionaria nel protocollo dello studio. 4

Calcolo della numerosità campionaria necessaria per conseguire una potenza adeguata per 1)confrontare due medie campionarie (test t di Student) 2)valutare se una variazione media è significativa (test t di Student per dati appaiati) 3)confrontare due proporzioni campionarie (test del chi-quadrato) 4)ottenere un intervallo di confidenza della media di ampiezza non superiore ad un dato valore 5)ottenere un intervallo di confidenza della prevalenza di ampiezza non superiore ad un dato valore Variabile di risposta quantitativa: Confronto fra 2 medie (z α/2 + z β ) σ n > 2 [ ] 2 dove n = numerosità di ciascuno dei due gruppi z α/2 = 1.96 per alfa = 5% z β = 0.842, 1.282, 1.645 per potenza = 80, 90, 95% σ = deviazione standard, desunta da studi pilota o dalla letteratura δ = µ 1 -µ 2 = differenza minima clinicamente rilevante δ 5

Esempio: Il farmaco di riferimento riduce la pressione sistolica di 25 mmhg, il nuovo farmaco per essere competitivo dovrebbe ridurre la pressione sistolica di almeno 30 mmhg (ovvero 5 mmhg in più). La deviazione standard della riduzione della pressione viene stimata in 10 mmhg da studi precedenti. Si adotta un alfa del 5% e una potenza del 90%, pertanto z α/2 = 1.96 e z β = 1.282. (z α/2 + z β ) σ n > 2 [ ] 2 n > 2 [ ] 2 n > 84.06 n 85 Occorrono almeno 85 soggetti per gruppo. δ (1.96 + 1.28) 10 5 Calcolo della numerosità campionaria necessaria per conseguire una potenza adeguata per 1)confrontare due medie campionarie (test t di Student) 2)valutare se una variazione media è significativa (test t di Student per dati appaiati) 3)confrontare due proporzioni campionarie (test del chi-quadrato) 4)ottenere un intervallo di confidenza della media di ampiezza non superiore ad un dato valore 5)ottenere un intervallo di confidenza della prevalenza di ampiezza non superiore ad un dato valore 6

Variabile di risposta qualitativa: Confronto fra 2 proporzioni n >[ z ] 2 α/2 2π(1- π) + z β π 1 (1- π 1 ) + π 2 (1- π 2 ) π 1 - π 2 dove n = numerosità necessaria per ciascuno dei 2 gruppi z α/2 = 1.96 per alfa = 5% z β = 0.842, 1.282, 1.645 per potenza = 80, 90, 95% π = (π 1 - π 2 ) / 2 π 1 = probabilità attesa nella popolazione dei controlli, desunta da studi pilota o dalla letteratura π 1 - π 2 = differenza minima clinicamente rilevante, che si vuole evidenziare con una potenza 1-β π 2 = probabilità attesa nel gruppo trattato Esempio: Nei pazienti affetti da tumore X in stadio Y, la sopravvivenza a 5 anni è del 30% con il trattamento standard. Dati preliminari suggeriscono che nei pazienti sottoposti ad un nuovo trattamento la sopravvivenza salga al 40%. Si adotta un alfa del 5% e una potenza dell 80%, pertanto z α/2 = 1.96 e z β = 0.842. z α/2 2π(1- π) + z β π 1 (1- π 1 ) + π 2 (1- π 2 ) n > [ ] 2 π 1 - π 2 1.96 2 0.35(1-0.35) + 0.84 0.3(1-0.3) + 0.4(1-0.4) n >[ ] 2 0.3-0.4 n > 355.94 n 356 Occorrono almeno 356 soggetti per gruppo. 7

Calcolo della numerosità campionaria necessaria per conseguire una potenza adeguata per 1)confrontare due medie campionarie (test t di Student) 2)valutare se una variazione media è significativa (test t di Student per dati appaiati) 3)confrontare due proporzioni campionarie (test del chi-quadrato) 4)ottenere un intervallo di confidenza della media di ampiezza non superiore ad un dato valore 5)ottenere un intervallo di confidenza della prevalenza di ampiezza non superiore ad un dato valore Variabile di qualitativa: calcolo dell intervallo di confidenza di una prevalenza 2 z n > π (1-π)[ α/2 ] 2 δ dove n = numerosità di ciascuno dei due gruppi z α/2 = 1.96 per alfa = 5% π = prevalenza attesa sulla base di uno studio pilota o della letteratura scientifica δ = ampiezza massima accettabile per l intervallo di confidenza 8

DA DOVE DERIVA QUESTA FORMULA? limite superiore IC limite inferiore IC (p + z α/2 p(1-p)/n) - (p - z α/2 p(1-p)/n) δ 2 z α/2 p(1-p)/n δ divido il I e il II membro per 2 z α/2 p(1-p)/n δ /(2 z α/2 ) elevo il I e il II membro al quadrato p(1-p)/n δ 2 /(2 z α/2 ) 2 moltiplico per n e divido per il II membro p(1-p) (2 z α/2 ) 2 / δ 2 n Esempio: Si vuole stimare la prevalenza (probabilità) di asma in una popolazione. Dati preliminari provenienti dalla letteratura suggeriscono che la prevalenza di asma si aggiri intorno al 5%. Qual è la numerosità campionaria necessaria per ottenere un intervallo di confidenza al 95% di ampiezza inferiore o uguale al 2%? Dati: π = 0.05 1-α = 95% z α/2 = 1,96 ampiezza IC 2% n =? n 0,05*0,95 * (2 * 1,96) 2 / 0,02 2 n 0,0475 * (3,92) 2 / 0,0004 n 0,0475 * 15,36 / 0,0004 n 1824,76 n 1825 9