Lezione VIII: χ 2 test Cattedra di Biostatistica Dipartimento di Scienze Biomediche, Università degli Studi G. d Annunzio di Chieti Pescara Prof. Enzo Ballone Lezione 9a- Test del chi quadrato. Statistica inferenziale per variabili qualitative. La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze assolute o percentuali. Osservazioni cliniche conducono sovente a risultati tipo "il 60% degli individui trattati con un farmaco è migliorato rispetto al 47% del gruppo di soggetti di controllo (trattati con altro farmaco, con placebo, etc)", implicando con ciò un confronto tra i risultati ottenuti per i due gruppi. Questa differenza sarà statisticamente significativa o può essere attribuita al caso, al campionamento, alla randomizzazione, etc? 1
Statistica inferenziale per variabili qualitative. Tali risultati provengono da valutazioni dell outcome (la valutazione del risultato, del parametro da misurare, per valutare l efficacia del trattamento) di tipo qualitativo (migliorato o non migliorato, successo o fallimento (Failure), Per la significatività statistica della differenza dell effetto della terapia, occorre considerare metodi statistici che specifici che permettano, anche con tale tipo di outcome, di verificare l'ipotesi zero (NULLA) di una differenza casuale tra le frequenze percentuali riscontrate. Variabili statistiche doppie. Variabili statistiche doppie, confronto di 2 campioni. (Confronto tra 2 percentuali) Esempio 3. Si abbia un campione di 1020 soggetti diviso in Non fumatori (B): nb=625 Prevalenza BCO 15% Fumatori (A): na=400 Prevalenza BCO 30% Disegno dello studio: Trasversale (Cross-sectional Study), di prevalenza: si rilevano contemporaneamente la presenza della malattia e del fattore. Il fumo è causa (o fattore di rischio) per la bronchite? Il fumo può essere ritenuto causa (o fattore di rischio) per la BCO? Ossia, il (+15%) risulta statisticamente significativo? Variabili statistiche doppie. La prevalenza di bronchite risulta statisticamente tra i fumatori e i non fumatori? H0: La bronchite si sviluppa indipendentemente dal fumo; H1: I fumatori sviluppano bronchite più dei non fumatori; Tabella di contingenza (2x2) FATTORE BRONCHITE (FUMO) SI NO TOT SI 120 280 400 NO 93 527 620 TOTALE 213 807 1020 2
Variabili statistiche doppie. TASSI DI PREVALENZA x 100 SOGGETTI Se ci fosse indipendenza tra fumo e BCO si dovrebbero riscontrare le stesse prevalenze di pazienti con BCO tra i fumatori e i non fumatori. Va costruita quindi una tabella le cui frequenze rispondono alla condizione d'indipendenza Variabili statistiche doppie. Tabella tetracorica d'indipendenza Teoria Delle Ipotesi Statistiche. H 0 = ipotesi zero o ipotesi nulla le due frequenze (PREVALENZE) differiscono per effetto dell'errore di campionamento. H 1 = ipotesi alternativa le due frequenze (prevalenze) non differiscono per effetto dell'errore di campionamento. il test del χ2 consente di saggiare l'ipotesi nulla. 3
Test χ 2. Nel caso di tabelle 2x2 si può calcolare il valore del test χ2 anche attraverso la formula seguente: FORMULA ABBREVIATA PER IL CALCOLO DEL χ2 VALIDA SOLO NEL CASO DI TABELLE TETRACORICHE Torniamo al nostro esempio. Nel nostro esempio avremo: 2 χ = ( 120*527 93* 280) *1020 = 32.21 213*807 * 400*620 Il risultato del test (32.21) essendo maggiore di 5 (valore tabulato per nessuna associazione tra fumo di sigaretta e BCO) si rifiuta l ipotesi nulla e si accetta quella alternativa di forte associazione tra fumo e prevalenza di BCO. 2 Verifica di ipotesi. 1- TEORIA DELLA VERIFICA DELLE IPOTESI STATISTICHE Consiste nello stabilire se l'assunzione fatta, si possa considerare esatta o meno, sulla base delle osservazioni condotte su una parte delle unità del collettivo medesimo. 2 - L'IPOTESI (H 0 ) E' un assunto particolare circa le caratteristiche (i parametri della popolazione. E' una affermazione su eventi "sconosciuti" costruita in modo tale da poter essere verificata mediante un test statistico (T.S.) 3 - TEST STATISTICO E' una tecnica di inferenza statistica, mediante la quale si accetta o rifiuta una certa ipotesi, ad un livello critico di significatività. 4
Verifica di ipotesi. 4 - LIVELLO DI SIGNIFICATIVITA' E' il margine d'errore che siamo disposti a commettere, di solito 5 o 1%, ma più è piccolo e più riduciamo il rischio di rifiutare H 0 quando in realtà è vera. 5 - FUNZIONE TEST E' la funzione dei dati campionari di cui si serve un test per portare alla decisione di accettare o respingere H 0. 6 - VERIFICA D'IPOTESI E' una metodologia statistica che basandosi sulle probabilità porta a prendere delle decisioni. Verifica di ipotesi. 7 - GRADI DI LIBERTA' Sono dati, in generale, dal numero delle modalità che la variabile assume meno i vincoli. g.l.=r-1 per variabili statistiche semplice g.l.=(r-1)(c-1) per variabili statistiche doppie Misure di rischio. Il fumo è causa (o fattore di rischio) per la bronchite? Studio di coorte, prospettico, Di follow-up. Tabella di contingenza (2x2) BRONCHITE FUMO SI NO TOT SI 120 280 400 NO 93 527 620 TOTALE 213 807 1020 5
Misure di rischio. TASSI DI INCIDENZA PER 100 SOGGETTI/ANNO 213 P = = 20.8% 1020 120 PF = = 30% 400 93 = 620 T NF = RISCHIO ATTRIBUIBILE (RA) = INCIDENZA TRA GLI ESPOSTI INCIDENZA TRA I NON ESPOSTI: P 15% 30% - 15% = 15% Misure di rischio. INTERPRETAZIONE: IL MAGGIOR RISCHIO DI BCO ATTRIBUITO, DOVUTO, CAUSATO etc. al fumo di sigaretta. Si può anche interpretare come segue: SE UN SOGGETTO FUMATORE SMETTESSE DI FUMARE, RIDURREBBE IL RISCHIO DI BCO DEL 15% (anno?) Rischio relativo (RR) = incidenza tra gli esposti/incidenza tra i non esposti 30%/15% = 2. Interpretazione: i fumatori hanno un rischio doppio (2 volte maggiore, 2/1, per ogni non fumatore colpito da BCO, vi sono 2 soggetti fumatori colpiti da BCO. Misure di rischio. N.B. se trattasi di uno studio caso-controllo, trasversale.. Il RR viene stimato attraverso l Odds Ratio (O.R.): rapporto incrociato: O.R. 120 x 527/280x93 = 2.43 χ 2 totale (for overal comparison) = χ 2 per il trend (χ 2 test for trend + χ 2 residuo (remainder) 6