Lezione VIII: test. χ 2. Statistica inferenziale per variabili qualitative. Prof. Enzo Ballone. Lezione 9a- Test del chi quadrato.

Documenti analoghi
STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Lezione VII: t-test. Prof. Enzo Ballone

Statistica inferenziale per variabili quantitative

Lezione VII: Z-test. Statistica inferenziale per variabili quantitative. Statistica inferenziale per variabili quantitative. Prof.

Simulazione di esercizi su test di significatività e 95%CI

Relazioni tra variabili: le tabelle di contingenza

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Il χ 2 (Pearson, 1900)

Dipartimento di Samità Pubblica e Malattie Infettive Sapienza Università di Roma

La relazione causa-effetto

Esercizi di statistica inferenziale

Argomenti della lezione:

Gli studi longitudinali (o di coorte) sono utilizzati: per la stima dell incidenza delle patologie per la stima della mortalità

materiale didattico II incontro

LE TABELLE DI CONTINGENZA

24/01/2012 STUDIO CASO-CONTROLLOCONTROLLO

Presentazione dell edizione italiana

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI

Bruno FEDERICO Cattedra di Igiene

Statistica. Lezione 8

Infermieristica basata sulle prove di efficacia

Misure epidemiologiche di rischio!

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Epidemiologia descrittiva

p = p q OR = p q Misura l esistenza di una malattia. E legato alla incidenza in quanto - Prevalenza = Incidenza x tempo medio di durata della malattia

Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione

Elementi di Epidemiologia per la Valutazione Comparativa di Esito

Fondamenti di Psicometria. La statistica è facile!!! VERIFICA DELLE IPOTESI

Elementi di Psicometria con Laboratorio di SPSS 1

Il Test di Ipotesi Lezione 5

Distribuzioni di frequenza di due variabili

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

Cognome e nome. 1. In uno studio viene misurata la pressione arteriosa sistolica a 36 soggetti, con i seguenti risultati.

Introduzione alla statistica per la ricerca in sanità

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II DIPARTIMENTO DI INGEGNERIA AEROSPAZIALE D.I.A.S. STATISTICA PER L INNOVAZIONE. a.a.

Cognome e nome. 2 In uno studio viene misurata la pressione arteriosa sistolica a 5 maschi adulti, con i seguenti risultati : 129; 134; 142; 128; 146

1. In uno studio viene misurata la pressione arteriosa sistolica a 36 soggetti, con i seguenti risultati. Media = 172,8 Deviazione standard= 24,25

Dispense Associazione PRELIMINARY DRAFT

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Parte 1 : Inferenza. Varianza nota test Z. Distribuzioni asintotiche dei test. Varianza ignota test t ad un campione

2 In uno studio viene misurata la pressione arteriosa sistolica a 5 maschi adulti, con i seguenti risultati : 127; 134; 142; 128; 144

Metodi statistici per le ricerche di mercato

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità D

Inferenza statistica

Nicola Bartolomeo. Cattedra di Statistica Medica - Scuola di Medicina Università degli Studi di Bari Aldo Moro. Pag. 1 di 44

Misure epidemiologiche di rischio!

Obiettivo: confrontare due proporzioni, studiare il legame in presenza di un fattore di stratificazione

ESERCIZI SULLA VERIFICA DI IPOTESI

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B

10 TEST STATISTICI PER LA VERIFICA DI IPOTESI

Misure di associazione (Misure della relazione di occorrenza)

TUTORATO 2 Test di significatività e intervalli di confidenza

ESERCITAZIONE N. 7 corso di statistica

Cenni all interpretazione di un Test d ipotesi

STATISTICA Lauree Triennali in OSTETRICIA ed INFERM. PEDIATRICA

IPOTESI SULLA FORMA DELLA DISTRIBUZIONE CASO DI UN CAMPIONE

Lezione VI: Distribuzione normale. La distribuzione normale (curva di Gauss). Prof. Enzo Ballone. Lezione 6a- Ia distribuzione normale

Statistica Inferenziale La verifica di ipotesi. Davide Barbieri

LEZIONI DI STATISTICA MEDICA

Cenni all interpretazione di un Test d ipotesi

Esercizi Esercizio 1 Esercizio 2 Esercizio 3 Esercizio 4

Metodologie e strumenti dell epidemiologia analitica Le misure di associazione Paolo Villari

Interpretazione dei risultati di RCT relativi a dati di sopravvivenza. Roberto D Amico - Università degli Studi di Modena e Reggio Emilia

STATISTICA MULTIVARIATA SSD MAT/06

Dipartimento di Fisica a.a. 2004/2005 Fisica Medica 2 Test di ipotesi 2/5/2005

Esercitazione 8 del corso di Statistica 2

LEZIONI DI STATISTICA MEDICA

Metodi statistici per lo studio dei fenomeni biologici

STATISTICA Lauree Triennali di Area Tecnica

EPI OVERVIEW

Obiettivi di uno studio trasversale o di prevalenza:

STUDIO DI COORTE. Lezione 5. Obiettivi di uno studio di coorte:

VERIFICA DELLE IPOTESI

Tempo disponibile: 60 minuti

TABELLE DI CONTINGENZA

Misure epidemiologiche di rischio. Rischio Relativo (RR)

Perché il medico deve conoscere la STATISTICA? 1. LA MEDICINA STA DIVENTANDO

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

ESERCIZI. Controlli (gr) Agente A (gr) Agente B (gr)

STATISTICA AZIENDALE Modulo Controllo di Qualità

Corso Avanzato di Statistica

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Misure di frequenza di malattia

Contenuti: Capitolo 14 del libro di testo

Elementi di Psicometria con Laboratorio di SPSS 1

Statistica Inferenziale

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

Metodi statistici per le ricerche di mercato

PARTE SECONDA CEM: EFFETTI BIOLOGICI E SANITARI

Capitolo 11 Test chi-quadro

Transcript:

Lezione VIII: χ 2 test Cattedra di Biostatistica Dipartimento di Scienze Biomediche, Università degli Studi G. d Annunzio di Chieti Pescara Prof. Enzo Ballone Lezione 9a- Test del chi quadrato. Statistica inferenziale per variabili qualitative. La presentazione dei dati per molte ricerche mediche fa comunemente riferimento a frequenze assolute o percentuali. Osservazioni cliniche conducono sovente a risultati tipo "il 60% degli individui trattati con un farmaco è migliorato rispetto al 47% del gruppo di soggetti di controllo (trattati con altro farmaco, con placebo, etc)", implicando con ciò un confronto tra i risultati ottenuti per i due gruppi. Questa differenza sarà statisticamente significativa o può essere attribuita al caso, al campionamento, alla randomizzazione, etc? 1

Statistica inferenziale per variabili qualitative. Tali risultati provengono da valutazioni dell outcome (la valutazione del risultato, del parametro da misurare, per valutare l efficacia del trattamento) di tipo qualitativo (migliorato o non migliorato, successo o fallimento (Failure), Per la significatività statistica della differenza dell effetto della terapia, occorre considerare metodi statistici che specifici che permettano, anche con tale tipo di outcome, di verificare l'ipotesi zero (NULLA) di una differenza casuale tra le frequenze percentuali riscontrate. Variabili statistiche doppie. Variabili statistiche doppie, confronto di 2 campioni. (Confronto tra 2 percentuali) Esempio 3. Si abbia un campione di 1020 soggetti diviso in Non fumatori (B): nb=625 Prevalenza BCO 15% Fumatori (A): na=400 Prevalenza BCO 30% Disegno dello studio: Trasversale (Cross-sectional Study), di prevalenza: si rilevano contemporaneamente la presenza della malattia e del fattore. Il fumo è causa (o fattore di rischio) per la bronchite? Il fumo può essere ritenuto causa (o fattore di rischio) per la BCO? Ossia, il (+15%) risulta statisticamente significativo? Variabili statistiche doppie. La prevalenza di bronchite risulta statisticamente tra i fumatori e i non fumatori? H0: La bronchite si sviluppa indipendentemente dal fumo; H1: I fumatori sviluppano bronchite più dei non fumatori; Tabella di contingenza (2x2) FATTORE BRONCHITE (FUMO) SI NO TOT SI 120 280 400 NO 93 527 620 TOTALE 213 807 1020 2

Variabili statistiche doppie. TASSI DI PREVALENZA x 100 SOGGETTI Se ci fosse indipendenza tra fumo e BCO si dovrebbero riscontrare le stesse prevalenze di pazienti con BCO tra i fumatori e i non fumatori. Va costruita quindi una tabella le cui frequenze rispondono alla condizione d'indipendenza Variabili statistiche doppie. Tabella tetracorica d'indipendenza Teoria Delle Ipotesi Statistiche. H 0 = ipotesi zero o ipotesi nulla le due frequenze (PREVALENZE) differiscono per effetto dell'errore di campionamento. H 1 = ipotesi alternativa le due frequenze (prevalenze) non differiscono per effetto dell'errore di campionamento. il test del χ2 consente di saggiare l'ipotesi nulla. 3

Test χ 2. Nel caso di tabelle 2x2 si può calcolare il valore del test χ2 anche attraverso la formula seguente: FORMULA ABBREVIATA PER IL CALCOLO DEL χ2 VALIDA SOLO NEL CASO DI TABELLE TETRACORICHE Torniamo al nostro esempio. Nel nostro esempio avremo: 2 χ = ( 120*527 93* 280) *1020 = 32.21 213*807 * 400*620 Il risultato del test (32.21) essendo maggiore di 5 (valore tabulato per nessuna associazione tra fumo di sigaretta e BCO) si rifiuta l ipotesi nulla e si accetta quella alternativa di forte associazione tra fumo e prevalenza di BCO. 2 Verifica di ipotesi. 1- TEORIA DELLA VERIFICA DELLE IPOTESI STATISTICHE Consiste nello stabilire se l'assunzione fatta, si possa considerare esatta o meno, sulla base delle osservazioni condotte su una parte delle unità del collettivo medesimo. 2 - L'IPOTESI (H 0 ) E' un assunto particolare circa le caratteristiche (i parametri della popolazione. E' una affermazione su eventi "sconosciuti" costruita in modo tale da poter essere verificata mediante un test statistico (T.S.) 3 - TEST STATISTICO E' una tecnica di inferenza statistica, mediante la quale si accetta o rifiuta una certa ipotesi, ad un livello critico di significatività. 4

Verifica di ipotesi. 4 - LIVELLO DI SIGNIFICATIVITA' E' il margine d'errore che siamo disposti a commettere, di solito 5 o 1%, ma più è piccolo e più riduciamo il rischio di rifiutare H 0 quando in realtà è vera. 5 - FUNZIONE TEST E' la funzione dei dati campionari di cui si serve un test per portare alla decisione di accettare o respingere H 0. 6 - VERIFICA D'IPOTESI E' una metodologia statistica che basandosi sulle probabilità porta a prendere delle decisioni. Verifica di ipotesi. 7 - GRADI DI LIBERTA' Sono dati, in generale, dal numero delle modalità che la variabile assume meno i vincoli. g.l.=r-1 per variabili statistiche semplice g.l.=(r-1)(c-1) per variabili statistiche doppie Misure di rischio. Il fumo è causa (o fattore di rischio) per la bronchite? Studio di coorte, prospettico, Di follow-up. Tabella di contingenza (2x2) BRONCHITE FUMO SI NO TOT SI 120 280 400 NO 93 527 620 TOTALE 213 807 1020 5

Misure di rischio. TASSI DI INCIDENZA PER 100 SOGGETTI/ANNO 213 P = = 20.8% 1020 120 PF = = 30% 400 93 = 620 T NF = RISCHIO ATTRIBUIBILE (RA) = INCIDENZA TRA GLI ESPOSTI INCIDENZA TRA I NON ESPOSTI: P 15% 30% - 15% = 15% Misure di rischio. INTERPRETAZIONE: IL MAGGIOR RISCHIO DI BCO ATTRIBUITO, DOVUTO, CAUSATO etc. al fumo di sigaretta. Si può anche interpretare come segue: SE UN SOGGETTO FUMATORE SMETTESSE DI FUMARE, RIDURREBBE IL RISCHIO DI BCO DEL 15% (anno?) Rischio relativo (RR) = incidenza tra gli esposti/incidenza tra i non esposti 30%/15% = 2. Interpretazione: i fumatori hanno un rischio doppio (2 volte maggiore, 2/1, per ogni non fumatore colpito da BCO, vi sono 2 soggetti fumatori colpiti da BCO. Misure di rischio. N.B. se trattasi di uno studio caso-controllo, trasversale.. Il RR viene stimato attraverso l Odds Ratio (O.R.): rapporto incrociato: O.R. 120 x 527/280x93 = 2.43 χ 2 totale (for overal comparison) = χ 2 per il trend (χ 2 test for trend + χ 2 residuo (remainder) 6