Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica Analisi dei dati in tabelle di contingenza Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 1
I metodi di analisi che vedremo sono utilizzati per il confronto di proporzioni in due o più diversi gruppi. L analisi delle tavole di contingenza appartiene al capitolo dedicato all analisi dei dati categorici. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 2
La tabella seguente presenta la frequenza di osservazioni, categorizzate secondo due variabili. Risultato Farmaco Curato Non curato Totale Proporzione curati A a b a+b a/(a+b) B c d c+d c/(c+d) TOTALE a+c b+d a+b+c+d La notazione usata è semplice ma non è generalizzabile a tabelle di maggiori dimensioni. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 3
La seguente notazione è più generale e si applica a tabelle di qualsiasi dimensione Risultato Farmaco Curato Non curato Totale Proporzione curati A n 11 n 12 n 1. n 11 / n 1. B n 21 n 22 n 2. n 21 / n 2. TOTALE n.1 n.2 n.. n. 1/ n.. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 4
Talvolta la tabella viene costruita indicando non le frequenze ma le corrispondenti proporzioni. Risultato Farmaco Curato Non curato Totale A p 11 p 12 p 1. B p 21 p 22 p 2. TOTALE p.1 p.2 p.. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 5
Si noti che i totali marginali della tabella (totali di riga e di colonna) sono definiti dal disegno dello studio e dai suoi risultati principali. Ad esempio: uno studio clinico include 200 pazienti, divisi in due gruppi di eguale dimensione trattati con due diversi farmaci. Il primo risultato dello studio sarà dato dal numero di pazienti che hanno mostrato un risultato favorevole del trattamento (120 risultati favorevoli, 80 con risultato non favorevole). La tabella completata relativamente ai totali marginali è: risultato Farmaco Curato Non curato Totale A n 11 n 12 100 B n 21 n 22 100 TOTALE 120 80 200 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 6
Si noti che, una volta definito un valore per una delle quattro celle, resta definito anche il valore delle celle restanti, poiché i totali marginali sono fissati. In altri termini, in una tabella 2*2 una sola delle celle è libera di assumere qualsiasi valore, le restanti sono fissate dai totali marginali. Il numero di celle libere corrisponde al numero di gradi di libertà (g.l. o d.f.). Il numero di gradi di libertà in una tabella r * c è dato da: g.l. = (r-1) * (c-1) Le tabelle 2*2 hanno un grado di libertà. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 7
Abbiamo già incontrato il numero di gradi di libertà nel calcolo della Deviazione Standard n i= 1 Dev. St. = ( ) x X i ( n 1) 2 n-1 è il numero di gradi di libertà per il calcolo della deviazione standard: dato il valore della media, il valore dell n esima osservazione è definito, noto il valore delle n-1 osservazioni precedenti. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 8
L analisi di una tabella di contingenza prevede: - il calcolo di indicatori di associazione tra le due variabili; - la valutazione della probabilità di osservare la tabella in esame data l ipotesi nulla (test di significatività). Esaminiamo dapprima il caso delle tabelle 2*2 (2 righe * 2 colonne) Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 9
Indicatori di associazione: Malattia Caso Controllo Totale Esposizione Presente a b a+b Assente c d c+d Totale a+c b+d a+b+c+d La misura di associazione usata più frequentemente è l Odds Ratio (Rapporto Crociato), abbreviato con OR. Come Odd intendiamo il rapporto: (probabilità a favore / probabilità contrarie). Per la spiegazione seguiamo la notazione della tabella alla pagina precedente. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 10
L odd di malattia tra i soggetti con esposizione è il rapporto tra le due probabilità condizionate: p(malattia Esposizione) e p(non_malattia esposizione). Odd(M E)= [a/(a+b)] / [b/(a+b)] = a/b In modo analogo si ottiene l odd di malattia tra i soggetti senza esposizione: p(malattia Non_Esposizione) e p(non_malattia Non_esposizione). Odd(M Non_E)=[c/(c+d)] / [d/(c+d)] = c/d Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 11
Odds Ratio (OR) è il rapporto tra i due odds: OR = (a/b)/(c/d) = (a*d) / (c*b) OR fornisce una stima del rischio di sviluppare un effetto quando è presente un fattore antecedente (Fleiss). L intervallo di valori validi per OR è: 0 <= OR <= Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 12
OR è stato sviluppato nell ambito degli studi di coorte e caso-controllo per fornire una stima del Rischio Relativo. Le proprietà ed i limiti di OR quale stimatore del Rischio Relativo saranno discussi nel corso di Epidemiologia. Può essere usato anche in tavole di contingenza derivate da altri disegni di studio ma in tal caso è interpretato semplicemente come un indicatore di associazione. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 13
Sviluppiamo un esempio derivato dallo studio clinico presentato a fine lezione sul confronto di due antibiotici nel trattamento delle infezioni in pazienti affetti da neoplasia. Febbre Farmaco Curato Non curato Totale Meropenem 79 56 135 Ceftazidima 49 65 114 TOTALE 128 121 249 OR (Meropenem vs. Ceftazidima) = (79 * 65) / (49 * 56) = 1,87 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 14
Interpretazione: le due variabili sembrano associate: la probabilità di essere trattati con successo per i pazienti trattati con meropenem è 1,87 volte maggiore che per i pazienti trattati con ceftazidime. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 15
Per calcolare l intervallo di confidenza nel caso dell OR dobbiamo utilizzare la seguente formula poiché la distribuzione di OR è asimmetrica (va da 0 a + ): IC (log(or)) = log(or) ± Z α/2 * ES(log(OR)) log(or) = logaritmo dell Odds Ratio 1 1 1 ES(log( OR)) = + + + a b c 1 d Quindi: IC log( OR) ( OR) = Ζ e ± α 2 * ES (log( OR)) Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 16
ES(log(OR))= (1/79 + 1/ 56 + 1/49 +1/65) = 0,2575 95% -> α = 0,05 da distribuire nelle due code (intervallo di confidenza bilaterale) Z(α/2) = Z(0,025 nella coda superiore) l_inf IC (95%) OR = exp(0,6267-1,96 * 0,2575) = 1,1297 l_sup IC (95%) OR = exp(0,6267 + 1,96 * 0,2575) = 3,0999 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 17
Esaminiamo i risultati di uno studio eziologico in un gruppo di tossicodipendenti sull'associazione tra positività al test della tubercolina ed uso promiscuo di siringhe per l'iniezione di stupefacenti. test della tubercolina Uso di siringhe Positivo Negativo Totale Promiscuo 24 73 97 Non Promiscuo 28 133 161 TOTALE 52 206 258 L'associazione tra il risultato del test alla tubercolina e l'uso promiscuo delle siringhe è misurato dall'odds Ratio. OR = (24 * 133) / (73 * 28) = 1,56 Interpretazione:? Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 18
ES(log(OR))= 0,3140 95% -> α = 0,05 da distribuire nelle due code (intervallo di confidenza bilaterale) Z(α/2) = Z(0,025 nella coda superiore) l_inf IC (95%) OR = exp(0,4457-1,96 * 0,3140) = 0,8439 l_sup IC (95%) OR = exp(0,4457 + 1,96 * 0,3140) = 2,2898 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 19
Test di ipotesi. Nell' analisi di tabelle di contingenza l'ipotesi di lavoro di solito corrisponde all'associazione tra le due variabili mentre l'ipotesi nulla corrisponde all'assenza di associazione. H0: le variabili non sono associate (quindi OR=1) Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 20
Il test statistico misura la probabilità di osservare una tabella come quella data (o più estrema) se vale l'ipotesi nulla. Il test adottato è il Chi-quadro (χ 2 ). Questo test fornisce la probabilità (data l ipotesi nulla) di osservare una tabella come quella in esame o una tabella più estrema. Esamineremo dapprima la formula approssimata di questo test, che si basa sulla misura della differenza tra il numero di osservazioni in ciascuna cella della tabella ed il corrispondente numero di osservazioni attese, data l ipotesi nulla. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 21
Calcolo del numero di osservazioni attese H 0 : Le due variabili non sono associate. Se due eventi sono indipendenti P(B A) = P(B) Quindi La probabilità del realizzarsi congiunto di due eventi è data dal prodotto della probabilità di ciascuno di essi. P(A B) = P(A) P(B) Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 22
Osservati: Febbre Farmaco Curato Non curato Totale Meropenem 79 56 135 Ceftazidima 49 65 114 TOTALE 128 121 249 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 23
Calcolo degli attesi: Febbre Farmaco Curato Non curato Totale Meropenem E(a) = E(b) = a+b (a+b)*(a+c)/t (a+b)*(b+d)/t Ceftazidima E(c ) = (c+d)*(a+c)/t E(d) = (c+d)*(b+d)/t c+d TOTALE a+c b+d T E(a) = ((a+b)/t)*((a+c)/t)*t=(a+b)*(a+c)/t Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 24
attesi Febbre Curato Non curato Totale Meropenem 69.398 65.602 135 Ceftazidima 58.602 55.398 114 Totale 128 121 249 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 25
2 χ = ( oss att) att 2 χ 2 = (a-e(a)) 2 (b-e(b)) 2 (c-e(c)) 2 (d-e(d)) 2 E(a) + E(b) + E(c) + E(d) Dove E(a) = [(a+b)/t] * [(a+c)/t] * T = (a+b) * (a+c)/t Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 26
(O-A)^2/A Febbre Curato Non curato Meropenem 1.329 1.406 Ceftazidima 1.573 1.664 chi2= 1.329 + 1.406 +1.573 + 1.664 = 5.972 Si tratta di una formula approssimata che è valida quando il numero di osservazioni non è troppo piccolo (ogni cella Atteso >1; non più del 20% delle celle con atteso < 5). Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 27
Come si usa il valore χ 2? Il valore di probabilità corrispondente al valore della statistica χ 2 si legge su apposite tabelle, dato il valore di χ 2 ed il numero di gradi di libertà. La probabilità viene letta su una sola coda della distribuzione χ 2. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 28
5.972 Le tavole forniscono l area della distribuzione compresa tra un dato valore di χ 2 e. Il grafico presenta la curva della distribuzione χ 2 con 1 gradi di libertà. Il valore di χ 2 è sulle ascisse. L area verde corrisponde al 5% della distribuzione. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 29
Probabilità corrispondente al valore chi_quadro g.l. 0,500 0,400 0,300 0,250 0,100 0,050 0,025 0,010 0,001 1 0,455 0,708 1,074 1,323 2,706 3,841 5,024 6,635 10,827 2 1,386 1,833 2,408 2,773 4,605 5,991 7,378 9,210 13,815 3 2,366 2,946 3,665 4,108 6,251 7,815 9,348 11,345 16,266 4 3,357 4,045 4,878 5,385 7,779 9,488 11,143 13,277 18,466 5 4,351 5,132 6,064 6,626 9,236 11,070 12,832 15,086 20,515 6 5,348 6,211 7,231 7,841 10,645 12,592 14,449 16,812 22,457 7 6,346 7,283 8,383 9,037 12,017 14,067 16,013 18,475 24,321 8 7,344 8,351 9,524 10,219 13,362 15,507 17,535 20,090 26,124 9 8,343 9,414 10,656 11,389 14,684 16,919 19,023 21,666 27,877 10 9,342 10,473 11,781 12,549 15,987 18,307 20,483 23,209 29,588 11 10,341 11,530 12,899 13,701 17,275 19,675 21,920 24,725 31,264 12 11,340 12,584 14,011 14,845 18,549 21,026 23,337 26,217 32,909 13 12,340 13,636 15,119 15,984 19,812 22,362 24,736 27,688 34,527 14 13,339 14,685 16,222 17,117 21,064 23,685 26,119 29,141 36,124 15 14,339 15,733 17,322 18,245 22,307 24,996 27,488 30,578 37,698 16 15,338 16,780 18,418 19,369 23,542 26,296 28,845 32,000 39,252 17 16,338 17,824 19,511 20,489 24,769 27,587 30,191 33,409 40,791 18 17,338 18,868 20,601 21,605 25,989 28,869 31,526 34,805 42,312 19 18,338 19,910 21,689 22,718 27,204 30,144 32,852 36,191 43,819 20 19,337 20,951 22,775 23,828 28,412 31,410 34,170 37,566 45,314 21 20,337 21,992 23,858 24,935 29,615 32,671 35,479 38,932 46,796 22 21,337 23,031 24,939 26,039 30,813 33,924 36,781 40,289 48,268 23 22,337 24,069 26,018 27,141 32,007 35,172 38,076 41,638 49,728 24 23,337 25,106 27,096 28,241 33,196 36,415 39,364 42,980 51,179 25 24,337 26,143 28,172 29,339 34,382 37,652 40,646 44,314 52,619 26 25,336 27,179 29,246 30,435 35,563 38,885 41,923 45,642 54,051 27 26,336 28,214 30,319 31,528 36,741 40,113 43,195 46,963 55,475 28 27,336 29,249 31,391 32,620 37,916 41,337 44,461 48,278 56,892 29 28,336 30,283 32,461 33,711 39,087 42,557 45,722 49,588 58,301 30 29,336 31,316 33,530 34,800 40,256 43,773 46,979 50,892 59,702 40 39,335 41,622 44,165 45,616 51,805 55,758 59,342 63,691 73,403 50 49,335 51,892 54,723 56,334 63,167 67,505 71,420 76,154 86,660 60 59,335 62,135 65,226 66,981 74,397 79,082 83,298 88,379 99,608 70 69,334 72,358 75,689 77,577 85,527 90,531 95,023 100,425 112,317 80 79,334 82,566 86,120 88,130 96,578 101,879 106,629 112,329 124,839 90 89,334 92,761 96,524 98,650 107,565 113,145 118,136 124,116 137,208 100 99,334 102,946 106,906 109,141 118,498 124,342 129,561 135,807 149,449 110 109,334 113,121 117,269 119,608 129,385 135,480 140,916 147,414 161,582 120 119,334 123,289 127,616 130,055 140,233 146,567 152,211 158,950 173,618 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 30
chi^2 = 5,972 p compresa tra 0,01 e 0,025 Probabilità corrispondente al valore chi_quadro g.l. 0,500 0,400 0,300 0,250 0,100 0,050 0,025 0,010 0,001 1 0,455 0,708 1,074 1,323 2,706 3,841 5,024 6,635 10,827 Questa informazione è sufficiente per rifiutare H0 con α=0,05 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 31
Formula abbreviata (valida solo per tabelle 2 x 2) χ 2 = T*(ad-bc) 2 (a+b)(a+c)(b+c)(c+d) χ 2 = n..*(n11* n22 - n12* n21) 2 n1.*n2.*n.1*n.2 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 32
Un altro esempio test della tubercolina Uso di siringhe Positivo Negativo Totale Promiscuo 24 73 97 Non Promiscuo 28 133 161 TOTALE 52 206 258 (O-A)^2/A test della tubercolina Uso di siringhe Positivo Negativo Promiscuo 1,012719 0,255638 Non Promiscuo 0,610148 0,154018 chi^2 = 2,032523 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 33
chi^2 = 2,032523 p compresa tra 0,1 e 0,25 Probabilità corrispondente al valore chi_quadro g.l. 0,500 0,400 0,300 0,250 0,100 0,050 0,025 0,010 0,001 1 0,455 0,708 1,074 1,323 2,706 3,841 5,024 6,635 10,827 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 34
Per stimare, attraverso l'interpolazione lineare, la probabilità incognita, corrispondente ad un determinato valore del test statistico: P = Probabilità incognita T = Valore ottenuto dal test statistico P 1 = Probabilità immediatamente inferiore T 1 = Valore del test statistico a P 1 P 2 = Probabilità immediatamente superiore T 2 = Valore del test statistico a P 2 P = P 1 + (P 2 - P 1 ) * [(T - T 1 ) / (T 2 - T 1 )] Calcolo relativo all esempio precedente: P= 0,100+(0,250-0,100)*(2,033-2,706)/(1,323-2,706) =0,100+(0,150)*(-0,773)/(-1,483) =0,100+(0,150)*(0,521) =0.178 Il valore esatto di p per chi^2 = 2,032523 é p=0.154 la differenza è dovuta al fatto che siamo in una regione della curva chi^2 in cui la variazione di p non è esattamente lineare. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 35
Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 36
Correzione per la continuità (Yates). I valori osservati in una tabella di contingenza sono frequenze, quindi possono assumere solo valori interi. La distribuzione χ 2 è invece una distribuzione continua. E stata quindi proposta una correzione, applicabile alle tabelle 2*2, che ha l effetto di ridurre il valore di χ 2 (effetto conservativo). 2 χ = 1 2 oss att 2 att Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 37
oppure χ 2 = n..* ( n11* n22 - n12* n21-1/2n..) 2 n1.*n2.*n.1*n.2 oppure χ 2 = T*( ad-bc -1/2T) 2 (a+b)(a+c)(b+c)(c+d) ad-bc è il valore assoluto di (ad-bc) Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 38
Sviluppiamo un esempio utilizzando dati relativi ad uno studio storico sul trattamento dell'ulcera peptica L errore di primo tipo era stato fissato a 0,05. La tabella dei valori osservati è: Ulcera Peptica Farmaco Curato Non curato Totale Pirenzepina 23 7 30 Tritiozina 18 13 31 TOTALE 41 20 61 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 39
OR (pirenzepina vs. tritiozina) = 2,37 IC95%(OR): 0,7847 <= OR <=7,1766 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 40
Il calcolo dei valori attesi porta a questi risultati. Ulcera Peptica Farmaco Curato Non curato Totale Pirenzepina 20,16 9,84 30 Tritiozina 20,84 10,16 31 TOTALE 41 20 61 Il calcolo della statistica χ 2 ( 23-20,16-1/2) 2 ( 7-9,84-1/2) 2 ( 18-20,84-1/2) 2 ( 13-10,16-1/2) 2 χ 2 = 20,16 + 9,84 + 20,84 + 10,16 = = 0,272 + 0,566 + 0,263 +0,539 = 1,6298 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 41
Interpretazione: Il valore di χ 2, letto dall apposita tabella, dato 1 grado di libertà corrisponde ad un valore di probabilità compreso tra 0,10 e 0,25 0,10 <probabilità < 0,25. Poiché l errore α era stato fissato a 0,05, non rifiuto l ipotesi nulla. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 42
Posso anche calcolare il valore di probabilità utilizzando una funzione di Excel: dato χ 2 = 1,629752 ed 1 grado di libertà calcolo: p= 0,201737. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 43
χ 2 esatto La formula approssimata è valida quando il numero di osservazioni non è troppo piccolo (ogni cella Atteso >1; non più del 20% delle celle con atteso < 5). Quando il numero di soggetti nella tabella è piccolo si suggerisce di utilizzare la formula del χ 2 esatto, sviluppata da Fischer. Il test si basa sul calcolo della probabilità associata alla tabella osservata ed a ciascuna delle tabelle più estreme. Il test è stato sviluppato a partire dalla funzione di probabilità ipergeometrica. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 44
Costruzione delle tabelle più estreme (cioè con indicatore di associazione maggiore di quello osservato nella tabella data). Esempio. La tabella riporta il numero di pazienti trattati in due reparti con intervento per frattura collo del femore ed il relativo numero di complicanze. Tab 1 Reparto Complicanza A B Totale SI 2 6 8 NO 18 14 32 TOTALE 20 20 40 OR= (2*14)/(6*18)=0.26 p= (n 1.!* n 2.!* n.1!* n.2!) / (n..! * n 11!* n 12!* n 21!* n 22!) Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 45
Altre possibili tabelle Tab 2 Reparto Complicanza A B Totale SI 1 7 8 NO 19 13 32 TOTALE 20 20 40 OR=? Tab 3 Reparto Complicanza A B Totale SI 0 8 8 NO 20 12 32 TOTALE 20 20 40 OR=? Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 46
p(tab 1)= 8!32!20!20!/40!2!6!18!14! = 0,095760 p(tab 2)= 8!32!20!20!/40!1!7!19!13! = 0,020160 p(tab 3)= 8!32!20!20!/40!0!8!20!12! = 0,001638 p totale = 0,117558 Il test fornisce direttamente il valore di probabilità. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 47
Test di Mc Nemar per dati appaiati Frequentemente il disegno dello studio prevede l appaiamento tra due soggetti o l analisi dello stesso soggetto in condizioni diverse. Immaginiamo di trattare un gruppo di soggetti con due diversi antidolorifici. Ciascun soggetto riceve prima un farmaco e poi l'altro, secondo una sequenza casuale. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 48
In questo caso la tabella, gli indicatori di associazione ed il calcolo di χ 2 diventano: Trattamento A Trattamento B Migliorato Non migliorato Totale Migliorato k r k+r Non migliorato s m s+m TOTALE k+s r+m N Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 49
OR (McNemar) = r/s Il χ 2 di McNemar, calcolato con la correzione per la continuità è: χ 2 1 ( r s 1) = gl r + s 2 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 50
Test di Mc Nemar, sviluppo di un esempio. E stato condotto uno studio con l obbiettivo di confrontare due farmaci antiinfiammatori, che indichiamo come A e B. Non siamo in grado di prevedere quale dei due farmaci darà i migliori risultati. Sono inclusi 347 pazienti affetti da artrite. Ciascun paziente riceve, in sequenza casuale, i due diversi farmaci. Confronto quindi le risposte ai due farmaci calcolando l Odds Ratio. L errore di primo tipo è fissato a 0,05. Il test statistico appropriato è il test di Mc Nemar, con correzione per la continuità. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 51
Trattamento A Trattamento B Migliorato Non migliorato Totale Migliorato 87 112 199 Non migliorato 79 69 148 TOTALE 166 181 347 OR (McNemar) (modalità A vs. modalità B)= r/s = 1,42 χ 2 1g.l.= 5,36 p < 0,025 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 52
Interpretazione: La probabilità di ottenere un miglioramento per i pazienti trattati con il farmaco A è 1,42 volte più elevata che per i pazienti trattati con il farmaco B. La probabilità di osservare un risultato come quello osservato o più estremo è inferiore al valore prefissato per il rifiuto dell ipotesi nulla, che viene quindi respinta. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 53
Tabelle R x C L estensione del calcolo di χ 2 a tabelle con un maggior numero di righe e di colonne è semplice e si basa sulla formula approssimata: 2 χ = ( oss att) att 2 Il numero di gradi di libertà si calcola come (righe-1)*(colonne-1). La correzione per la continuità non viene applicata. Non sono disponibili formule per il calcolo del χ 2 esatto in tabelle con dimensione maggiore di 2x2. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 54
Tabelle 2*n Costituiscono un caso particolare delle tabelle R*C Il calcolo di χ 2 si basa sulla formula approssimata: 2 χ = ( oss att) att 2 Il numero di gradi di libertà si calcola come (righe-1)*(colonne-1). Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 55
Un esempio di impiego del test χ 2 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 56
In questa tabella è stato usato χ2 senza la correzione di Yates. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 57
Un esempio di impiego del test esatto di Fischer 2 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 58
Esaminiamo alcune curve con la distribuzione X^2 per un diverso numero di gradi di libertà. Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 59
Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 60
Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 61
Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 62
Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 63
Esercizi dal testo p 273 n 1 p 273 n 3 p 274 n 6 p 274 n 9 p 274 n 10 p 276 n 16 Corso di laurea in medicina e chirurgia - Statistica Medica - Analisi dei dati in tabelle di contingenza 64