Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 8 a.a 2011-2012 Dott.ssa Daniela Ferrante daniela.ferrante@med.unipmn.it
Tabelle di contingenza La tabella seguente presenta la frequenza di osservazioni, categorizzate secondo due variabili Risultato Farmaco Curato Non curato Totale A a b a+b B c d c+d TOTALE a+c b+d a+b+c+d 2
Tabelle di contingenza La seguente notazione è più generale e si applica a tabelle di qualsiasi dimensione Risultato Farmaco Curato Non curato Totale A n 11 n 12 n 1. B n 21 n 22 n 2. TOTALE n.1 n.2 n.. 3
Tabelle di contingenza Si noti che, una volta definito un valore per una delle quattro celle, resta definito anche il valore delle celle restanti, fissati i totali marginali. In altri termini, in una tabella 2*2 una sola delle celle è libera di assumere qualsiasi valore, le restanti sono fissate dai totali marginali. Il numero di celle libere corrisponde al numero di gradi di libertà (g.l. o d.f.). 4
Gradi di libertà Il numero di gradi di libertà in una tabella r * c è dato da: g.l. = (n.righe-1) * (n.colonne-1) Le tabelle 2*2 hanno quindi 1 grado di libertà. 5
Tabelle di contingenza L analisi di una tabella di contingenza prevede: Il calcolo di indicatori di associazione tra le due variabili La valutazione della probabilità di osservare la tabella in esame data l ipotesi nulla (test di significatività). 6
Tabelle di contingenza Esaminiamo dapprima il caso delle tabelle 2*2 Malattia Caso Controllo Totale Esposizione Presente a b a+b Assente c d c+d Totale a+c b+d a+b+c+d 7
Odds ratio La misura di associazione usata più frequentemente è l Odds Ratio (Rapporto Crociato), abbreviato con OR. Come Odd intendiamo il rapporto: (probabilità a favore / probabilità contrarie). 8
Odds ratio L odd di malattia tra i soggetti con esposizione è il rapporto tra le due probabilità condizionate: P(Malattia Esposizione) e P(Non_malattia esposizione). Odd(M E)= [a/(a+b)] / [b/(a+b)] = a/b In modo analogo si ottiene l odd di malattia tra i soggetti senza esposizione come rapporto tra le due probabilità condizionate P(Malattia Non_Esposizione) e P(Non_malattia Non_esposizione). Odd(M Non_E)=[c/(c+d)] / [d/(c+d)] = c/d 9
Odds ratio Odds Ratio (OR) è il rapporto tra i due odds: OR = (a/b)/(c/d) = (a*d) / (c*b) L intervallo di valori validi per OR è: 0 <= OR <= 10
Esempio 1 Un campione di 500 studenti ha partecipato ad uno studio volto a valutare il livello di conoscenza di un certo gruppo di malattie comuni da parte di studenti universitari dei primi anni di medicina Tipo di facoltà Conoscenza delle malattie Buona Scarsa Totale Medicina 31 91 122 Altro 19 359 378 TOTALE 50 450 500 11
Esempio 1 OR (Medicina vs. Altro) = (31 * 359) / (91 * 19) = 6,4 Interpretazione: Le due variabili sembrano associate: la probabilità di conoscere le malattie è 6,4 volte maggiore per gli studenti di medicina che per gli iscritti ad altre facoltà 12
Intervallo di confidenza dell odds ratio IC (ln(or)) = ln(or) ± Z α/2 * ES(ln(OR)) IC ln( OR ) ± ( OR ) = Ζ e α 2 * ES (ln( OR )) ln(or) = logaritmo in base e dell Odds Ratio ES 1 1 1 (ln( OR )) = + + + a b c 1 d 13
Esempio 1 ES(ln( OR)) = 1/ 31+ 1/ 91+ 1/19 + 1/ 359 = 0,31 α = 0,05 da distribuire nelle due code poichè l' intervallo di confidenza è bilaterale I.C.95%: e (1,86-1,96 * 0,31) ; e (1,86 + 1,96 * 0,31) I.C.95%: (3,50; 11,79) 14
Test di ipotesi Nell' analisi di tabelle di contingenza l'ipotesi di lavoro di solito corrisponde all'associazione tra le due variabili mentre l'ipotesi nulla corrisponde all'assenza di associazione. H0: le variabili non sono associate (quindi OR=1) 15
Test chi-quadro Il test statistico misura la probabilità di osservare una tabella come quella data (o più estrema) se vale l'ipotesi nulla. Il test adottato è il Chi-quadro (χ 2 ). Questo test fornisce la probabilità (data l ipotesi nulla) di osservare una tabella come quella in esame o una tabella più estrema. 16
Test chi-quadro 2 χ = ( oss att ) att 2 χ 2 = (a-e(a)) 2 + (b-e(b)) 2 + (c-e(c)) 2 + (d-e(d)) 2 E(a) E(b) E(c) E(d) 17
Test chi-quadro Calcolo del numero di osservazioni attese Conoscenza delle malattie Facoltà Buona Scarsa Totale Medicina E(a) = (a+b)*(a+c)/t E(b)=(a+b)*(b+d)/T a+b Altro E(c ) = (c+d)*(a+c)/t E(d)=(c+d)*(b+d)/T c+d TOTALE a+c b+d T 18
Test chi-quadro Come si usa il valore χ 2? Il valore di probabilità corrispondente al valore della statistica χ 2 si legge su apposite tabelle, dato il valore di χ 2 ed il numero di gradi di libertà. Ponendo alfa=0.05 e considerando 1 grado di libertà (essendo la tabella 2x2) otteniamo: 19
Distribuzione Chi quadrato Probabilità 0,001 0,01 0,025 0,05 0,1 gradi libertà 1 10,83 6,64 5,02 3,84 2,71 2 13,82 9,21 7,38 5,99 4,61 3 16,27 11,35 9,35 7,82 6,25 4 18,47 13,28 11,14 9,49 7,78 5 20,52 15,09 12,83 11,07 9,24 6 22,46 16,81 14,45 12,59 10,65 7 24,32 18,48 16,01 14,07 12,02 8 26,13 20,09 17,54 15,51 13,36 9 27,88 21,67 19,02 16,92 14,68 10 29,59 23,21 20,48 18,31 15,99 11 31,26 24,73 21,92 19,68 17,28 12 32,91 26,22 23,34 21,03 18,55 13 34,53 27,69 24,74 22,36 19,81 14 36,12 29,14 26,12 23,69 21,06 15 37,70 30,58 27,49 25,00 22,31 16 39,25 32,00 28,85 26,30 23,54 17 40,79 33,41 30,19 27,59 24,77 18 42,31 34,81 31,53 28,87 25,99 19 43,82 36,19 32,85 30,14 27,20 20 45,32 37,57 34,17 31,41 28,41 per numeri di g.l. superiori a 20 usate la riga corrispondente a 20 20
Tipo di facoltà Conoscenza delle malattie Buona Scarsa Totale Medicina 31 91 122 Altro 19 359 378 TOTALE 50 450 500 21
Calcolo i valori attesi: Conoscenza delle malattie Facoltà Buona Scarsa Totale Medicina E(a) = 12,2 E(b) = 109,8 122 Altro E(c) = 37,8 E(d) = 340,2 378 TOTALE 50 450 500 22
2 χ = (31 12,2) 12,2 2 + (91 109,8) 109,8 2 + (19 37,8) 37,8 2 + (359 340,2) 340,2 2 = 42,58 42,58 > 3,84 quindi rifiuto H 0 P value < 0,001 23
Distribuzione chi-quadro 0,05 0,05 1,98 3,84 24
Tabelle R x C L estensione del calcolo di χ 2 a tabelle con un maggior numero di righe e di colonne è semplice e si basa sulla formula: 2 χ Il numero di gradi di libertà si calcola come: (righe-1)*(colonne-1). = ( oss att ) att 2 25
χ 2 esatto La formula approssimata è valida quando il numero di osservazioni non è troppo piccolo Quando la tabella ha un valore atteso minore di 5 in qualche cella, si suggerisce di utilizzare la formula del χ2 esatto, sviluppata da Fisher. Il test si basa sul calcolo della probabilità associata alla tabella osservata ed a ciascuna delle tabelle più estreme (cioè con indicatore di associazione maggiore di quello osservato nella tabella data) 26
χ 2 esatto Uso casco e traumi facciali negli incidenti con bicicletta Con casco Senza casco Totale Traumi facciali 2 (3) 13 (12) 15 Altri traumi 6 (5) 19 (20) 25 TOTALE 8 32 40 Fisher's Exact Test H 0 : π 1 - π 2 = 0 Alternative > < H 1 : π 1 - π 2 0 p-value = 0.69924 27
Posso anche calcolare il valore di probabilità utilizzando una funzione di Excel: 28