Università del Piemonte Orientale. Corso di laurea in biotecnologie mediche. Corso di Statistica Medica. Analisi dei dati in tabelle di contingenza

Documenti analoghi
Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati in tabelle di contingenza

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati in tabelle di contingenza

Statistica. Lezione 8

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Analisi dei dati in tabelle di contingenza

Università del Piemonte Orientale. Corso di Laurea in Igiene Dentale. Corso di Statistica per la ricerca sperimentale e tecnologica

Università del Piemonte Orientale Corso di dottorato in medicina molecolare a.a Corso di Statistica Medica

STATISTICA Lauree Triennali di Area Tecnica

STATISTICA Lauree Triennali in OSTETRICIA ed INFERM. PEDIATRICA

Distribuzioni di frequenza di due variabili

Cognome e nome Tempo disponibile: 75 minuti

Prof.ssa G. Serio, Prof. P. Trerotoli, Cattedra di Statistica Medica, Università di Bari 1/16. Malato vs non malato. Esposto vs non esposto

2 In uno studio viene misurata la pressione arteriosa sistolica a 5 maschi adulti, con i seguenti risultati : 127; 134; 142; 128; 144

Cognome e nome. 2 In uno studio viene misurata la pressione arteriosa sistolica a 5 maschi adulti, con i seguenti risultati : 129; 134; 142; 128; 146

1. In uno studio viene misurata la pressione arteriosa sistolica a 36 soggetti, con i seguenti risultati. Media = 172,8 Deviazione standard= 24,25

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI

I test statistici sulle frequenze

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Intervalli di confidenza

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Cognome e nome. Distribuzione Gaussiana; Media = 122,4 mmhg; Deviazione standard= 14,28 mmhg

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Intervalli di confidenza

Tempo disponibile: 60 minuti

p = p q OR = p q Misura l esistenza di una malattia. E legato alla incidenza in quanto - Prevalenza = Incidenza x tempo medio di durata della malattia

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Dr. Marco Vicentini Anno Accademico Rev 20/04/2011

LEZIONI DI STATISTICA MEDICA

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

TABELLE DI CONTINGENZA

Cognome e nome Tempo disponibile: 60 minuti

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Rischio relativo e Odds Ratio

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

Università del Piemonte Orientale. Corsi di laurea triennale ad indirizzo sanitario. Corso di Statistica Medica

Università del Piemonte Orientale. Corso di Laurea in Igiene Dentale. Corso di Statistica per la ricerca sperimentale e tecnologica

Università del Piemonte Orientale. Corso di laurea in biotecnologie. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità.

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

LE TABELLE DI CONTINGENZA

Esercizi di statistica

Corso di Psicometria Progredito

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Casa dello Studente. Casa dello Studente

Statistica (parte II) Esercitazione 4

Esercizi sull associazione di variabili categoriche

Statistica. Capitolo 13. Test sulla Bontà di Adattamento e Tabelle di Contingenza. Cap. 16-1

La relazione causa-effetto

Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. La distribuzione Normale (o di Gauss)

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità.

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Copyright Esselibri S.p.A.

malattia ESPOSTI no malattia PERSONE SENZA MALATTIA malattia NON ESPOSTI no malattia Come schematizzare il disegno di uno studio di coorte

Capitolo 11 Test chi-quadro

Lezione VIII: test. χ 2. Statistica inferenziale per variabili qualitative. Prof. Enzo Ballone. Lezione 9a- Test del chi quadrato.

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

Ulteriori Conoscenze di Informatica e Statistica

Analisi della varianza

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Chi-quadro. sono variabili aleatorie indipendenti con distribuzione allora la variabile aleatoria

Dispense Associazione PRELIMINARY DRAFT

Lezione VII: Z-test. Statistica inferenziale per variabili quantitative. Statistica inferenziale per variabili quantitative. Prof.

Cognome e nome. b. Numero di globuli bianchi in 1 ml di sangue

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VI

Ulteriori Conoscenze di Informatica e Statistica

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E

Università del Piemonte Orientale Corsi di Laurea triennale di area tecnica. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

COGNOME.NOME...MATR..

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

Università del Piemonte Orientale. Corsi di laurea di area tecnica. Corso di Statistica Medica. Analisi dei dati quantitativi :

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Elementi di Psicometria (con laboratorio software 1)

Contenuto del capitolo

Esercizi di statistica inferenziale

Il test del χ 2. Federico Plazzi. 24 Novembre 2015

Introduzione alla statistica per la ricerca in sanità

Obiettivo: confrontare due proporzioni, studiare il legame in presenza di un fattore di stratificazione

Statistica. Lezione 4

materiale didattico II incontro

PROBABILITÀ ELEMENTARE

COMPLEMENTI DI PROBABILITA E STATISTICA. 3 Crediti

Qualche principio generale dell analisi statistica

Statistica Inferenziale La verifica di ipotesi. Davide Barbieri

(f o -f a ) f a fo = frequenza osservata fa = frequenza attesa per effetto del caso (cioè se è vera l'ipotesi nulla) DISEGNI CON UNA SOLA VARIABILE

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Statistica descrittiva in due variabili

Lezione 5: La Verifica delle Ipotesi Il test t

Analisi della regressione multipla

Richiami di inferenza statistica Strumenti quantitativi per la gestione

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Prova scritta di Statistica

Presentazione dell edizione italiana

Transcript:

Università del Piemonte Orientale Corso di laurea in biotecnologie mediche Corso di Statistica Medica Analisi dei dati in tabelle di contingenza Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 1

I metodi di analisi che vedremo sono utilizzati per il confronto di proporzioni in due o più diversi gruppi. L analisi delle tavole di contingenza appartiene al capitolo dedicato all analisi dei dati categorici. I Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 2

La tabella seguente presenta la frequenza di osservazioni, categorizzate secondo due variabili. Risultato Farmaco Curato Non curato Totale Proporzione curati A a b a+b a/(a+b) B c d c+d c/(c+d) TOTALE a+c b+d a+b+c+d La notazione usata è semplice ma non è generalizzabile a tabelle di maggiori dimensioni. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 3

La seguente notazione è più generale e si applica a tabelle di qualsiasi dimensione Risultato Farmaco Curato Non curato Totale Proporzione curati A n 11 n 12 n 1. n 11 / n 1. B n 21 n 22 n 2. n 21 / n 2. TOTALE n.1 n.2 n.. n. 1/ n.. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 4

Talvolta la tabella viene costruita indicando non le frequenze ma le corrispondenti proporzioni. Risultato Farmaco Curato Non curato Totale A p 11 p 12 p 1. B p 21 p 22 p 2. TOTALE p.1 p.2 p.. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 5

Si noti che i totali marginali della tabella (totali di riga e di colonna) sono definiti dal disegno dello studio e dai suoi risultati principali. Ad esempio: uno studio clinico include 200 pazienti, divisi in due gruppi di eguale dimensione trattati con due diversi farmaci. Il primo risultato dello studio sarà dato dal numero di pazienti che hanno mostrato un risultato favorevole del trattamento (120 risultati favorevoli, 80 con risultato non favorevole). La tabella completata relativamente ai totali marginali è: risultato Farmaco Curato Non curato Totale A n 11 n 12 100 B n 21 n 22 100 TOTALE 120 80 200 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 6

Si noti che, una volta definito un valore per una delle quattro celle, resta definito anche il valore delle celle restanti, poiché i totali marginali sono fissati. In altri termini, in una tabella 2*2 una sola delle celle è libera di assumere qualsiasi valore, le restanti sono fissate dai totali marginali. Il numero di celle libere corrisponde al numero di gradi di libertà (g.l. o d.f.). Il numero di gradi di libertà in una tabella r * c è dato da: g.l. = (r-1) * (c-1) Le tabelle 2*2 hanno un grado di libertà. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 7

Abbiamo già incontrato il numero di gradi di libertà nel calcolo della Deviazione Standard n i= 1 Dev. St. = ( ) x X i ( n 1) 2 n-1 è il numero di gradi di libertà per il calcolo della deviazione standard: dato il valore della media, il valore dell n esima osservazione è definito, noto il valore delle n-1 osservazioni precedenti. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 8

L analisi di una tabella di contingenza prevede: - il calcolo di indicatori di associazione tra le due variabili; - la valutazione della probabilità di osservare la tabella in esame data l ipotesi nulla (test di significatività). Esaminiamo dapprima il caso delle tabelle 2*2 (2 righe * 2 colonne) Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 9

Indicatori di associazione: Malattia Caso Controllo Totale Esposizione Presente a b a+b Assente c d c+d Totale a+c b+d a+b+c+d La misura di associazione usata più frequentemente è l Odds Ratio (Rapporto Crociato), abbreviato con OR. Come Odd intendiamo il rapporto: (probabilità a favore / probabilità contrarie). Per la spiegazione seguiamo la notazione della tabella alla pagina precedente. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 10

L odd di malattia tra i soggetti con esposizione è il rapporto tra le due probabilità condizionate: p(malattia Esposizione) e p(non_malattia esposizione). Odd(M E)= [a/(a+b)] / [b/(a+b)] = a/b In modo analogo si ottiene l odd di malattia tra i soggetti senza esposizione: p(malattia Non_Esposizione) e p(non_malattia Non_esposizione). Odd(M Non_E)=[c/(c+d)] / [d/(c+d)] = c/d Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 11

Odds Ratio (OR) è il rapporto tra i due odds: OR = (a/b)/(c/d) = (a*d) / (c*b) OR fornisce una stima del rischio di sviluppare un effetto quando è presente un fattore antecedente (Fleiss). L intervallo di valori validi per OR è: 0 <= OR <= Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 12

OR è stato sviluppato nell ambito degli studi di coorte e caso-controllo per fornire una stima del Rischio Relativo. Le proprietà ed i limiti di OR quale stimatore del Rischio Relativo saranno discussi nel corso di Epidemiologia. Può essere usato anche in tavole di contingenza derivate da altri disegni di studio ma in tal caso è interpretato semplicemente come un indicatore di associazione. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 13

Sviluppiamo un esempio derivato dallo studio clinico presentato a fine lezione sul confronto di due antibiotici nel trattamento delle infezioni in pazienti affetti da neoplasia. Febbre Farmaco Curato Non curato Totale Meropenem 79 56 135 Ceftazidima 49 65 114 TOTALE 128 121 249 OR (Meropenem vs. Ceftazidima) = (79 * 65) / (49 * 56) = 1,87 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 14

Interpretazione: le due variabili sembrano associate: la probabilità di essere trattati con successo per i pazienti trattati con meropenem è 1,87 volte maggiore che per i pazienti trattati con ceftazidime. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 15

Per calcolare l intervallo di confidenza nel caso dell OR dobbiamo utilizzare la seguente formula poiché la distribuzione di OR è asimmetrica (va da 0 a + ): IC (ln(or)) = ln(or) ± Z α/2 * ES(ln(OR)) ln(or) = logaritmo naturale dell Odds Ratio 1 1 1 ES(ln( OR)) = + + + a b c 1 d Quindi: IC ln( OR) ( OR) = Ζ e ± α 2 * ES (ln( OR)) Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 16

ES(ln(OR))= (1/79 + 1/ 56 + 1/49 +1/65) = 0,2575 95% -> α = 0,05 da distribuire nelle due code (intervallo di confidenza bilaterale) Z(α/2) = Z(0,025 nella coda superiore) l_inf IC (95%) OR = exp(0,6267-1,96 * 0,2575) = 1,1297 l_sup IC (95%) OR = exp(0,6267 + 1,96 * 0,2575) = 3,0999 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 17

Esaminiamo i risultati di uno studio eziologico in un gruppo di tossicodipendenti sull'associazione tra positività al test della tubercolina ed uso promiscuo di siringhe per l'iniezione di stupefacenti. test della tubercolina Uso di siringhe Positivo Negativo Totale Promiscuo 24 73 97 Non Promiscuo 28 133 161 TOTALE 52 206 258 L'associazione tra il risultato del test alla tubercolina e l'uso promiscuo delle siringhe è misurato dall'odds Ratio. OR = (24 * 133) / (73 * 28) = 1,56 Interpretazione:? Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 18

ES(ln(OR))= 0,3140 95% -> α = 0,05 da distribuire nelle due code (intervallo di confidenza bilaterale) Z(α/2) = Z(0,025 nella coda superiore) l_inf IC (95%) OR = exp(0,4457-1,96 * 0,3140) = 0,8439 l_sup IC (95%) OR = exp(0,4457 + 1,96 * 0,3140) = 2,2898 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 19

Test di ipotesi. Nell' analisi di tabelle di contingenza l'ipotesi di lavoro di solito corrisponde all'associazione tra le due variabili mentre l'ipotesi nulla corrisponde all'assenza di associazione. H0: le variabili non sono associate (quindi OR=1) Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 20

Il test statistico misura la probabilità di osservare una tabella come quella data (o più estrema) se vale l'ipotesi nulla. Il test adottato è il Chi-quadro (χ 2 ). Questo test fornisce la probabilità (data l ipotesi nulla) di osservare una tabella come quella in esame o una tabella più estrema. Esamineremo dapprima la formula approssimata di questo test, che si basa sulla misura della differenza tra il numero di osservazioni in ciascuna cella della tabella ed il corrispondente numero di osservazioni attese, data l ipotesi nulla. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 21

Calcolo del numero di osservazioni attese H 0 : Le due variabili non sono associate. Se due eventi sono indipendenti P(B A) = P(B) Quindi La probabilità del realizzarsi congiunto di due eventi è data dal prodotto della probabilità di ciascuno di essi. P(A B) = P(A) P(B) Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 22

test della tubercolina Uso di siringhe Positivo Negativo Totale Promiscuo E(a) = E(b) = a+b (a+b)*(a+c)/t (a+b)*(b+d)/t Non Promiscuo E(c ) = E(d) = c+d (c+d)*(a+c)/t (c+d)*(b+d)/t TOTALE a+c b+d T E(a) = ((a+b)/t)*((a+c)/t)*t=(a+b)*(a+c)/t Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 23

ATTESI (data H0) test della tubercolina Uso di siringhe Positivo Negativo Totale Promiscuo 19,550388 77,449612 97 Non Promiscuo 32,449612 128,55039 161 TOTALE 52 206 258 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 24

La formula approssimata è valida quando il numero di osservazioni non è troppo piccolo (ogni cella Atteso >1; non più del 20% delle celle con atteso < 5). 2 χ = ( oss att) att 2 χ 2 = (a-e(a)) 2 (b-e(b)) 2 (c-e(c)) 2 (d-e(d)) 2 E(a) + E(b) + E(c) + E(d) Dove E(a) = [(a+b)/t] * [(a+c)/t] * T = (a+b) * (a+c)/t Il valore atteso delle restanti celle viene calcolato in modo analogo o per differenza dai totali marginali. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 25

(O-A)^2/A test della tubercolina Uso di siringhe Positivo Negativo Promiscuo 1,012719 0,255638 Non Promiscuo 0,610148 0,154018 chi^2 = 2,032523 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 26

Formula abbreviata (valida solo per tabelle 2 x 2) χ 2 = T*(ad-bc) 2 (a+b)(a+c)(b+c)(c+d) χ 2 = n..*(n11* n22 - n12* n21) 2 n1.*n2.*n.1*n.2 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 27

Come si usa il valore χ 2? Il valore di probabilità corrispondente al valore della statistica χ 2 si legge su apposite tabelle, dato il valore di χ 2 ed il numero di gradi di libertà. La probabilità viene letta su una sola coda della distribuzione χ 2 ma il test è bilaterale. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 28

Probabilità corrispondente al valore chi_quadro g.l. 0,500 0,400 0,300 0,250 0,100 0,050 0,025 0,010 0,001 1 0,455 0,708 1,074 1,323 2,706 3,841 5,024 6,635 10,827 2 1,386 1,833 2,408 2,773 4,605 5,991 7,378 9,210 13,815 3 2,366 2,946 3,665 4,108 6,251 7,815 9,348 11,345 16,266 4 3,357 4,045 4,878 5,385 7,779 9,488 11,143 13,277 18,466 5 4,351 5,132 6,064 6,626 9,236 11,070 12,832 15,086 20,515 6 5,348 6,211 7,231 7,841 10,645 12,592 14,449 16,812 22,457 7 6,346 7,283 8,383 9,037 12,017 14,067 16,013 18,475 24,321 8 7,344 8,351 9,524 10,219 13,362 15,507 17,535 20,090 26,124 9 8,343 9,414 10,656 11,389 14,684 16,919 19,023 21,666 27,877 10 9,342 10,473 11,781 12,549 15,987 18,307 20,483 23,209 29,588 11 10,341 11,530 12,899 13,701 17,275 19,675 21,920 24,725 31,264 12 11,340 12,584 14,011 14,845 18,549 21,026 23,337 26,217 32,909 13 12,340 13,636 15,119 15,984 19,812 22,362 24,736 27,688 34,527 14 13,339 14,685 16,222 17,117 21,064 23,685 26,119 29,141 36,124 15 14,339 15,733 17,322 18,245 22,307 24,996 27,488 30,578 37,698 16 15,338 16,780 18,418 19,369 23,542 26,296 28,845 32,000 39,252 17 16,338 17,824 19,511 20,489 24,769 27,587 30,191 33,409 40,791 18 17,338 18,868 20,601 21,605 25,989 28,869 31,526 34,805 42,312 19 18,338 19,910 21,689 22,718 27,204 30,144 32,852 36,191 43,819 20 19,337 20,951 22,775 23,828 28,412 31,410 34,170 37,566 45,314 21 20,337 21,992 23,858 24,935 29,615 32,671 35,479 38,932 46,796 22 21,337 23,031 24,939 26,039 30,813 33,924 36,781 40,289 48,268 23 22,337 24,069 26,018 27,141 32,007 35,172 38,076 41,638 49,728 24 23,337 25,106 27,096 28,241 33,196 36,415 39,364 42,980 51,179 25 24,337 26,143 28,172 29,339 34,382 37,652 40,646 44,314 52,619 26 25,336 27,179 29,246 30,435 35,563 38,885 41,923 45,642 54,051 27 26,336 28,214 30,319 31,528 36,741 40,113 43,195 46,963 55,475 28 27,336 29,249 31,391 32,620 37,916 41,337 44,461 48,278 56,892 29 28,336 30,283 32,461 33,711 39,087 42,557 45,722 49,588 58,301 30 29,336 31,316 33,530 34,800 40,256 43,773 46,979 50,892 59,702 40 39,335 41,622 44,165 45,616 51,805 55,758 59,342 63,691 73,403 50 49,335 51,892 54,723 56,334 63,167 67,505 71,420 76,154 86,660 60 59,335 62,135 65,226 66,981 74,397 79,082 83,298 88,379 99,608 70 69,334 72,358 75,689 77,577 85,527 90,531 95,023 100,425 112,317 80 79,334 82,566 86,120 88,130 96,578 101,879 106,629 112,329 124,839 90 89,334 92,761 96,524 98,650 107,565 113,145 118,136 124,116 137,208 100 99,334 102,946 106,906 109,141 118,498 124,342 129,561 135,807 149,449 110 109,334 113,121 117,269 119,608 129,385 135,480 140,916 147,414 161,582 120 119,334 123,289 127,616 130,055 140,233 146,567 152,211 158,950 173,618 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 29

chi^2 = 2,032523 p compresa tra 0,1 e 0,25 Probabilità corrispondente al valore chi_quadro g.l. 0,500 0,400 0,300 0,250 0,100 0,050 0,025 0,010 0,001 1 0,455 0,708 1,074 1,323 2,706 3,841 5,024 6,635 10,827 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 30

Il grafico presenta la curva della distribuzione χ 2 con 1 gradi di libertà. Il valore di χ 2 è sulle ascisse. L area verde corrisponde al 5% della distribuzione. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 31

0,05 χ 2 =7,815 Le tavole forniscono l area della distribuzione compresa tra un dato valore di χ 2 e. Il grafico presenta la curva della distribuzione χ 2 con 3 gradi di libertà. Il valore di χ 2 è sulle ascisse. L area verde corrisponde al 5% della distribuzione. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 32

Correzione per la continuità (Yates). I valori osservati in una tabella di contingenza sono frequenze, quindi possono assumere solo valori interi. La distribuzione χ 2 è invece una distribuzione continua. E stata quindi proposta una correzione, applicabile alle tabelle 2*2, che ha l effetto di ridurre il valore di χ 2 (effetto conservativo). 2 χ = 1 2 oss att 2 att Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 33

oppure χ 2 = n..* ( n11* n22 - n12* n21-1/2n..) 2 n1.*n2.*n.1*n.2 oppure χ 2 = T*( ad-bc -1/2T) 2 (a+b)(a+c)(b+c)(c+d) ad-bc è il valore assoluto di (ad-bc) Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 34

Sviluppiamo un esempio utilizzando dati relativi ad uno studio storico sul trattamento dell'ulcera peptica L errore di primo tipo era stato fissato a 0,05. La tabella dei valori osservati è: Ulcera Peptica Farmaco Curato Non curato Totale Pirenzepina 23 7 30 Tritiozina 18 13 31 TOTALE 41 20 61 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 35

OR (pirenzepina vs. tritiozina) = 2,37 IC95%(OR): 0,7847 <= OR <=7,1766 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 36

Il calcolo dei valori attesi porta a questi risultati. Ulcera Peptica Farmaco Curato Non curato Totale Pirenzepina 20,16 9,84 30 Tritiozina 20,84 10,16 31 TOTALE 41 20 61 Il calcolo della statistica χ 2 ( 23-20,16-1/2) 2 ( 7-9,84-1/2) 2 ( 18-20,84-1/2) 2 ( 13-10,16-1/2) 2 χ 2 = 20,16 + 9,84 + 20,84 + 10,16 = = 0,272 + 0,566 + 0,263 +0,539 = 1,6298 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 37

Interpretazione: Il valore di χ 2, letto dall apposita tabella, dato 1 grado di libertà corrisponde ad un valore di probabilità compreso tra 0,10 e 0,25 0,10 <probabilità < 0,25. Poiché l errore α era stato fissato a 0,05, non rifiuto l ipotesi nulla. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 38

Posso anche calcolare il valore di probabilità utilizzando una funzione di Excel: dato χ 2 = 1,629752 ed 1 grado di libertà calcolo: p= 0,201737. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 39

χ 2 esatto Quando il numero di soggetti nella tabella è piccolo si suggerisce di utilizzare la formula del χ 2 esatto, sviluppata da Fischer. Il test si basa sul calcolo della probabilità associata alla tabella osservata ed a ciascuna delle tabelle più estreme. Il test è stato sviluppato a partire dalla funzione di probabilità ipergeometrica. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 40

Costruzione delle tabelle più estreme (cioè con indicatore di associazione maggiore di quello osservato nella tabella data). Esempio. La tabella riporta il numero di pazienti trattati in due reparti con intervento per frattura collo del femore ed il numero di complicanze osservate in ciascun reparto (dati fittizi). Tab 1 Reparto Complicanza A B Totale SI 2 6 8 NO 18 14 32 TOTALE 20 20 40 p= (n 1.!* n 2.!* n.1!* n.2!) / (n..! * n 11!* n 12!* n 21!* n 22!) Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 41

Altre possibili tabelle Tab 2 Reparto Complicanza A B Totale SI 1 7 8 NO 19 13 32 TOTALE 20 20 40 Tab 3 Reparto Complicanza A B Totale SI 0 8 8 NO 20 12 32 TOTALE 20 20 40 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 42

P(tab 1)= 8!32!20!20!/40!2!6!18!14! = 0,095760 P(tab 2)= 8!32!20!20!/40!1!7!19!13! = 0,020160 P(tab 3)= 8!32!20!20!/40!0!8!20!12! = 0,001638 P totale = 0,117558 Il test fornisce direttamente il valore di probabilità. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 43

Test di Mc Nemar per dati appaiati Frequentemente il disegno dello studio prevede l appaiamento tra due soggetti o l analisi dello stesso soggetto in condizioni diverse. Immaginiamo di trattare un gruppo di soggetti con due diversi antidolorifici. Ciascun soggetto riceve prima un farmaco e poi l'altro, secondo una sequenza casuale. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 44

In questo caso la tabella, gli indicatori di associazione ed il calcolo di χ 2 diventano: Trattamento A Trattamento B Migliorato Non migliorato Totale Migliorato k r k+r Non migliorato s m s+m TOTALE k+s r+m N Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 45

OR (McNemar) = r/s Il χ 2 di McNemar, calcolato con la correzione per la continuità è: χ 2 1 ( r s 1) = gl r + s 2 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 46

Test di Mc Nemar, sviluppo di un esempio. E stato condotto uno studio con l obbiettivo di confrontare due farmaci antiinfiammatori, che indichiamo come A e B. Non siamo in grado di prevedere quale dei due farmaci darà i migliori risultati. Sono inclusi 347 pazienti affetti da artrite. Ciascun paziente riceve, in sequenza casuale, i due diversi farmaci. Confronto quindi le risposte ai due farmaci calcolando l Odds Ratio. L errore di primo tipo è fissato a 0,05. Il test statistico appropriato è il test di Mc Nemar, con correzione per la continuità. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 47

Trattamento A Trattamento B Migliorato Non migliorato Totale Migliorato 87 112 199 Non migliorato 79 69 148 TOTALE 166 181 347 OR (McNemar) (modalità A vs. modalità B)= r/s = 1,42 χ 2 1g.l.= 5,36 p < 0,025 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 48

Interpretazione: La probabilità di ottenere un miglioramento per i pazienti trattati con il farmaco A è 1,42 volte più elevata che per i pazienti trattati con il farmaco B. La probabilità di osservare un risultato come quello osservato o più estremo è inferiore al valore prefissato per il rifiuto dell ipotesi nulla, che viene quindi respinta. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 49

Tabelle R x C L estensione del calcolo di χ 2 a tabelle con un maggior numero di righe e di colonne è semplice e si basa sulla formula approssimata: 2 χ = ( oss att) att 2 Il numero di gradi di libertà si calcola come (righe-1)*(colonne-1). La correzione per la continuità non viene applicata. Non sono disponibili formule per il calcolo del χ 2 esatto in tabelle con dimensione maggiore di 2x2. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 50

Tabelle 2*n Costituiscono un caso particolare delle tabelle R*C Il calcolo di χ 2 si basa sulla formula approssimata: 2 χ = ( oss att) att 2 Il numero di gradi di libertà si calcola come (righe-1)*(colonne-1). Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 51

Un esempio di impiego del test χ 2 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 52

In questa tabella è stato usato χ2 senza la correzione di Yates. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 53

Un esempio di impiego del test esatto di Fischer 2 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 54

Esaminiamo alcune curve con la distribuzione X^2 per un diverso numero di gradi di libertà. Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 55

Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 56

Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 57

Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 58

Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 59

Esercizi dal testo p 273 n 1 p 273 n 3 p 274 n 6 p 274 n 9 p 274 n 10 p 276 n 16 Corso di laurea in biotecnologie mediche - Statistica Medica - Analisi dei dati in tabelle di contingenza 60