Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di statistica

Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di statistica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici Corso di laurea in medicina e chirurgia - 2004-05 - Statistica Medica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici 1

In ambito sanitario vengono comunemente utilizzati esami diagnostici (tests di laboratorio, radiografie, esame istologico o citologico, esame obiettivo, anamnesi, ecc.). Questi esami hanno l obbiettivo di riconoscere i soggetti malati e quelli sani, relativamente alla condizione esaminata. Corso di laurea in medicina e chirurgia - 2004-05 - Statistica Medica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici 2

Un applicazione dei test diagnostici alla popolazione generale (non sintomatica) viene effettuata nei programmi di screening, proposti a tutta la popolazione, in assenza di indicazioni cliniche. Programmi di screening sono in atto o in corso di sperimentazione in Piemonte per: - neoplasie della mammella; - neoplasie della cervice uterina; - neoplasie del grosso intestino; - fenilchetonuria (neonati); - insufficienza tiroidea (neonati). Corso di laurea in medicina e chirurgia - 2004-05 - Statistica Medica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici 3

Nella situazione più semplice un esame diagnostico fornisce un risultato che può essere espresso come esame positivo oppure esame negativo. Spesso anche esami il cui risultato è espresso su una scala continua sono interpretati come Positivi / Negativi in quanto indicano oppure negano l esistenza di una patologia. I soggetti sottoposti all esame sono quindi sottoposti ad ulteriori esami oppure a sorveglianza clinica e quindi possono essere definiti come sani o malati. Questo accade per tutti i soggetti nelle fasi sperimentali del test mentre, in fase di implementazione di regola vengono sottoposti ad esami ulteriori i casi positivi ed a sola sorveglianza clinica o epidemiologica i casi negativi. I risultati di un esame possono quindi essere riassunti in una tabella di contingenza con due righe (per il risultato dell esame) e due colonne (per indicare se il soggetto era malato o no). Corso di laurea in medicina e chirurgia - 2004-05 - Statistica Medica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici 4

Malattia Malato Sano Totale Test Positivo Negativo Totale Il totale delle righe indicherà quanti soggetti hanno esame positivo e quanti negativo. Il totale delle colonne indicherà quanti soggetti sono risultati malati e quanti sani al termine dei controlli e della sorveglianza clinica. I totali di riga e di colonna sono indicati anche come totali marginali Corso di laurea in medicina e chirurgia - 2004-05 - Statistica Medica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici 5

E esperienza comune che gli esami non sono perfetti e che alcuni soggetti malati avranno un esame negativo mentre alcuni soggetti sani avranno un esame positivo. Le 4 celle della tabella consentono di scrivere il numero dei soggetti separatamente in base alle seguenti condizioni: Esame Malattia Indicati come: Lettera Positivo Malati Veri Positivi (VP) a Positivo Sani Falsi Positivi (FP) b Negativo Malati Falsi Negativi (FN) c Negativo Sani Veri negativi (VN) d Corso di laurea in medicina e chirurgia - 2004-05 - Statistica Medica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici 6

Malattia Malato Sano Totale Test Positivo a b a+b Negativo c d c+d Totale a+c b+d N Oppure: Malattia Malato Sano Totale Test Positivo VP FP Negativo FN VN Totale Corso di laurea in medicina e chirurgia - 2004-05 - Statistica Medica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici 7

Da questa tabella possiamo calcolare i due indicatori fondamentali per la valutazione delle capacità di un test: Sensibilità probabilità che il test sia positivo se il sogg. è malato = P(+ malato) è stimata dalla proporzione di malati con test positivo. = a / (a+c) = VP / Totale malati Specificità probabilità che il test sia negativo se il sogg. non è malato = P(- non_malato) è stimata dalla proporzione di non_malati con test negativo. = d / (b+d) = VN / Totale sani Indice di Youden = 1 [(1-sens) + (1-spec)] = (sens + spec) - 1 Corso di laurea in medicina e chirurgia - 2004-05 - Statistica Medica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici 8

Da questa tabella possiamo calcolare i due indicatori fondamentali per valutare la probabilità di malattia (o di assenza di malattia) sulla base dei risultati del test: Valore predittivo del risultato positivo probabilità che il sogg. sia malato se il test è positivo = P(malato +) è stimata dalla proporzione di test positivo con sogg malato = a / (a+b) = VP / Totale positivi al test Valore predittivo del risultato negativo probabilità che il sogg. sia non_malato se il test è negativo = P(non_malato -) è stimata dalla proporzione di test negativo con sogg non_malato = d / (c+d) = VN / Totale negativi al test Corso di laurea in medicina e chirurgia - 2004-05 - Statistica Medica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici 9

Si noti che il valore predittivo del risultato di un esame dipende dalla frequenza della malattia (prevalenza) nella popolazione sottoposta ad esame. Corso di laurea in medicina e chirurgia - 2004-05 - Statistica Medica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici 10

Esempio (costruito con dati ipotetici) Malattia Malato Sano Totale Test Positivo 120 40 160 Negativo 30 210 240 Totale 150 250 400 Sensibilità = a / (a+c) = 120 / 150 = 80,0% Specificità = d / (b+d) = 210 / 250 = 84,0% Valore predittivo del risultato positivo = a / (a+b) = 120 / 160 = 75,0% Valore predittivo del risultato negativo = d / (c+d) = 210 /240 = 87.5% Corso di laurea in medicina e chirurgia - 2004-05 - Statistica Medica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici 11

Esempio / esercizio (costruito con dati ipotetici) Malattia Malato Sano Totale Test Positivo 120 4000 4120 Negativo 30 21000 21030 Totale 150 25000 25150 Sensibilità = Specificità = Valore predittivo del risultato positivo = Valore predittivo del risultato negativo = Corso di laurea in medicina e chirurgia - 2004-05 - Statistica Medica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici 12

Variazione dei valori predittivi con la variazione della prevalenza Sensibilità = 95% Specificità = 95% % % % % % % % % % % % % Preval. 99 95 90 80 60 40 20 10 5 1 0,5 0,1 VP+ 99,9 99,7 99,4 99 97 93 83 68 50 16 9 2 VP- 16 50 68 83 93 97 99 99,4 99,7 99,9 99,9 99,9 1-(VP-) 84 50 32 17 7 3 1 0,6 0,3 0,1 0,03 0,01 Corso di laurea in medicina e chirurgia - 2004-05 - Statistica Medica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici 13

Distribuzione di frequenza del valore dell'enzima CK in persone con sintomi compatibili con infarto miocardico 480+ non infarto infarto 440-479 400-439 360-399 320-359 280-319 C K 240-279 200-239 160-199 120-159 80-129 40-79 0-39 -100-80 -60-40 -20 0 20 40 60 numero osservazioni Corso di laurea in medicina e chirurgia - 2004-05 - Statistica Medica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici 14

infarto CK non infarto 2 1-39 88 13 40-79 26 30 80-129 8 30 120-159 5 21 160-199 0 19 200-239 1 18 240-279 1 13 280-319 1 19 320-359 0 15 360-399 0 7 400-439 0 8 440-479 0 35 480+ 0 Corso di laurea in medicina e chirurgia - 2004-05 - Statistica Medica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici 15

Distribuzione percentuale del valore dell'enzima CK in persone con sintomi compatibili con infarto miocardico 480+ %non infarto %infarto 440-479 400-439 360-399 320-359 280-319 CK 240-279 200-239 160-199 120-159 80-129 40-79 1-39 80 70 60 50 40 30 20 10 0 10 20 percentuale Corso di laurea in medicina e chirurgia - 2004-05 - Statistica Medica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici 16

Nel caso di un test che fornisce risultati secondo una scala numerica, occorre definire il valore corrispondente alla separazione tra risultato positivo e risultato negativo (cutoff point). Corso di laurea in medicina e chirurgia - 2004-05 - Statistica Medica Applicazione del calcolo della probabilità: la valutazione dei tests diagnostici 17

Come variano sensibilità, specificità e valore predittivo? n.> cutoff Cutoff Infarto Non infarto Sens Spec VP+ VP- 1 230 130 1,00 0,00 0,64 0,98 40 228 42 0,99 0,68 0,84 0,88 80 215 16 0,93 0,88 0,93 0,73 120 185 8 0,80 0,94 0,96 0,63 160 155 3 0,67 0,98 0,98 0,57 200 134 3 0,58 0,98 0,98 0,53 240 115 2 0,50 0,98 0,98 0,49 280 97 1 0,42 0,99 0,99 0,47 320 84 0 0,37 1,00 1,00 0,44 360 65 0 0,28 1,00 1,00 0,42 400 50 0 0,22 1,00 1,00 0,41 440 43 0 0,19 1,00 1,00 0,40 480 35 0 0,15 1,00 1,00 0,36 19

Curva ROC (receiver operating characteristic) 1,0 0,0 0,1 0,2 0,3 0,4 0,5 0,6 0,7 0,8 0,9 1,0 0,9 >=40 0,8 >=120 0,7 sensibilità 0,6 0,5 0,4 >= 160 >=200 0,3 >= 220 0,2 0,1 0,0 1-specificità La curva ROC presenta graficamente la variazione della sensibilità e della specificità con il variare del cutoff. 20

Esempi di valori di sensibilità e specificità Ref. Malattia Tipo di pazienti Gold standard Test Sensibilità Specificità Sackett Ulcera, ernia iatale o Esame radiologico 95% 30% r.21 altra patologia gastrica Sackett r.28 Sackett r.28 Stenosi coronarica > 50% Stenosi coronarica > 70% Pazienti con sintomi inviati a controllo specialistico Pazienti con angina instabile inviati a controllo specialistico Pazienti con angina instabile inviati a controllo specialistico Sackett r.20 Recupero senza invalidità Sackett r.19 Aumento della Pazienti e volontari pressione endocranica Sackett r.14 Tumore della prostata Uomini con sintomi di ostruzione delle vie urinarie Sackett r.17 Sackett r16 Trombosi venosa profonda Carcinoma pancreatico Coronarografia Coronarografia Anamnesi mirata (storia clinica, relazione tra dolore ed assunzione di cibi) Anamnesi mirata (aumento dei sintomi) ECG sforzo (positivo se ST sottoslivellato >1mm) 83% 39% 60% 91% Coma non traumatico Follow-up Riflesso corneale 92% 35% Pazienti con sintomi inviati a controllo specialistico Pazienti con sintomi di carcinoma del pancreas in centro specialistico Puntura lombare o Assenza di pulsazione 100% 88% immagine radiologica della vena retinica Biopsia transrettale Fosfatasi acida 56% 94% Citologia secrezione 29% 98% prostatica Citologia di agobiopsia 55% 91% Palpazione per la 69% 89% ricerca di noduli Angiografia venosa Pletismografia e 92% 92% con mezzo di diffusione fibrinogeno contrasto marcato con 125 I Intervento chirurgico o Ecografia 65% 82% autopsia TAC 90% 82% 21

Rapporto di verosimiglianza (likelyhood ratio o LR) E il Rapporto tra due probabilità : LR + (rapporto di verosimiglianza per il risultato positivo) - la probabilità di avere un test positivo essendo ammalati (Sensibilità) - la probabilità di avere un test positivo essendo NON ammalati (1-specificità) LR + = verosimiglianza (likelyhood) di risultato positivo se la persona è malata. LR - (rapporto di verosimiglianza per il risultato negativo) - la probabilità di avere un test negativo essendo ammalati (Sensibilità) - la probabilità di avere un test negaitivo essendo NON ammalati (1-specificità) LR - = verosimiglianza (likelyhood) di risultato negativo se la persona è malata. 22

Malattia Malato Sano Tot. LR Test Positivo a/(a+c) b/(b+d) [a/(a+c)] / [b/(b+d)] Negativo c/(a+c) d/(b+d) [c/(a+c)] / [d/(b+d)] Totale a+c b+d LR+ = [a/(a+c)] / [b/(b+d)] LR- = [c/(a+c)] / [d/(b+d)] 23

Malattia Malato Sano Tot. LR Test Positivo 120/150 40/250 a+b [120/150] / [40/250] = 5 Negativo 30/150 210/250 c+d [30/150] / [210/250] = 0,24 Totale a+c b+d 24

Quando i risultato è espresso su una scala nominale/ordinale con più valori o su una scala continua (categorizzata) possiamo calcolare il valore del rapporto di verosimiglianza per ciascuna categoria. Esempio di test con risultato su scala ordinale: PAP test. 25

infarto CK non infarto 2 1-39 88 13 40-79 26 30 80-129 8 30 120-159 5 21 160-199 0 19 200-239 1 18 240-279 1 13 280-319 1 19 320-359 0 15 360-399 0 7 400-439 0 8 440-479 0 35 480+ 0 230 TOTALE 130 26

CK LR malati Non malati 1-39 (2/230)/(88/130)= 0,01 2 88 40-79 (13/230)/(26/130)= 0,28 13 26 80-279 (118/230)/(15/130)= 4,45 118 15 280 + (97/230)/(1/130)= 54,83 97 1 TOTALI 230 130 27

Nel caso della tabella precedente, non è corretto usare i termini di sensibilità e di specificità (appropriati quando i risultati del test sono espressi su scala binaria) ma si suggerisce di usare solo i termini di probabilità di un dato risultato del test tra i malati e tra i non_malati. 28

Esempi di valori di rapporto di verosimiglianza Ref. Malattia Gold standard Test LR Sackett Stenosi coronarica Angiografia o autopsia Anamnesi mirata (ricerca sintomi Uomini 115 r.7 >75% angina tipica) Donne 120 Sackett Stenosi coronarica Angiografia o autopsia Anamnesi mirata (ricerca sintomi Uomini 14 r.7 angina atipica) Donne 15 Sackett r.32 Trombosi venosa profonda Angiografia con mezzo di contrasto >= 4 segni o differenza di circonferenza 2,6 Sackett r.7 Sackett r.28 Sackett r24 Segni tipici (dolore, sensazione di calore, colore cute,indurimento, edema, differenza di circonferenza tra i due arti > 3 cm) Stenosi coronarica Angiografia ECG sforzo Stenosi coronarica Carcinoma del colon Coronarografia con mezzo di contrasto Intervento chirurgico o biopsia Sottoslivellamento ST Scintigrafia coronarica CEA < 4 segni, senza differenza circonferenza 0,15 >= 2,5 mm 39 2 2,49 11 1,5 1,99 4,2 1 1,49 2,1 0,05 0,99 0,92 <0,05 0,23 Positivo 3,6 Negativo 0,05 >=20 ng/ml 3,5 10-19.9 2,3 5-9.9 1,4 1-4.9 0,94 <1 0,46 29

LR consente di misurare la variazione della probabilità di malattia in seguito all esecuzione di un test: Odd_pretest * Likelyhood_Ratio = Odd_posttest Odd_pretest = odd di malattia prima dell esecuzione del test In assenza di informazioni cliniche, Odd_pretest = prevalenza / (1- prevalenza) Likelyhood_Ratio = risultato del test Odd_posttest = odd di malattia dopo l esecuzione del test 30

Come si passa da Odd a probabilità e viceversa? Odd = probabilità / (1- probabilità) Probabilità= odd / (odd +1) 31

Odd_posttest corrisponde al valore predittivo del risultato del test. Odd_posttest = VP+ / (1 - VP+) quindi: VP+ = Odd_posttest / (Odd_posttest +1) 32

Verifichiamo quanto detto, riferendoci al risultato positivo del test: Malattia Malato Sano Tot. LR Test Positivo a/(a+c) b/(b+d) [a/(a+c)] / [b/(b+d)] Negativo c/(a+c) d/(b+d) [c/(a+c)] / [d/(b+d)] Totale a+c b+d Prevalenza = (a+c)/(a+b+c+d) Pretest_odd = Prev / (1-prev) = [(a+c)/(a+b+c+d)]/[1- (a+c)/(a+b+c+d)] = = [(a+c)/(a+b+c+d)]/[(b+d)/(a+b+c+d)] = [(a+c) / (b+d)] LR+ = [a/(a+c)] / [b/(b+d)] = [a (b+d)/b (a+c)] Posttest_odd = [(a+c) / (b+d)] * [a (b+d)/b (a+c)] = a/b Probabilità corrispondente = odd / (odd+1) = (a/b)/(a/b+1) = (a/b)/((a+b)/b) = a/b * b/(a+b) = a/(a+b) = Valore predittivo 33

CK LR malati Non malati 1-39 (2/230)/(88/130)= 0,01 2 88 40-79 (13/230)/(26/130)= 0,28 13 26 80-279 (118/230)/(15/130)= 4,45 118 15 280 + (97/230)/(1/130)= 54,83 97 1 TOTALI 230 130 34

Possiamo utilizzare la seguente relazione per interpretare il risultato di una sequenza di esami: Odd_pretest * Likelyhood_Ratio = Odd_posttest L odd posttest di un dato esame costituisce l odd_pretest per l esame successivo. Esame 1: Odd_pretest(esame1) * Likelyhood_Ratio(esame1) = Odd_posttest(esame1) Esame 2: Odd_posttest(esame1) * Likelyhood_Ratio(esame2) = Odd_posttest(esame2) Esame 3: Odd_posttest(esame2) * Likelyhood_Ratio(esame3) = Odd_posttest(esame3) 35

Esempio: Viene visitato un paziente che presenta anamnesi suggestiva per sindrome anginosa. Dopo la visita medica valuto nel 50% (p=0.50; odd= 1:1) la probabilità che il paziente sia affetto da ischemia cardiaca conseguente a riduzione della perfusione coronarica. Vengono prescritti elettrocardiogramma da sforzo e scintigrafia del miocardio. Entrambi gli esami risultano positivi. In base ad una ricerca di letteratura si sono ottenuti i seguenti valori di rapporto di verosimiglianza: ECG da sforzo = 6,79 Scintigrafia del miocardio (tra i soggetti con precedente ECG da sforzo positivo) = 1,56. 36

Pretest_odd LR Posttest_odd Posttest_probabilità 1 * 6,79 = 6,79 6,79 * 1,56 = 10,60 0,913793 37

Perché ho sottolineato che il valore di LR per la scintigrafia del miocardio si riferisce ai pazienti con ECG positivo? I risultati dei due esami (ECG da sforzo e scintigrafia del miocardio) non sono indipendenti. Lo studio che abbiamo utilizzato per valutare il valore del rapporto di verosimiglianza per i due esami fornisce questi risultati: Scintigrafia miocardio: LR per ischemia coronarica, dato il risultato positivo dell esame. Se ECGsforzo positivo : LR = 1,56 Se ECGsforzo negativo : LR = 1,94 38