ERRORI IN EPIDEMIOLOGIA

Errori in Epidemiologia Accuratezza (o validità) Errori sistematici Confondimento Misclassificazione Selezione Precisione Errori random Errore Errore random Errore sistematico Numerosità del campione

Accuratezza e precisione

Precisione È di solito espressa utilizzando gli intervalli di confidenza Dipende dalla grandezza del campione e dall efficienza dello studio

Accuratezza (o validità) Bias di selezione Bias di informazione (misclassificazione) Confondimento

Bias di selezione Selezione del campione nello studio I partecipanti allo studio potrebbero essere differenti in qualche aspetto rispetto ai non partecipanti Esempi

Bias di selezione Esempio n. 1 Studio della prevalenza dell obesità Se per qualche motivo i soggetti obesi partecipano meno frequentemente dei soggetti non obesi, allora la stima della prevalenza dell obesità sarà distorta

Bias di selezione Esempio n. 2 Studio sull effetto degli zaini pesanti sul mal di schiena nei ragazzi Durante l ora di educazione fisica, si misura sia il peso dello zaino che la presenza di mal di schiena

Calcolo del Rischio Relativo Mal di schiena Non mal di schiena Totale Zaino pesante 10 10 20 Zaino leggero 30 150 180 RR = 10/20 30/180 = 3

Bias di selezione Gli studenti più atletici potrebbero essere assenti perché impegnati in competizioni al di fuori della scuola Se gli studenti più atletici portano più spesso zaini pesanti E se soffrono di meno di mal di schiena Si può avere una stima distorta dell effetto del portare uno zaino pesante

Calcolo del Rischio Relativo Mal di schiena Non mal di schiena Totale Zaino pesante 10 10 20 Zaino leggero 30 150 180 RR = 10/20 30/180 = 3 Questa cella è sotto-rappresentata per l assenza di soggetti atletici

Calcolo del Rischio Relativo Mal di schiena Non mal di schiena Totale Zaino pesante 10 20 30 Zaino leggero 30 150 180 RR = 10/30 30/180 = 2 Con 10 soggetti atletici esposti non malati in più

Calcolo del Rischio Relativo Mal di schiena Non mal di schiena Totale Zaino pesante 10 30 40 Zaino leggero 30 150 180 RR = 10/40 30/180 = 1.5 Con 20 soggetti atletici esposti non malati in più

Misclassificazione Assegnazione dei soggetti in studio alla categoria sbagliata di una variabile categorica La misclassificazione può riguardare: La variabile di esposizione La variabile d effetto La variabile confondente Più variabili

Misclassificazione Non differenziale L errore è uguale per tutti i soggetti Differenziale L errore dipende dalle caratteristiche del soggetto Ad esempio, la misclassificazione dell esito può essere più grande per i non esposti e più piccola per gli esposti Oppure, la misclassificazione dell esposizione può essere più grande nei controlli e più piccola nei casi (recall bias)

Conseguenze della misclassificazione Non differenziale Sottostima dell effetto Differenziale Sottostima o sovrastima dell effetto

Effetto senza misclassificazione dell esposizione Effetto senza misclassificazione ESPOSTI NON ESPOSTI

Effetto con misclassificazione non differenziale dell esposizione Effetto con misclassificazione Effetto senza misclassificazione ESPOSTI NON ESPOSTI

Esempio di misclassificazione Se il 10% degli esposti viene classificato come non esposto Dati corretti Esposti Non esposti Casi 20 10 N a rischio 100 100 RR=2 Esposti Non esposti Casi 18 12 N a rischio 90 110 RR=1.8 Se il 20% degli esposti viene classificato come non esposto Esposti Non esposti Casi 16 14 N a rischio 80 120 RR=1.7

Esempio di misclassificazione Se il 10% degli esposti viene classificato come non esposto ed il 10% dei non esposti viene classificato come esposto Esposti Non esposti Casi 19 11 N a rischio 100 100 RR=1.7 Se il 20% degli esposti viene classificato come non esposto ed il 20% dei non esposti viene classificato come esposto Esposti Non esposti Casi 17 13 N a rischio 100 100 RR=1.3

Confondimento Un errore nella stima di una misura epidemiologica o nella stima di un effetto che deriva da uno squilibrio tra i gruppi posti a confronto di altri fattori causali della malattia Un confondente È associato con la malattia tra i non esposti È associato con l esposizione nella popolazione che dà origine ai casi Non è una causa intermedia

Confondimento ESPOSIZIONE MALATTIA CONFONDENTE

Esempio di confondimento Dati grezzi Esposti Non esposti Casi 40 101 Tempo-persona 1100 1100 RR=0.4 Giovani Anziani Esposti Non esposti Esposti Non esposti Casi 20 1 Casi 20 100 Tempopersonpersona 1000 100 Tempo- 100 1000 RR=2.0 RR=2.0

Confondimento Misura Cambiamento nella stima dell effetto Controllo Prevenzione Restrizione Randomizzazione Appaiamento Terapia Analisi stratificata Standardizzazione Modelli multivariabili

La standardizzazione Immaginiamo di voler confrontare i tassi di mortalità di una serie di popolazioni indice (A, B, C, ) La diversità nella distribuzione dell età tra le popolazioni può introdurre un bias Il bias può essere eliminato con la standardizzazione dei tassi di mortalità, utilizzando una comune popolazione di riferimento (Z)

Popolazione A Età Anni-persona Morti Tasso di mortalità (per 1,000 annipersona) 0-14 4,000 8 2 15-44 3,000 15 5 45-64 2,000 20 10 65+ 1,000 25 25 totale 10,000 68 6.8

Popolazione B Età Anni-persona Morti Tasso di mortalità (per 1,000 annipersona) 0-14 1,000 8 8 15-44 2,000 40 20 45-64 3,000 120 40 65+ 4,000 400 100 totale 10,000 568 56.8

Confronto tra tassi grezzi Il tasso grezzo di mortalità in A (6.8) è circa 1/9 di quello di B (56.8) Il confronto tra tassi specifici suggerisce invece che il rapporto è circa 1/4 BIAS! Diversa distribuzione dell età tra A e B

Utilizzo di una popolazione di riferimento Z Età Anni-persona Morti Tasso di mortalità (per 1,000 annipersona) 0-14 25,000 100 4 15-44 25,000 250 10 45-64 25,000 500 20 65+ 25,000 1250 50 totale 100,000 2100 21.0

Standardizzazione diretta Quale sarebbe la mortalità in Z se Z avesse gli stessi tassi di mortalità specifici per età di A, B,?

Standardizzazione diretta Età Anni-persona Tasso di Morti attese di Z mortalità di A in Z (per 1,000 anni-persona) 0-14 25,000 2 50 15-44 25,000 5 125 45-64 25,000 10 250 65+ 25,000 25 625 totale 100,000 1050 Tasso di mortalità standardizzato (metodo diretto) = 1050/100000 = 10.5/1000

Standardizzazione diretta Età Anni-persona Tasso di Morti attese di Z mortalità di B in Z (per 1,000 anni-persona) 0-14 25,000 8 200 15-44 25,000 20 500 45-64 25,000 40 1,000 65+ 25,000 100 2,500 totale 100,000 4,200 Tasso di mortalità standardizzato (metodo diretto) = 4,200/100,000 = 42.0/1000

Standardizzazione diretta Il confronto tra i due tassi standardizzati di mortalità evidenzia un rapporto 1/4 Pop. A: 10.5/1000 py Pop. B: 42/1000 py L utilizzo di una stessa popolazione di riferimento (Z) ha rimosso il confondimento legato alla differente distribuzione dell età in A e B

Standardizzazione indiretta Quale sarebbe la mortalità in A, B, se A, B, avessero gli stessi tassi di mortalità specifici per età di Z? La standardizzazione indiretta permette di calcolare per ogni popolazione il rapporto standardizzato di mortalità (SMR), che è il rapporto tra eventi osservati ed eventi attesi

Standardizzazione indiretta Età Anni-persona Tasso di Morti attese di A mortalità di Z in A (per 1,000 anni-persona) 0-14 4,000 4 16 15-44 3,000 10 30 45-64 2,000 20 40 65+ 1,000 50 50 totale 10,000 136 SMR = casi osservati/casi attesi = 68/136 = 0.50 Tasso di mortalità standardizzato (metodo indiretto) = 0.50*21/1000 = 10.5/1000

Standardizzazione indiretta Età Anni-persona Tasso di Morti attese di B mortalità di Z in B (per 1,000 anni-persona) 0-14 1,000 4 4 15-44 2,000 10 20 45-64 3,000 20 60 65+ 4,000 50 200 totale 10,000 284 SMR = casi osservati/casi attesi = 568/284 = 2.00 Tasso di mortalità standardizzato (metodo indiretto) = 2.00*21/1000 = 42.0/1000

Standardizzazione diretta ed indiretta I tassi di mortalità standardizzati di A e B possono quindi essere confrontati: la mortalità di A è ¼ quella di B In questo caso, i due metodi, diretto ed indiretto, forniscono lo stesso risultato A volte i due metodi danno risultati diversi

Standardizzazione diretta ed indiretta Il metodo diretto fornisce risultati più validi Il metodo indiretto consente di ottenere una maggiore precisione (errori standard più piccoli) poiché i tassi specifici della popolazione indice non vengono utilizzati nel calcolo