Indice. 1 Che cos è l epidemiologia? ------------------------------------------------------------------------------- 3

LEZIONE RICERCA EMPIRICA IN AMBITO EPIDEMIOLOGICO (PRIMA PARTE) PROF. PAOLO PASETTI

Indice 1 Che cos è l epidemiologia? ------------------------------------------------------------------------------- 3 1.1. Oggetti di studio e scopi dell epidemiologia ------------------------------------------------------ 3 1.2. Di cosa parleremo in questo corso? ---------------------------------------------------------------- 4 1.3. Che cosa significa misurare in epidemiologia? ------------------------------------------------ 5 2 Alcune misure fondamentali: le misure di occorrenza (di malattia) ---------------------------- 6 2.1 La popolazione a rischio -------------------------------------------------------------------------------- 6 2.2 La prevalenza di malattia ------------------------------------------------------------------------------- 6 2.3 Il tasso di incidenza di malattia ------------------------------------------------------------------------ 7 2.4 Incidenza cumulativa (o rischio) ----------------------------------------------------------------------- 8 2.5 Il tasso di mortalità --------------------------------------------------------------------------------------- 9 2.6 Tassi di mortalità grezzi, specifici, standardizzati --------------------------------------------------- 9 3 Alcune misure fondamentali: le misure di associazione ----------------------------------------- 13 3.1 Il rapporto di rischio (RR) e il rapporto tra tassi (RT) -------------------------------------------- 13 3.2 Il rapporto tra odds (Odds Ratio: OR) -------------------------------------------------------------- 14 4 Alcune misure fondamentali: le misure di impatto ----------------------------------------------- 16 2 di 17

1 Che cos è l epidemiologia? Dal punto di vista etimologico, il termine epidemiologia si compone di tre parole greche: Epì = sopra Demos = popolo, popolazione Logos = discorso. Dunque, se seguiamo l origine etimologica del termine, l epidemiologia studia ciò che sta sopra cioè accade a una popolazione. Oggetto di studio dell epidemiologia non sono gli individui, ma le popolazioni. L epidemiologia, al pari della demografia, sua parente stretta, è una scienza statistica: essa, cioè, si avvale in modo massiccio della metodologia statistica. Non potrebbe esistere epidemiologia senza statistica. Ma qual è, sostanzialmente, l oggetto di studio di cui si occupa l epidemiologia? Un ottima definizione dell epidemiologia è quella di Last (1995), tratta dal suo A dictionary of Epidemiology 1 : l epidemiologia è lo studio della distribuzione e dei determinanti delle situazioni (o degli eventi) collegate alla salute in una specifica popolazione, e l applicazione di questo studio al controllo dei problemi di salute. 1.1. Oggetti di studio e scopi dell epidemiologia L epidemiologia moderna si occupa di una vastissima gamma di problemi, forse neanche immaginabili nei primi anni di sviluppo di questa disciplina. Storicamente, infatti, i primi utilizzi dell epidemiologia sono stati nel campo delle malattie trasmissibili (eziologia); in questo campo l uso dell epidemiologia è ancora attuale; 1 Last JM, A dictionary of epidemiologo, 3 rd ed., 1995; Oxford, Oxford University Press. 3 di 17

Oggi, l epidemiologia ha come sue principali missioni lo studio dell eziologia delle malattie croniche e degenerative (stili di vita), lo studio dei determinanti ambientali delle malattie, lo studio degli effetti di interventi preventivi e delle azioni di promozioni della salute. L epidemiologia è utilizzata proficuamente anche per studiare il decorso e le conseguenze delle malattie negli individui (si parla in questo caso di epidemiologia clinica). L epidemiologia viene efficacemente applicata nella descrizione dello stato di salute di una popolazione (per le politiche sanitarie), nella descrizione dell esposizione di una popolazione a possibili determinanti ambientali di malattia. Un campo di applicazione dell epidemiologia, piuttosto recente e di grande interesse, si occupa dello studio dei determinanti sociali e socioeconomici delle malattie. Un altro settore applicativo dell epidemiologia, che sta prendendo sempre più piede negli ultimi decenni, riguarda la valutazione dell efficacia e dell efficienza dei servizi sanitari (ad esempio: studio dell appropriatezza di un certo trattamento o di un esame clinico; studi di impatto: qual è l impatto sulla salute di una certa politica di riduzione dell inquinamento atmosferico?): si parla, in questo caso, di epidemiologia valutativa (non ce ne occuperemo in particolare nel presente corso). 1.2. Di cosa parleremo in questo corso? In primo luogo, l epidemiologia ha come scopo quello di misurare la salute e la malattie: introdurremo pertanto le principali misure epidemiologiche, comprendendo in queste ultime anche le misure di impatto in sanità pubblica. Parleremo poi dell epidemiologia analitica, analizzando nel dettaglio i principali tipi di studio epidemiologico. Ci occuperemo, infine, del modo in cui si può controllare l errore in epidemiologia, in particolare a proposito del confondimento e della modificazione di effetto. 4 di 17

1.3. Che cosa significa misurare in epidemiologia? In epidemiologia si misura, in primo luogo, la presenza, oppure l assenza, di una malattia. Perché si possa parlare di stato di malattia deve essere presente una diagnosi, effettuata da un medico tramite sintomi, segni, test diagnostici, ecc. Ma, più in generale, l epidemiologia si prefigge lo scopo di misurare una certa condizione, che può essere clinica, pre-clinica o post-clinica: ad esempio, si può misurare un fattore di rischio comportamentale: condizione di fumatore/non fumatore (e, tra i fumatori, quantità di sigarette fumate al giorno, ecc.); oppure un fattore di rischio pre-clinico (es.: ipercolesterolemia). Ancora, dopo la malattia e la terapia, si può misurare il decorso della malattia stessa: sopravvivenza a 1, 2, 5 anni; avvalendosi di opportune scale di misura, si può misurare la qualità della vita dopo la terapia. Si può, infine, misurare l esposizione a fattori di rischio ambientali e/o professionali: ad esempio, condizione di esposto/non esposto a una certa sostanza inquinante. 5 di 17

2 Alcune misure fondamentali: le misure di occorrenza (di malattia) 2.1 La popolazione a rischio Il primo concetto che deve assolutamente essere definito con chiarezza è quello di popolazione a rischio. Quasi sempre, per determinate patologie, la popolazione a rischio non coincide con il totale della popolazione, ma rappresenta solo una parte, delimitata con precisione, della popolazione totale (ad esempio, per età e sesso). Per fare un esempio, per il carcinoma della cervice uterina, la popolazione a rischio è formata dalle sole donne, in età compresa tra 25 e 69 anni. Una eccezione a questo ragionamento, però molto rilevante, è costituita dalle esposizioni ambientali: in una certa area, è tutta la popolazione che vi risiede, senza eccezioni, ad essere esposta a un certo inquinante. 2.2 La prevalenza di malattia La prevalenza misura la quota, in una certa popolazione, in un certo istante di tempo, delle persone ammalate di una certa malattia. La prevalenza di malattia (P) si può esprimere con la seguente formula: P N.persone ammalate al tempo t Popolazione a rischio al tempot ( 10 n ) La prevalenza può essere riferita non solo a una malattia, ma anche a una condizione preclinica (es. diabete mellito), o a un fattore di rischio comportamentale (es. prevalenza di fumatori). 6 di 17

Ad esempio, in Emilia-Romagna, la prevalenza di fumatori (2008) nella popolazione 18-69 anni, è pari al 30% (Fonte: Sistema di sorveglianza PASSI, 2009); solitamente la prevalenza si esprime in termini percentuali. 2.3 Il tasso di incidenza di malattia Mentre, come abbiamo visto, la prevalenza è riferita a un istante di tempo, nel quale vengono contate le persone che, a quell istante, sono ammalate (o hanno una certa condizione), il tasso di incidenza si riferisce a un intervallo di tempo (di solito un anno), durante il quale si conta quante persone hanno ammalato di quella malattia, relativamente alla popolazione a rischio presente in quell anno. Le persone comprese nella popolazione a rischio andranno contate tenendo conto della durata, cioè secondo il loro contributo di presenza durante l anno: si parla pertanto di annipersona; gli anni-persona, usualmente, si calcolano come popolazione media dell anno considerato (che si ottiene calcolando il valore medio tra la popolazione a inizio anno e la popolazione a fine anno). L incidenza è un vero e proprio tasso, cioè una velocità di diffusione della malattia. Se vogliamo rappresentare con un immagine la differenza tra prevalenza e incidenza, possiamo dire che la prevalenza si può paragonare a una bacinella più o meno piena, mentre l incidenza si può paragonare alla velocità dell acqua che esce dal rubinetto, che a sua volta va ad alimentare la bacinella (vedi figura sottostante). 7 di 17

La formula per il calcolo del tasso di incidenza è la seguente: I N.anni - persona nell' anno X N.persone che ammalano nell' anno X (Pop.inizio anno Pop.fineanno)/2 ( 10 n ) Il tasso di incidenza, solitamente, si esprime per 100.000, o talvolta per 1000, anni-persona. 2.4 Incidenza cumulativa (o rischio) A differenza che nel tasso di incidenza, nell incidenza cumulativa (misura che spesso viene chiamata rischio) non si considerano, a denominatore, gli anni-persona, ma la popolazione esposta al rischio, cioè quella all inizio del periodo in studio: IC N.persone che ammalano Popolazione all' inizio del nel periodo X ( 10 periodo n ) 8 di 17

2.5 Il tasso di mortalità Molto utilizzato anche in demografia, il tasso di mortalità è una misura fondamentale in epidemiologia: esso misura i decessi non solo in quanto tali (come in demografia), ma in quanto possibili esiti di malattia. In particolare, vengono studiati i tassi di mortalità relativi a una certa causa di morte, o un certo gruppo di cause di morte (esempio: tumori) Per alcune patologie molto gravi e con rapido decorso (es. tumore del polmone), il tasso di mortalità può essere un valido sostituto del tasso di incidenza. Il tasso (grezzo) di mortalità, per una singola causa, si calcola con la seguente formula: TM Numero di decessi, per una certa causa di morte, nell' anno X N.anni - persona nell' anno X (Pop.inizio anno Pop.fineanno)/2 ( 10 n ) 2.6 Tassi di mortalità grezzi, specifici, standardizzati Un semplice tasso (di incidenza, mortalità o altro) è certamente utile per dare una misura immediata del fenomeno in studio: se un tasso di mortalità è pari a 400 per 100mila, significa che in quell anno, per quella certa causa, sono morte 400 persone su 100mila. Molto diverso diventa il discorso se il tasso (relativo, poniamo, alla provincia di Ferrara nel 2008) deve essere confrontato con il tasso relativo allo stesso anno ma a un altra provincia, ad esempio la provincia di Modena. Un tasso di mortalità (ma il discorso sarebbe del tutto analogo per un tasso di incidenza, di ospedalizzazione, ecc.) è, in realtà, fortemente dipendente dalla struttura per età e sesso che ha generato il tasso stesso: ad esempio, in generale, una popolazione anziana, soprattutto per alcune cause (es. i tumori), tenderà ad avere tassi di mortalità più elevati rispetto a una popolazione 9 di 17

giovane. Così - ed è proprio il caso della provincia di Ferrara - una provincia con una struttura per età molto spostata verso le classi di età più anziane tenderà ad avere tassi di mortalità molto elevati per i tumori, e meno elevati, ad esempio, per gli incidenti stradali (che colpiscono maggiormente le età più giovani). Anche il sesso è una variabile importante: di solito, i tassi di mortalità per tumore del polmone sono molto più alti per i maschi che per le femmine; anche altre variabili particolari (confondenti) possono avere un influenza sui tassi grezzi. Come si può operare per cercare di depurare i tassi grezzi dall effetto della struttura per età e/o di altre variabili confondenti? Un primo passo consiste nel calcolare, al posto del tasso generale (tasso grezzo), una serie di tassi, ciascuno per ogni classe di età: sono i cosiddetti tassi etàspecifici. Ad esempio, può essere interessante valutare la mortalità per una certa causa limitatamente alla classe di età 25-34 anni; in questo caso, il tasso età-specifico è dato da: TM (2534) Numero di decessi, per una certa causa di morte, nell' anno X,in età 25-34 anni N.anni - persona nell' anno X,in età 25-34 anni ( 10 n ) Limitatamente ad alcuni scopi, può essere sufficiente fare riferimento ai tassi età-specifici. Se, però, vogliamo veramente disporre di una misura di uso generale che sia depurata dall effetto della struttura per età, il passo successivo consiste nel trovare un metodo che consenta di eliminare (o quasi) l effetto della struttura per età (e, eventualmente, per sesso) della popolazione generante, sia per la popolazione A che per la popolazione B. Questo metodo consiste nel calcolare tutti i tassi età-specifici delle popolazioni, rispettivamente, A e B e, successivamente, applicare tali tassi specifici non più alle reali strutture per età delle popolazioni per età, rispettivamente, A e B, bensì un altra struttura per età di una popolazione qualunque (detta popolazione standard), la cui scelta è arbitraria. In questo modo, si calcola un tasso di mortalità, sia per A che per B, come se fosse quello sperimentato da tale ipotetica, comune popolazione standard; così facendo i due tassi, per A e per B, diventano confrontabili perché non hanno più nulla a che fare con le strutture per età, né di A, né di B; 10 di 17

Questo metodo è detto di standardizzazione diretta (esistono altri metodi di standardizzazione dei tassi, dei quali non ci occupiamo in questa sede). Sintetizziamo schematicamente la procedura per il calcolo di un tasso standardizzato. Date due serie di tassi di mortalità età-specifici (popolazione A e popolazione B): TM ; A TM ; B 1 A 1 B TM TM 2 2 ;...; TM ;...; TM A B i i A ;...; TM ;...; TM B k k E data la struttura per età della popolazione-standard che è stata scelta (esempio: popolazione Italia al Censimento 2001) [popolazione puntuale, come in questo caso, o personeanno nel caso la popolazione sia riferita a un intervallo di tempo]: p ; 1 p ;...; 2 pi;...; p dove k Popolazione nella classe di età i - esima (Italia 2001) pi Popolazione totale(italia 2001) Il tasso standardizzato di mortalità, per la popolazione A, è dato da: A TM STAND ITALIA 2001 ATM1 p1 ATM2 p2... ATMi pi... A TM k p k Per la popolazione B, il calcolo del tasso standardizzato di mortalità è del tutto analogo. ATTENZIONE: naturalmente, per potere fare confronti, la popolazione-standard deve essere sempre la stessa! A titolo esemplificativo, riportiamo nella seguente tabella i primi dieci paesi del mondo (2002) per mortalità per tumori (fonte: OMS). 11 di 17

I tassi sono standardizzati; la popolazione standard, in questo caso, è la popolazione mondiale media 2000-2005 (è lo standard attualmente utilizzato dall OMS). TUMORI 2002 TASSI STD. DI MORTALITA (X 100.000) 1 Mongolia 306,4363 2 Bolivia 256,2753 3 Ungheria 200,9356 4 Grenada 198,6302 5 Sierra Leone 180,9561 6 Polonia 180,1296 7 Angola 179,4031 8 Repubblica Ceca 176,5555 9 Perù 174,5961 10 Uruguay 170,2951 12 di 17

3 Alcune misure fondamentali: le misure di associazione Le misure di occorrenza di malattia viste finora (prevalenze, tassi di incidenza, tassi di mortalità, rischi) sono utili per misurare l insorgenza di una malattia, di una condizione preclinica, di un fattore di rischio. Ma, il passo in avanti che adesso dobbiamo fare è: come possiamo confrontare e mettere in relazione l andamento o l insorgenza di una malattia o di una condizione in DUE popolazioni diverse? In altre parole, se le misure di occorrenza sono misure assolute della diffusione e/o dell insorgenza delle malattie, le misure di associazione che vedremo nel seguito sono misure relative della diffusione e dell insorgenza delle malattie; una certa misura (tasso, rischio) viene confrontata con la misura relativa a un altra popolazione o a un altro gruppo. 3.1 Il rapporto di rischio (RR) e il rapporto tra tassi (RT) Nel paragrafo precedente, abbiamo visto l incidenza cumulativa, o rischio (R), come rapporto tra persone che ammalano in un certo periodo e popolazione a rischio all inizio del periodo. Spesso, in epidemiologia, si è interessati soprattutto a confrontare la diffusione di una malattia o condizione in due popolazioni differenti: tipicamente, ad esempio, quella degli ESPOSTI a un certo fattore di rischio e quella dei NON ESPOSTI. Diventa allora importante trovare una misura per confrontare i due rispettivi rischi: il Rapporto di Rischio è appunto il rapporto tra i due rischi: se abbiamo, ad esempio, RR=3, significa che il rischio nella popolazione degli esposti è 3 volte maggiore del rischio nella popolazione dei non esposti Il RR è molto utilizzato in un particolare tipo di studio epidemiologico, che vedremo più avanti: lo studio di coorte. Il rapporto di rischio (RR) si calcola con la seguente formula: R( popolazione ESPOSTI) RR R(popolazione NONESPOSTI ) 13 di 17

Un altra misura di associazione interessante, anche se di uso meno frequente, è il rapporto tra tassi (RT), calcolato come il rapporto tra i due tassi di incidenza: rispettivamente, quello relativo agli esposti e quello relativo ai non esposti. La formula è la seguente: I( popolazione ESPOSTI) RT I(popolazione NONESPOSTI ) 3.2 Il rapporto tra odds (Odds Ratio: OR) Una misura di associazione molto importante è il Rapporto tra odds (OR). Dato un certo insieme di individui, suddiviso dicotomicamente in due parti: coloro che sono ammalati, (o hanno una certa condizione, A) e coloro che non sono ammalati (NA), si dice ODDS il rapporto tra la probabilità di essere ammalati e la probabilità dell evento complementare, cioè di non essere ammalati (NA); si ha cioè: Odds = P(A)/P(NA)=P(A)/(1-P(A)) Poiché, con semplici passaggi, si ha: P( A) Odds P ( NA ) Ammalati Popolazione a rischio Non ammalati Popolazione a rischio Ammalati Non ammalati è evidente che per calcolare l odds non è necessario conoscere la consistenza numerica della popolazione a rischio, ma è sufficiente sapere quanti sono ammalati e quanti no. Questo per quanto riguarda il calcolo degli odds di malattia; se, però, vogliamo confrontare ciò che accade a un insieme di individui (es. gli ESPOSTI a un certo FDR) con ciò che accade a un 14 di 17

altro insieme di individui (es. i NON ESPOSTI), possiamo fare il rapporto tra i due ODDS (questo rapporto è detto Odds Ratio, OR): Odds( ESPOSTI ) OR Odds( NonESPOSTI [Ammalati/Non ammalati] [Ammalati/Non ammalati] esposti non esposti Esiste poi una formula calcolatoria ancora più semplice, che permette di calcolare l OR a partire da una tabella di contingenza. Se abbiamo una tabella a doppia entrata del tipo: CASI (ammalati) CONTROLLI (non ammalati) TOTALE Esposti al A B A+B FDR Non esposti C D C+D al FDR TOTALE A + C B + D A+B+C+D Si ha che: Odds(E) = A/B Odds(NE) = C/D E quindi: OR = Odds(E)/Odds(NE)= (A/B)/(C/D)= A*D / B*C L aspetto più interessante dell Odds Ratio consiste nel fatto che è possibile calcolarlo anche se non si conosce l entità numerica della popolazione a rischio di riferimento. Proprio per questa sua proprietà, l OR trova il suo utilizzo ideale negli studi epidemiologici di tipo caso-controllo, che vedremo nel seguito. Vedremo, inoltre, che il significato empirico, in termini interpretativi, dell OR è simile a quello del Rapporto di Rischio (RR). 15 di 17

4 Alcune misure fondamentali: le misure di impatto Osserviamo i dati della seguente tabella, tratti da uno studio di coorte su 118539 donne sane in età 30-55 anni, con follow-up di 8 anni, sulla relazione tra fumo di sigaretta e ictus (Colditz et al., 1988 2 ): Condizione di fumo Numero casi di ictus Anni-persona in osservazione (in 8 anni) Tasso di incidenza di ictus (X 100.000) Mai fumato 70 395594 17,7 Ex-fumatrici 65 232712 27,9 Fumatrici 139 280141 49,6 TOTALE 274 908447 30,2 Osservando i tassi di incidenza, si può notare come l incidenza di ictus sia molto più alta per le fumatrici, come ci si poteva aspettare. Possiamo però porci un altra domanda: di tutti i casi di ictus che si sono verificati, quanti sono attribuibili all esposizione al fattore di rischio (in questo caso il fumo)? In altri termini, quanti sarebbero evitabili, nel caso venisse rimosso completamente il FDR (ad esempio, se venisse completamente eliminato il fumo)? La risposta a questa domanda è molto importante, soprattutto nell ambito della sanità pubblica: serve per valutare l impatto delle politiche sanitarie che sono state attuate, o di eventuali politiche sanitarie che si progetta di attuare. Riferendosi alle misure di questo tipo si parla, infatti, di misure di impatto. 2 Dati tratti da: Colditz GA et al., Cigarette smoking and risk of stroke in middle-aged women, New England Journal of Medicine, 1988; 318 (15): 937-941. 16 di 17

Per rispondere a questa domanda, tre sono le principali misure; le vediamo brevemente. DIFFERENZA DI RISCHIO È la differenza tra l incidenza negli esposti e l incidenza nei non esposti: con riferimento ai dati della tabella, I(E) I(NE)= 49,6 17,7= 31,9 (X 100.000) RISCHIO ATTRIBUIBILE NEGLI ESPOSTI È dato da RAE = [I(E) I(NE)]/I(E) Con riferimento ai dati della tabella, RAE= 31,9/49,6 = 0,643 = 64,3% Questo significa che, tra gli esposti, al fatto di essere stati esposti al fumo si può attribuire il 64,3% dei casi di malattia (ictus) che si sono verificati. RISCHIO ATTRIBUIBILE DI POPOLAZIONE Si può calcolare se si dispone dell incidenza di malattia nell intera popolazione (purtroppo, non sempre si dispone di questa informazione; per disporne, i dati dovrebbero provenire da uno studio di coorte, o simili). RAP = [I(POP) I(NE)]/I(POP) Riprendendo i dati della nostra tabella: RAP = (30,2 17,7)/30,2 = 0,414 = 41,4% Ciò significa che, nella popolazione generale (e non solo tra gli esposti), al fatto di essere stati esposti al fumo si può attribuire il 41,4% dei casi di malattia (ictus) che si sono verificati. 17 di 17