4. Statistical analysis. 2. Sample size calculation. 1. Epidemiologic study design. 3. Data quality and coding. Metropolitana del corso

Transcript

1 4. Statistical analysis 2. Sample size calculation l 1. Epidemiologic study design 3. Data quality and coding 5. Sounding interpretation it tti Metropolitana del corso

2 Argomenti trattati Statistica descrittiva Test statistici Stima per intervalli Misure epidemiologiche La regressione lineare Cenni introduttivi all analisi multivariata

3 Test statistici ed intervalli di confidenza Fabrizio Stracci

4 Il test statistico E uno strumento per valutare se vi è un effetto sistematico Non fornisce una risposta certa L ld dll f La validità delle risposte fornite dipende da alcuni assunti o condizioni che variano dal tipo di test adottato

5 Ingredienti del test Variabile bl di risposta misurata operativamente Variabile esplicativa (di cui vogliamo indagare l effetto) Ipotesi alternativa (H a ) Ipotesi nulla ( H 0 ) Errore alfa Stima dell effetto sistematico Stima della variabilità casuale Distribuzione teorica di probabilità

6 Ingredienti del test Variabile bl di risposta Variabile di risposta: e la quantità che misuriamo Variabile esplicativa per tutte le unità sperimentali. Variabile di risposta Variabile esplicativa Ipotesi alternativa (H a ) Ipotesi nulla ( H 0 ) Errore alfa Variabile esplicativa: determina la formazione dei Stima dell effetto gruppi da confrontare sistematico Stima della variabilità casuale Distribuzione ib i La natura dll della variabile ibil di risposta (quantitativa, i teorica di probabilità categoriale, dicotomica ) e quella della variabile di risposta influiscono sulla scelta del tipo di test

7 Ingredienti del test Variabile bl di risposta L i Lipotesi i alternativa o di lavoro afferma che la variabile ibil Variabile esplicativa esplicativa è associata, influenza direttamente o Ipotesi alternativa indirettamente, la variabile di risposta Variabile di risposta Variabile esplicativa Ipotesi alternativa (H a ) Ipotesi nulla ( H 0 ) Errore alfa L ipotesi nulla o di non effetto, all opposto, afferma che i Stima dell effetto valori assunti dalla variabile di risposta nelle sperimentali non differiscono tra i gruppi a confronto unità sistematico Stima della variabilità casuale Distribuzione ib i teorica di Il test statistico consiste in una valutazione della probabilità b probabilità di osservare i valori del campione* posto che l ipotesi nulla è vera *in realtà i valori osservati e i valori più improbabili rispetto all ipotesi nulla

8 Ingredienti del test V bl d L errore alfa, α, o di I tipo, consiste nel respingere l ipotesi nulla quando essa è vera Variabile di risposta Variabile esplicativa Ipotesi alternativa (Ha) Ipotesi nulla ( H 0 ) Errore alfa Stima dell effetto sistematico Stima della variabilità casuale E un tasso di errore che fissiamo arbitrariamente prima di effettuare il testt Distribuzione ib i teorica La definizione di errore di I tipo implica che esista di probabilità almeno un altro tipo di errore che potremmo definire di II tipo o beta (β)

9 Types of Errors Study's Conclusion True Effect (reject null hyp.) Reality True Effect Truth No Effect Type I or Alpha Error No Effect (don't reject null hyp.) Type II or Beta Error Truth

10 Ingredienti del test V bl d Il valore sperimentale del test di solito si basa sul rapporto tra queste due quantità, una misura (Ha) che esprime la dff differenza tra i gruppi a confronto e una misura che esprime la variabilità delle unità Stima dell effetto sistematico sperimentali indipendente d dal trattamento : Variabile di risposta Variabile esplicativa Ipotesi alternativa Ipotesi nulla ( H 0 ) Errore alfa Stima dell effetto Stima della variabilità casuale Distribuzione ib i teorica di probabilità segnale effetto _ sistematico disturbo errore

11 Ingredienti del test Variabile bl di risposta Variabile esplicativa Ipotesi alternativa (H a ) Ipotesi nulla ( H 0 ) Errore alfa Stima dell effetto sistematico Stima della variabilità casuale Distribuzione ib i teorica di probabilità

12 Assumere una distribuzione teorica di probabilità: implica una approssimazione ci consente di assegnare una probabilità al nostro risultato [la probabilità di osservare un risultato come il nostro* per effetto del caso su una serie infinita di ripetizioni] la distribuzione teorica assegna probabilità non nulla che qualsiasi risultato si verifichi per caso d l l h l quindi se vogliamo trarre una qualche conclusione dobbiamo stabilire arbitrariamente un valore limite (il tasso di errore alfa)

13 Risultato del test Punti critici. Utilizzando apposite tabelle o software, possiamo confrontare il valore sperimentale del test con il valore tabulare corrispondente all errore alfa prescelto Valore p. Possiamo ottenere direttamente da un programma la probabilità del nostro risultato sotto l ipotesi nulla: se tale probabilità p < α il test è significativo

14 il test t di Student: Si applica quando la variabile di risposta è quantitativa continua e Ne assume, tra l altro, la normalità della distribuzione Serve a confrontare due gruppi caratterizzati dalla variabile esplicativa, quella di cui vogliamo valutare l effetto (ad esempio trattamento A vs trattamento B)

15 FORMULAZIONE DELLE IPOTESI IPOTESI ALTERNATIVA = H a La media delle due popolazioni a confronto è diversa H a : µ A µ B TEST A DUE CODE La media della popolazione A è maggiore di quella della popolazione B H a : µ A >µ B TEST A UNA CODA La media della popolazione A è minore di quella della popolazione p B H a : µ A <µ B TEST A UNA CODA IPOTESI NULLA = H 0 La media delle due popolazioni è uguale H 0 : µ M = µ nm

16 Possibilities: Actual Situation H O is True H O is False Decision Reject H O Type I Error Correct decision II Do not reject H O Correct decision II Type II Error

17 Un esempio: il test t di Student per il confronto di due gruppi t = s p x A x B n n A B Effetto sistematico Variabilità casuale Se alcuni assunti sono verificati, possiamo calcolare s p come: s p = deva + dev n + n 2 A B B

18 Ignoriamo quale sia il valore effettivo del parametro =µ A µ B

19 Ignoriamo quale sia la variabilità σ A, σ B

20 Distribuzione t

21 Al crescere del numero dei casi la distribuzione t di Student tende a convergere con la distribuzione normale

22 Il valore p A differenza di alfa, il valore p dipende dai dati p corrisponde alla probabilità di osservare un valore sperimentale del test come quello osservato o più improbabile bil sotto l i ipotesi i nulla Quindi se l errore alfa è quello consueto, valori p<0.05 indicano un test significativo

23 Stimatore intervallare per (µ x -µ y ): Vl Valore t tabulare 1 1 ( x y) ± t α s + 2 ; 2 df p n x n y Errore standard della differenza tra le medie

24 Il test del chi-quadrato Si applica quando i dati in studio sono costituiti da frequenze o conteggi E un test non parametrico, non richiede l assunto della normalità

25 Variabile bl Risposta L1 Risposta L2 esplicativa* L1 f 11 f 12 R 1 L2 f 21 f 22 R 2 L3 f 31 f 32 R 3 L4 f 41 f 42 R 4 C 1 C 2 F Variabile di cui si vuole testare la relazione Totali marginali

26 I valori attesi H a µ Lj µ R H 0 µ R è indipendente dai livelli della variabile esplicativa Se H 0 è vera, allora i diversi i strati della variabile esplicativa differirebbero solo per effetto del caso. E la stessa distribuzione delle medie marginali è attesa sotto l ipotesi nulla entro ogni strato: e ij =R i *(C j / F)

27 Variabile Risposta L1 Risposta L2 esplicativa* L1 e 11 = R 1 *(C 1 / F) e 12 = R 1 *(C 2 / F) R 1 L2 e 21 e 22 R 2 L3 e 31 e 32 R 3 L4 e 41 e 42 = R 4 *(C 2 / F) R 4 C 1 C 2 F Mi aspetto la stessa quota (C 1 / F) entro ciascuna riga della Mi aspetto la stessa quota (C 1 / F) entro ciascuna riga della prima colonna e (C 2 / F) per la seconda colonna

28 Il valore sperimentale del chi-quadrato si calcola in base alla formula: cioè: ( f e ) 2 r c 2 ij ij Χ = e i= 1 j= 1 ij Effetto sistematico Variabilità casuale (Poisson) Χ 2 = (e f 11 ) /e 11 + (e 21 f 21 ) /e (e 42 f 42 ) 2 /e 42

29 La distribuzione chi-quadrato

30 Distribuzione chi Distribuzione chiquadrato

31 La formula per tabelle 2x2 e la correzione S di Yates A a b N A B c d N B N S N F N F

32 ANOVA Gruppo A Gruppo B Gruppo C X11 X12 X13 X21 X22 X23 X31 X32 X33 X41 X42 X43 Un generico elemento si indica come xij, dove i indica l elemento o la riga e j il gruppo o la colonna

33 ANOVA 2 Dev tot ( z k ( ) 2 x x ij = j= 1 i= 1 Dobbiamo suddividere l intera variabilità presente nei dati nelle due componenti che corrispondono all appartenenza ai gruppi e alla variabilità casuale

34 ANOVA 3 z k 2 = ( ) Dev x x entro j= 1 i= 1 La variabilità all interno di ciascun gruppo riflette la variabilità casuale Possiamo ricavare la Devianza tra gruppi come differenza tra la Devianza totale e quella entro gruppi ij j

35 La tabella ANOVA Fonti di variabilità Somma dei quadrati Gradi di libertà Totale N-1 Entro gruppi N-Z Tra gruppi Z-1 Medie dei quadrati Test F = Media dei quadrati tra gruppi / Media dei quadrati entro gruppi Confronto con F tabulare

36 Applicazione Studio trasversale dei volumi ecografici tiroidei nell eugubino

37 Obiettivo Studiare la distribuzione dei volumi tiroidei in una popolazione pp originariamente affetta da carenza di iodio recentemente sottoposta ad un intervento per la promozione dell uso di sale iodato Studiare la relazione tra volumi tiroidei e variabili come la familiarità, l uso riferito di sale iodato e la residenza in zona urbana (intervento+) o rurale (intervento-)

38 Journal of Endocrinological Investigation Vol. 29, November 2006 nr. 10 Evaluation of goiter using ultrasound criteria: A survey in a middle schoolchildren population of a mountain area in Central Italy C. Marino1, M. Martinelli2, G. Monacelli1, F. Stracci3, D. Stalteri4, V. Mastrandrea3, E. Puxeddu2, and F. Santeusanio2 1Centro Salute di Gubbio, U.S.L. no. 1 dell Umbria, Gubbio; 2Dipartimento di Medicina Interna; 3Dipartimenti di Specialità Medico Chirurgiche e Sanità Pubblica, Università degli Studi di Perugia, Perugia; 4Direzione Generale U.S.L. no. 1 dell Umbria, Città di Castello, Italy Iodine deficiency is still an important health care problem in the world. In Italy, as in most European countries, it is responsible for the development of mild to moderate endemic goiter. In 1995 we conducted a goiter survey vyin the Gubbio township, an area of Umbria region in Italy, close to the Appenine mountain chain. This study demonstrated a high prevalence of goiter in the middle schoolchildren population, indicating the presence of moderate endemic goiter. Soon after, a goiter prevention campaign aimed at implementing the consumption of iodinated salt was started. In 2001, a second survey was conducted in the middle schoolchildren hld (age yr old) of Gbb Gubbio and neighbour townships. Eight hundred d thirteen subjects were studied. Data obtained in 240 age-matched children, studied in the same area in 1995, were used for comparison to monitor changes 5 yr after the beginning of iodine prophylaxis. Thyroid volume was measured by ultrasonography. Gland volume was expressed in ml. A large population pp living in a iodine-sufficient area, previously reported by others, was used as control. Urinary iodine excretion was measured randomly in 20% of the children. The overall prevalence of goiter decreased between 1995 and 2001 from 29 to 8%. Goiter odds ratio (OR), corrected for age, was 4.0 (95% CI ) for 1995 compared to 2001 (p<0.000). Mean thyroid volume in the matched populations was 7.6±2.5 ml in 1995 and 5.7±2.1 ml in Mdi Median idi iodine urinary excretion increased from 72.6 to 93.5 microg/l, atthe limiti of statistical significance. Living in a rural area, no consumption of iodized salt and familiarity for goiter represented independent risk factors for goiter development. This study was the first conducted in Umbria region and confirmed that an implementation campaign for iodized salt consumption is a simple and useful instrument to prevent endemic goiter and related diseases. A new survey to evaluate goiter prevalence in the same area 10 yr after the beginning of iodine prophylaxis is already planned. (J. Endocrinol. Invest. 29: , 2006)

39 Ecco come appaiono le prime osservazioni nel nostro database

40 Std. Dev = 1.63 Mean = 5 0 N = volume tiroideo (ml) Distribuzione dei volumi tiroidei in un campione rappresentativo costituito da 323 individui di età compresa tra 11 e 14 anni con curva normale sovrapposta

41

42

43 Da un precedente studio apprendiamo che il volume tiroideo medio per una popolazione simile a quella in studio ma caratterizzata da un apporto adeguato di iodio è 5.19 ml (µ 0 ). La stima campionaria del parametro µ eu, volume tiroideo medio nell area precedentemente gozzigena, ottenuta nel nostro studio è m eu = 5.09 ml. Costruiamo un test t fissando il tasso di errore α=0.05.

44 H a : Il volume tiroideo nell area già ad endemia gozzigena è diverso rispetto all area di controllo H 0 : Il volume tiroideo medio è lo stesso nell area già ad endemia gozzigena e nell area di controllo o la differenza tra le medie dei volumi è pari a 0. Il valore sperimentale del test è x µ 0 x µ t = = = = s SE x n 307

45 t tabulare per 321 gl e α =0.05 è pari a 1.960; poiché <1.96 non abbiamo evidenza sufficiente per respingere l i lipotesi i nulla che il volume tiroideo id medio è lo stesso nelle due zone (test non significativo) alternativamente possiamo riportare il valore p = o 66.5% di osservare un risultato come quello attuale o più estremo sotto l assunto che l ipotesi nulla sia vera.

46 Alcuni problemi dei test di ipotesi Il test è incentrato sull ipotesi nulla e quindi non fornisce alcuna informazione sulla probabilità del risultato osservato. In altre parole il test non ci informa sulla probabilità bili che il parametro diff differenza tra volume medio della tiroide nelle due popolazioni sia pari a 0.4 ml rispetto ad altre differenze possibili come 0.1, 0.5 e così via. Il risultato del test tiene conto del valore osservato e di valori più estremi (non osservati) rispetto al valore di riferimento dell ipotesi nulla. Il risultato del test non fornisce alcuna informazione sulla entità dell effetto del fattore di confronto. Un test può risultare significativo solo per il gran numero di osservazioni (ad esempio per individui anziché 323, la stessa differenza di volume di soli 0.4 ml ha un p<0.0000). Quindi il test non ci consente di distinguere effetti rilevanti da effetti quantitativamente irrilevanti.

47 Area Controllo Studio Volume tiroideo medio (ml) Intervallo di confidenza al 95% costruito attorno alla media dei volumi tiroidei

48 Consideriamo ora il confronto tra volumi tiroidei per i residenti in aree urbane e i residenti in aree rurali Volume tiroide eo (ml) N= rurale urbana Residenza Scatola con baffi che illustra la distribuzione ib i dei volumi tiroidei id i in base alla residenza. La scatola è suddivisa dai tre quartili e i baffi contengono 15 1,5 volte lintervallo l i ll interquartile. il I punti rappresentano osservazioni i estreme o outliers.

49 Il volume tiroideo medio per i residenti in aree urbane è 4.8 (DS 1.5) con 187 gl, e, per i residenti in aree rurali, 5.4 (DS 1.8) con 134 gl. Il valore sperimentale del test t risulta pari a assumendo varianze eguali. Quindi per 321 gl e α=0.05, test a due code, il risultato è significativo p<0.05. Precisamente p =

50 Lo stimatore puntuale è: x rurale x urbano = 0.55 ml L intervallo di confidenza ad un livello ll arbitrariamente stabilito (convenzionalmente 95%)per il parametro di interesse, differenza tra le medie dei volumi tiroidei nei residenti urbani e rurali, si calcola come segue: I. calcolo di una stima congiunta della variabilità nei due gruppi: s = pool = 2 ( n 1) s + ( n 1) urbano urbano 187 * * n urbano rurale + n 2 rurale = s 2 rurale =

51 II. calcolo l l errore standard d del parametro: ES x urb x rur = s pool n 1 urbana + n 1 rurale = * = III. trovo il valore t tabulare per un errore 1-α/2 e 321 gl = 1.96 IV. calcolo il fattore di errore: FE = t [0.025, 321] * ES= =1.960*0.182= V il f di d l (0 6 l) V. sommo e sottraggo il fattore di errore dal parametro (0.6 ml) trovando un intervallo al 95% che va da 0.2 ml a 0.9 ml.

52 Alcuni vantaggi dell impiego degli stimatori intervallari L intervallo di confidenza conserva l informazione contenuta nel test di significatività: se l intervallo contiene il valore nullo del parametro, allora un test di ipotesi sarebbe risultato non significativo e viceversa. L intervallo di confidenza è espresso in ml come la differenza tra i volumi laddove il risultato del test non ha dimensione; questo ci consente di osservare che la differenza media in base ai dati è compatibile con una differenza molto piccola (0.2 ml) ma anche con una sensibile (0.9 ml). Quindi l intervallo di confidenza ci consente di valutare se la differenza osservata è biologicamente rilevante oltreché valutarne la significatività statistica. L attenzione non è incentrata sulla significatività statistica e ciò aiuta ad evitare di trarre conclusioni dicotomiche (positivo/negativo).

53 Sono possibili le seguenti situazioni: L intervallo di confidenza contiene il valore nullo ed entrambi gli estremi non sono clinicamente i rilevanti: lo studio esclude un effetto rilevante della variabile considerata (conclusiivo). L intervallo di confidenza contiene il valore nullo ma almeno un estremo include valori clinicamente importanti: i risultati dello studio non ci consentono di trarre conclusioni; si evidenzia l opportunità di ripetere lo studio con un campione di maggiori dimensioni. (non conclusiivo).. L intervallo di confidenza non include il valore nullo del parametro ma l estremo superiore non include effetti clinicamente importanti: sebbene statisticamente significativo, lo studio esclude un effetto rilevante del fattore in studio (non conclusiivo).. L intervallo di confidenza non include il valore nullo del parametro e gli effetti compatibili con i risultati (valori interni all intervallo) sono rilevanti: lo studio indica un effetto importante del fattore in studio (conclusiivo)..

54 Consideriamo la prevalenza di gozzo registrata nello studio p gozzo =8/323=2.48 Possiamo ricavare un intervallo di confidenza per questa proporzione utilizzando l approssimazione normale. Nella formula per l errore standard sostituiamo la varianza binomiale p(1-p): ES = p (1 n p ) = ( ) 323 = L intervallo approssimato al 95% va da *0.0086=0.008 a , cioè da circa 0.8% a 4,2%. Per campioni piccoli e per valori p lontani da 0.5, come in questo caso, l approssimazione normale non è accurata ed è preferibile utilizzare metodi cosiddetti esatti (utilizzando l intervallo di Fisher da 1.1% a 4.8%).

55 Gozzo Tiroidi normali e patologiche Residenza Urbana Rurale Totale Presente Assente Totale Test di indipendenza. Chi quadrato p Chi-quadrato correzione di Yates p Esatto di Fisher 0.022

56 In termini di Rischio relativo Al denominatore abbiamo gli individui id i presenti e non gli anni-persona P(gozzo residenza rurale)=r rur = casi rur / n rur = =7/135 = R urb = 1/188 = Il rapporto tra i rischi esprime quante volte sia più probabile essere affetto da gozzo per uno studente residente in area rurale rispetto all area area urbana RR = R rur / R urb = / = 9.75

57 Residenza Gozzo Presente Assente Rurale a b Urbana c d In termini di Odds Ratio Gli odds sono i rapporti tra una proporzione p e il suo complemento a 1 (1-p). Per i rurales: Odds rur = p gozzo rur /1- p gozzo rur = a/c=7/128= l odds di gozzo tra i residenti rurali è 1 a 18 Un analogo calcolo per i residenti urbani fornisce Odds urb = Il rapporto tra gli odds è Odds rur /Odds urb =0.055/0.0054=10.23 OR è una misura di effetto, di associazione autonoma e uno stimatore del RR la cui validità dipende dalla rarità dell e evento ento in studio

58 Rischio relativo Odds ratio

59 Intervalli di confidenza per RR Calcoliamo l errore standard per il rischio relativo per il logaritmo ln(rr)=2.28 per rendere maggiormente simmetrica la distribuzione: ES ln( RR) c d a n + b n = = urb L intervallo consueto al 95% si ottiene esponenziando gli estremi: rur ( ) IC inf = exp = 1.21 L intervallo al 95% va da 1.2 a Utilizzando una formula alternativa basata sul chi-quadrato otteniamo un intervallo da 1.8 a 57.1

60 Intervalli di confidenza per OR Anche per OR è preferibile calcolare l un intervallo su scala logaritmica, ln(or)=2.325: ES ln( OR) a + b + c + d = = Come per RR è necessario esponenziare gli estremi dell intervallo IC inf =exp[2.325-(1.96*1.075)]= e IC sup =exp[2.325+(1.96*1.075)]=84.13 Quindi l intervallo ll di confidenza al 95% per OR va da 1.2 a 84.1 Per questo evento raro i due intervalli (OR e RR) sono in buon accordo

61

62 re] p[goit Iodized salt use never sometimes always Residence urban rural urban rural Familiarity no no yes yes

63

64 3. Statistical analysis Statistiche i descrittive i e intervallo di confidenza Test statistici Misure epidemiologiche Test diagnostici i Regressione lineare Analisi di sopravvivenza Modelli per dati longitudinali Dati mancanti Regressione logistica Riduzione i dei dati Modelli gerarchici

65 IC esatto per SIR/SMR Assumo distribuzione di Poisson Trovo i limiti inferiore I e superiore S per i casi C o i decessi D osservati Calcolo l i rapporti I/E e S/E dove E sono i casi o i decessi attesi

66 Obiettivi del corso Convenire una base di conoscenze omogenea per la formazione di un gruppo di professionisti che a vario titolo contribuirà allo sviluppo dell epidemiologia regionale Individuare bisogni formativi specifici da soddisfare Verificare gli interessi attuali in campo epidemiologico- statistico e prospettare strategie

67 Misure di frequenza Proporzioni i (proportion): frazioni i in cui il numeratore è contenuto nel denominatore Rapporti (ratio): frazioni in cui il numeratore non è contenuto nel denominatore Tassi (rate): velocità di comparsa di un fenomeno in un tempo determinato che si misura come rapporto tra numero di eventi e anni persona di esposizione

68 Intervalli di confidenza per RR Calcoliamo l errore standard per il rischio relativo per il logaritmo ln(rr)=2.28 per rendere maggiormente simmetrica la distribuzione: ES ln( RR) c d ln ln a n + b n = = urb L intervallo consueto al 95% si ottiene esponenziando gli estremi: rur ( ) IC inf = exp = 8.7 L intervallo al 95% va da 8.7 a 11.0

69 Intervalli di confidenza per OR Anche per OR è preferibile calcolare l un intervallo su scala logaritmica, ln(or)=2.325: ES ln( OR) ln ln a + b + c + d = = Come per RR è necessario esponenziare gli estremi dell intervallo IC inf =exp[2.325-(1.96*0.072)]= )] 9 e IC sup =exp[2.325+(1.96*0.072)]=11.8 Quindi l intervallo ll di confidenza al 95% per OR va da 8.9 a 11.8 Per questo evento raro i due intervalli (OR e RR) sono in buon accordo

70 La prevalenza (unità sperimentali che hanno una caratteristica sul totale delle unità esaminate) è una proporzione

71 Misure di associazione Rischio relativo (Risk ratio or Relative risk) Rapporto tra odds (Odds ratio). Differenza tra rischi Rischio attribuibile e rischio attribuibile di popolazione

72