RCT sperimentazione clinica controllata

RCT Sperimentazione clinica controllata Sperimentazione: studio longitudinale in cui si valuta un intervento di cui non si conosce l esito (altrimenti inutile e non etico ma da cui ci si aspetta risultati clinicamente rilevanti Clinica: l obiettivo primario è valutare l efficacia clinica

Efficacia clinica (primario) Efficacia farmacologica (secondario) capacità di modificare la storia naturale della malattia capacità di influenzare parametri clinici, sierologici etc. Hard: di oggettiva valutazione Soft: di soggettiva valutazione

Controllata: è importante simultaneo un gruppo di controllo in parallelo - il saggio statistico dell ipotesi richiede un elemento di riferimento - deve essere evitata la distorsione da confronto inadeguato - permette la valutazione di differenze piccole ma clinicamente rilevanti

POPOLAZIONE CAMPIONE Trattamento sperimentale Trattamento standard N. Eventi N. Eventi Risultati discordanti tra studi possono dipendere da: - Distorsione provocata da errori sistematici - Distribuzione che i risultati possono avere intorno al valore vero la deviazione dipende dalla precisione delle stime (variabilità casuale )

Errore Sistematico Deriva da fonte esterna (introdotta anche se non voluta dal ricercatore), porta a distorsione sistematica delle informazioni. Si verificano in fase di progettazione ed esecuzione dello studio. I risultati ottenuti sono difficilmente correggibili attraverso più o meno sofisticate elaborazioni statistiche. Attiene alla non comparabilità dei gruppi in studio per motivi relativi a: - popolazioni - interventi - osservazioni

Non comparabilità delle popolazioni Selection Bias Due gruppi a confronto dovrebbero avere un identico outcome in assenza del farmaco che si sta studiando. Contromisura: il bilanciamento dei fattori prognostici (capaci di influenzare il decorso della malattia indipendentemente dal trattamento) conosciuti e non, nei due gruppi è assicurato (ma vale la pena controllare) dalla randomizzazione.

Manuale metodologico NICE - 2009

Non comparabilità degli interventi Performance Bias Tutte le condizioni di contorno e i trattamenti accessori alla sperimentazione devono essere identiche nei due gruppi. Contromisura: l uso del placebo e il blinding (cecità dello sperimentatore, del paziente)

Non comparabilità delle osservazioni Detection Bias La conoscenza del tipo di trattamento da parte di chi assume o somministra il farmaco può influenzare il paziente che riferisce la manifestazione clinica o il ricercatore che registra le misure di esito. Possono condizionare comportamenti, stili di vita etc. Contromisura: blinding (cieco, doppio cieco etc. di colui il quale assegna l outcome, di colui il quale analizza i dati).

Non comparabilità delle perdite al follow up Attrition Bias Fattori associati all efficacia, alla sicurezza e alla tollerabilità di un trattamento possono condizionarne l adesione; perdite selettive modificano la distribuzione dei fattori prognostici. Contromisura: analisi di tutti i soggetti randomizzati (intention to treat)

Haderslev KV, Tjellesen L, Sorensen HA, Staun M. Alendronate increases lumbar spine bone mineral density in patients with Crohn s disease. Gastroenterology. 2000;119:639-46. One patient in the alendronate group was lost to follow up; thus data from 31 patients were available for the intention-to-treat analysis. Five patients were considered protocol violators... consequently 26 patients remained for the per-protocol analyses.

Errore Casuale Errore non eliminabile che ridimensiona le nostre certezze. Ci obbliga ad esprimerci in termini di probabilità e a misurare il nostro livello di precisione. L idea chiave su cui si basa l analisi statistica degli studi clinici è che si possono eseguire osservazioni su un campione di soggetti e poi compiere inferenze sulla popolazione da cui il campione è stato tratto. L inferenza implica la ineliminabilità dell errore

Significatività statistica e dimensione del campione Negli studi campionari tutte le differenze possono essere il risultato del caso: le distribuzioni campionarie di studi di una data dimensione individuano il valore di probabilità del 5% sotto il quale si assume convenzionalmente il rischio di attribuire le differenze al trattamento; un livello di probabilità sopra il 5% non mi consente di attribuire le differenze al trattamento. Più le differenze sono grandi meno è probabile che siano casuali Più i campioni sono piccoli più è probabile avere grandi differenze per caso Più i campioni sono grandi più è probabile che differenze piccole e irrilevanti siano statisticamente significative

Specificare l ipotesi alternativa: Inferenza Il farmaco A è più efficace del farmaco B nel ridurre la glicemia Specificare l ipotesi nulla: Definisco il risultato che falsifica l ipotesi alternativa (il farmaco A non è più efficace del farmaco B nel ridurre la glicemia) Definire le regole dell inferenza: Fisso il limite oltre il quale la verità dell ipotesi nulla è da considerarsi improbabile (5% è la misura più frequentemente utilizzata)

trattati con farmaco A trattati con farmaco B 110 110 120 130 Glicemia Randomizzazione Farmaco A Glicemia media Farmaco B Glicemia media 130 125 120 115

Tipi di errore Ipotesi alternativa: Il farmaco A è più efficace del farmaco B nel ridurre la glicemia Ipotesi nulla: Il farmaco A non è più efficace del farmaco B nel ridurre la glicemia Realtà Ipotesi nulla (A = B) Falsa Vera Studio campionario Ipotesi nulla (A = B) Falsa Vera errore β errore α

Significatività statistica e dimensione del campione RCT 100 soggetti 50 15 eventi p 0.3 50 10 eventi RR 0.67 (0.33 1.34) RCT 200 soggetti 100 30 eventi p 0.1 100 20 eventi RR 0.67 (0.41 1.09) RCT 400 soggetti 200 60 eventi p 0.02 200 40 eventi RR 0.67 (0.47 0.94)

Abuso del test di ipotesi Il limite del 5% è convenzionale (scegliere il limite più ragionevole). La dicotomizzazione di un risultato in due esiti alternativi S/NS non esprime la realtà dei risultati. Due studi identici con un p di 0.045 e 0.052, forniscono elementi per prendere decisioni alternative? I risultati sono praticamente uguali. L uso esclusivo del p tende ad enfatizzare il significato e soprattutto ad equipararla pericolosamente all importanza clinica o alla rilevanza biologica. In realtà un ricercatore/lettore è interessato alla grandezza delle differenze tra i trattamenti e alla precisione di questa stima.

Uso degli Intervalli di Confidenza - I.C. L intervallo di confidenza esprime (con una probabilità del 90-95-99%) il range dei valori entro il quale è compreso il valore vero Vantaggi degli I.C. Permettono di valutare: - entità della grandezza della differenza (stima puntuale) -il livello di precisione (range dei valori) all interno del range dei valori la stima puntuale ha la maggiore probabilità di essere il valore vero

Esempio Trattamento A = 100 pazienti; PA media 146.4 mmhg Trattamento B = 100 pazienti; PA media 140.4 mmhg Differenza = 6 mmhg (1.1 10.9) Trattamento A = 50 pazienti; PA media 146.4 mmhg Trattamento B = 50 pazienti; PA media 140.4 mmhg Differenza = 6 mmhg (- 1.0 13.9)

Presentazione dei risultati Misure: relative R.R. (cambiamento del rischio/protezione nel gruppo esposti rispetto al gruppo dei controlli). assolute R.A. (numero assoluto di eventi causati/evitati nel gruppo esposti rispetto al gruppo dei controlli).

Esempio n eventi rischio nel periodo (5 anni) Trattati 15000 1800 1800/15000=0.12 Controlli 15000 3000 3000/15000=0.20 RR RA 0.12/0.20=0.60 0.20-0.12=0.08 R.R. = 0.60 1-R.R = 1-0.60 = 0.40 Il trattamento riduce del 40% il rischio nei soggetti trattati per 5 anni. R.A. = 0.08 Il trattamento evita 8 eventi a 100 persone trattate per 5 anni. NNT (informazione di immediata comprensione clinica) 1/0.08 = 13 occorrono 13 trattamenti per 5 anni per evitare un evento.

Esempio (pazienti meno gravi) n eventi rischio nel periodo (5 anni) Trattati 15000 135 135/15000=0.009 Controlli 15000 225 225/15000=0.015 RR 0.009/0.015 =0.6 RA 0.015-0.009 =0.006 R.R. = 0.60 1-R.R = 1-0.60 = 0.40 (Il rischio relativo è uguale) Il trattamento riduce del 40% il rischio nei soggetti trattati per 5 anni. RA = 0.006 Il trattamento evita 6 eventi a 1000 (mille) persone trattate per 5 anni. NNT = 1/0.006 = 167 occorrono 167 trattamenti per 5 anni per evitare un evento.

Il Rischio Relativo (RR) non è influenzato dalla grandezza assoluta dei fenomeni. RR = Id esposti = 0.002 / Id non esposti = 0.001 = 0.002 / 0.001 = 2 RR = Id esposti = 0.2 / Id non esposti = 0.1 = 0.2 / 0.1 = 2 Il RR esprime la forza dell associazione, indipendentemente dalla frequenza della malattia, è utile in contesti sperimentali RA = Id esposti = 0.002 - Id non esposti = 0.001 = 0.002-0.001 = 0.001 RA = Id esposti = 0.2 - Id non esposti = 0.1 = 0.2-0.1 = 0.1 Il RA incorpora l informazione sulla frequenza della malattia, è utile in contesti di sanità pubblica

Randomizzazione Allocazione random significa che un paziente ha la stessa probabilità di avere uno dei trattamenti, ma il tipo di trattamento non può essere previsto. Come randomizzare: - Randomizzazione semplice - Randomizzazione a blocchi (per avere un bilanciamento progressivo dei gruppi a confronto) - Randomizzazione stratificata (per ridurre il rischio di sbilanciamento per fattori prognostici)

Randomizzazione Perché nascondere l allocazione al trattamento Ridurre il rischio che i ricercatori possono essere influenzati dalla conoscenza del trattamento in modo conscio o inconscio nel determinare: l eleggibilità la partecipazione la comunicazione al paziente l allocazione La conoscenza del trattamento prima dell allocazione tende a sovrastimare l effetto del trattamento.

Randomizzazione Come nascondere l allocazione al trattamento Metodo di scelta: chi genera l allocazione è diverso da chi determina l eleggibilità e l adesione al trial (meglio se esterno al trial) es. sistema centralizzato telefonico Metodo alternativo: buste sigillate e con numerazione progressiva

Analisi Intention to treat Una strategia che confronta i pazienti nei gruppi in cui sono stati assegnati in origine dalla randomizzazione indipendentemente da quello che succede dopo l allocazione: evidenza di false inclusioni non compliance deviazioni dal protocollo co-interventi perdite al follow-up

Analisi Obiettivi principali dell analisi intention to treat proteggere la validità interna (la randomizzazione) proteggere la validità esterna (avvicinare la valutazione dell efficacia a quello che di fatto avviene nella pratica)

Analisi Sbilanciamenti delle caratteristiche dei pazienti tra i gruppi dopo la randomizzazione (chance bias) Strategie: definire in anticipo (in fase di disegno) i fattori che sappiamo influenzano l esito valutare l effetto indipendente della caratteristica sull esito aggiustare

Analisi Analisi per sottogruppi Sono condotte per valutare l effetto di un trattamento in gruppi di pazienti individuati in base alla presenza di una specifica caratteristica Servono a indagare la consistenza dei risultati in sottogruppi della popolazione individuati in base alla presenza di specifiche caratteristiche

Analisi Analisi per sottogruppi L analisi per sottogruppi aumenta la probabilità di risultati falsamente positivi quindi Tali analisi devono essere numericamente contenute Devono essere pre-specificate nel protocollo dello studio Wang R, et al., NEJM, 2007

Casi particolari - Cluster RCT - RCT pragmatici - RCT di non inferiorità

Cluster RCT The CONSORT statement focused on reporting parallel group randomised trials in which individual participants are randomly assigned to study groups. randomly assign groups of individuals (such as families or medical practices) rather than individuals. I cluster RCT sono più complessi nel disegno, richiedono una maggiore dimensione del campione (per ottenere una stessa potenza statistica) e richiedono una analisi più complessa.

Cluster RCT Esempi di cluster: pazienti di MMG, famiglie, classi scolastiche, ecc. Le osservazioni fatte sui membri di ciascun cluster tendono a somigliarsi (correlare), quindi la dimensione effettiva del campione è inferiore a quella ottenibile mediante la randomizzazione di singoli individui Questo inconveniente ha una dimensione che dipende dalla dimensione dei cluster e dal grado di somiglianza tra i membri del cluster (coefficiente di correlazione intraclassi o intracluster) BMJ 2004;328;702-708

Nessun follow up dedicato, ma uso di database, registri, ecc RCT pragmatici Le procedure su come utilizzare il trattamento sperimentale sono altamente flessibili e affidate agli erogatori Outcome clinicamente rilevante e senza centralizzazione della misura Criteri di elegibilità ampi, senza selezioni per rischio, comorbidità, ecc Nessuna strategia per il miglioramento della compliance

RCT di non inferiorità Poiché la prova di uguaglianza perfetta non è possibile, per gli RCT di non inferiorità, è pre-fissato un margine di non inferiorità per l effetto del trattamento sull outcome primario. Gli studi di equivalenza sono simili eccetto per il fatto che il margine di equivalenza è fissato tra e +

RCT di non inferiorità JAMA. 2006;295:1152-1160

Studi sequenziali Possibili se: outcome a breve termine; alta efficacia attesa; necessità di minimizzare le dimensioni campionarie I disegni sequenziali prevedono un analisi dati in continuo, cioè dopo ogni paziente trattato si testa il raggiungimento della dimostrazione di efficacia (o di non efficacia). L analisi in continuo richiede che la verifica dell outcome sia possibile dopo brevi periodi di follow up. Il vantaggio di questi disegni sta nel poter dimostrare l ipotesi alternativa con una dimensione campionaria ridotta rispetto agli studi con disegno classico. I problemi relativi alla moltiplicazione degli errori alfa e beta connessi ai test multipli, sono risolti distribuendo le probabilità nel corso del tempo in modo da non superare i valori ammessi (usualmente alfa=0.05 e beta=0.20).

Triangular Test

Spending function

Efficacia della ketamina nello stato di male epilettico convulsivo refrattario in età pediatrica: uno studio multicentrico, randomizzato, controllato, in aperto, no profit, con disegno sequenziale. Dimensioni del campione ed analisi statistica: Assumendo una potenza (1-beta) pari all 80%, un errore alfa del 5% (due code) si riportano qui di seguito le numerosità campionarie attese secondo il disegno sequenziale con test triangolare, confrontate con quelle previste ipotizzando un disegno standard (non sequenziale): % Successi braccio intervento % Successi braccio controllo Trial fisso (N atteso di pazienti) Trial sequenziale (N atteso di pazienti) massimo medio mediano 90 centile 90 60 52,17 80,58 35,00 33,43 54,19 85 60 89,15 137,70 59,64 57,14 92,61 80 60 155,40 240,10 103,80 99,62 161,50 75 60 297,90 460,20 198,70 190,90 309,50