Master in Evidence Based Practice e Metodologia della Ricerca clinico-assistenziale assistenziale Gestione ed Analisi Statistica dei dati Daniela Fortuna 12 giugno 2014
TEST di ipotesi Finora abbiamo visto come l uso l degli intervalli di confidenza permettono di estendere i risultati di un campione alla popolazione di riferimento. Il passo successivo nell analisi statistica è mettere a confronto due o più gruppi, oppure mettere a confronto un risultato ottenuto dal campione e un valore atteso.
TEST di IPOTESI: Significatività Statistica Si mettono a confronto due misure, allo scopo di verificare se la loro differenza è probabilmente dovuta al caso oppure no. Se la differenza NON è CASUALE cioè non è dovuta al caso, si dice che è «statisticamente significativa». La metodologia utilizzata è quella del Test di ipotesi
TEST di ipotesi TEST significa prova, verifica, accertamento Tutti i Test (test di gravidanza, test elettorale, test di ammissione, test statistico, ecc.) si basano sulla verifica di una certa condizione ipotizzata. La verifica non avviene mai in modo diretto ma attraverso la valutazione di fenomeni strettamente correlati.
TEST di ipotesi Quindi l'esito del test Statistico non da certezza, ma solo una fiducia valutabile in termini di probabilità. In statistica la verifica si effettua mediante dati campionari e poiché manca l evidenza diretta, non avremo certezza ma solo una fiducia più o meno grande nel fatto che la condizione esista.
EPIDEMIOLOGIA: il TEST diagnostico Risultato di un test Positivo Negativo Condizione Clinica ignota Sano falso positivo vero negativo Malato vero positivo falso negativo sensibilità del test la frequenza di risultati veri-positivi specificità del test la frequenza di veri-negativi α la frequenza di falsi-positivi (errore del 1 tipo) β la frequenza di falsi-negativi (errore del 2 tipo)
EPIDEMIOLOGIA: il TEST diagnostico Sensibilità e β sono complementari cioè veri-positivi e falsi-negativi sono complementari. Infatti se un test è sempre giustamente positivo (100% di veri-positivi) non segnalerà mai negatività per errore (0% di falsi negativi). Specificità e α sono complementari cioè veri-negativi e falsi-positivi sono complementari. Infatti se un test è specifico con il 100% di veri-negativi non segnalerà mai positività per errore (0% di falsi-positivi). Quindi dire che un test è specifico è come dire che ha una bassa probabilità di falsi positivi, cioè che α è piccolo
EPIDEMIOLOGIA: il TEST diagnostico In sintesi Condizione Clinica reale ignota H0: Sano H1: Malato Positivo falsi positivi errore α (di 1 tipo) veri positivi Sensibilità Risultato del test Negativo veri negativi Specificità falsi negativi errore β (di 2 tipo) Un test per essere affidabile deve possedere sia un'alta specificità che un'alta sensibilità.
STATISTICA: il TEST d ipotesi Lo schema del test statistico è simile a quello del test diagnostico ma ha la peculiarità di privilegiare l evidenza dei falsi-positivi rispetto ai falsi-negativi L ipotesi di partenza è l ipotesi nulla H0 (cioè l ipotesi dello scettico) quella che nega il risultato, attribuendo le differenze osservate alla naturale variabilità dei fenomeni o al campionamento.
STATISTICA: il TEST d ipotesi Ipotesi nulla H0: le differenze osservate sono dovute al caso l'ipotesi nulla viene mantenuta fino a che le prove o i dati in nostro possesso non siano tali da costringerci a rifiutarla Concediamo quindi fiducia all ipotesi nulla, rifiutandola solo quando l'evidenza dei risultati sia macroscopica, cioè quando la probabilità di falsi-positivi α sia minore del 5%.
Risultato del TEST statistico Il risultato di un test statistico è α ovvero il p-value Ipotesi nulla Condizione reale ignota H0 H1 Risultato del test statistico se α<5% H0 rifiutata se α>=5% H0 accettata Dato significativo Dato non significativo falsi positivi errore di 1 tipo valutato con α veri positivi nessun errore veri negativi nessun errore falsi negativi errore di 2 tipo valutato con β Ipotesi alternativa
TEST di ipotesi Ad esempio : Da un indagine campionaria su 50 soggetti, si è rilevato un tasso di colesterolemia medio pari a 270 mg/dl e deviazione standard =79, sapendo che il tasso medio in soggetti normali è 210 mg/dl vogliamo verificare se questa differenza è dovuta al caso oppure no
IPOTESI NULLA H 0 Per verificare se la colesterolemia media rilevata nel campione, 270 mg/dl sia significativamente diversa dal valore normale 210 mg/dl, si parte dall ipotesi che i due valori medi siano uguali e che la loro differenza è semplicemente dovuta al caso, cioè all errore casuale. Questa ipotesi di partenza viene chiamata IPOTESI NULLA e viene indicata come H 0 quindi: IPOTESI NULLA H 0 I due valori sono uguali e la loro differenza è dovuta al caso
Il test d ipotesi quindi consiste nel dimostrare se H0 èvera Si considera una distribuzione teorica di probabilità e si verifica se la media campionaria è all interno dell intervallo a cui corrisponde il 95% di probabilità oppure è fuori da questo intervallo Regione di Regione di Regione di accettazione rifiuto di H0 rifiuto di H0 Regione di di H0 Regione di Regione di rifiuto di H rifiuto di H 0 accettazione 0 di H 0? 210 270 270 Media normale Media campionaria
La logica del TEST di IPOTESI IPOTESI NULLA H 0 Non c èc nessuna differenza, ovvero la differenza osservata è dovuta al caso Accetto o rifiuto l ipotesi l nulla? Per rispondere effettuo un TEST DI IPOTESI
Errore di 1 tipo: livello di significatività di un test statistico Il livello di significatività di un test statistico è α la probabilità di commettere un errore di 1 tipo ovvero è la probabilità di rifiutare l ipotesi nulla, quando questa è vera Livello di significatività α = P(errore di 1 tipo ) = P(rifiutare H 0 quando H 0 è vera)
Errore di 1 tipo: livello di significatività di un test statistico Il livello di significatività 5% viene adottato molto frequentemente in quanto si ritiene che il rapporto 1/20 (cioè 0.05) sia sufficientemente piccolo da poter concludere che sia piuttosto improbabile che la differenza osservata sia dovuta al semplice caso Ovviamente, se si vuole escludere con maggiore probabilità l'effetto del caso, si adotterà un livello di significatività inferiore (es. 1% )
Test d ipotesi tra 2 medie Per effettuare il test utilizzo una formula chiamata Statistica Test. Nel caso del confronto tra 2 medie la statistica test è la t di Student definita come: t = m 1 m 2 ES Dove m 1 ed m 2 sono le due medie a confronto ES è l Errore Standard calcolato come deviazione standard divisa la radice della numerosità campionaria: : DS/ n
TEST di IPOTESI tra 2 medie: test t di Student confronto tra una media campionaria e una media attesa Esempio Da un indagine campionaria su 50 soggetti, si è rilevato un tasso di colesterolemia medio pari a 270 mg/dl e deviazione standard =79, sapendo che il tasso medio in soggetti normali è 210mg/dl vogliamo verificare se questa differenza è dovuta al caso oppure no t = Gradi di libertà: n-1=50-1=49 Significatività m 1 m 2 ES Valore critico t di student per 49 gradi di liberà 90% 1.299 95% 1.676 97.5% 2.009 99% 2.403 99.5% 2.678 99.75% 2.937 99.9% 3.261 99.95% 3.496 (270-210) = 79/ 50 = 60 7,1 = 8,45 Rifiuto l ipotesi l nulla H 0 : La differenza è statisticamente significatica -1.7 1.7 8,45 ALMA MATER STUDIORUM Università di Bologna
In sintesi il risultato del Test di ipotesi va confrontato con un VALORE CRITICO tabulato in apposite tabelle già definite, che riportano i valori della distribuzione di probabilità per diversi livelli di significatività α e gradi di libertà Se il risultato del test di ipotesi SUPERA il valore critico,, allora la differenza fra i gruppi viene dichiarata statisticamente significativa e, quindi, l'ipotesi NULLA viene RESPINTA. Se il risultato del test di ipotesi È INFERIORE al valore critico,, allora la differenza fra i gruppi viene dichiarata statisticamente NON significativa e, quindi, l'ipotesi NULLA viene ACCETTATA.
Ma cosa sono i gradi di libertà? i gradi di libertà rappresentano il numero di possibilità che i dati che compongono un campione hanno di variare liberamente. In generale si calcolano togliendo dal numero delle unità del campione il numero delle condizioni cui essi sono vincolati. Nel nostro esempio abbiamo 50 valori di colesterolemia, ciascuno dei quali può assumere un valore qualsiasi ed un vincolo, la media deve essere 270, io posso assegnare un valore qualsiasi ai primi 50-1 =49 numeri, ma l'ultimo sarà vincolato dal fatto che la media deve essere 270, quindi in questo caso, i gradi di libertà sono 50-1=49.
La t di Student e i gradi di libertà La distribuzione della t di Student cambia al variare dei gradi di libertà: all aumentare dei gradi di libertà la curva diventa più stretta e più alta!. Per questo motivo quando applichiamo il test t di Student, per trovare il valore critico con cui confrontare il valore della statica test abbiamo bisogno di calcolare i gradi di libertà. Esistono quindi tanti valori critici a seconda dei gradi di libertà
TEST di IPOTESI :test t di Student confronto tra 2 medie campionarie Es. Sono stati rilevati i tempi di ventilazione meccanica, espressi in ore, in due Terapie Intensive post-chirurgiche e si vuole valutare se differiscono in modo significativo. TI a: 5 7 9 7 5 15 6 8 4 7 4 5 5 TI b: 11 10 8 0 17 4 0 22 6 24 0 m a =6,7 e m b =9,3 n a =13 e n b =11 s=5,76 Applicando questa formula Gradi di libertà:(n a -1 )+ (n b -1)=22 Risulta: t=1,09 e confrontando questo valore con quello critico della t di Student corrispondente a 22 gradi di libertà che è 2,07 possiamo dire che la differenza NON è statisticamente significativa con p=0.14 ALMA MATER STUDIORUM Università di Bologna
TEST di IPOTESI :test t di Student confronto tra 2 medie campionarie Il valore della statistica test t di Student è inferiore al valore critico quindi: L ipotesi nulla viene accettata. Questo significa che la differenza nei tempi medi di ventilazione meccanica rilevati nelle due Terapie Intensive è dovuta al caso Risulta: t=1,09 e confrontando questo valore con quello critico della t di Student corrispondente a 22 gradi di libertà che è 2,07 possiamo dire che la differenza NON è statisticamente significativa con p=0.14-2,07 1,09 2,07
Sintesi TEST di IPOTESI IPOTESI NULLA H 0 La differenza è dovuta al caso Accetto o rifiuto l ipotesi l nulla? Per rispondere effettuo un TEST DI IPOTESI Confronto il valore ottenuto dal TEST con dei valori critici già calcolati su apposite tabelle Ipotesi nulla RIFIUTATA differenza significativa Valore del test maggiore Valore critico Valore del test minore Valore critico Ipotesi nulla ACCETTATA differenza NON significativa
Test t di student con SPSS SPSS Click Analizza Confronta medie Test t campioni indipendenti
TEST di IPOTESI :test Chi-quadrato Esempio: Si vuole verificare l efficacia di due diversi farmaci: le differenze sono statisticamente significative, ad un livello di significatività α del 5%? guariti non guariti totali farmaco 1 52 10 62 farmaco2 40 21 61 totali 92 31 123 guariti (farmaco1)=52/62=84% guariti (farmaco2)= 40/61=66% Totale guariti=92/123=74,8% IPOTESI NULLA H 0 : la differenza delle % di guariti è dovuta al CASO, I due farmaci sono ugualmente efficaci Ipotesi Nulla Dati attesi percentuale di guariti del 74,8% per entrambi i farmaci guariti non guariti totali farmaco 1 46 16 62 farmaco2 46 15 61 totali 92 31 123
TEST di IPOTESI :test Chi-quadrato Esempio: Si vuole verificare l efficacia di due diversi farmaci: le differenze sono statisticamente significative, ad un livello di significatività α del 5%? Dati campionari rilevati guariti non guariti totali farmaco 1 52 10 62 farmaco2 40 21 61 totali 92 31 123 Dati attesi sotto l ipotesi nulla guariti non guariti totali farmaco 1 46 16 62 farmaco2 46 15 61 totali 92 31 123 Per ciascuna combinazione farmaco guariti si calcola
TEST di IPOTESI :test Chi-quadrato Ora, confrontando il nostro valore (5.46) con quelli tabulati, notiamo che esso è >3.841 e <6.635. Ciò consente di ritenere che la differenza fra i due gruppi sia significativa al livello di significatività α 5% ma non al livello di significatività 1%. Nel nostro caso, il valore ottenuto è un chiquadrato con «1 grado di libertà»; infatti, per tabelle come quella che stiamo studiando, il grado di libertà è uguale a (numero di righe-1)x(numero di colonne-1).
Osservazioni Nell esempio precedente è stato scelto un livello di significatività α del 5%, cioè si è scelto che il rischio massimo accettabile, di commettere l errore rifiutando l ipotesi nulla, quando questa è vera, è il 5%. la probabilità corrispondente al valore del chi-quadrato 5.46, in corrispondenza di 1 grado di libertà è 0.019 e questo valore prende il nome di p-value. Quindi il p-value della differenza di efficacia dei nostri due farmaci messi a confronto è: p=0.019 che è minore di α=0.05 In sintesi: il p-value p=0.019 minore di 0.05 (del 5%) significa che la probabilità che la differenza riscontrata sia dovuta al caso è minore del 5% ovvero la probabilità che la differenza sia statisticamente significativa è del 95%. Se avessimo scelto un livello di significatività inferiore, ad esempio dell 1% non avremmo riscontrato alcuna differenza significativa nell efficacia dei due farmaci messi a confronto.
IL CHI_QUADRATO e i GRADI DI LIBERTA Anche il chi-quadrato come la t di Student varia al variare dei gradi di libertà. All aumentare dei gradi di libertà la curva diventa più bassa e più larga!
Test CHI-QUADRATO con SPSS SPSS Click Analizza Statistiche descrittive Tavole di contingenza Statistiche click Chi-quadrato
Studio di efficacia: ODDS RATIO Negli studi di efficacia di un trattamento spesso è necessario mettere a confronto gli esiti del gruppo di trattamento con quelli del gruppo di controllo espressi come ODDS Ratio. In questo caso il test di ipotesi deve verificare se l ODDS RATIO è significativamente diverso da 1 Esempio: studio di efficacia di un nuovo trattamento per la prevenzione delle lesioni da pressione Odds Ratio LDP Sì No Trattati 19 121 Controlli 17 115 OR=(19/121)/(17/115)=0,157/0,148=1,06
TEST per verificare la significatività degli ODDS RATIO Il test d ipotesi utilizzato per verificare se un odds ratio è significativamente diverso da 1 e con quale probabilità (p-value) è il test di Cochran Mantel- Heanszel, che è una variante del test chi-quadrato SPSS Click Analizza Statistiche descrittive Tavole di contingenza Statistiche click Chi-quadrato click Statistiche di Cochran e Mantel-Heanszel
TEST per verificare la significatività degli ODDS RATIO OUTPUT di SPSS Stima di Mantel-Haenszel del rapporto odds comune Stima 1,062 ln(stima),060 Errore standard di ln(stima),358 Significatività asintotica (2 sensi),866 Intervallo di confidenza al 95% asintotico Rapporto odds comune ln(rapporto odds comune) Limite inferiore Limite superiore Limite inferiore Limite superiore La stima di Mantel-Haenszel del rapporto odds comune viene distribuita in modo asintotico e normale in base al rapporto odds comune dell'assunzione 1,000, in modo analogo al log naturale della stima.,526 2,144 -,642,763 ODDS RATIO p-value Intervallo di confidenza Poichè il p- value=0,866 ed è superiore a 0,05 l odds ratio non è significativamente diverso da 1 Il rischio di LDP è lo stesso nei due trattamenti
In sintesi per il confronto tra 2 MEDIE Test t di Student per il confronto tra 2 PROPORZIONI o percentuali Test Chi-quadrato per la Significatività degli ODDS RATIO Test di Cochran Mantel Heanszel
Il confronto delle medie tra più di 2 gruppi Esempio: su 272 pazienti sottoposti ad intervento chirurgico si vuole valutare se la degenza media e significativamente diversa tra le classi di età Età N Degenza media Std Dev Minimum Maximum 18-30 anni 14 6.6 5.7 2 18 30-40 anni 28 6.4 4.2 2 24 40-50 anni 55 7.9 3.9 3 18 50-60 anni 54 10.9 10.4 2 53 60-70 anni 71 10.5 7.0 3 41 70-80 anni 41 11.8 8.3 2 42 80-90anni 9 15.9 8.5 4 31 Il Test t di Student può essere utilizzato solo per il confronto tra 2 medie
Il confronto delle medie tra più di 2 gruppi: Analisi della Varianza (ANOVA) L analisi della varianza (in inglese: Analysis of Variance, abbreviata con l acronimo ANOVA) è utilizzata per testare la significatività statistica delle differenze tra medie campionarie sulla base delle rispettive varianze.
Analisi della Varianza (ANOVA) Il principio alla base di questo test è quello di stabilire se due o più medie campionarie possono derivare da popolazioni che hanno la stessa media. Quando le medie sono solamente due è indifferente usare l ANOVA o il test t di Student, mentre dobbiamo necessariamente utilizzare l ANOVA quando le medie sono più di due.
La logica dell ANOVA L'ipotesi alla base dell'analisi della varianza è che : dati n gruppi, la varianza totale può essere suddivisa in due componenti: Varianza interna ai gruppi (anche detta Within) e Varianza tra i gruppi (Between). Varianza totale = Varianza within + Varianza between Ipotesi nulla H0 Varianza between < Varianza within e quindi la differenza tra i gruppi è dovuta alla sola variabilità interna
Analisi della Varianza (ANOVA) Quindi l analisi della varianza si basa sul rapporto Varianza tra i gruppi (Between( Between) Varianza interna ai gruppi (Within( Within) e la significatività è verificata mediante il test F di Fisher
ANOVA in SPSS SPSS Click Analizza Confronta medie ANOVA univariata Il risultato SPSS per l ANOVA sulle degenze medie per gruppi di età durata della degenza (in giorni) Fra gruppi Entro gruppi Totale ANOVA Somma dei Media dei quadrati df quadrati F Sig. 1275.054 6 212.509 3.968.001 14192.226 265 53.556 15467.279 271 le degenze medie sono significativamente diverse tra le classi di età considerate