Statistica. Lezione 8

Documenti analoghi
Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati in tabelle di contingenza

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Analisi dei dati in tabelle di contingenza

Università del Piemonte Orientale. Corso di Laurea in Igiene Dentale. Corso di Statistica per la ricerca sperimentale e tecnologica

Prof.ssa G. Serio, Prof. P. Trerotoli, Cattedra di Statistica Medica, Università di Bari 1/16. Malato vs non malato. Esposto vs non esposto

Statistica. Lezione 1

Rischio relativo e Odds Ratio

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

I test statistici sulle frequenze

Statistica. Lezione 4

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

p = p q OR = p q Misura l esistenza di una malattia. E legato alla incidenza in quanto - Prevalenza = Incidenza x tempo medio di durata della malattia

Esercizi sull associazione di variabili categoriche

Corso di Psicometria Progredito

Il χ 2 (Pearson, 1900)

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI

Obiettivo: confrontare due proporzioni, studiare il legame in presenza di un fattore di stratificazione

Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione

Corso Avanzato di Statistica

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Casa dello Studente. Casa dello Studente

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

Copyright Esselibri S.p.A.

Capitolo 11 Test chi-quadro

Misure epidemiologiche di rischio!

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Contenuti: Capitolo 14 del libro di testo

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

Esercizio 1. soddisfazione

Esempio di calcolo di rischio relativo

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

INFERENZA STATISTICA I (CANALE B)

Esercitazione 8 maggio 2014

Statistica 1 A.A. 2015/2016

Analisi della regressione multipla

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Statistica per le le ricerche ricerche di mercato 9.b 9.b Analisi Analisi preliminari preliminari Verifica di ipotesi: test test di indipendenza

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA AZIENDALE Modulo Controllo di Qualità

Intervalli di confidenza

Chi-quadro. sono variabili aleatorie indipendenti con distribuzione allora la variabile aleatoria

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

Approssimazione normale alla distribuzione binomiale

Statistica Applicata all edilizia: il modello di regressione

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

Statistica Inferenziale

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

INFERENZA STATISTICA I (CANALE B)

Università del Piemonte Orientale. Corso di laurea in biotecnologie. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità.

Facoltà di Economia - Università di Pavia Simulazione Prova Scritta di Statistica Sociale 19 dicembre 2012

Sviluppi e derivate delle funzioni elementari

Esercitazioni di Algebra e Geometria

Università del Piemonte Orientale. Corsi di laurea triennale ad indirizzo sanitario. Corso di Statistica Medica

normopeso <=25 sovrappeso obesità I obesità II obesità III >=40

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Ulteriori Conoscenze di Informatica e Statistica

Università del Piemonte Orientale. Corsi di laurea di area tecnica. Corso di Statistica Medica. Analisi dei dati quantitativi :

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

STATISTICA A K (60 ore)

Scuola di specializzazione In Fisica Sanitaria a.a. 2005/2006 Epidemiologia Prof. Maria Antonietta Penco

Analisi della varianza

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

Gestione ed Analisi Statistica dei dati

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Prova d'esame di Statistica I - Corso Prof.ssa S. Terzi

CORSO INTEGRATO DI STATISTICA E INFORMATICA MEDICA

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Vedi: Probabilità e cenni di statistica

Analisi bivariata dei dati

Esercitazione: La kappa di Cohen

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

Statistica15-30/11/2015 ANALISI DEI RAPPORTI DISCONTINUI (FREQUENZE)

Criteri di Valutazione della scheda (solo a carattere indicativo)

Metodo dell albero ramificato

Infermieristica basata sulle prove di efficacia

Test delle Ipotesi Parte I

Corso di Psicometria Progredito

LABORATORIO DI PROBABILITA E STATISTICA

UNIVERSITÀ DEGLI STUDI DI PERUGIA

Introduzione ai test statistici

Capitolo 6 La distribuzione normale

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Confronto tra due popolazioni Lezione 6

Esercitazione 8 del corso di Statistica 2

L analisi dei dati. Primi elementi. EEE- Cosmic Box proff.: M.Cottino, P.Porta

Le statistiche campionarie sono stime dei parametri ignoti della popolazione al cui valore siamo interessati.

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica e Biometria. Test di ipotesi

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici

Strumenti informatici Realizzare un test z, un test t e un test F per campioni indipendenti con Excel e SPSS

Modelli Log-lineari Bivariati

La verifica delle ipotesi

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza

Transcript:

Università degli Studi del Piemonte Orientale Corso di Laurea in Infermieristica Corso integrato in Scienze della Prevenzione e dei Servizi sanitari Statistica Lezione 8 a.a 2011-2012 Dott.ssa Daniela Ferrante daniela.ferrante@med.unipmn.it

Tabelle di contingenza La tabella seguente presenta la frequenza di osservazioni, categorizzate secondo due variabili Risultato Farmaco Curato Non curato Totale A a b a+b B c d c+d TOTALE a+c b+d a+b+c+d 2

Tabelle di contingenza La seguente notazione è più generale e si applica a tabelle di qualsiasi dimensione Risultato Farmaco Curato Non curato Totale A n 11 n 12 n 1. B n 21 n 22 n 2. TOTALE n.1 n.2 n.. 3

Tabelle di contingenza Si noti che, una volta definito un valore per una delle quattro celle, resta definito anche il valore delle celle restanti, fissati i totali marginali. In altri termini, in una tabella 2*2 una sola delle celle è libera di assumere qualsiasi valore, le restanti sono fissate dai totali marginali. Il numero di celle libere corrisponde al numero di gradi di libertà (g.l. o d.f.). 4

Gradi di libertà Il numero di gradi di libertà in una tabella r * c è dato da: g.l. = (n.righe-1) * (n.colonne-1) Le tabelle 2*2 hanno quindi 1 grado di libertà. 5

Tabelle di contingenza L analisi di una tabella di contingenza prevede: Il calcolo di indicatori di associazione tra le due variabili La valutazione della probabilità di osservare la tabella in esame data l ipotesi nulla (test di significatività). 6

Tabelle di contingenza Esaminiamo dapprima il caso delle tabelle 2*2 Malattia Caso Controllo Totale Esposizione Presente a b a+b Assente c d c+d Totale a+c b+d a+b+c+d 7

Odds ratio La misura di associazione usata più frequentemente è l Odds Ratio (Rapporto Crociato), abbreviato con OR. Come Odd intendiamo il rapporto: (probabilità a favore / probabilità contrarie). 8

Odds ratio L odd di malattia tra i soggetti con esposizione è il rapporto tra le due probabilità condizionate: P(Malattia Esposizione) e P(Non_malattia esposizione). Odd(M E)= [a/(a+b)] / [b/(a+b)] = a/b In modo analogo si ottiene l odd di malattia tra i soggetti senza esposizione come rapporto tra le due probabilità condizionate P(Malattia Non_Esposizione) e P(Non_malattia Non_esposizione). Odd(M Non_E)=[c/(c+d)] / [d/(c+d)] = c/d 9

Odds ratio Odds Ratio (OR) è il rapporto tra i due odds: OR = (a/b)/(c/d) = (a*d) / (c*b) L intervallo di valori validi per OR è: 0 <= OR <= 10

Esempio 1 Un campione di 500 studenti ha partecipato ad uno studio volto a valutare il livello di conoscenza di un certo gruppo di malattie comuni da parte di studenti universitari dei primi anni di medicina Tipo di facoltà Conoscenza delle malattie Buona Scarsa Totale Medicina 31 91 122 Altro 19 359 378 TOTALE 50 450 500 11

Esempio 1 OR (Medicina vs. Altro) = (31 * 359) / (91 * 19) = 6,4 Interpretazione: Le due variabili sembrano associate: la probabilità di conoscere le malattie è 6,4 volte maggiore per gli studenti di medicina che per gli iscritti ad altre facoltà 12

Intervallo di confidenza dell odds ratio IC (ln(or)) = ln(or) ± Z α/2 * ES(ln(OR)) IC ln( OR ) ± ( OR ) = Ζ e α 2 * ES (ln( OR )) ln(or) = logaritmo in base e dell Odds Ratio ES 1 1 1 (ln( OR )) = + + + a b c 1 d 13

Esempio 1 ES(ln( OR)) = 1/ 31+ 1/ 91+ 1/19 + 1/ 359 = 0,31 α = 0,05 da distribuire nelle due code poichè l' intervallo di confidenza è bilaterale I.C.95%: e (1,86-1,96 * 0,31) ; e (1,86 + 1,96 * 0,31) I.C.95%: (3,50; 11,79) 14

Test di ipotesi Nell' analisi di tabelle di contingenza l'ipotesi di lavoro di solito corrisponde all'associazione tra le due variabili mentre l'ipotesi nulla corrisponde all'assenza di associazione. H0: le variabili non sono associate (quindi OR=1) 15

Test chi-quadro Il test statistico misura la probabilità di osservare una tabella come quella data (o più estrema) se vale l'ipotesi nulla. Il test adottato è il Chi-quadro (χ 2 ). Questo test fornisce la probabilità (data l ipotesi nulla) di osservare una tabella come quella in esame o una tabella più estrema. 16

Test chi-quadro 2 χ = ( oss att ) att 2 χ 2 = (a-e(a)) 2 + (b-e(b)) 2 + (c-e(c)) 2 + (d-e(d)) 2 E(a) E(b) E(c) E(d) 17

Test chi-quadro Calcolo del numero di osservazioni attese Conoscenza delle malattie Facoltà Buona Scarsa Totale Medicina E(a) = (a+b)*(a+c)/t E(b)=(a+b)*(b+d)/T a+b Altro E(c ) = (c+d)*(a+c)/t E(d)=(c+d)*(b+d)/T c+d TOTALE a+c b+d T 18

Test chi-quadro Come si usa il valore χ 2? Il valore di probabilità corrispondente al valore della statistica χ 2 si legge su apposite tabelle, dato il valore di χ 2 ed il numero di gradi di libertà. Ponendo alfa=0.05 e considerando 1 grado di libertà (essendo la tabella 2x2) otteniamo: 19

Distribuzione Chi quadrato Probabilità 0,001 0,01 0,025 0,05 0,1 gradi libertà 1 10,83 6,64 5,02 3,84 2,71 2 13,82 9,21 7,38 5,99 4,61 3 16,27 11,35 9,35 7,82 6,25 4 18,47 13,28 11,14 9,49 7,78 5 20,52 15,09 12,83 11,07 9,24 6 22,46 16,81 14,45 12,59 10,65 7 24,32 18,48 16,01 14,07 12,02 8 26,13 20,09 17,54 15,51 13,36 9 27,88 21,67 19,02 16,92 14,68 10 29,59 23,21 20,48 18,31 15,99 11 31,26 24,73 21,92 19,68 17,28 12 32,91 26,22 23,34 21,03 18,55 13 34,53 27,69 24,74 22,36 19,81 14 36,12 29,14 26,12 23,69 21,06 15 37,70 30,58 27,49 25,00 22,31 16 39,25 32,00 28,85 26,30 23,54 17 40,79 33,41 30,19 27,59 24,77 18 42,31 34,81 31,53 28,87 25,99 19 43,82 36,19 32,85 30,14 27,20 20 45,32 37,57 34,17 31,41 28,41 per numeri di g.l. superiori a 20 usate la riga corrispondente a 20 20

Tipo di facoltà Conoscenza delle malattie Buona Scarsa Totale Medicina 31 91 122 Altro 19 359 378 TOTALE 50 450 500 21

Calcolo i valori attesi: Conoscenza delle malattie Facoltà Buona Scarsa Totale Medicina E(a) = 12,2 E(b) = 109,8 122 Altro E(c) = 37,8 E(d) = 340,2 378 TOTALE 50 450 500 22

2 χ = (31 12,2) 12,2 2 + (91 109,8) 109,8 2 + (19 37,8) 37,8 2 + (359 340,2) 340,2 2 = 42,58 42,58 > 3,84 quindi rifiuto H 0 P value < 0,001 23

Distribuzione chi-quadro 0,05 0,05 1,98 3,84 24

Tabelle R x C L estensione del calcolo di χ 2 a tabelle con un maggior numero di righe e di colonne è semplice e si basa sulla formula: 2 χ Il numero di gradi di libertà si calcola come: (righe-1)*(colonne-1). = ( oss att ) att 2 25

χ 2 esatto La formula approssimata è valida quando il numero di osservazioni non è troppo piccolo Quando la tabella ha un valore atteso minore di 5 in qualche cella, si suggerisce di utilizzare la formula del χ2 esatto, sviluppata da Fisher. Il test si basa sul calcolo della probabilità associata alla tabella osservata ed a ciascuna delle tabelle più estreme (cioè con indicatore di associazione maggiore di quello osservato nella tabella data) 26

χ 2 esatto Uso casco e traumi facciali negli incidenti con bicicletta Con casco Senza casco Totale Traumi facciali 2 (3) 13 (12) 15 Altri traumi 6 (5) 19 (20) 25 TOTALE 8 32 40 Fisher's Exact Test H 0 : π 1 - π 2 = 0 Alternative > < H 1 : π 1 - π 2 0 p-value = 0.69924 27

Posso anche calcolare il valore di probabilità utilizzando una funzione di Excel: 28