Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza



Documenti analoghi
Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Intervalli di confidenza

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Intervalli di confidenza

Inferenza statistica. Statistica medica 1

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Analisi dei dati quantitativi :

Statistica. Lezione 6

Statistiche campionarie

Metodi statistici per le ricerche di mercato

La distribuzione Gaussiana

Elementi di Psicometria con Laboratorio di SPSS 1

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)


CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Università del Piemonte Orientale. Corso di dottorato in medicina molecolare. a.a Corso di Statistica Medica. Inferenza sulle medie

Università del Piemonte Orientale. Corsi di Laurea Triennale di area tecnica. Corso di Statistica Medica

E naturale chiedersi alcune cose sulla media campionaria x n

Elementi di Psicometria con Laboratorio di SPSS 1

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

3. Confronto tra medie di due campioni indipendenti o appaiati

Concetto di potenza statistica

Inferenza statistica

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Capitolo 12 La regressione lineare semplice

Il confronto fra proporzioni

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

VERIFICA DELLE IPOTESI

Capitolo 11 Test chi-quadro

Elementi di Psicometria con Laboratorio di SPSS 1

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Analisi dei dati in tabelle di contingenza

Corso di Laurea in Ingegneria Informatica Anno Accademico 2014/2015 Calcolo delle Probabilità e Statistica Matematica

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

1. Distribuzioni campionarie

Statistica inferenziale

Verifica di ipotesi

Facoltà di Psicologia Università di Padova Anno Accademico

Metodi statistici per le ricerche di mercato

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Elementi di Epidemiologia

Regressione Logistica: un Modello per Variabili Risposta Categoriali

GESTIONE INDUSTRIALE DELLA QUALITÀ A

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

Temi di Esame a.a Statistica - CLEF

OSSERVAZIONI TEORICHE Lezione n. 4

Corso di. Dott.ssa Donatella Cocca

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Istituzioni di Statistica e Statistica Economica

ANALISI DEI DATI EPIDEMIOLOGICI

La logica statistica della verifica (test) delle ipotesi

STATISTICA IX lezione

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

Lineamenti di econometria 2

Esercizio 1. Proprietà desiderabili degli stimatori (piccoli campioni)

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

Corso di Fisica generale

Tema A Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

Statistica descrittiva

STATISTICA ESERCITAZIONE 11 Dott. Giuseppe Pandolfo 3 febbraio Modelli continui di probabilità: la v.c. uniforme continua

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Università del Piemonte Orientale. Corsi di Specialità. Corso di Statistica Medica. Analisi dei dati quantitativi : Analisi della varianza

STATISTICA INFERENZIALE

CAPITOLO 7 LE DISTRIBUZIONI CAMPIONARIE E GLI INTERVALLI DI CONFIDENZA

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

L analisi statistica

( x) ( x) 0. Equazioni irrazionali

Il campionamento. Ulteriori vantaggi: economicità (costi e tempi limitati)

ANALISI DELLE FREQUENZE: IL TEST CHI 2

Università del Piemonte Orientale. Corso di Laurea in Igiene Dentale. Corso di Statistica per la ricerca sperimentale e tecnologica

Corso di Psicometria Progredito

FONDAMENTI DI PSICOMETRIA - 8 CFU

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità C

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Corso di Psicometria Progredito

LEZIONE n. 5 (a cura di Antonio Di Marco)

Il campionamento statistico

La distribuzione Normale. La distribuzione Normale

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Introduzione all Inferenza Statistica

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

Prova di autovalutazione Prof. Roberta Siciliano

Il Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO. Pasquale Iandolo

INCERTEZZA DI MISURA

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

Corso di Psicometria Progredito

Modulo didattico sulla misura di grandezze fisiche: la lunghezza

PRODUZIONE DI LENTI A CONTATTO

DISTRIBUZIONI DI PROBABILITÀ

CAPACITÀ DI PROCESSO (PROCESS CAPABILITY)

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

Grafici delle distribuzioni di frequenza

Il farmaco generico. Contenuti tecnico-scientifici del farmaco generico: comunicazione a corrente alternata

Esercitazione n.2 Inferenza su medie

LE CARTE DI CONTROLLO (4)

Transcript:

Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 1 Con questa lezione si inizia l'argomento dell'inferenza statistica, cioè il percorso che dai dati di un singolo campione stima il parametro nella popolazione. Campione inferenza Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 2

Si osserva facilmente che campioni ripetuti dalla stessa popolazione forniscono medie campionarie diverse. Ciascuna di queste medie campionarie costituisce una stima non distorta del parametro (media della popolazione) ma non può essere usata come stima del parametro da sola, senza tenere conto dell incertezza causata dall errore campionario. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 3 Una statistica calcolata su un campione di soggetti (statistica campionaria) costituisce una stima non distorta del parametro (la statistica calcolata nella popolazione) ma la statistica campionaria è affetta da una imprecisione, detta errore campionario, determinato dalla variabilità casuale del campionamento. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 4

Possiamo trarre conclusioni sul valore del parametro nella popolazione a partire dai dati campionari seguendo due percorsi: 1. La stima intervallare (Il calcolo dell'intervallo di confidenza) 2. Il test dell'ipotesi La 'stima intervallare' o 'intervallo di confidenza' fornisce un range di possibili valori entro i quali si ritiene sia compreso il parametro in esame. Il range è stimato a partire dai risultati del campione (es. la media della popolazione), con un certo grado di confidenza (fiducia? prudenza?). Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 5 Cosa significa esattamente l'intervallo di confidenza? Il 95% dei campioni estratto da una popolazione con media µ avrà un "intervallo di confidenza al 95%" della media campionaria che include µ. E il restante 5%? Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 6

Campionamento ripetuto. I tratti orizzontali sono gli intervalli di confidenza. Quelli che non comprendono il valore medio della popolazione sono in rosso (4,3%). Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 7 In pratica abbiamo a disposizione un solo campione. Come facciamo a sapere se il nostro campione è tra quelli del 95 o del 5%? "We do not know whether our interval estimate includes the unknown population mean. Being right most of the time is the best one can hope for -- there is always the possibility of being misled by an unlucky sample." (anonimo) Non possiamo dire con certezza se è uno dei 'fortunati 95%' il cui intervallo comprende il valore 12 (il valore del parametro) ma siamo fiduciosi al 95% ("abbiamo probabilità del 95%") che lo sia. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 8

Se vogliamo una maggiore confidenza possiamo ottenerla: L ampiezza dell intervallo è proporzionale al grado di confidenza. Se vogliamo che il grado di confidenza sia maggiore, anche l'intervallo dovrà essere più ampio. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 9 Dagli stessi dati, con diversi gradi di confidenza 152 151 150 149 148 147 146 145 IC_99% IC_95% IC_90% Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 10

Calcolo dell intervallo di confidenza: il caso della media Abbiamo visto che la media campionaria costituisce la stima migliore della media della popolazione ma questo non significa che la media campionaria sia priva di errore campionario: si osserva facilmente che campioni ripetuti danno medie campionarie diverse. L intervallo di confidenza è un intervallo di valori intorno ad una media campionaria; Tale intervallo ha una probabilità definita di includere il parametro (cioè il valore della statistica nella popolazione). L intervallo di confidenza viene solitamente riferito ad un test a 2 code. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 11 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 12

Se conosco σ (deviazione standard della popolazione), l intervallo di confidenza è definito in modo tale da soddisfare la seguente equazione (procedura analoga al calcolo del test Z per la verifica dell ipotesi): p X Z α 2 σ n µ X + Z α 2 σ = 1 α = 1 n p( Z α ) Limite fiduciale superiore = X + Z α/2 *(σ/ n). Limite fiduciale inferiore = X - Z α/2 *(σ/ n). Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 13 Dove: X media campionaria µ: media della popolazione (σ/ n): errore standard della media (calcolato da σ) Z α/2 = valore della deviata normale standardizzata corrispondente alla precisione desiderata. Viene calcolata dalla distribuzione di probabilità Normale Standard, per un test a 2 code. Ad es. per un intervallo di confidenza al 95% su due code Z α/2 = 1,96. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 14

Di solito l intervallo di confidenza intorno alla media viene indicato come: X ± Z α/2 *(σ/ n) Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 15 Incertezza Intervallo di confidenza = X ± Zα/2 *(σ/ n). Statistica campionaria (es. media) Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 16

Incertezza Intervallo di confidenza = X ± Zα/2 *(σ/ n). Statistica campionaria (es. media) Ampiezza ( sicurezza ) dell intervallo Variabilità del campione (Errore Standard) Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 17 Intervallo di confidenza = X ± Zα/2 *(σ/ n). Statistica campionaria (es. media) sicurezza della stima (ampiezza dell intervallo) Variabilità del campione (Errore Standard) Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 18

Dati i 50 campioni dell esempio seguente, osserviamo che in tre casi (6% dei campioni) l intervallo di confidenza al 95% non comprende la media. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 19 Estrazione di 50 campioni di numerosità 20 da distribuzione gaussiana con µ=0 e δ=1. Le barre rappresentano l intervallo di confidenza al 95% (test a 2 code). 1.0 0.5 0.0-0.5-1.0 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 20

Esempio: calcolo dell intervallo di confidenza nel caso di una media: N 15 Media campionaria σ=2,53 mmhg 149,133 mmhg (calcolo omesso) Limite superiore dell Int. conf. 95%= 149,133 + 1,960 *(2,53/ 15) = 150,41 Limite inferiore dell Int. conf. 95%= 149,133 1,960 *(2,53/ 15) = 147,85 Intervallo di confidenza al 95%: 147,85 <= µ <=150,41 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 21 Limite superiore dell Int. conf. 90%= 149,133 + 1,645 *(2,53/ 15) = yyyyy Limite inferiore dell Int. conf. 90%= 149,133 1,645 *(2,53/ 15) = yyyyy Limite superiore dell Int. conf. 99%= 149,133 + xxxxx *(2,53/ 15) = yyyyy Limite inferiore dell Int. conf. 99%= 149,133 xxxxx *(2,53/ 15) = yyyyy Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 22

Il modo comunemente usato per indicare media campionaria ed intervallo di confidenza è il seguente: Media = 149,13 (IC 95%: 147,85-150,41) Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 23 Il 90% dei campioni avrà un intervallo di confidenza al 90% della media che include µ. Limite superiore dell Int. conf. 90%= 149,133 + 1,645 *(2,53/ 15) = 150,21 Limite inferiore dell Int. conf. 90%= 149,133 1,645 *(2,53/ 15) =148,06 Intervallo di confidenza al 90%: 148,06 <= µ <=150,21 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 24

Il 99% dei campioni avrà un intervallo di confidenza al 99% della media che include µ. 149,133+2,57*(2,53/ 15) 149,133-2,57*(2,53/ 15) Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 25 152 151 150 149 148 147 146 145 IC_99% IC_95% IC_90% Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 26

Se non conosciamo σ possiamo definire un intervallo di confidenza della media campionaria basandoci sul test t e sulla distribuzione di probabilità t L intervallo di confidenza è definito in modo tale da soddisfare la seguente equazione: s s X t α µ X + t α gl, n gl, n 2 2 Dove: t gl,α/2 = valore della funzione t corrispondente all errore di 1 tipo (gl: gradi di libertà, in questo caso pari a n-1) Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 27 Limite fiduciale superiore = X + t gl,α/2 *(s/ n). Limite fiduciale inferiore = X - t gl,α/2 *(s/ n). Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 28

Intervallo di confidenza = X ± t (α/2,g.l.) * (s/ n). Media campionaria sicurezza dell intervallo Errore Standard Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 29 Estrazione di 50 campioni di numerosità 20 da una distribuzione gaussiana con µ=0. σ è ignota, quindi l errore standard è stato calcolato dalla deviazione standard campionaria. Le barre rappresentano l intervallo di confidenza al 95%. Si noti che le barre sono di ampiezza diversa tra loro, a causa della variabilità campionaria della deviazione standard. 1.0 0.5 µ 0.0-0.5-1.0-1.5 I Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 30

Esempio: calcolo dell intervallo di confidenza usando la distribuzione t Risultati: N 15 Media campionaria 149,1 mmhg (calcolo omesso) s= 4,72 mmhg (calcolo omesso) Il valore della statistica t (errore 1 tipo <= 0,05 e test a due code, 14 gl) = 2,145 Lim.superiore dell Int. conf. 95% = 149,1 + 2,145 *( 4,72/ 15) = 151,75 mmhg Lim.inferiore dell Int. conf. 95% = 149,1 2,145 *( 4,72/ 15) = 146,52 mmhg Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 31 Come si calcola l intervallo di confidenza relativo ad altre statistiche? La procedura per il calcolo dell intervallo di confidenza è una procedura generale che si applica a tutte le statistiche. La differenza tra le statistiche è soltanto nel calcolo dell errore standard. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 32

Intervallo di confidenza = Statistica ± z (α/2) * (Errore standard). Statistica sicurezza dell intervallo Variabilità del campione (Errore Standa della statistica) Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 33 Intervallo di confidenza delle proporzioni Nota: i metodi descritti sono validi solo per campioni grandi Nella popolazione: Deviazione standard di una proporzione: σ = [π*(1-π)] Nel campione: Deviazione standard di una proporzione: s = [p*(1-p)] Errore standard di una proporzione campionaria ( se σ nota): ES = σ / n Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 34

Se σ ignota: Errore standard di una proporzione campionaria: ES = s / n Intervallo di confidenza = [p ± Z α/2 *(s/ n)] Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 35 Intervallo di confidenza = p ± z (α/2 ) * (Errore standard di p) Proporzione sicurezza dell intervallo Variabilità del campione (Errore Standard della proporzione) Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 36

Per calcolare l intervallo di confidenza nel caso dell OR dobbiamo utilizzare la seguente formula poiché la distribuzione di OR è asimmetrica (va da 0 a + ): IC (log(or)) = log(or) ± Z α/2 * ES(log(OR)) log(or) = logaritmo dell Odds Ratio 1 1 1 ES(log( OR)) = + + + a b c 1 d Quindi: IC log( OR) ( OR) = Ζ e ± α 2 * ES (log( OR)) Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 37 Intervallo di confidenza = log(or) ± z (α/2) * ES (log(or)). Statistica sicurezza dell intervallo Variabilità del campione (Errore Standard della statistica) Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 38

Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 39 Vantaggi dell intervallo di confidenza: Il test dell ipotesi porta ad una valutazione binaria (rifiuto / non rifiuto di H0). L intervallo di confidenza indica l intervallo di valori del parametro (nella popolazione) con cui il risultato campionario che abbiamo osservato è compatibile. Esiste una corrispondenza tra p ed intervallo di confidenza calcolati rispetto allo stesso errore di I tipo: l intervallo di confidenza comprende tutti i valori che non sarebbero stati rifiutati da un test dell ipotesi. Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 40

Esercizi dal testo p 174 n 1 p 174 n 2 p 174 n 3 p 174 n 4 p 174 n 5 p 175 n 7 Università del Piemonte Orientale Corso di laurea in biotecnologia Corso di Statistica Medica Intervalli di confidenza 41