Corso di. Dott.ssa Donatella Cocca

Documenti analoghi
DISTRIBUZIONE NORMALE (1)

FENOMENI CASUALI. fenomeni casuali

DISTRIBUZIONI DI PROBABILITA

PROBABILITA. Distribuzione di probabilità

tabelle grafici misure di

Variabili aleatorie gaussiane

SCHEDA DIDATTICA N 7

Distribuzione normale

Esercizio 1. Durante un inchiesta su 500 studenti frequentanti i corsi di Algebra (A), Fisica (F) e Statistica è stato rilevato che:

COME LEGGERE I RISULTATI DI UNO STUDIO CLINICO CONTROLLATO

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

LEZIONI DI STATISTICA MEDICA

DISTRIBUZIONI DI PROBABILITA (parte 1) 1 / 19

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

Utilizzando la terminologia generica di prima, la variabile standardizzata X si calcola quindi

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)

Esercitazione: La distribuzione NORMALE

Modelli di probabilità

Alcune v.a. discrete notevoli

Distribuzione Normale

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

Distribuzione Normale

Variabile casuale Normale

Distribuzione Normale

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

RICHIAMI DI CALCOLO DELLE PROBABILITÀ

Metodi statistici per le ricerche di mercato

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità

PROBABILITÀ SCHEDA N. 3 VARIABILI ALEATORIE BINOMIALE E NORMALE. 1. La variabile aleatoria di Bernoulli e la variabile aleatoria binomiale

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"

DISTRIBUZIONI DI PROBABILITA

Teoria e tecniche dei test. Concetti di base

Variabili Casuali Continue

Lezione n. 1 (a cura di Irene Tibidò)

Variabili aleatorie. Variabili aleatorie

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 3: Variabili aleatorie discrete notevoli

Variabili casuali. - di Massimo Cristallo -

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. La distribuzione Normale (o di Gauss)

LA DISTRIBUZIONE NORMALE

Strumenti di indagine per la valutazione psicologica

Tipi di variabili. Indici di tendenza centrale e di dispersione

Capitolo 6 La distribuzione normale

DISTRIBUZIONI DI PROBABILITA (parte 2) 1 / 27

Le frequenze riportate in tabella possono essere considerate il risultato di un esperimento

( ) ( ) ( e la probabilità che si verifichi un evento compreso tra c e b a < c < b sarà data da:

Corso in Statistica Medica

Distribuzione degli Errori di Misura. La distribuzione normale

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Università del Piemonte Orientale Corsi di Laurea triennale di area tecnica. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità

Statistica. Capitolo 6. Variabili Aleatorie Continue e Distribuzioni di Probabilità. Cap. 6-1

STATISTICA A D (72 ore)

Corso di Statistica. Distribuzioni di probabilità per variabili casuali discrete. Prof.ssa T. Laureti a.a

Capitolo 6. La distribuzione normale

Modulo III. Definizione ed elementi di calcolo delle probabilità Le variabili casuali La distribuzione normale e la normale standardizzata

Distribuzioni di probabilità discrete. Prof.ssa Fabbri Francesca Classe 5C

Parametri statistici

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

Esercizi di Probabilità e Statistica

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E

3) In una distribuzione di frequenza si può ottenere più di una moda Vero Falso

ISTOGRAMMI E DISTRIBUZIONI:

Distribuzioni teoriche di probabilità: distribuzione binomiale e distribuzione normale

Le v.c. si utilizzano come modelli di riferimento per studiare la realtà

Propagazione delle varianze, conosciuta come propagazione degli errori.

Statistica. Lezione 4

Probabilità: teoremi e distribuzioni

assuma valori in un determinato intervallo è data dall integrale della sua densità ( = )=

Distribuzioni teoriche di probabilità: distribuzione binomiale e distribuzione normale

Distribuzioni teoriche di probabilità: distribuzione binomiale e distribuzione normale

Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti

Metodi statistici per le ricerche di mercato

LA DISTRIBUZIONE NORMALE. La distribuzione Gaussiana. Dott.ssa Marta Di Nicola

Statistica descrittiva

Distribuzioni di probabilità nel continuo

Università del Piemonte Orientale. Corso di laurea in biotecnologie. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità.

UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA

Università degli Studi di Cassino. Esercitazione di Statistica 2 dell Simona Balzano

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità.

Statistica. Lezione : 18, 19. Variabili casuali

Metodi Matematici ed Informatici per la Biologia Esame Finale, II appello 2 Luglio Matricola: Codice

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità.

DISTRIBUZIONI DI PROBABILITA

Tutorato di Complementi di Analisi Matematica e Statistica 30 maggio 2016

Lezione VI: Distribuzione normale. La distribuzione normale (curva di Gauss). Prof. Enzo Ballone. Lezione 6a- Ia distribuzione normale

INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA

C.I. di Metodologia clinica

Teorema del Limite Centrale

Programma della parte introduttiva: Lezione 5

Lezione 3 Calcolo delle probabilità

Tutorato di Complementi di Analisi Matematica e Statistica 26 maggio 2016

Esercizio 1. La variabile casuale G, somma di due V.C. normali, si distribuisce anch essa come una normale.

Outline. 1 v.c. continue. 2 v.c. Normale. 3 v.c. Esponenziale. Lezione 13. A. Iodice. v.c. continue. v.c. Normale. v.c.

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Probabilità. Lezioni : 11, 12. Docente: Alessandra Durio

Modelli probabilistici variabili casuali

La legge di Gauss degli errori come limite di una binomiale

Transcript:

Corso di Statistica medica e applicata 5 a Lezione Dott.ssa Donatella Cocca

Concetti principale della lezione precedente I concetti principali che sono stati presentati sono: I fenomeni probabilistici Definizione di probabilità Proprietà della probabilità Legge empirica del caso Teorema di Bayes Applicazioni nel campo medico del teorema

Rischio relativo - RR Il rischio relativo (RR) (anche detto relative risk o risk ratio) è il rapporto tra la probabilità che si verifichi un evento in un gruppo esposto (ad un trattamento, ad un fattore di rischio, ad un fattore protettivo), e la probabilità che si verifichi lo stesso evento in un gruppo di non esposti (allo stesso trattamento, fattore di rischio, fattore protettivo). RR=(rischio negli esposti)/(rischio nei non esposti) Come si calcola il RR Prendiamo come esempio lo studio sull efficacia della supplementazione periconcezionale con acido folico (4 mg) e multivitaminico per la prevenzione della ricorrenza (un primo figlio già malato) della nascita di un neonato con difetti del tubo neurale (DTN).

Rischio relativo - RR Si sono registrati 6 casi di DTN fra le 593 donne che avevano ricevuto in epoca periconcezionale la supplementazione di acido folico e multivitaminico (rischio nelle esposte al trattamento preventivo 6/593 = 0.01 ovvero 1%) e 21 casi fra le 602 donne che invece avevano ricevuto un placebo (rischio nelle non esposte 21/602 = 0.034 ovvero 3.4%). RR = (6/593) / (21/602) = 0.01/0.034 = 0.29 Il RR esprime in altre parole il numero di volte in più o in meno che un evento/malattia si verifichi in un gruppo rispetto ad un altro, in questo caso i figli di donne che hanno ricevuto la supplementazione hanno un rischio di nascere con un NTD di circa un terzo rispetto ai figli delle donne che non hanno ricevuto la supplementazione.

Rischio relativo - RR Generalizzando la formula, se dividiamo gli i soggetti osservati in 4 categorie: malati esposti (a), malati non esposti (c), non malati esposti (b), non malati non esposti (d), allora si ha: RR= a ( a+ b) c ( c+ d)

Rischio relativo - RR Se RR = 1 significa che il rischio che si verifichi l'evento nei 2 gruppi è uguale. In questo caso non c è associazione fra l esposizione e l esito, cioè essere esposti ad un trattamento, o fattore ritenuto protettivo o fattore ritenuto di rischio non modifica la probabilità che un evento si verifichi. Se RR>1 significa che il rischio del verificarsi dell'evento nel gruppo dei trattati o esposti è superiore rispetto al gruppo di controllo. In questo caso l esposizione è dannosa. Se RR<1 significa che il rischio che si verifichi un evento nel gruppo dei trattati o esposti è inferiore rispetto al gruppo di controllo. In questo caso l esposizione è protettiva. Il RR indica la forza dell associazione fra l esposizione (o trattamento) e l esito ed è sempre un numero positivo.

Odds Ratio - OR L odds ratio di un trattamento è il rapporto tra la frequenza con la quale un evento si verifica in un gruppo di pazienti e la frequenza con la quale lo stesso evento si verifica in un gruppo di pazienti di controllo. Consideriamo il seguente esempio: una morte neonatale si verifica in 20 bambini su un totale di 100 nati pretermine, il rischio di mortalità perinatale è 20/100 = 0.20 = 20%. L'odds di mortalità perinatale, invece, è il numero di neonati che muoiono (20) contro il numero di neonati che sopravvivono (100-20 = 80). L odds di mortalità neonatale fra i nati pretermine è quindi 20/80 = 0.25 (gli scommettitori direbbero: 1 a 4).

Odds Ratio - OR Con una semplificazione estrema si può dire che odds ratio e rischio relativo sono relativamente simili dal punto di vista concettuale (ma dal punto di vista quantitativo lo sono solo per eventi che si verificano raramente). Infatti la tabella seguente mostra la differenza tra odds ratio e rischio relativo su diversi campioni presi in considerazione:

Odds Ratio - OR Consideriamo l esempio precedentemente fatto per il rischio relativo: la somministrazione periconcezionale con acido folico (4 mg) e multivitaminico per la prevenzione della ricorrenza (un primo figlio già malato) della nascita di un neonato con difetti del tubo neurale (DTN). L'odds ratio è: OR = (6/586) / (21/581) = 3486/12327 = 0.28 Cioè, abbiamo una marcata riduzione del rischio di partorire nuovamente un feto affetto da DTN. Generalizzando la formula, anche in questo caso abbiamo: malati esposti (a), malati non esposti (c), non malati esposti (b), non malati non esposti (d), allora si ha:

Odds Ratio - OR a c b d OR= Come per il rischio relativo, anche in questo caso un OR<1 indica che l'evento si verifica più raramente nel gruppo trattato rispetto al gruppo di controllo. La seguente tabella mostra l esempio di odds ratio con la relativa formula per il suo calcolo:

ROC-curve Le curve operative caratteristiche (Receiver Operating Characteristic Curves, ROC) sono rappresentazioni grafiche di confronti di un test diagnostico quando i risultati del test possono assumere diversi valori in un intervallo o range. Utilizzare i livelli di enzimi cardiaci per diagnosticare un infarto miocardico, o diversi valori di glicemia a digiuno per i pazienti con un sospetto di diabete mellito, sono esempi della possibile utilità delle curve ROC. Se il test ha più di un cut point (valore soglia di laboratorio) o ha un range di due o più risposte al test (per esempio, negativo, debolmente positivo e fortemente positivo), si può creare una curva ROC ponendo sensibilità e specificità su di un grafico. Ogni punto del grafico avrà quindi il suo valore di sensibilità e specificità.

ROC-curve Un buon test avrà un valore ROC (area sotto la curva) maggiore dell 80%. Vengono spesso eseguiti calcoli per trovare quale punto o posizione sotto la curva (valore di laboratorio) abbia la miglior combinazione di sensibilità e specificità.

Variabili Casuali Le variabili casuali (o stocastiche o aleatorie) sono variabili numeriche, che assumono valori diversi a caso. I valori possono dipendere da una estrazione casuale, per esempio se scegliamo a caso uno studente e misuriamo la sua pressione diastolica. In questo caso la variabile casuale è ovviamente la pressione, che avrà valori imprevisti. Ci sono due tipologie generali di variabili casuali: Variabili casuali discrete (eventi discreti): non possono assumere tutti i valori in alcun intervallo. Per esempio, il numero di " teste " osservato dopo il lancio di due monete, assumerà valore 0, 1, o 2 ma non per esempio 1,75.

Variabili Casuali Variabili casuali continue (eventi misurati su scala continua): assumono tutti i valori in un certo intervallo. Per esempio, il peso alla nascita di bambini può assumere qualunque valore, diciamo, tra 0,5 kg e 6 kg. Con le variabili casuali continue, c'è un numero infinito di possibilità tra due qualunque valori. C'è, per esempio, un numero infinito di pesi tra 2 kg e 3 kg.

Distribuzioni di probabilità di variabili casuali discreti La distribuzione di probabilità di una variabile aleatoria discreta è rappresentata dall elenco delle modalità che la variabile assume, a ciascuna delle quali è associata la relativa probabilità. Esempio: Valutazione dell uso di farmaci in una popolazione di donne che hanno partorito in un ospedale dell est americano fra il 1980 e 1982 e studio dell associazione fra uso di farmaci ed alcuni comportamenti materni nei confronti dell alcool, del tabacco e delle droghe. Risultati: le donne che hanno un comportamento a rischio durante la gravidanza, hanno maggiore probabilità di usare farmaci durante la gravidanza.

Distribuzioni di probabilità di variabili casuali discreti Si vuole costruire la distribuzione di probabilità della variabile discreta: X = numero farmaci usati prescritti e non (prescritti) dai soggetti in studio. Prevalenza di farmaci usati, prescritti e non, fra donne che hanno partorito:

Distribuzioni di probabilità di variabili casuali discreti Distribuzione di probabilità del numero di farmaci usati, prescritti e non, durante la gravidanza dei soggetti in studio:

Distribuzioni di probabilità di variabili casuali discreti Rappresentazione grafica

Distribuzioni di probabilità di variabili casuali discreti Distribuzione di probabilità cumulata :

Distribuzioni di probabilità di variabili casuali discreti Rappresentazione grafica Proprietà delle Distribuzioni di Probabilità di una variabile discreta I valori di P(X=x) sono tutti positivi e minori di 1: 0 P(X=x) 1 La somma dei valori di P(X=x) è uguale a 1: ΣP(X=x)=1

Distribuzione Binomiale La distribuzione binomiale è la legge della variabile casuale (o aleatoria) che rappresenta il numero di successi della variabile X = numero di successi quando i due parametri sono pari a n = numero di osservazioni e p = probabilità di successo in ciascuna osservazione. Per capire meglio cosa è una distribuzione binomiale analizziamo prima: Prova di Bernoulli: prova o esperimento i cui possibili risultati sono costituiti da due eventi mutuamente esclusivi (malato o sano, vero o falso, maschio o femmina).

Distribuzione Binomiale Processo di Bernoulli: sequenza di prove bernoulliane che soddisfano le seguenti condizioni: o Ciascuna prova può avere come risultato uno dei possibili eventi (mutuamente esclusivi). Uno dei possibili eventi è denotato (arbitrariamente) come un successo e l altro come un insuccesso; o La probabilità di un successo, indicata con p, rimane costante di prova in prova. La probabilità di insuccesso, 1-p, è indicata con q; o Le prove sono indipendenti, ovvero il risultato di una prova non è influenzato dal risultato di qualsiasi altra prova.

Distribuzione Binomiale In un processo bernoulliano la probabilità di ottenere x successi in n prove è : n x n-x n n! P(X = x)= p q dove = x x x! ( n x)! Tale espressione è chiamata distribuzione binomiale ed è interamente specificata da due parametri, n e p. La media e la varianza della distribuzione binomiale sono rispettivamente : µ=np ed σ 2 = np(1-p)

Distribuzione Binomiale Esempio: In una certa popolazione il 52% di tutti i nati registrati è maschio. Scegliendo a caso 5 record da questa popolazione ci chiediamo quale è la probabilità che esattamente tre di questi corrispondano a nati maschi. Assegniamo: 1 al successo (record per nato maschio) 0 all insuccesso (record per nato femmina) p = 0.52; q = 0.48; x = numero successi = 3; n = numero prove = 5 5 ( ) 3 2 5! 3 P X = 3 = 0.52 0.48 = 0.52 0.48 3 2!3! 5 4 3 2 1 3 2 = 0.52 0.48 0.324 2 1 3 2 1 2 =

Distribuzione di probabilità di Poisson Vi sono fenomeni in cui determinati eventi, con riferimento ad un intervallo di tempo o spazio, accadono raramente: il numero di eventi che si verificano in quell intervallo variano da 0 a n, ed n non è determinabile a priori. Per lo studio di eventi rari di questo tipo si utilizza la Distribuzione di probabilità di Poisson. Se x è il numero di volte in cui si verifica un evento casuale in un intervallo di tempo o spazio, la probabilità che x si verifichi è data da: λ x P ( X = x) = e x! λ

Distribuzione di probabilità di Poisson dove: λ è chiamata parametro della distribuzione e rappresenta la media della distribuzione (numero medio di volte in cui l evento casuale si verifica nell intervallo) e è il numero di Nepero, pari a 2.7183. Proprietà della Distribuzione di Poisson: La media e la varianza sono uguali; La distribuzione di Poisson è il limite per n che tende all infinito e con λ = np della distribuzione binomiale; quindi quando n è molto grande e p è molto piccola, la distribuzione binomiale può essere approssimata con una di Poisson avente media λ = np (di solito tale approssimazione è accettabile per np 10 e np>50).

Distribuzione di probabilità di Poisson Per tale motivo la distribuzione di Poisson è anche chiamata distribuzione per eventi rari. Quindi la distribuzione di Poisson è adatta a descrivere un importante classe di fenomeni in cui, su un grande numero n di prove, in ciascuna delle quali la probabilità di successo è piccola, si verificano mediamente λ successi.

Distribuzione di probabilità di Poisson Esempio: Tassi elevati di inquinamento atmosferico possono determinare reazioni allergiche gravi. Durante un mese (30 giorni), nel pronto soccorso di un ospedale si sono avuti 27 ricoveri urgenti. Può essere ragionevole ipotizzare che gli eventi abbiano una distribuzione giornaliera costante, in accordo con la legge di Poisson. Calcolare la probabilità (P i ) di avere i casi di allergia al giorno, per i che varia da 0 a 8. Dopo aver calcolato la media giornaliera λ=(27/30)=0.9, si applica la formula: i i λ λ P = e = i 0. 9 i! 0. 9 i! e si ottengono i risultati riportati nella tabella: 1 2.7183

Distribuzione di probabilità di Poisson i P i 0 0.40657 1 0.365913 2 0.164661 3 0.049398 4 0.011115 5 0.002001 6 0.000300 7 0.000039 8 0.000004 La rappresentazione grafica evidenzia come la distribuzione delle probabilità con λ = 0,9 sia fortemente asimmetrica, con asimmetria destra.

Distribuzioni di probabilità di variabili casuali continui Tutti i modelli precedenti forniscono la distribuzione teorica di variabili casuali discrete. Quando si devono descrivere variabili casuali continue e positive la distribuzione più frequente e di maggiore utilità nella ricerca sperimentale, fondamento della statistica parametrica, è la distribuzione normale o gaussiana. La maggior parte dei fenomeni che si osservano nella realtà assumono la forma di una distribuzione normale: fenomeni biomedici (colesterolo, pressione arteriosa, ceppo genetico, ecc.); fenomeni antropometrici (statura, peso, perimetro toracico, ecc.); fenomeni fisici (misure del periodo di un pendolo, ecc.).

Distribuzioni di probabilità di variabili casuali continui La formula relativa alla distribuzione normale è: f ( x) 2πσ dove: µ è la media; σ è la deviazione standard; π è una costante pari a 3,14159; e è una costante pari a 2,718282; i valori della x vanno da - a + ; = 1 ( x µ ) 2 e 2 σ f(x) corrisponde all'altezza della curva per ogni valore di x 2 ricordo che µ = x= σ = k i= 1 ( x i x N ) 2 n N xi i = 1 i N

Distribuzioni di probabilità di variabili casuali continui In termini meno matematici, la formula relativa alla distribuzione normale permette di stimare il valore di f(x) (il valore dell ordinata y o altezza della curva) per ogni valore di x (il valore della ascissa).

Distribuzioni di probabilità di variabili casuali continui La media e la deviazione standard della popolazione risultano completamente rappresentative della distribuzione, essendo questa simmetrica rispetto alla media, con i punti di flesso corrispondenti alla deviazione standard.

Distribuzioni di probabilità di variabili casuali continui Se µ (media) varia e σ (deviazione standard) rimane costante, si hanno infinite curve normali con la stessa forma e la stessa dimensione, ma con l'asse di simmetria in un punto diverso. Quando due distribuzioni hanno media differente, è possibile ottenere l'una dall'altra mediante traslazione o trasformazione lineare dei dati.

Distribuzioni di probabilità di variabili casuali continui Se invece µ rimane costante e σ varia, tutte le infinite curve hanno lo stesso asse di simmetria; ma hanno forma più o meno appiattita, secondo il valore di σ.

CARATTERISTICHE DELLA DISTRIBUZIONE NORMALE è simmetrica intorno alla sua media µ; media, la moda e la mediana coincidono; l area sottesa alla curva è uguale ad 1. A causa della simmetria rispetto alla media a destra e a sinistra della perpendicolare alzata dalla media si trova il 50% dell area. presenta una diminuzione dell addensamento delle osservazioni man mano che ci si allontana dal valore medio; la percentuale di casi che cade fra la media ed i multipli della deviazione standard e' costante. Il grafico seguente mostra questa proprietà della distribuzione normale:

CARATTERISTICHE DELLA DISTRIBUZIONE NORMALE per ogni coppia di valori µ e σ si ottengono tante distribuzioni normali.

CARATTERISTICHE DELLA DISTRIBUZIONE NORMALE Si può riportare l insieme di tali distribuzioni a un unica distribuzione ponendo: z = x µ σ L equazione per la distribuzione normale standardizzata è 2 data da: f z 1 ( ) z e 2 = 2π π Tale distribuzione ha media 0 e deviazione standard 1:

CARATTERISTICHE DELLA DISTRIBUZIONE NORMALE Esempio: Da uno studio sulla malattia di Alzheimer, Dusheiko ha riportato i dati che sono compatibili con l'ipotesi che il peso del cervello delle vittime della malattia si distribuisca normalmente. Dai dati possiamo calcolare una media di 1076.80 grammi e una deviazione standard di 105.76 grammi. Se assumiamo che questi risultati sono applicabili a tutte le vittime della malattia di Alzheimer, ci chiediamo quale sia la probabilità che una vittima della malattia scelta a caso abbia un cervello che pesa meno di 800 grammi. L'area tratteggiata corrisponde alla probabilità richiesta:

CARATTERISTICHE DELLA DISTRIBUZIONE NORMALE Dobbiamo determinare quale valore di z corrisponde ad un x di 800. Per far questo usiamo la formula: µ z = x σ (Tale formula trasforma ogni valore di qualsiasi distribuzione normale nel corrispondente valore di z della distribuzione normale standardizzata)

CARATTERISTICHE DELLA DISTRIBUZIONE NORMALE Dalla tabella che segue troviamo che l'area a sinistra di z = - 2.62 è 0.0044. Possiamo sintetizzare quanto detto nel seguente modo: 800 1076.80 P = 105.76 ( x< 800) = P z< = P( z< 2.62) 0. 0044 In conclusione la probabilità che un paziente scelto a caso abbia un peso del cervello minore di 800 grammi è uguale a 0.0044.

CARATTERISTICHE DELLA DISTRIBUZIONE NORMALE

CARATTERISTICHE DELLA DISTRIBUZIONE NORMALE Dunque: o qualsiasi distribuzione normale può essere trasformata in curva normale standardizzata con media 0 e d.s. 1; o l uso della forma standardizzata ci consente di trovare, servendoci delle tavole apposite, la porzione di area compresa tra due valori qualsiasi. L asimmetria diminuisce, a parità di p e q, al crescere di n e la distribuzione si approssima alla curva normale

CARATTERISTICHE DELLA DISTRIBUZIONE NORMALE Per λ > 20 si può ammettere senza grande rischio di errore che la v.c. (variabile casuale) di Poisson si distribuisce come una normale standardizzata del tipo: k λ σ

CARATTERISTICHE DELLA DISTRIBUZIONE NORMALE Esempio1: Il 30% di una popolazione è immune da una malattia. Se si estrae un campione casuale di dimensione 10 da questa popolazione, ci si chiede qual è la probabilità che esso contenga esattamente quattro persone immuni. P p = 0.3; q = 0.7; n = 10; x = 4 10! 4!6! ( x= 10) = 0.7 0.3 = 0. 2001 6 4

CARATTERISTICHE DELLA DISTRIBUZIONE NORMALE

CARATTERISTICHE DELLA DISTRIBUZIONE NORMALE Esempio2: Supponendo che da alcuni dati ufficiali rilevati sulla popolazione nazionale, risulti che il valore medio dell HDL-colesterolo è di 57 mg/100 ml con uno scarto quadratico medioσ=5. Sapendo che la distribuzione è di tipo normale, si vuole determinare: 1. La percentuale di valori HDL-colesterolo superiori a 60 mg/100 ml In tal caso il valore empirico è x = 60, quindi: x µ 60 57 z = = = σ 5 0,6 Dalla tabella, a tale valore di z corrisponde il valore 0,2257, che rappresenta l area compresa tra la media e z = 0,6.

CARATTERISTICHE DELLA DISTRIBUZIONE NORMALE Ma, poiché si vuole determinare la percentuale dei casi che supera z = 0,6 (e quindi l area compresa tra z = 0,6 e l infinito), sarà necessario sottrarre il valore trovato sulle tavole alla metà dell area sottesa dalla curva: 0,5-0,2257=0,2743 pertanto i valori di HDL-colesterolo superiori a 60 mg/100 ml corrispondono al 27,43% di tutti i valori osservati.

CARATTERISTICHE DELLA DISTRIBUZIONE NORMALE 2. La percentuale di valori HDL-colesterolo compresi tra 40 mg/100 ml e 45 mg/100 ml. In tal caso i valori empirici sono x 1 =40 e x 2 =45 quindi: 40 57 z = = 3.4 ; z2 5 45 57 5 1 = = 2.4 Dalla tabella, a tali valori di z corrispondono, rispettivamente, i valori 0,4996 e 0,4918. Per determinare la percentuale dei casi che cadono tra i due valori -3,4 e -2,4 occorre sottrarre: 0,4996-0,4918 = 0,0078 pertanto i valori di HDL-colesterolo compresi tra 40 mg/100 ml e 45 mg/100 ml corrispondono allo 0,78% di tutti i valori osservati.

CARATTERISTICHE DELLA DISTRIBUZIONE NORMALE

CARATTERISTICHE DELLA DISTRIBUZIONE NORMALE 3. La percentuale di valori HDL-colesterolo compresi tra 55 mg/100 ml e 58 mg/100 ml. In tal caso i valori empirici sono x 1 =55 e x 2 =58 (in questo intervallo è compreso il valor medio), quindi: 55 57 z1= = 0.4 ; z 2 5 58 57 1 = = 5 0.2 Dalla tabella, a tali valori di z corrispondono rispettivamente i valori 0,1554 e 0,0793. Per determinare la percentuale dei casi che cadono tra i due valori -0,4 e 0,2 occorre sommare: 0,1554 + 0,0793 = 0,2347 pertanto i valori di HDLcolesterolo compresi tra 55 mg/100 ml e 58 mg/100 ml corrispondono al 23,47% di tutti i valori osservati.

Concetti principale della lezione I concetti principali che sono stati presentati sono: I fenomeni probabilistici RR OR ROC-curve Variabili casuali Distribuzione Binomiale Distribuzione di Poisson Distribuzione di Gauss