Esercizi di Probabilità Grazia Corvaia, Patrizio Lattanzio, Alessandra Nardi February 0, 09 L urna colorata In un urna si trovano 0 palline, 5 viola e 5 arancioni. Calcolare la probabilità che, in due estrazioni successive, escano due palline dello stesso colore sia reinserendo sia non reinserendo la pallina nell urna dopo la prima estrazione. Prima di tutto costruiamo lo spazio dei possibili eventi Ω : Ω = {(A, A), (V, V ), (A, V ), (V, A)} Il nostro evento è che escano due palline dello stesso colore, dunque: {(A A) (V V )} Notiamo che i due eventi sono INCOMPATIBILI se si verifica uno, non puó verificarsi l altro; dunque, in base al terzo assioma, possiamo scrivere: P {(A A) (V V )} = P (A A) + P (V V ) Se reinseriamo nell urna la pallina dopo la prima estrazione, gli eventi delle intersezioni sono INDIPENDENTI. Avremo pertanto: P {(A A) (V V )} = P (A) P (A) + P (V ) P (V ) Adesso quantifichiamo: P {(A A) (V V )} = + = Se non reinseriamo la pallina estratta nell urna avremo ancora: P {(A A) (V V )} = P (A A) + P (V V ) In questo caso tuttavia i due eventi sono dipendenti, applichiamo quindi la legge delle Probabilità Composte P (A B) = P (B) P (A B)
P (A A) + P (V V ) = P (A) P (A A) + P (V ) P (V V ) Quantificando: P {(A A) (V V )} = 5 0 9 + 5 0 9 = 9 Il medico indeciso Un medico si trova a dover decidere se sia preferibile somministrare al paziente immediatamente una nuova terapia antivirale sperimentale o provare inizialmente una terapia standard e passare al farmaco sperimentale solo in caso di fallimento. Teniamo conto che la probabilità di risposta della terapia standard A è 0., mentre se somministriamo subito il nuovo antivirale B la probabilità di guarigione è 0.8. Tuttavia la terapia standard, in uso da molti anni, a fronte di una minore probabilità di risposta, garantisce una maggiore affidabilità rispetto agli effetti secondari. Il dubbio riguarda il rischio che l efficacia del nuovo farmaco possa diminuire se somministrato dopo un fallimento. Qual è la probabilità di risposta minima, dopo fallimento della prima terapia, perché sia attuabile la terapia in due fasi? Definiamo gli eventi A: risposta al farmaco standard come prima terapia P(A) = 0. B: risposta al farmaco sperimentale come prima terapia P(B) = 0.8 B: risposta al farmaco sperimentale come seconda terapia Calcoliamo P(B) nel caso di doppia somministrazione: P (B) = P (B A) +P (B A c )P (B) = P (A) P (B A) + P (A c ) P (B A c ) Assumiamo per semplicitã P (B A) = poiché se ha avuto effetto il primo farmaco, il paziente è già guarito. P (A c ) = P (A) La probabilità di risposta al secondo farmaco dopo fallimento del primo rappresenta la mia incognita. Indichiamo P (B A C ) = x e andiamo a sostituire i valori. Sostituisco i valori: P(B) deve essere almeno 0.8 P (B) = 0. + ( 0.) x 0.8 0. + ( 0.) x
0.8 0. + 0.6x 0.6x 0.8 0. x 0. 0.6 = 0.6. La terapia in due fasi è accettabile solo se la probabilità di risposta del farmaco sperimentale a seguito di fallimento del farmaco standard resta di almeno 0.6. Le monete di Pinocchio Lanciamo monete bilanciate una dopo l altra.. Calcolare la probabilità dei seguenti eventi A = {la prima testa esce al terzo lancio} B = {esce due volte testa} C = {esce croce al secondo lancio} Ω = {(T, T, T ), (T, T, C), (T, C, T ), (T, C, C), (C, T, T ), (C, T, C), (C, C, T ), (C, C, C)} Poiché i risultati dei singoli lanci sono indipendenti gli eventi in Ω sono equiprobabili avendo ciascuno probabilità /8 di verificarsi. La condizione di equiprobabilità è essenziale per poter utilizzare la definizione classica di probabilità (casi favorevoli su casi possibili) A = {(C, C, T )} P (A) = 8 B = {(T, T, C), (T, C, T ), (C, T, T )} Come in Ω la virgola indica l unione degli eventi che sono tra loro incompatibili. Ne segue che P (B) = 8 + 8 + 8 = 8 C = {(T,C,T), (T,C,C), (C,C,T), (C,C,C)} P (C) = 8 + 8 + 8 + 8 = 8 =. Analizzare le possibili coppie di eventi e chiarire quali sono INCOMPATIBILI. Ricordiamo che affinché due eventi siano incompatibili la loro intersezione deve essere = ) (A B) = sono eventi incompatibili
) (A C) = {(C, C, T )} non sono eventi incompatibili ) (B C) = {(T, C, T )} non sono eventi incompatibili. Gli eventi A,B e C costituiscono una partizione di Ω No, gli eventi indicati non sono una partizione di Ω poiché non sono disgiunti a due a due e la loro unione (A B C) = {(C, C, T ), (T, T, C), (T, C, T ), (C, T, T ), (T, C, C), (C, C, C)} Ω. Analizzare gli eventi a due a due e valutare quali sono INDIPENDENTI: ) iniziamo dall evento A e B, se gli eventi fossero indipendenti allora: quantifichiamo: P (A B) = P (A) P (B) P = 8 8 SONO DIP EDENT I ) P (A C) = P (A) P (C) 8 = 8 SONO DIP ENDENT I ) P (B C) = P (B) P (C) 8 = 8 8 = 6 SONO DIP ENDENT I Keine Panik Un paziente risulta positivo al test per l epatite B; qual è la probabilità che il paziente sia effettivamente malato? Definiamo gli eventi : B + = { paziente malato } B = { paziente sano } T + = { test positivo } T = { test negativo } Ipotizziamo che il test utilizzato sia caratterizzato dai seguenti valori: Sensibilità P (T + A + ) = 0.95 Specificità P (T A ) = 0.90
Vogliamo sapere P (B + T + ) Applichiamo il teorema di Bayes. P (B + T + ) = P (T + B + ) P (B + ) P (T + ) La P (T + ), ovvero la probabilità che il test risulti positivo, non è nota in generale ma puï essere ricavata come segue : P (T + ) = P (T + B + ) + P (T + B ) Utilizzando la probabilità condizionata, riscriviamo le intersezioni come: P (T + B + ) = P (T + B + ) P (B + ) P (T + B ) = P (T + B ) P (B ) Per ricondurci ai valori di sensibilità e specificità facciamo i complementi opportuni ricordando che, in caso di eventi condizionati, l evento noto non deve essere modificato (essendo appunto noto): P (T + B ) = P (T + B ) P (B ) = ( P (T B )) ( P (B + )) Riscriviamo il teorema di Bayes andando a sostituire: P (B + T + ) = P (T + B + ) P (B + ) P (T + B + ) P (B + ) + ( P (T B )) ( P (B + )) In questa espressione P (B + ) indica la probabilità di essere malati a priori; per stimarla possiamo utilizzare i dati di prevalenza dell epatite B che in Italia sono intorno a 00000 affetti P (B+ ) = 00000 Sostituiamo i valori: P (B + T + ) = 0.95 0.95 00000 00000 + ( 0.90) ( 00000 ) 5 Il gioco delle tre scatole Abbiamo tre scatole identiche, ogni scatola contiene monete. La prima scatola contiene due monete da 50 cent, la seconda contiene una moneta da 50 cent e una da euro, la terza contiene due monete da euro. Estraggo una scatola casualmente e, da questa scatola estraggo una moneta da 50 cent. 5
a) Qual è la probabilità che io abbia astratto la prima, la seconda o la terza scatola? Definiamo gli eventi di interesse e le relative probabilità a priori: A=(Ho estratto la prima scatola) P (A) = B=(Ho estratto la seconda scatola) P (B) = C=(Ho estratto la terza scatola) P (C) = L estrazione casuale della scatola implica che le probabilità a priori siano le stesse D=(Ho estratto una moneta da 50 cent) Vogliamo calcolare la probabilità delle tre scatole, noto l evento D; in simboli P (A D), P (B D), P (C D) Sappiamo che P (D A) = P (D B) = P (D C) = 0 Dal teorema di Bayes dove P (A D) = P (D A) P (A) P (D) P (D) = P ((D A) (D B) (D C)) Essendo eventi incompatibili, avremo P (D) = P (D A) + P (D B) + P (D C) Per la legge delle probabilità composte P (D A) = P (D A) P (A) P (D B) = P (D B) P (B) P (D C) = P (D C) P (C) Sostituendo P (A D) = P (D A) P (A) P (D A) P (A) + P (D B) P (B) + P (D C) P (C) 6
Da cui P (A D) = + + 0 = Analogamente P (B D) = P (D B) P (B) P (D A) P (A) + P (D B) P (B) + P (D C) P (C) Da cui P (B D) = + + 0 = 6 = Infine P (C D) = P (D C) P (C) P (D A) P (A) + P (D B) P (B) + P (D C) P (C) = 0 Questo semplice esempio puó aiutarci ad intuire la logica alla base dell approccio Bayesiano dell inferenza. Immaginiamo che le tre scatole siamo delle ipotesi da valutare. P (A), P (B), P (C) sono le loro probabilità a priori, tutte uguali nel nostro esempio. Eseguiamo il nostro esperimento e indichiamo con D l evidenza sperimentale. Il Teorema di Bayes ci consente di rivalutare le probabilità delle nostre ipotesi alla luce dei dati sperimentali calcolando le loro probabilità a posteriori, P (A D), P (B D), P (C D). È evidente che, dopo l estrazione della moneta da 50 cent, la scatola piú probabile diviene la prima scatola. Il rapporto P (D A), noto come rapporto di verosimiglianza delle due ipotesi P (D B) sulla base dei nostri dati sperimentali, è quello che trasforma il rapporto delle probabilità a priori nel rapporto delle probabilità a posteriori P (A) P (B) P (D A) P (D B) = P (A D) P (B D) / / / = / / Le due scatole avevano inizialmente la stessa probabilità ma, osservata la moneta estratta, la prima scatola diventa due volte piú probabile della seconda scatola Questa logica puó essere iterata come dimostra l esempio che segue. Le probabilità a posteriori dopo il primo esperimento diventeranno le probabilità 7
a priori per l esperimento successivo, riflettendo le nostre conoscenze all inizio del secondo esperimento. b) Rimettiamo la moneta nella scatola da cui l abbiamo estratta, ripetiamo l estrazione dalla stessa scatola ed esce nuovamente una moneta da 50 cent. Calcolare le probabilità che la scatola che abbiamo estratto sia la prima, la seconda o la terza. Evento E = ( Esce di nuovo una moneta da 50 cent) Le probabilità a posteriori dopo la prima estrazione possono essere considerate probabilità a priori prima della seconda estrazione: P (A) =, P(B)=, P(C)=0 Dobbiamo calcolare P (A E), P (B E), P (C E) P (A E) = P (E A) P (A) P (E) P (E) = P (E A) P (E B) P (E C) Essendo eventi incompatibili avremo P (E) = P (E A) + P (E B) + P (E C) P (E A) = P (E A) P (A) P (E B) = P (E B) P (B) P (E C) = P (E C) P (C) quindi: P (A E) = P (E A) P (A) P (E A) P (A) + P (E B) P (B) + P (E C) P (C) = + = + 0 5 P (B E) = P (B E) = P (E B) P (B) P (E) P (E B) P (B) P (E A) P (E) + P (E B) P (B) + P (E C) P (C) = + = + 0 5 8
P (C E) = P (C E) = P (E C) P (C) P (C) P (E C) P (C) P (E A) P (A) + P (E B) P (B) + P (E C) P (C) = 0 La seconda estrazione di una moneta da 50 cent ha evidentemente rafforzato l ipotesi che la scatola estratta sia la prima. 6 Lanciamo i dadi Un dado viene lanciato due volte in successione. Indichiamo con X e X il risultato del primo e del secondo lancio Calcolare la distribuzione della somma dei due risultati Y = X + X X = Risultato primo lancio Ω X = {,,,, 5, 6}, P (X = k) = 6 k Ω X X = Risultato secondo lancio Ω X = {,,,, 5, 6}, P (X = j) = 6 j Ω X Y = X + X Ω Y = {,,, 5, 6, 7, 8, 9, 0,, } Riportiamo nella matrice a seguire tutti i risultati osservabili per il vettore aleatorio (X, X ) 5 6,,,,, 5, 6,,,,, 5, 6,,,,, 5, 6,,,,, 5, 6 5 5, 5, 5, 5, 5, 5 5, 6 6 6, 6, 6, 6, 6, 5 6, 6 Osserviamo che P {(X = k) (X = j)} = 6 6 = 6 (k, j) Ω (X, X ) poiché i risultati dei due lanci sono indipendenti e il dado è bilanciato. Possiamo allora applicare la definizione classica di probabilità come rapporto di casi favorevoli all evento su casi possibili 9
P (Y = ) = P (Y = ) = P (Y = ) = P (Y = 5) = P (Y = 6) = P (Y = 7) = P (Y = 8) = P (Y = 9) = P (Y = 0) = P (Y = ) = P (Y = ) = 6 6 6 6 5 6 6 6 5 6 6 6 6 6 Allo stesso risultato si puó giungere utilizzando le proprietà della probabilità P (Y = ) = P ((X = X = ) (X = X = ) (X = X = )) Dato che gli eventi sono incompatibili possiamo riscrivere la probabilità della loro unione come somma delle probabilità dei singoli eventi P (Y = ) = P (X = X = ) + P (X = X = ) + P (X = X = ) = da cui, sempre per l indipendenza dei lanci P (Y = ) = 6 + 6 + 6 = 6 = 6. 7 Ancora sui dadi Immaginiamo di sapere che il risultato del primo lancio sia stato un numero maggiore di. Calcolare la distribuzione di Y X > Adesso l insieme di coppie osservabili sarà 5 6,,,,, 5, 6 5 5, 5, 5, 5, 5, 5 5, 6 6 6, 6, 6, 6, 6, 5 6, 6 0
da cui Ω Y X> = {5, 6, 7, 8, 9, 0,, } Osserviamo che ancora queste coppie sono equiprobabili (perché?) quindi possiamo utilizzare la definizione classica di probabilità per ottenere P (Y = 5) = P (Y = 6) = P (Y = 7) = P (Y = 8) = P (Y = 9) = P (Y = 0) = P (Y = ) = P (Y = ) = 8 8 8 8 8 8 8 8 Ad un risultato analogo saremmo arrivati utilizzando la definizione di probabilità condizionata. Ad esempio P (Y = 5 X > ) = P (Y = 5 X > ) P (X > ) = /6 8/6 = /8