CALCOLO DELLE PROBABILITA Italo Nofroni Statistica medica - Facoltà di Medicina Sapienza - Roma Nella ricerca scientifica, così come nella vita, trionfa l incertezza Chi guiderà il prossimo governo? Quanto costerà la benzina fra 3 mesi? Conviene più investire in BOT o in Azioni? Chi vincerà i prossimi mondiali di calcio? Quando di troverà una cura per l AIDS? Il prossimo inverno sarà molto freddo? A queste domande, in genere, non si può dare una risposta certa, ma soltanto una risposta basata su dati, informazioni, opinioni, ipotesi, teorie una risposta, quindi, più o meno strettamente basata sul Calcolo delle probabilità Il Calcolo delle probabilità è costituito da un insieme di metodi matematici atti ad esprimere numericamente la fiducia (probabilità) che un determinato evento si verifichi Ogni evento, ovvero il verificarsi di un determinato risultato, si ottiene, generalmente, dall effettuazione di una prova (detta casuale o aleatoria) L insieme di tutti i possibili eventi conseguenti ad una prova è detto spazio degli eventi (o spazio campionario) Esempio 1 Prove ed eventi Prova Spazio degli eventi Lancio di una moneta Test o croce Lancio di un dado Facce da 1 a Estrazione di una carta Cuori, quadri, fiori, picche Giocare al Superenalotto Vincere o perdere Salire le scale Inciampare o meno Fare una diagnosi Indovinarla o meno Assumere una terapia Guarire, non guarire Fare una esame universitario Promosso o bocciato 1
Esempio 2 - Spazio degli eventi del lancio di 2 dadi Se un evento è, a sua volta, costituito dal verificarsi di più eventi singoli, legati tra loro da una qualche regola, viene detto evento complesso (o evento composto) 1 2 1 2 3 Dado B 2 3 3 4 4 4 In questo caso lo spazio degli eventi è determinato da come si compongono i vari eventi Dado A 3 4 4 9 9 10 9 10 11 9 10 11 12 Eventi compatibili Che possono verificarsi insieme Eventi indipendenti il verificarsi dell uno non influenza il verificarsi dell altro Eventi incompatibili Che non possono verificarsi insieme Eventi dipendenti il verificarsi dell uno influenza il verificarsi dell altro Eventi dicotomici Che possono presentarsi solo con due distinte modalità Eventi policotomici Che possono presentarsi con più di due modalità In questo caso, spesso, vengono uniti o raggruppati, secondo logiche diverse Eventi complementari Dato l evento E, l evento complementare corrisponde all evento NON E = E (detto E soprasegnato) La somma (unione) di due eventi complementari determina lo spazio degli eventi, ovvero la totalità di tutti i possibili eventi P (E) + P (E) = 1 2
Eventi complementari Pertanto, indicando con p la probabilità che l evento E si verifichi e con q la probabilità contraria (che l evento E non si verifichi), sarà sempre p + q = 1 Eventi impossibili Che non possono verificarsi mai, la cui probabilità vale sempre 0 Eventi possibili Che possono verificarsi con diversi livelli di probabilità Eventi certi Che si verificano sempre, la cui probabilità vale sempre 1 Pertanto la probabilità di un qualunque evento, e calcolata con qualunque metodo, è sempre necessariamente compresa tra 0 ed 1 Frequentemente, per semplici esigenze pratiche, la probabilità viene moltiplicata per 100, esprimendola quindi con un valore percentuale 0 P(E) 1 0 %(E) 100 Scuola classica La probabilità è stata studiata da tre distinte Scuole di pensiero che ne hanno fornito tre diversi metodi di calcolo Scuola classica Scuola frequentista Scuola soggettivista (o Bayesiana) La probabilità di un evento è data dal numero dei casi favorevoli all evento, sul numero dei casi possibili P(E) = -------------------- Numero casi favorevoli Numero casi possibili 3
Tale metodo è correttamente applicabile purché Siano noti e ben definiti sia i casi favorevoli che i casi possibili I casi possibili siano equiprobabili Esempio 3 - Probabilità di ottenere testa lanciando una moneta La prova lancio di una moneta (regolare) può dar luogo solo a 2 eventi: testa e croce 1 P(Testa) = -------- = 0.0 2 Esempio 4 - Probabilità di estrarre una carta a spade (senza fare imbrogli ) 10 P(S) = --------------- = 0.2 40 Scuola frequentista La probabilità di un evento si ottiene dal rapporto fra il numero dei successi ed il numero delle prove indipendenti, purché queste siano sufficientemente numerose In pratica il rapporto fornisce solo una stima della vera probabilità cui si arriverebbe solo effettuando infinite prove Quindi, col metodo frequentista, la vera probabilità si otterrà come Numero dei successi P(E) = -------------------- Numero delle prove lim N Scuola soggettivista La probabilità di un evento è espressa, soggettivamente, sulla base delle informazioni a priori di cui dispone il ricercatore E evidente che ricercatori diversi in possesso di informazioni diverse, ma anche delle stesse informazioni, possono definire probabilità diverse 4
Per assegnare un valore numerico a tale probabilità soggettiva, ci si pone nel ruolo di scommettitore Si stabilisce che si è disposti a perdere la quantità U quando l evento E non si verifica, in cambio di una vincita V, quando l evento E si realizza Si accetta, inoltre, in teoria, di assumere nella scommessa entrambi i ruoli, in quanto la si giudica equa Secondo tale logica, la probabilità dell evento E si otterrà come U P(E) = -------------- U + V In questa situazione, un modo alternativo di esprimere la probabilità è ricorrere al calcolo degli odds P(E) U/(U + V) U Odds = ------------- = ---------------- = ------- 1 P(E) V/(U + V) V L odds rappresenta quanto si è disposti a rischiare, per unità di vincita, scommettendo su un determinato evento Esprime, quindi, il grado di sicurezza con cui si prevede l esito, in una scala compresa fra 0 ed infinito E pari al reciproco della quota che un bookmaker paga nel caso di vincita 1 - Teorema delle probabilità totali Le procedure già viste consentono di calcolare/stimare/valutare la probabilità di eventi singoli Per la probabilità di eventi complessi si ricorre ai seguenti quattro teoremi Dati due o più eventi incompatibili, la probabilità che si verifichi uno di essi è data dalla somma delle probabilità dei singoli eventi P(A o B) = P(A) + P(B)
Esempio Da un mazzo di carte italiane di vuol estrarre una carta e calcolare la probabilità che questa sia un asso o una figura Sappiamo che le carte italiane sono in totale 40 e che gli eventi richiesti sono incompatibili, perciò avremo P(Asso o Figura) = P(A) + P(F) = = 4/40 + 12/40 = = 0.1 + 0.3 = 0.4 2 - Teorema delle probabilità composte Dati due o più eventi indipendenti, la probabilità che si verifichino congiuntamente è data dal prodotto delle probabilità dei singoli eventi P(A e B) = P(A) P(B) Esempio Si vuol conoscere la probabilità di ottenere testa lanciando una moneta, estrarre una carta a spade ed ottenere 4 lanciando un dado I tre eventi sono ovviamente tra loro indipendenti Perciò avremo P(Testa e Spade e X = 4) = = P(T) x P(S) x P(4) = = 1/2 x 10/40 x 1/ = = 1/2 x 1/4 x 1/ = = 1/4 = 0.020 3 - Teorema delle probabilità totali per eventi compatibili Dati due o più eventi compatibili, ed indipendenti, la probabilità che si verifichi uno di essi è data dalla somma delle probabilità dei singoli eventi, meno il prodotto delle probabilità dei singoli eventi P(A o B) = P(A) + P(B) P(A)P(B)
Esempio Da un mazzo di carte italiane di vuol estrarre una carta e calcolare la probabilità che questa sia una carta a coppe o una figura I due eventi sono ovviamente compatibili e indipendenti Perciò avremo P(Coppe o Figura) = = P(C) + P(F) - P(C) x P(F) = = 10/40 + 12/40 10/40 x 12/40 = = 22/40 3/40 = 19/40 = 0.4 La logica di tale risultato può essere confermato con il ricorso ai diagrammi di Wenz F C 4 - Teorema delle probabilità composte per eventi dipendenti Dati due o più eventi dipendenti, la probabilità che si verifichino congiuntamente è data dal prodotto delle probabilità condizionate dei singoli eventi C F In questa situazione è necessario tener conto dell ordine del verificarsi degli eventi in quanto il primo è in grado di influenzare il secondo, il secondo il terzo e così via P(A e B) = P(A) P(B/A) Esempio Da un urna contenente palline rosse e 12 palline verdi, se ne vogliono estrarre 2 senza ripetizione (senza inserire nuovamente nell urna la prima estratta), e calcolare la probabilità che la prima sia rossa e la seconda verde
Poiché la prima pallina estratta non verrà reimbussolata, la seconda estrazione sarà affettuata su un numero di palline inferiore rispetto alla prima e quindi con una probabilità diversa, detta condizionata dalla prima estrazione Quindi avremo P(Rossa e Verde) = = P(R) x P(V/R) = = /20 x 12/19 = = 0.22