Problemi e formula di Bayes Daniela Valen), Treccani Scuola 1
Problemi antichi 1. Lancio una volta un dado A 1 : Esce 6 P( A 1 ) = 1 6 B 1 : NON esce 6 2. Lancio più volte un dado P( B 1 ) = 5 6 Sapere l esito del primo lancio non modifica la probabilità che esca o non esca 6 anche al secondo lancio. Ogni lancio è indipendente dai precedenti. Ecco un video che illustra due classici problemi sul lancio ripetuto di dadi. Le scommesse del Cavalier De Méré https://www.youtube.com/watch?v=_buzheq0upk Daniela Valen), Treccani Scuola 2
Riflessioni sul primo problema Ecco il problema dei quattro lanci di dadi successivi schematizzato con un diagramma ad albero A 1 : Esce 6 B 1 : NON esce 6 P( A 1 ) = 1 6 P( B 1 ) = 5 6 Riflettiamo sulla probabilità dei seguenti eventi in 4 lanci di un dado C. Non esce 6 per 4 volte D. Esce 6 almeno una volta D = C P ( D ) = 1 5 6 0,5177 Per risolvere il problema applico: la probabilità composta e la probabilità dell evento complementare Daniela Valen), Treccani Scuola C = B 1 B 2 B 3 B 4 P(C) = 5 4 6 5 6 5 6 5 6 = 5 6 3 4
Riflessioni sul secondo problema Estendo il procedimento a 24 lanci di 2 di dadi Una figura per visualizzare le 36 alternative nel lancio di 2 dadi A 1 : Esce doppio 6 B 1 : NON esce doppio 6 P( A 1 ) = 1 36 P B 1 = 35 36 Riflettiamo sulla probabilità dei seguenti eventi relativi a 24 lanci di 2 dadi C. Non esce doppio 6 per 24 volte 36 D. Esce doppio 6 almeno una volta D = C P( D) = 1 35 P(C) = 35 36 4 Daniela Valen), Treccani Scuola 24 24 0, 4914
Altre riflessioni sul secondo problema Che succede se lancio i due dadi più di 24 volte, ad esempio 26 volte? A 1 : Esce doppio 6 P( A 1 ) = 1 36 B 1 : NON esce doppio 6 P( B 1 ) = 35 36 = 1 35 P D 36 26 0,5193 Lancio i 2 dadi 26 volte e punto sull uscita di almeno un doppio 6. È più probabile vincere che perdere Anche per risolvere il secondo problema applico: la probabilità composta e la probabilità dell evento complementare Daniela Valen), Treccani Scuola 5
Un problema attuale Un notevole fastidio della posta elettronica (email) è l arrivo di messaggi indesiderati (spam). Perciò molti gestori di email propongono un software (filtro antispam) che cerca parole frequenti nelle mail già ricevute e classificate come spam. Con gli esiti di questa ricerca, il filtro - valuta la probabilità P che sia una spam ogni nuovo messaggio; - mostra il messaggio solo se P è inferiore a dato un valore, ad esempio 0,9. Scopriamo, a partire da un esempio, il procedimento per calcolare la probabilità P e le sue numerose applicazioni nei più vari settori della realtà scientifica e sociale. Daniela Valen), Treccani Scuola 6
Un filtro antispam Un filtro antispam ha analizzato 5000 mail ricevute e ha trovato che: - il 30% delle mail ricevute è stata classificata spam dall utente; - l 80% delle spam conteneva la parola acquista ; - solo il 2% dei messaggi validi conteneva la parola acquista. Queste informazioni portano a valutare statisticamente la probabilità dei seguenti eventi: A. Il messaggio è spam Ā. Il messaggio NON è spam (è valido) B. Trovo la parola acquista nel messaggio B I A. Trovo la parola acquista nel messaggio che è spam B I Ā. Trovo la parola acquista nel messaggio che NON è spam Debbo quindi calcolare la probabilità che un messaggio sia spam, sapendo che contiene la parola acquista, cioè P(A I B). Quali probabilità conosco e come organizzo il calcolo? Daniela Valen), Treccani Scuola 7
Daniela Valen), Treccani Scuola Filtro antispam: probabilità note Eventi da esaminare A. Il messaggio è spam Ā. Il messaggio non è spam (è valido) B. Il messaggio contiene la parola acquista Prima valutazione statistica di probabilità: il 30% dei messaggi è classificata spam Altre due informazioni da considerare: - nell 80% delle spam ho trovato acquista P(A) = 30 100 = 0,3 P(B A) = 80 100 = 0,8 - nel 2% delle NON spam ho trovato acquista P(B A ) = 2 100 = 0,02 Da tutte queste informazioni debbo ricavare la probabilità che sia spam un messaggio che contiene la parola acquista, cioè debbo calcolare P(A B) = P A B P B P(A ) = 1 P(A) = 0, 7 8
Filtro antispam: calcolare P(A I B) Un diagramma ad albero per organizzare il calcolo Infine trovo P(A B) = P A B P B = 0,24 0,254 0,945 0,945 > 0,9, perciò il filtro tratterà il messaggio come spam Daniela Valen), Treccani Scuola 9
Riflessioni sul procedimento seguito P( A B) = P( B A) P( A) P(A B) = P A B P B P( B) = P( B A) P( A) + P( B A ) P( A ) Ecco come calcolare P(AIB) a partire dalle probabilità note P(A B) = P(B A) P A P(B A) P A + P(B A ) P( A ) Daniela Valen), Treccani Scuola 10
La formula di Bayes Risponde a una domanda: Esempio Come modifico la probabilità che una mail sia spam, quando so che contiene la parola acquista? Daniela Valen), Treccani Scuola P(A B) = In generale Come modifico la probabilità di un evento A, quando so che si è verificato un altro evento B? La formula può essere scritta in varie forme: P(A B) = P A B P B Se sono dati P(A B) e P( B) P(A B) = P(B A) P A P(B A) P( A)+ P(B A ) P A Se sono dati P( A), P( A ), P( B A), P( B A ) P(B A) P A P B Thomas Bayes 1701-1761 Se sono dati P(B A), P(A) e P B 11
Applicazioni della formula di Bayes Numerose applicazioni della formula nei più vari settori della realtà scientifica e sociale Diagnosi mediche Intelligenza artificiale Ricerca di relitti in mare Daniela Valen), Treccani Scuola Indagini della polizia e processi penali o civili 12
Attività 2 Il lavoro di gruppo è dedicato a risolvere problemi che richiedono di applicare la probabilità composta, insieme con la probabilità dell evento complementare o la formula di Bayes Dividetevi in gruppi di 2 4 persone; ogni gruppo avrà una scheda di lavoro da completare. Avete 30 minuti di tempo Daniela Valenti, Treccani scuola 13
Che cosa abbiamo ottenuto Daniela Valenti, Treccani scuola 14
Problema sul Totocalcio Il tifoso sbaglia 5 pronostici su 100 La storia del Totocalcio 0,4877 < 0,5 La probabilità di fare 14 è poco più piccola della probabilità che esca Testa lanciando una moneta. Daniela Valenti, Treccani scuola 0,5133 > 0,5 La probabilità di fare 13 era poco più grande della probabilità che esca Testa lanciando una moneta. 15
Problema sugli errori di scrittura Poco più grande della probabilità che non esca 6 lanciando un dado. Ecco perché i nomi dei siti sono generalmente corti. Qualche esempio Presidenza della repubblica italiana: www.quirinale.it Presidenza del consiglio dei ministri: www.governo.it Daniela Valenti, Treccani scuola 16
Problema sulle indagini nei processi La formula di Bayes fornisce un procedimento scientifico per prendere in considerazione tutte le informazioni disponibili, ciascuna con la loro importanza, in modo da ottenere una condivisibile valutazione di probabilità. Daniela Valenti, Treccani scuola 17
I diagrammi ad albero Sono un utile strumento per schematizzare i dati e il procedimento risolutivo di un problema di calcolo delle probabilità. Daniela Valenti, Treccani scuola 18
Problema sui test di gravidanza Questo è il procedimento per valutare gli esperimenti che studiano alcune importanti caratteristiche dei test clinici. Daniela Valenti, Treccani scuola 19
Strumenti essenziali Diagrammi ad albero Diagrammi di Venn Tabelle a doppia entrata Formule Daniela Valenti, Treccani scuola 20
Problemi, giochi, paradossi, Guardiamo un video per incontrare un problema intrigante Il problema di Monty Hall https://www.youtube.com/watch?v=pjwmi7ovaag Steve Selvin, un professore americano di statistica, propone il problema per la prima volta nel 1975. Il problema compare poi nel 1990 su un settimanale americano e da allora acquista popolarità, fino a comparire fra le applicazioni per smartphone e tablet. Steve Selvin (1941) Ma come si arriva a risolvere il problema? Daniela Valenti, Treccani scuola 21
Risolvere il problema di Monty Hall Ecco un procedimento basato su un diagramma ad albero Stesso ragionamento, se il giocatore sceglie la porta 2 o 3. In rete si trovano video e documenti con molte altre soluzioni: dopo tanti anni il problema continua a stimolare la creatività. Daniela Valenti, Treccani scuola 22