ESERCIZI SULLE PROBABILITA E LE VARIABILI ALEATORIE



Documenti analoghi
Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria della probabilità A.A

Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria della probabilità A.A

Statistica. Lezione : 18, 19. Variabili casuali

c) Ancora in corrispondenza allo stesso valore di p e ponendo Y = minorazione, fornita dalla diseguaglianza di Chebichev, per la probabilita

Sulle probabilità nel gioco del SuperEnalotto, di Witko -

Introduzione al modello Uniforme

Teoria della probabilità Variabili casuali

Corso di Istituzioni di Matematiche con Elementi di Statistica. anno accademico 2015/2016 corso A-L (G. Gaeta & N. Bressan)

Laboratorio di Chimica Fisica. Analisi Statistica

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Probabilità. Lezioni : 11, 12. Docente: Alessandra Durio

Alcune v.a. discrete notevoli

Introduzione al modello Uniforme

Variabili casuali. - di Massimo Cristallo -

Teorema del limite centrale TCL

Distribuzioni di Probabilità

RICHIAMI DI CALCOLO DELLE PROBABILITÀ

1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente:

Definizione della variabile c 2 Distribuzione della variabile c 2

Statistica ARGOMENTI. Calcolo combinatorio

p k q n k = p n (k) = n 12 = 1 = ,1208. q = 1 2 e si ha: p 12 (8) =

Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazion

Outline. 1 v.c. continue. 2 v.c. Normale. 3 v.c. Esponenziale. Lezione 13. A. Iodice. v.c. continue. v.c. Normale. v.c.

Esercitazione N. 1 (11 ottobre 2016)

Appunti di Elettronica I Lezione 3 Risoluzione dei circuiti elettrici; serie e parallelo di bipoli

y + P(x) y + Q(x) y = 0 y(x) = c 1y 1(x) + c 2 y 2(x).

3.1 La probabilità: eventi e variabili casuali

Note sulla probabilità

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Probabilità. Spazi di probabilità

Elaborazione statistica di dati

Sistemi lineari. Lorenzo Pareschi. Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara

Elaborazione statistica di dati

Calcolo delle Probabilità

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

assuma valori in un determinato intervallo è data dall integrale della sua densità ( = )=

, B con probabilità 1 4 e C con probabilità 1 4.

Variabili aleatorie n-dim

Corso di Laurea Triennale in Matematica Calcolo delle Probabilità I (docenti G. Nappo, F. Spizzichino)

Esperimentazioni di Fisica 1. Prova in itinere del 12 giugno 2018

PROBABILITA. Distribuzione di probabilità

Il Corso di Fisica per Scienze Biologiche

Variabili aleatorie Parte I

Corso di Fondamenti di Telecomunicazioni

1! 4! = 5. Quindi la probabilità di ottenere 1 successo su 5 lanci sarà 5 2 = 5! 2! 3! = 10

INFORMAZIONI. p. 1/23

POPOLAZIONE E CAMPIONI

{ } corrisponde all uscita della faccia i-esima del dado. La distribuzione di probabilità associata ( )

1 Schemi alle differenze finite per funzioni di una variabile

Indici di posizione e dispersione per distribuzioni di variabili aleatorie

Il coefficiente angolare è 3/2 mentre Q ha coordinate (0;0). La retta passa per l origine.

Esercitazione 5 del corso di Statistica 2 Prof. Domenico Vistocco

Corsi di Laurea in Ingegneria Civile e Edile Analisi Matematica II e Probabilita Lezioni A.A. 2000/01, prof. G. Stefani 9 Ottobre Gennaio 2001

Esercitazione del 29 aprile 2014

Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 2016/17 - Prova del

Lezione 12. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 12. A. Iodice.

1) Probabilità di errore di trasmissione. 2) Capacità di canale. 3) Esempi di calcolo della capacità. 4) Disuguaglianza di Fano

LOGARITMI. Corso di laurea: BIOLOGIA Tutor: Floris Marta; Max Artizzu PRECORSI DI MATEMATICA. L uguaglianza: a x = b

La Retta Ogni funzione di primo grado rappresenta, graficamente, una retta. L equazione della retta può essere scritta in due modi

Variabili aleatorie. Variabili aleatorie e variabili statistiche

Materiale didattico per il corso di Statistica I Quinta esercitazione SOLUZIONI

04 - Numeri Complessi

Calcolo delle probabilità (3/7/2001) (Ing. Elettronica, Informatica, Telecomunicazioni - Latina)

MATEMATICA FINANZIARIA RISCHI: RAPPRESENTAZIONE E GESTIONE (CENNI)

Correzione Esercitazione 2

Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 2016/17 - Prova del

Esercitazioni di Matematica

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA

CALCOLO DELLE PROBABILITÀ - 9 giugno 1998 Scrivere le risposte negli appositi spazi Motivare dettagliatamente le risposte su fogli allegati

Calcolo delle Probabilità e Statistica, Ingegneria Civile e A&T e Informatica I prova finale a.a. 2016/17

Distribuzione Normale. Dott. Claudio Verona

SOLUZIONI DEL 2 0 TEST DI PREPARAZIONE ALLA 1 a PROVA INTERMEDIA

Basi matematiche per il Machine Learning

RICHIAMI DI STATISTISTICA E CALCOLO DELLE PROBABILITA

Esercizi. 2. [Conteggio diretto] Due dadi vengono lanciati in successione. a) Qual è la probabilità che la somma dei due risultati faccia 7?

SCHEDA DIDATTICA N 7

La funzione di distribuzione Gaussiana normale

MATEMATICA E STATISTICA CORSO A SCIENZE BIOLOGICHE MOLECOLARI ESERCITAZIONE

P (CjB m )P (B m ja) = p:

Esercizi di statistica

Corso di Laurea in Ingegneria Informatica e Automatica (M-Z) Università di Roma La Sapienza CALCOLO DELLE PROBABILITÀ E STATISTICA ESAME DEL 6/02/2017

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 3: Variabili aleatorie discrete notevoli

CAPITOLO QUINTO DISTRIBUZIONE NORMALE

Sistemi II. Sistemi II. Elisabetta Colombo

Statistica. Lezione : 17. Variabili casuali

DISTRIBUZIONI DI PROBABILITA (parte 2) 1 / 27

Scheda n.3: densità gaussiana e Beta

Matematica (proff. Archetti e Pellizzari) Corso di laurea COMES 3 settembre 2012

Corso di Laurea in Informatica Applicata Esame di Calcolo delle Probabilità e Statistica Prova scritta dell 11 gennaio 2007

Sperimentazioni di Fisica I mod. A Statistica - Lezione 3

tabelle grafici misure di

1 Polinomio di Taylor 1. 2 Formula di Taylor 2. 3 Alcuni sviluppi notevoli 2. 4 Uso della formula di Taylor nel calcolo dei limiti 4

Vedi: Probabilità e cenni di statistica

Elementi di Teoria della Probabilità

Statistica Descrittiva Soluzioni 3. Medie potenziate

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

Prime nozioni sui segnali

Laboratorio di Calcolo B 68

Università del Piemonte Orientale Corsi di Laurea triennale di area tecnica. Corso di Statistica Medica. Le distribuzioni teoriche di probabilità

Transcript:

ESERCIZI SULLE PROBABILITA E LE VARIABILI ALEATORIE Esercizio N. Calcolare: - la probabilità di vincere la rendita ventennale (4 euro al mese) al Win for life, - la probabilità di fare il 6 o il 5 + al Super Enalotto, - la probabilità di fare 4 al Totocalcio. In ognuno dei tre contesti si tratta, prima di tutto, di calcolare il numero di casi possibili. Win for Life Ricordiamo che per vincere la rendita ventennale occorre: a) indovinare numeri che saranno estratti da un pannello di numeri, b) indovinare il numerone, che a sua volta è compreso tra e e può coincidere o meno con uno dei numeri estratti. Il numero di casi a) è pari alle combinazioni semplici, senza ripetizioni, di elementi, presi da un insieme che ne contiene. La formula da applicare è dunque quella del coefficiente binomiale: N E n n! k k!( n k)! () con n e k. Sostituendo i valori numerici si trova: N 84756 E La probabilità di indovinare numeri in una puntata casuale è allora: P a 6 5.4 () 84756 La probabilità di vincere la rendita ventennale, però, non è ancora fornita dalla (). Occorre infatti tener conto del numerone, il quale aumenta il numero dei casi fino a: N + 84756 3695 a b e riduce la probabilità di un fattore, portandola a: 7 +.7 3695. (3) P a b Visto che la giocata minima è di un euro, l equità del gioco richiederebbe una vincita pari a 3695 euro. In realtà, tenendo conto che con la vincita della rendita ventennale vengono assegnati ulteriori euro (premio di categoria inferiore automaticamente assegnato) la vincita complessiva è di 4 + 97 euro, quindi oltre 3.8 volte minore. Per non considerare il fatto che, nel caso di vincitori multipli, la rendita viene divisa tra essi. E anche importante osservare che si può vincere la rendita ventennale anche non indovinando alcun numero estratto, ed indovinando il numerone (la stessa simmetria vale anche per i premi minori, qui non presi in esame). Ciò si giustifica immediatamente osservando che non indovinare

alcun numero è del tutto equivalente ad indovinare numeri (quelli non estratti). Ne consegue che la probabilità di fare è uguale alla probabilità di fare. Super Enalotto Per il Super Enalotto la sequenza dei 6 numeri vincenti (lasciando da parte il numero jolly) si ottiene, casualmente, dall insieme dei 9 numeri in gioco. Ricordiamo che il regolamento del gioco prevede che i 6 numeri siano tutti diversi tra loro. Di conseguenza, il numero di casi possibili N E è dato dal numero di combinazioni semplici, senza ripetizioni, di 6 elementi, presi da un insieme che ne contiene 9. La formula da applicare è dunque ancora la () con n 9 e k 6. Sostituendo i valori numerici si trova: N E 66463 La probabilità di vittoria di una giocata singola (6 numeri) è allora pari all inverso di N E e quindi a: P E 9.6 (4) 66463 Da un diverso punto di vista, il valore di N E esprime ovviamente anche il numero di combinazioni necessarie per avere la certezza di fare 6 punti. In questo caso, dunque, il gioco sarebbe equo se, a fronte di euro giocato (costo della giocata minima, che però corrisponde alla scelta di due combinazioni), si avesse la certezza di riceverne, totalizzando 6 punti, 66463. Il giusto premio, dunque, sarebbe di 33735 euro. In realtà, la vincita più alta ad oggi realizzata, il agosto 9, a Bagnone (MS), è stata di quasi 48 milioni di euro. Per quanto concerne il 5 +, la probabilità di vincita può essere calcolata come segue. Sia: a b c d e f la sequenza di 6 numeri giocata dallo scommettitore e A B C D E F la sequenza estratta. Ipotizziamo che le due sequenze non coincidano e che dunque la giocata non abbia prodotto un 6. Chiediamoci preliminarmente quale sia la probabilità del 5. A rigore questa affermazione non è completamente vera. Da regolamento del gioco, esiste infatti la possibilità che la sestina non venga completata (e dunque premiata). Ciò avviene quando i 5 numeri estratti sulla sesta ruota (Roma) sono identici a quelli già attribuiti alle ruote precedenti. La probabilità che ciò avvenga è ovviamente pari alla probabilità di fare cinquina su una data ruota del gioco del lotto (N.B.: giocando 5 numeri) e dunque, ripetendo il ragionamento fatto sopra, vale 9. Introducendo questa correzione (che tiene dunque conto della probabilità di completare la sestina), la 5 ( ) (4) dovrebbe essere sostituita dall espressione seguente: P E. La correzione non modifica in maniera 9 9 ( 6 ) ( 5 ) apprezzabile la P E ma, riducendo la probabilità di vincita, mette ulteriormente in evidenza la non equità del gioco in cui il premio dipende dall ammontare delle giocate, attuali e precedenti, fatte dagli scommettitori, e non tiene conto dell esiguità del valore di P E (come sarebbe invece necessario in un gioco equo).

Si realizza un 5 quando uno e uno solo dei numeri estratti assume uno degli 84 valori che non fanno parte della giocata. D altro canto, questo numero, che non è stato individuato, può essere uno qualunque dei 6 estratti. In totale, quindi, si hanno 84 6 casi favorevoli a questo evento, sul totale dei casi possibili. In definitiva, la probabilità di realizzare un 5 sarà allora: 84 6 9 6 Una volta realizzato il 5, si realizza il 5 + se il numero non uscito coincide con il numero jolly. Sempre in virtù del regolamento del gioco, il numero jolly può assumere, per ogni estrazione, 84 valori (questo perché non può coincidere con alcuni dei numeri estratti) e dunque la probabilità di indovinarlo (o, meglio, di averlo indovinato ove si consideri la specifica estrazione), sarà /84. Gli eventi elementari sono ovviamente indipendenti e dunque le relative probabilità (di aver realizzato un 5 e di indovinare il numero jolly) si moltiplicano. In definitiva, la probabilità di realizzare un 5 + sarà allora: 84 6 6 9 84 9 6 6 sei volte maggiore della probabilità di realizzare un 6. Totocalcio In questo caso si hanno 4 risultati, ciascuno suscettibile di assumere 3 valori (,, ). Il numero dei casi possibili diventa allora 4 N 3 478969 T Come si vede, questo numero è circa 3 volte minore del valore di N E calcolato più sopra per il Super Enalotto. Corrispondentemente, la probabilità di vittoria giocando una singola colonna vale: P T 7.9 (5) 478969 ed è quindi più di due ordini di grandezza maggiore della (3). Vincere al Super Enalotto è dunque assai più complicato che vincere al Totocalcio. In realtà poi, lo squilibrio tra le due situazioni si accentua se si considera che mentre le sequenze del Super Enalotto sono effettivamente equiprobabili (almeno dal punto di vista di chi gioca) nel caso del Totocalcio molte delle sequenze teoricamente possibili vengono in realtà scartate dalla logica e dalle modalità con le quali si costruisce il risultato: ad esempio, non si ha memoria storica, e non v è motivo per ritenere che potrà aversi in futuro, di una colonna Totocalcio costituita da tutti segni. Resta il fatto che anche nel caso del Totocalcio il montepremi dipende dall ammontare delle giocate. Trattandosi di un gioco che è stato estremamente popolare in passato ma che attualmente è considerato fuori moda, le vincite sono modeste: la più elevata è stata realizzata a Meda (MI) il 3 marzo 5, ed ha portato nelle tasche del vincitore 963484 euro. Anche qui, e in quanto seguirà, trascuriamo per semplicità la probabilità di non completare la sestina. 3

4

Esercizio N. Si consideri l esperimento che consiste nel lancio simultaneo di due dadi (non truccati). Si definisca la variabile aleatoria discreta come la somma dei numeri risultanti dal lancio. Si descrivano le principali caratteristiche statistiche della variabile. Il primo passo consiste nella individuazione del numero e del valore dei possibili risultati dell esperimento aleatorio considerato. Visto che ogni dado può produrre 6 uscite diverse, i casi possibili sono 6 6 36 e la variabile assume valori compresi tra (ambedue i dadi danno valore ) e (ambedue i dadi danno valore 6). Se, come si è ipotizzato, i dadi non sono truccati ogni combinazione ha la stessa probabilità di verificarsi. D altro canto, alcune combinazioni producono lo stesso risultato; ad esempio, 3 si ottiene sia nel caso che il primo dado dia e il secondo, sia nel caso, simmetrico del precedente, che il primo dado dia e il secondo. 4 può essere il risultato di un lancio in cui ambedue i dadi assumono il valore, o di un lancio in cui il primo dado fornisce e il secondo 3, oppure ancora di un lancio in cui il primo dado fornisce 3 e il secondo. Questi eventi si escludono vicendevolmente e quindi le loro probabilità possono essere sommate. Estendendo il ragionamento iniziato più sopra ed indicando con P(i) la probabilità che i, si trova: P() P() 36 P(3) P() 36 3 P(4) P() 36 4 P(5) P(9) 36 5 P(6) P(8) 36 6 P(7) 36 6 (6) Si verifica immediatamente che i Pi () (7) così come è necessario per la condizione di normalizzazione. A partire dalle (6), è possibile graficare l andamento della funzione densità di probabilità f (x) per la variabile. Trattandosi di una variabile discreta, f (x) è costituita da una sequenza di impulsi matematici allocati in corrispondenza dei valori possibili per e di area pari alla corrispondente probabilità. Il risultato è riportato in Figura, dove le delta di Dirac sono state rappresentate con altezza diversa, proprio a tener conto visivamente della diversa area. La funzione di ripartizione, o distribuzione di probabilità cumulativa, F (x) rappresenta la probabilità che x. Nel caso, in esame, di variabile discreta si tratta di una funzione a gradini, in quanto la probabilità si incrementa ogni volta che si incontra un valore possibile. L andamento grafico per il caso in esame è riportato in Figura. 5

f (x) 3 4 5 6 7 8 9 x Figura F (x) 3 4 5 6 7 8 9 Figura x A questo punto possiamo calcolare il valore medio della variabile. Ricordando la definizione, si ottiene direttamente: m i P() i 7 i (8) Questo risultato poteva essere previsto anche semplicemente guardando all andamento di f (x), che è appunto centrata su tale valore. Infine, possiamo calcolare la varianza che, sempre ricordando la definizione generale, risulta: σ i ( ) i m P( i) 5.833 (9) La radice quadrata della (9) fornisce la deviazione standard (o scarto quadratico medio) σ, il cui valore risulta allora pari a.45. 6

Esercizio N. 3 Un esempio significativo di applicazione della teoria delle variabili aleatorie di tipo discreto si rinviene nel cosiddetto canale binario, di importanza fondamentale nell ambito delle trasmissioni numeriche. Si consideri dunque il caso di una sorgente numerica binaria, che emette i simboli e con probabilità P e P rispettivamente. Transitando lungo il canale di trasmissione, ove sono presenti rumore e altre cause di disturbo, il simbolo trasmesso può essere distorto e, conseguentemente equivocato in ricezione. Indichiamo con p ij (i, ; j, ) la probabilità che, trasmesso il simbolo i, in ricezione venga rivelato il simbolo j. In un canale ideale sarebbe, evidentemente, p p e p p. Nel canale reale, invece, le probabilità di transizione da un simbolo all altro sono in generale diverse da zero, e la situazione è illustrata in Figura 3. P p p P p P p P Figura 3 I simboli e in ricezione sono caratterizzati da probabilità P e P, ottenibili come: P ' P p + Pp P ' P p + Pp () In particolare compare, e la sua valutazione è estremamente importante in pratica, una probabilità di errore P P p + Pp E () che appunto si verifica quando, avendo trasmesso un simbolo, si riceve il simbolo complementare. Per un canale del tipo illustrato in Figura 3, si assuma: P.8, P., p.9, p., p.3, e si determini la probabilità di errore. Innanzitutto osserviamo che tra i dati assegnati manca il valore di p, che invece è necessario per la determinazione della P E. D altro canto, questo valore può essere immediatamente determinato utilizzando la condizione di normalizzazione: trasmesso il simbolo, in accordo con la Figura 3 non vi sono alternative al fatto che in ricezione esso venga rivelato come tale o che venga sostituito dal simbolo. Allora deve essere p + p () esattamente come P + P, e quindi: 7

p p.7 (3) Tenendo dunque conto dei valori di probabilità che caratterizzano il canale e sostituendo nella () si ottiene: P E. (4) Nell esempio numerico, le probabilità a priori dei simboli e sono state assunte diverse tra loro, come pure diverse erano le probabilità di transizione. Nondimeno, un caso particolare, frequente in pratica, è costituito dal canale binario simmetrico (BSC Binary Symmetric Channel). Per esso si ha: P P P' P' p p p p p p (5) Per questo canale si verifica immediatamente che risulta PE p (6) 8

Esercizio N. 4 Una variabile aleatoria è descritta da una densità di probabilità gaussiana con valor medio m e varianza σ 4. Si determinino: ) Pr{ 6}; ) Pr{ > 3}; 3) Pr{ }; 4) Pr{ < 3}. La densità di probabilità della variabile in oggetto è fornita dalla seguente espressione: f ( x m ) ( ) exp ( x ) x exp πσ σ π 8 (7) ed il suo andamento grafico è riportato in Figura 4...5 f (x)..5-6 -4-4 6 8 x Figura 4 A partire dalla densità di probabilità, il calcolo della probabilità che la variabile sia contenuta entro un dato intervallo (che può essere anche illimitato, superiormente o inferiormente) si riduce, ovviamente, al calcolo di un integrale. In particolare: b b ( x m ) Pr { a< b} f ( x) dx exp dx πσ σ (8) a a Si noterà che, a rigore, l integrale (8) fornisce la Pr{a b}; d altro canto, essendo una variabile aleatoria continua, si ha anche Pr{ a} e dunque il fatto di includere nel calcolo l estremo inferiore di integrazione è del tutto irrilevante. Analoga osservazione varrà per gli sviluppi successivi, e non sarà dunque ripetuta. Ai fini del calcolo, è sempre conveniente introdurre il seguente cambiamento di variabile: 9

x m σ y dx σ dy (9) Con le posizioni (9), la (8) diventa: Pr b m σ { < } exp( ) a b y dy () π a m σ Si ricordi ora la definizione della funzione errore: erf ( t ) t ( ) exp π y dy () che, sostituita nella (), consente dunque di ricavare b m { } erf a m P a b erf < σ σ () Dalla definizione stessa di funzione errore, osserviamo che risulta: erf ( ) erf ( t) erf ( t) (3) Particolarizzata all esercizio in esame, la () fornisce: b a Pr{ a< b} erf erf (4) A questo punto, le probabilità incognite si determinano valutando numericamente la funzione errore. In realtà, sono disponibili delle tabelle da cui è possibile leggere, con buona approssimazione, il valore cercato. Tipicamente, in luogo della funzione errore, queste tabelle forniscono la funzione errore complementare erfc() t erf() t (5) Tabelle per la funzione erfc( ) sono state fornite in una dispensa a parte e verranno utilizzate di seguito per risolvere la parte numerica dell esercizio. Scritta in termini di funzione errore complementare la (4) diventa: a b Pr{ a< b} erfc erfc (6) Procediamo ora al calcolo per i diversi casi proposti:

) qui si tratta di assumere: a b 6 Dunque Pr{ 6} erfc( ) erfc(.4) (7) Ora erfc ( ) erf( ) + erf( ) (8) mentre dalle tabelle leggiamo che erfc (.4).46 (9) Sostituendo: Pr{ 6}.97695 (3) ) qui si deve porre: a 3 b Dunque Pr{ > 3} erfc(.35) erfc( ) (3) Ora erfc ( ) erf( ) (3) mentre dalle tabelle leggiamo che erfc (.35).6 (33) Sostituendo: Pr{ > 3}.35 (34) 3) qui si deve porre: a b Dunque Pr{ } erfc( ) erfc(.4) (35)

Ora erfc (.4) erf(.4) + erf(.4) + erfc(.4).9539 (36) ove si è utilizzata la (7). (37) Sostituendo: Pr{ }.35 (38) 4) qui si deve porre: a b 3 Dunque Pr{ < 3} erfc( ) erfc(.35) (39) Considerando che erfc () (4) e utilizzando la (3) si ricava: { } Pr < 3.895 (4)

Esercizio N. 5 Si determinino valor medio e varianza delle variabili aleatorie seguenti tutte di notevole interesse pratico: ) gaussiana; ) uniforme; 3) di Laplace; 4) esponenziale unilatera; 5) di Rayleigh; 6) binomiale; 7) di Poisson. Le densità di probabilità e le distribuzioni di probabilità cumulativa relative a queste variabili sono già state introdotte in una dispensa precedente. Per comodità, le densità di probabilità vengono comunque ripetute di seguito. ) Gaussiana: f ( x μ) ( x) exp πσ σ (4) ) Uniforme: f a x b ( x) b a x < a, x> b (43) 3) Di Laplace (o esponenziale bilatera): a f ( x) exp( a x) a > (44) 4) Esponenziale unilatera: f a exp( ax) x ( x) x < (45) 5) Di Rayleigh: f x x exp x ( x) σ σ x < (46) 6) Binomiale: n n k n k f ( x) p ( p) δ ( x k) (47) k k 3

7) Di Poisson: f n λ ( x) exp( λδ ) ( x k) k! k k (48) Ciò premesso, il calcolo del valore medio m e della varianza σ per le varie distribuzioni può essere effettuato applicando direttamente le formule, e vale a dire: m x f ( x) dx + (49) σ + ( ) x m f ( x) dx (5) Per quanto concerne la varianza, in particolare, può essere utile la nota relazione: σ m (5) in cui + x f ( x) dx (5) è il valore quadratico medio (momento di ordine ). Ai fini del calcolo dei momenti, peraltro, e dunque di m come pure di, una procedura alternativa consiste nell utilizzo della funzione caratteristica C (u) per il tramite della relazione: M j j j dcu ( ) ( i) j,,. (53) j du u dove M j è il momento di ordine j. I risultati sono riassunti in Tabella. La convenienza (o meno) nell uso della (53) in luogo del calcolo diretto è normalmente conseguenza della struttura (più o meno complessa) della funzione densità di probabilità, e quindi dell integrale che il calcolo diretto chiede di risolvere. In effetti, le funzioni densità di probabilità proposte dall esercizio sono piuttosto semplici. Così, ad esempio, il calcolo del valore medio per la variabile uniforme è immediato, avendosi: b b b a a+ b m x f( x) dx xdx b a b a (54) a a come riportato in tabella. Il calcolo basato sulla funzione caratteristica, se non più complicato è certamente più lungo; ricordando che la funzione caratteristica nel caso di variabile uniforme vale: 4

C exp( iub) exp( iua) ( u) b a iu (55) si ha infatti: m d exp( iub) exp( iua) d exp( iub) exp( iua) ( i) du b a iu a b du u u u iubexp( iub) iua exp( iua) exp( iub) + exp( iua) a b u u (56) Sostituendo u, è chiaro che si tratta di una forma indeterminata, del tipo /, risolubile applicando la regola di L Hopital. Derivando dunque numeratore e denominatore, la precedente diventa: m ibexp( iub) b u exp( iub) ia exp( iua) + a u exp( iua) ibexp( iub) + ia exp( iua) a b u u (57) b exp( iub) + a exp( iua) a b a + b a b a b u Risultato questo coincidente, come atteso, con la (54), ma ottenuto dopo molti più passaggi. m σ gaussiana μ σ uniforme (a + b)/ (b a) / di Laplace /a esponenziale unilatera /a /a di Rayleigh σ π / ( π/)σ binomiale np np( p) di Poisson λ λ Tabella D altro canto se si considera, ad esempio, la variabile binomiale, per il calcolo diretto del valore medio è necessario un artificio. Il calcolo da sviluppare, infatti, è il seguente: n n ( ) δ n k ( k) + + n k n k k n k (58) k k m x f ( x) dx x p ( p) ( x k) dx k p ( p) avendo applicato, come al solito, la proprietà di campionamento della delta di Dirac. Si procede come segue: 5

n n! n( n )! ( k ) k!( n k)! ( k )!( n k)! ( n )! n n ( k!( ) n k)! ( k ) ( h ) n n n k n k k n k k n k m k p ( p) k p ( p) p ( p) k k k n n n k n k k n k h ( n ) h np p ( p) np p ( p) np p ( p) k k h avendo effettuato, nell ultimo passaggio, il cambio di variabile nella sommatoria: h k. In precedenza, l estremo inferiore della sommatoria era stato posto a in considerazione del fatto che il contributo alla somma per k è nullo. A questo punto basta osservare che deve essere: n h n ( h ) p h ( n ) h ( p), (6) in virtù della condizione di normalizzazione per un esperimento di Bernoulli su n prove. Equivalentemente, si può anche ricordare l espressione del coefficiente binomiale: m m + k m k ( ) ( a b) a b k m k che va qui applicato assumendo m n, a p e b p, ovviamente fornendo lo stesso risultato. In definitiva si ha dunque, per la variabile binomiale: (59) (6) m np (6) così come riportato in Tabella I. Il calcolo basato sulla funzione caratteristica è molto più diretto. Quest ultima, nel caso di variabile binomiale, vale: [ p pexp( iu ] n + ) (63) e quindi, applicando la (53), si ottiene: u [ ] [ + exp( )] dc( u) d p p iu m ( i) ( i) du du n u u ( i) n p + p exp( iu) ip exp( iu) np n (64) ovviamente coincidente con quanto ricavato in precedenza. 6

Esercizio N. 6 Una variabile aleatoria gaussiana a valor medio nullo e varianza unitaria viene applicata ad un circuito raddrizzatore a doppia semionda la cui caratteristica ingresso-uscita vale y x /. Determinare la densità di probabilità della variabile aleatoria in uscita Y. Ripetere il calcolo assumendo un raddrizzatore a semplice semionda in luogo di quello a doppia semionda. Si tratta di un tipico problema di trasformazione di variabile aleatoria. La variabile aleatoria in ingresso è caratterizzata da una densità di probabilità f x ( x) exp π (65) Nel caso di raddrizzatore a doppia semionda la caratteristica ingresso-uscita è illustrata in Figura 5. y x Figura 5 Le formule di trasformazione di variabile aleatoria, che sono note dalla teoria, devono essere applicate a tratti, nelle zone in cui il legame funzionale tra x e y è monotono. Dalla Figura osserviamo dunque che è necessario distinguere il caso x e il caso x. Per x si ha: x dx y x y dy (66) e quindi 3 : dx 4y fy( y) f( x) exp exp dy x y y (67) π π Per x si ha invece: ( ) x dx y x y dy (68) ma, come in precedenza, 3 In altra dispensa, anziché il prodotto per dx/dy si considerava la divisione per dy/dx ; come accennato nella parte relativa alle funzioni di n variabili aleatorie, le due procedure sono perfettamente equivalenti (fornendo infatti, come è facile verificare, lo stesso risultato). 7

dx 4y fy( y) f( x) exp exp dy x y y (69) π π identica alla (67). Inoltre, visto che tanto i valori di x quanto i valori di x producono y, le (67) e (69) devono essere sommate per ricavare la densità di probabilità risultante della variabile Y. In definitiva si ha dunque: ( ) f Y ( y ) ( y) exp y π y < (7) La seconda riga della (7) è giustificata dal fatto che non si hanno valori di x che producono y <. Nel caso di raddrizzatore a semplice semionda la caratteristica ingresso-uscita è illustrata in Figura 6. y x Figura 6 Nulla cambia, rispetto al caso precedente, per i valori di x (per i quali dunque continua a valere la (69)) mentre tutti i valori di x < vengono trasformati in y. Ciò significa che ad y viene ad essere associata una probabilità diversa da zero, e in particolare: x Pr{ Y } Pr{ < } f ( x) dx exp dx π (7) La variabile aleatoria Y in uscita dal raddrizzatore a semplice semionda è quindi una variabile aleatoria mista, e la sua densità di probabilità si scrive dove ( ) fy ( y) exp y u( y) + δ ( y ) (7) π y uy ( ) y < (73) è la funzione gradino unitario. 8

Esercizio N. 7 Due variabili aleatorie e Y, tra loro statisticamente indipendenti, sono descritte da due densità di probabilità uniformi, f (x) e f Y (y), la prima tra e a, la seconda tra b e. Posto Z + Y, si ipotizzi inizialmente che sia a b, e si calcolino: ) la densità di probabilità di Z; ) il valore medio e la varianza di Z. Si ripeta quindi il calcolo assumendo b > a. Le densità di probabilità di e Y sono mostrate in Figura 7. f (x) f (y) Y /a /b a x -b y Figura 7 Nel caso di variabili aleatorie statisticamente indipendenti, è noto che la densità di probabilità della somma si ottiene come integrale di convoluzione delle densità di probabilità degli addendi; si ha cioè: + fz( z) f( z y) fy( y) dy (74) Si tratta quindi di particolarizzare questo risultato all esercizio in esame. Nel caso a b, le densità di probabilità di e Y si riducono a due funzioni rettangolari di uguale estensione, seppur diversamente allocate. Il risultato della convoluzione di due funzioni di questo tipo è ben noto dalla teoria dei segnali, producendo infatti una funzione triangolare. Questa funzione sarà allocata tra a e +a, corrispondenti, rispettivamente, a valore minimo e valore massimo di Z, ed avrà l andamento illustrato in Figura 8. Il valore medio e la varianza di Z possono essere determinati a partire dalla f Z (z); nondimeno, risulta più agevole e significativo il calcolo diretto a partire dalla conoscenza degli indicatori statistici di e Y. Si ha infatti: m Z + Y + Y m + m Z Y ( ) Z Z Z Z Z Z Z σ Z m Z m Z + m Z m Z + m ( + Y) m (75) Z + Y + Y m D altro canto, essendo e Y statisticamente indipendenti, si ha Y Y mmy, mentre mz ( m + my) m + my + mmy. Sostituendo nella seconda delle (75) otteniamo: 9

Z Y mmy m my mmy Y σ + + σ + σ (76) avendo anche utilizzato il risultato (5). f Z(z) /a -a a z Figura 8 In definitiva: il valor medio della somma è uguale alla somma dei valori medi e la varianza della somma è uguale alla somma delle varianze. Dalla Tabella (dove a e b rappresentano gli estremi dell intervallo di definizione della singola densità di probabilità uniforme) ricaviamo immediatamente (per il caso più generale): m σ a b, my a b, σy (77) per cui, sostituendo: m σ Z Z a b a + b (78) Nel caso particolare di a b le (78) forniscono: m σ Z Z a 6 (79) Per b > a il risultato della convoluzione non è più un triangolo, ma diventa invece un trapezio così come illustrato in Figura 9.

f (z) Z /b -b (a-b) a z Figura 9 Il tratto costante, in particolare, corrisponde alla zona in cui, eseguendo la convoluzione, la funzione f (z y) è tutta contenuta entro la funzione f Y (y). Per valor medio e varianza di Z valgono in questo caso le espressioni generali (78).

IL PARADOSSO DEL COMPLEANNO Un risultato del calcolo probabilistico che sembra sorprendente ogni volta che viene enunciato è il cosiddetto paradosso del compleanno (birthday paradox): In un insieme di 3 persone, assemblate senza seguire alcun criterio specifico, la probabilità che almeno due di esse festeggino il compleanno nello stesso giorno è maggiore di /. Come verificheremo immediatamente di seguito, questa affermazione può facilmente essere dimostrata matematicamente. Nondimeno, essa è apparentemente sorprendente quando si considera che la probabilità che due persone scelte a caso abbiano date di compleanno coincidenti è molto bassa (/365.7.7%). Ciò che però si è portati a trascurare è il fatto che, quando la probabilità viene calcolata in un insieme di persone, il numero di possibilità favorevoli all evento cresce rapidamente e ciò incrementa, come ovvio, la probabilità: in un insieme di 3 persone vi sono 3 3! 3 ( ) 53 possibili combinazioni di date e ciascuna di esse è una possibile!! candidata a verificare l evento di cui si sta stimando la probabilità. E 53 non è un numero trascurabile. Come premesso, comunque, il paradosso del compleanno può essere verificato matematicamente. Ai fini della verifica ipotizziamo che l anno consti di 365 giorni (escludiamo cioè l eventualità che l anno sia bisestile) ed assumiamo che tutte le date siano ugualmente probabili 4. Inoltre, nello stesso senso, escludiamo ovviamente situazioni contingenti particolari, quale la presenza, nel gruppo di persone considerato, di gemelli. Indichiamo con P (p) la probabilità che in un gruppo di p persone ve ne siano almeno due con la stessa data di compleanno. Il modo più semplice per calcolare P (p) consiste, in realtà, nella valutazione del suo complementare: P (p) rappresenta la probabilità che, nello stesso gruppo di p persone, le date di compleanno siano tutte diverse tra loro. Prese dunque due persone, la probabilità che, indipendentemente dalla data del compleanno della prima persona, ci sono 364 casi su 365 in cui la seconda compie gli anni in un giorno diverso; considerata una terza persona, ancora indipendentemente dalla data ci sono 363 casi su 365 in cui questa terza persona compie gli anni in un giorno diverso da entrambe le precedenti, e così via. La probabilità che, nel gruppo di p persone, i compleanni cadano in date tutte diverse è quindi: 364 363 366 p 364! 365! P ( p) 365 365 365 p (365 p)!365 (365 p)!365 p (8) Dalla (8) è allora immediato ricavare: 365! P ( p) (365 )!365 p p (8) e calcolando questa espressione per p 3 si trova: 365! P (3).57 (365 p)!365 p (8) 4 Nella realtà, quest ultima ipotesi è forse discutibile, nel senso che le statistiche dimostrano che taluni periodi dell anno, in funzione della nazione che si considera, sono caratterizzati da tassi di nascita maggiori. Analizzare particolari distribuzioni, comunque, non aggiunge nulla alle considerazioni che stiamo svolgendo, mentre complicherebbe la trattazione.

che, appunto, verifica la tesi. Generalizzando il risultato, la Figura riporta l andamento di P (p) al variare di p. Dal grafico si vede, ad esempio, che la probabilità di avere almeno due compleanni coincidenti in un gruppo di p 3 persone è pari circa al 7.63%. Già per p 57, peraltro, la probabilità è del 99%. Per p, è quasi certo che si troveranno due persone con compleanni coincidenti. Si deve anche osservare, benché ovvio, che la (8) va applicata per p 365. Se p > 365, infatti, è certo che almeno persone avranno la stessa data di compleanno, e dunque P (p). L aspetto rilevante dell analisi è che P (p) viene in realtà avvicinato per valori di p significativamente minori del massimo (così come confermato dalla Fig. )...8 P (p).6.4.. 3 4 5 6 7 8 9 p Figura Il paradosso del compleanno può ovviamente essere esteso a contesti diversi e più generali, in accordo con il seguente enunciato: Sia h: D R una qualunque funzione. Se si scelgono R.7 D elementi a caso, la probabilità che due di essi diano lo stesso valore della funzione è maggiore di.5. L esempio del compleanno è chiaramente un caso particolare di questo enunciato, ove D 365 è l insieme delle date possibili, R p è l insieme delle persone le cui date di compleanno vengono confrontate tra loro, e la funzione h definisce la data di compleanno delle p persone scelte a caso. Generalizzando la (8), si può ora scrivere: D D D R+ R P ( R, D) (83) D D D D D D e quindi: P ( R, D) R D D D (84) Nell ipotesi di D sufficientemente grande e di R << D la (84) può essere riscritta, utilizzando l approssimazione: 3

e x x (85) come segue: / D / D ( R )/ D (+ + + ( R ))/ D P ( R, D ) e e e e (86) Imponendo P (R, D) >.5 si ha dunque: (+ + + ( R )) / D R ( R ) e <.5 > ln (87) D e infine: R> Dln.7 D (88) Il passaggio dalla (87) alla (88) ovviamente implica che sia R >>. Il paradosso del compleanno ha significative applicazioni nell ambito della crittografia e dell autenticazione 5. Esiste anzi una tipologia di attacco da parte degli hacker che, proprio basata sul paradosso, da esso prende il nome (birthday paradox attack). Da un diverso punto di vista, il paradosso del compleanno viene ad esempio utilizzato nella criptanalisi per verificare la robustezza di algoritmi hash per la generazione di firme digitali. 5 Ovviamente queste tematiche saranno oggetto di corsi successivi. Qui vengono solo accennate per ribadire l importanza dell argomento in un contesto attuale e di notevole interesse. 4