Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA) A.A. 2017/18 - Prova scritta

Corso di Laurea in Informatica Calcolo delle Probabilità e Statistica (269AA A.A. 2017/18 - Prova scritta 2018-09-12 La durata della prova è di tre ore. Le risposte devono essere adeguatamente giustificate. Problema 1 Molte compagnie aeree praticano il cosiddetto overbooking, ossia vendono un numero maggiore di biglietti rispetto ai posti effettivamente disponibili, sfruttando il fatto che spesso non tutti i passeggeri si presentano. Analizziamo questa pratica con un semplice modello, in cui la compagnia ha venduto n biglietti e i posti a sedere disponibili sono al massimo 100. Inoltre supponiamo che ciascun possessore di biglietto si presenti al gate con probabilità p (0, 1, indipendentemente dagli altri passeggeri (supponiamo che n, p siano parametri noti e fissati. 1. Determinare la legge, il valore atteso e la varianza della variabile aleatoria X = numero di passeggeri che si presenta al gate, in funzione dei parametri n e p. 2. Esprimere (in funzione del parametro p la probabilità che almeno un passeggero resti a terra, nei due casi n = 101 ed n = 102. Si mostri che la probabilità è sempre maggiore nel secondo caso. 3. Supponiamo che ciascun biglietto costi 100 e, mentre per ciascun passeggero che rimane a terra la compagnia debba rimborsare subito 300 e (ossia perda 200 e. Si esprima, in funzione del parametro p, il valore atteso della variabile aleatoria G = incasso netto alla partenza del volo sia nel caso n = 100 sia nel caso n = 101. Mostrare che per alcuni valori di p (0, 1 tale valore atteso è maggiore nel secondo caso. 1. Poiché n e p sono parametri noti e fissati, la variabile aleatoria X rappresenta il numero di successi (dove successo significa che il passeggero si presenta in n esperimenti indipendenti. Abbiamo quindi che X è Bin(n, p e quindi E [X Ω] = np, Var (X Ω = np(1 p. 2. Si tratta di calcolare P (X > 100 Ω in entrambi i casi. Nel caso n = 101, abbiamo P (X > 100 Ω = P (X = 101 Ω = p 101. Nel secondo caso invece P (X > 100 Ω = P (X = 101 Ω + P (X = 102 Ω = 102p 101 (1 p + p 102. Pag. 1

Poiché 102p 101 (1 p + p 102 > p 101 101p 101 > 101p 102 1 > p, segue che la probabilità è sempre maggiore nel secondo caso. 3. Nel caso n = 100, abbiamo semplicemente che E [G Ω] = 100 2. Nel caso n = 101, scriviamo G usando la variabile X del punto 1: { 100n se X 100, G = 100n 300(X 100 se X > 100. E [G Ω] = E [G X 100] P (X 100 + E [G X = 101] P (X = 101 = E [G X 100] P (X 100 + E [G X = 101] P (X = 101 = 101 100 (1 P (X = 101 + (101 100 300 P (X = 101 = 101 100 300p 101, avendo usato il punto precedente. Si ha che è soddisfatta per p < 1/3 1/101 0.989. 101 100 300p 101 > 100 2 p 101 < 1 3, Problema 2 Si consideri una catena di Markov (X 1, X 2 avente insieme degli stati { 1, 1} e tempi {1, 2}, con matrice di transizione rappresentata graficamente in figura. Si supponga inoltre che la catena sia stazionaria. Sia inoltre Z una variabile aleatoria avente legge Gaussiana N (0, 1, non soltanto rispetto all informazione iniziale Ω ma anche rispetto a qualunque informazione del tipo {X 1 = n 1, X 2 = n 2 }, per ogni (n 1, n 2 { 1, 1} 2 (ossia, Z è Gaussiana indipendente dalla catena di Markov. 3/4-1 1 1/2 1. Scrivere la matrice di transizione Q (completare le probabilità mancanti e calcolarne tutte le distribuzioni invarianti. Calcolare la varianza di X 1, X 2 e la covarianza tra X 1 e X 2. 2. Calcolare valore atteso e varianza di X 1 Z. 3. Supponendo di osservare X 2 = 1, calcolare il valore atteso e la varianza della variabile X 1 Z. La varianza aumenta, diminuisce o rimane invariata (rispetto a quella calcolata con l informazione iniziale Ω? 4. (facoltativo La variabile X 1 Z è Gaussiana? Pag. 2

1. Troviamo ( 3/4 1/4 Q = 1/2 1/2 Q τ Id =, ( 1/4 1/2 1/4 1/2 da cui troviamo che tutti gli autovettori sono della forma (2s, s, per s R. Imponendo che la somma sia 1, si trova l unica distribuzione invariante µ = ( 2 3, 1 3. Poiché la catena è stazionaria, valore atteso e varianza di X 1 coincidono con quelli di X 2. Calcoliamo Infine calcoliamo E [X 1 Ω] = 2 3 + 1 3 = 1 3, Var (X 1 Ω = E [ X 2 1 Ω ] 1 9 = 8 9. E [X 1 X 2 Ω] = E [X 1 X 2 X 1 = 1] P (X 1 = 1 + E [X 1 X 2 X 1 = 1] P (X 1 = 1 = 2 3 E [X 2 X 1 = 1] + 1 3 E [X 2 X 1 = 1] = 2 ( 1 3 3 4 + 1 1 + 1 ( 1 1 4 3 2 + 1 1 2 = 1 3 Poiché Cov (X 1, X 2 Ω = E [X 1 X 2 Ω] E [X 1 Ω] E [X 2 Ω], ne segue che la covarianza vale 2/9. 2. Calcoliamo E [X 1 Z Ω] = E [Z X 1 = 1] P (X 1 = 1 + E [Z X 1 = 1] P (X 1 = 1 = 0 perché Z è Gaussiana indipendente da X 1 ; similmente, E [ (X 1 Z 2 Ω ] = E [ Z 2 X 1 = 1 ] P (X 1 = 1 + E [ Z 2 X 1 = 1 ] P (X 1 = 1 = P (X 1 = 1 + P (X 1 = 1 da cui la varianza di X 1 Z vale 1. 3. Ripetiamo gli stessi calcoli, stavolta rispetto all informazione X 2 = 1. Si ha E [X 1 Z X 2 = 1] = E [X 1 Z X 1 = 1, X 2 = 1] P (X 1 = 1 X 2 = 1 + E [X 1 Z X 1 = 1, X 2 = 1] P (X 1 = 1 X 2 = 1 = E [Z X 1 = 1, X 2 = 1] P (X 1 = 1 X 2 = 1 + E [Z X 1 = 1, X 2 = 1] P (X 1 = 1 X 2 = 1 = 0. Pag. 3

Similmente Var (X 1 Z X 2 = 1 = E [ (X 1 Z 2 X 2 = 1 ] pertanto rimane invariata. 4. Per ogni u R, = E [ (X 1 Z 2 X 1 = 1, X 2 = 1 ] P (X 1 = 1 X 2 = 1 + E [ (X 1 Z 2 X 1 = 1, X 2 = 1 ] P (X 1 = 1 X 2 = 1 = E [ Z 2 X 1 = 1, X 2 = 1 ] P (X 1 = 1 X 2 = 1 + E [ Z 2 X 1 = 1, X 2 = 1 ] P (X 1 = 1 X 2 = 1 = P (X 1 = 1 X 2 = 1 + P (X 1 = 1 X 2 = 1 = 1 ϱ(x 1 Z = u Ω = ϱ(x 1 Z = u X 1 = 1P (X 1 = 1 + ϱ(x 1 Z = u X 1 = 1P (X 1 = 1 = ϱ(z = u X 1 = 1P (X 1 = 1 + ϱ(z = u X 1 = 1P (X 1 = 1 = exp ( ( u2 1 P (X 1 = 1 + exp ( u2 1 P (X 1 = 1 2 2π 2 2π = exp ( u2 1. 2 2π Quindi X 1 Z ha legge normale standard. Problema 3 Sia N {0, 1, 2} una variabile aleatoria con legge uniforme (discreta e sia X [0, 1] una variabile aleatoria continua avente densità ϱ(x = x Ω {N = n} = (n + 1 x n per ogni x [0, 1], n {0, 1, 2}. 1. Calcolare E [X Ω] e Var (X Ω. 2. Supponendo di osservare { X > 2} 1, come cambia la legge di N? 3. Per ogni x (0, 1, dire come cambia la legge di N supponendo di osservare {X = x}. Discutere in particolare quale dei tre eventi ({N = n} n=0,1,2 è più probabile. 1. Calcoliamo Di conseguenza E [X N = n] = E [ X 2 N = n ] = E [X Ω] = 1 3 0 0 x (n + 1 x n dx = n + 1 n + 2, x 2 (n + 1 x n dx = n + 1 n + 3. 2 + 2 3 + 3 = 23 4 36, Pag. 4

e quindi E [ X 2 Ω ] = 1 3 Var (X Ω = 86 180 3 + 2 4 + 3 = 86 5 180, ( 23 2 0.07. 36 2. Calcoliamo Di conseguenza P (X > 1/2 N = n = 1/2 P (X > 1/2 Ω = 1 3 e tramite formula di Bayes abbiamo P (N = n X > 1/2 = In particolare è più probabile che sia N = 2. (n + 1 x n dx = 1 1 2 n+1. 2 + 3 4 + 7, 8 ( 1 1 2 n+1 / 2 + 3 4 + 7. 8 3. Usiamo la formula di Bayes, caso continuo/discreto: ϱ(x = x N = n P (N = n X = x = P (N = n Ω ϱ(x = x Ω (n + 1xn = 1 + 2x + 3x 2. Poiché il denominatore è lo stesso, basta capire al variare di x (0, 1 quale tra le tre funzioni 1 2x 3x 2 è maggiore (o uguale delle altre. Troviamo che per x (0, 1/2] è maggiore la prima (quindi {N = 0} è il più probabile, per x [1/2, 2/3] è maggiore la seconda (quindi {N = 1} è il più probabile mentre per x [2/3, 1 è maggiore la terza. Pag. 5