Sessione Live #6 Settimana dal 6 maggio al giugno 003 Variabili aleatorie n-dim Funzioni di ripartizione e di densità (F.D.R. e f.d.d.) congiunte e marginali, valori medi e momenti misti, funzione generatrice dei momenti, matrice di covarianza. Lezioni CD: 8-9-0
Esercizio Le due variabili aleatorie ed hanno densità congiunta data dalla seguente tabella: =- = =3 =- 0, 0, 0,05 =4 0, 0,5 0,05 a) Calcolare le densità marginali di e. b) Calcolare la media delle singole variabili e la Covarianza della coppia (,). Le due variabili sono indipendenti?
Soluzione a) Completiamo la tabella inserendo anche le densità marginali di e (è sufficiente sommare i valori della fdd congiunta lungo le righe e le colonne): =- = =3 =- 0, 0, 0,05 0,5 =4 0, 0,5 0,05 0,75 0,3 0,6 0, b) Ora che sono note le marginali, calcoliamo le medie e E[]: [ ] x [ x ] [ ] [ ] E = P = = 0,5 + 4 0,75 =,5 i= i E = 0,3 + 0,6 + 3 0, = 0,3 3 E = xiy jp = xi, = y j = 0,4 0, 0,3,6 + + 0,6 = 0,9 i= j= i La Covarianza delle variabili (,) è pari a E[]-E[]E[]=0,5. Le variabili e non sono dunque indipendenti.
Esercizio Una v.a. bidimensionale discreta (,) ha f.d.d. data dalla formula dove k è una costante. f x, y = k ( x+ y) ( ) xy{ },,, a) Determinare il valore di k b) Calcolare le distribuzioni marginali di e c) Sono indipendenti e?
Soluzione a) Occorre imporre che la probabilità totale sia, ossia ( ) ( ) [ ] = f x, y = k x+ y = k 3+ 4+ 5+ 6 = 8k, xy, = xy, = dunque k=/8. b) Applicando la formula per le f.d.d. marginali si ottiene ( ) = (, ) = ( + ) = ( + ) + ( + ) [ x ] x {,} f x f, x y x y x x 8 8 y = 4 + 3 8 y= ( ) = ( + ) = ( + ) + ( 4+ ) = [ 3+ ] y {,} f y 8 x y 8 y y 9 y x=
c) Affinché due v.a. discrete e siano indipendenti occorre che sia soddisfatta la relazione: P = x, = y = P = x P = y [ ] [ ] [ ] che, riscritta in termini di f.d.d. congiunta e marginali dà f x y f x f y,, = ( ) ( ) ( ) Si vede facilmente che questa relazione nel nostro caso non è soddisfatta, x+ y 4x+ 3 3+ y 8 8 9 [ ] [ ] [ ] e dunque le variabili e non sono indipendenti. Un'altro modo di procedere sarebbe stato quello di calcolare la covarianza della coppia (,): in questo caso si sarebbe scoperto che non è nulla, concludendo dunque che le variabili non sono indipendenti. Ma attenzione! Se avessimo trovato che la covarianza è nulla (variabili scorrelate), nulla avremmo potuto dire sull'indipendenza! (Esistono infatti coppie di variabili dipendenti, la cui covarianza è nulla.)
Esercizio 3 La F.D.R. di una v.a. bidimensionale (,) è data da F x y e e ( ) ( αx, )( βy = ) [ ], x 0, y 0 ) Calcolare le F.D.R. delle singole variabili e. Riconoscete qualche v.a. notevole? ) Le variabili e sono indipendenti? Sono scorrelate? 3) Calcolare P[<], P[<,<], P[>x, >y].
Soluzione a) Ricordando che F ( xy) [ x y],, = P,, si ricava che ( ) [ ] [ ] ( ) ]( x = P = P, + =, + = ) [ F x x x F x e α, x 0 e analogamente F y F y e β ( ) ( ) ]( y = +, = ) [, y 0 Si riconosce da queste formule che e hanno distribuzione esponenziale, di parametri α e β rispettivamente. b) Per l'indipendenza occorre che, dati due sottoinsiemi A, B dei numeri reali, avvenga che [ A B] = [ A] [ B] P, P P E' sufficiente che questa relazione sia verificata per insiemi del tipo (, a] cui occorre che le F.D.R. soddisfino la seguente,, = F x y F x F y ( ) ( ) ( ), per
Si vede immediatamente che ciò avviene nel nostro caso, per cui le variabili e sono indipendenti. Essendo indipendenti, le variabili sono certamente scorrelate, ossia la covarianza è nulla. (Si ricordi che il viceversa è falso! Esistono infatti variabili dipendenti ma scorrelate.) c) Le probabilità richieste si ottengono senza effettuare conti, ricordando la formula della F.D.R e sfruttando l'indipendenza: α [ < ] = [ ] = F = e α [ ] [ ] [ ] [ ] [ ] [ ] ( ) ( ) P P () ( ) β P, = P P = F () F () = ( e ) ( e ) α x P > x, > y = P > x P > y = F ( x) F( y) = e e β y
Esercizio 4 Una v.a. bidimensionale (,) ha distribuzione normale bivariata. Si sa che le due componenti, sono centrate (= media nulla) e hanno varianza pari rispettivamente a e 4. La covarianza σ, = ρ è da considerarsi come un parametro incognito. a) Convincersi che ρ può assumere solo valori compresi tra - e. b) Determinare funzione generatrice dei momenti per (,), in funzione del parametro ρ. Si vuole ora studiare la v.a. (unidimensionale) W=, in corrispondenza dei valori ρ = 0, ±, ±. c) W è una v.a. notevole? d) Determinare media e varianza di W.
Soluzione a) Cominciamo con qualche richiamo di teoria. L'espressione della f.d.d. di una normale bivariata è data da f( x, y) = πσ σ x y d e x µ x x µ x y µ y y µ y d + ( d ) σx σxσ y σ y ( )( ) dove µ, µ, σ, σ sono rispettivamente medie e deviazioni standard delle distribuzioni marginali di e. Il coefficiente d è legato alla covarianza σ, dalla relazione d = σ, σ σ Si vede subito che l'espressione della f.d.d. ha senso solo per d e dunque nel nostro caso deve essere ρ.
Introducendo la matrice di covarianza e la sua inversa (che nel CD è riportata in modo errato: c'è σ, anziché σ σ ), C σ σ = C = σ, σ, - d d σ σ σ d σ σ σ e i vettori z = ( x, y) e µ ( µ, µ ) =, si scrive più agevolmente la f.d.d.: f( z) = π C e t ( z µ ) C ( z µ ) Questa formula è più facile da ricordare, per la sua somiglianza con l'analoga unidimensionale.
b) Per la funzione generatrice dei momenti, introducendo il vettore t ( t, t ) ha l'espressione =, si t tz Gt () = E e = e µ t + { t t Ct} µ σ σ σ ρ Nel nostro caso ( = 0, =, =,, = ) si ricava che Gt () = e t t t t + ρ + 4
c) W è il prodotto di due v.a. normali (in generale neanche indipendenti), e non coincide con alcuna della v.a. viste nel corso. d) La media di W è E[], e dunque altro non è che la covarianza di (,), ρ, dal momento che E[]=E[]=0. Per calcolare la varianza occorre determinare il momento secondo di W, E[ W ] = E[ ]: è il momento misto di ordine 4 µ, della v.a. (,). Ricordando il legame tra momenti misti e derivate in 0 della funzione generatrice dei momenti (ricavata nei punti precedenti), con un po' di pazienza si ricava G ( ρ ) t G = G + ( t + ρ t ) G t 3 G t t 4 G t t = t + t G ( 4 ρ ) ρ( ρ ) ( ρ ) ( 4 ρ ) = t + t G+ t + t G+ t + t t + t G ( ρ ) ρ ρ( ρ )( ρ ) = 4G+ 4t + t G+ G+ t + t 4 t + t G+...
dove al posto dei punti di sospensione ci sarebbe la derivata dell'ultimo termine della riga precedente, che però è irrilevante ai nostri fini, in quanto si annulla quando viene calcolato in 0. Calcolando dunque l'ultima espressione in ( t, t ) = ( 0,0) (gli unici termini che danno contributo non nullo sono quelli sottolineati) si ricava G E W =E = 0,0 = 4+ 4 ( ) ρ t t e, ricordando che la media di W vale ρ, si ottiene infine la varianza richiesta [ ] σ = E W E W = (4+ ρ ) ρ = 4+ ρ W
Esercizio 5 Si considerino due variabili aleatorie e indipendenti aventi rispettivamente legge esponenziale di parametro λ ed esponenziale di parametro µ. Si trovi la legge delle seguenti v.a.: a) Z = Min(,) b) W = Max(,)
Soluzione z a) Ricordando che F ( z) = e λ, e analogamente per, si ha che [ Z > z] = [ z] [ > z > z] [ > z] [ > z] λ z µ z ( ) z ( F ( z) ) ( F ( z) ) e e e λ + = = = µ P P Min(, )> =P, =P P = da cui si riconsce che Z ha legge esponenziale di parametro ( λ + µ ). b) Per determinare la distribuzione di W, conviene considerare direttamente la F.D.R.: [ ] [ ] [ ] [ ] F ( w) = P Max(, ) w = P t, t = P w P w = W ( λ w)( µ w) = F ( w) F ( w) = e e per w positivo, naturalmente. Derivando la F.D.R. si ottiene la densità della variabile aleatoria W: ( ) ( ) µ w λw f ( w) = µ e + λe λ + µ e λ + µ W che dunque non è una v.a. notevole. w
Esercizio 6 Si supponga che il numero di clienti N che entra in un negozio sia distribuito con legge di Poisson di paramentro λ. Ogni cliente che entra esce avendo acquistato qualcosa con probabilità p, in modo indipendente dagli altri clienti e dal numero di persone presenti nel negozio. Determinare come si distribuisce la legge della variabile aleatoria A che conta i clienti che entrano nel negozio e fanno acquisti.
Soluzione Condizionatamente al fatto che nel negozio entrino n clienti, e sapendo che ognuno acquista in modo indipendente dall altro con probabilità p, possiamo dire che il numero di clienti che fanno acquisti su questi n è distribuito come una v.a. binomiale di parametri n e p, vale a dire: con k = 0,,n. n P k k [ A= k N = n] = p ( p) Ora, per determinare la f.d.d. di A è sufficiente sommare su tutti i valori di n: + + λ n n k n k e λ P[ A= k] = P [ A= k N = n] P[ N = n] = p ( p) = n= k n= k k n! ( ) ( ) ( n k + λ p ) n= k ( ) ( ) n k ( p) ( ) k k k p e λ p e λ λ λ pλ e e λ pλ = = = k! n k! k! k! per ogni intero k 0. Da qui si deduce che A segue una legge di Poisson di parametro λ p.