AA 2014-2015 Paolo Brunori
probabilità e variabili casuali - risultati: esiti potenziali mutualmente esclusivi di un processo causale [numero di goal segnati da Mario Gomez] - probabilità: proporzione delle volte in cui si verifica un risultato nel lungo periodo [Bayern Monaco 2009-13 segna 1 goal: 40/115=0.3478] - spazio campionario: insieme di tutti i risultati possibili [segna 0,1,2,3,.. goal] - evento: sottoinsieme di uno spazio campionario (insieme di risultati) [segna almeno un goal] - variabile casuale: sintesi numerica di un risultato casuale [numero di goal segnati in media per partita: 75/115=0.6521].
distribuzione di probabilità - distribuzione di probabilità di una variabile casuale: elenco di tutti i valori che può assumere con le loro probabilità: Pr(NG=0)=61/115=0.5304 Pr(NG=1)=40/115=0.3478 Pr(NG=2)=10/115=0.0869 Pr(NG=3)=2/115=0.0174 Pr(NG=4)=1/115 = 0.0087 Pr(NG=5)=1/115= 0.0087 Pr(NG=6)=0,...
funzione di ripartizione (c.d.f) - probabilità di un evento: somma delle probabilità di più risultati [Pr(NG<3)=Pr(NG=0)+Pr(NG=1)+Pr(NG=2)=0.6347] - c.d.f.: probabilità che una variabile casuale sia uguale o inferiore a un certo valore
distribuzione di Bernoulli - variabile causale binaria (risultati possibili: 0,1) - Gomez segna con probabilità p e non segna con probabilità (1 p)
distribuzione di probabilità di una variabile casuale continua - funzione di ripartizione: probabilità che la variabile casuale sia minore o uguale a un certo valore
distribuzione di densità di probabilità - funzione di densità (p.d.f): l area sotto la curva fra due valori misura la probabilità che la variabile casuale sia compresa fra i due valori (a=45, b=48)
valore atteso - valore atteso: valore medio di una variabile casuale Y in un numero elevato di prove: E(Y ) = y 1 p 1 + y 2 p 2 +... + y k p k = k i=1 y i p i - valore atteso di una variabile casuale di Bernoulli: E(G) = 1 p + 0 (1 p) - valore atteso di una variabile casuale continua: E(Y ) = µ Y = y i f Y (y) dove f Y è la funzione di probabilità di Y
dispersione di una distribuzione di probabilità - varianza: σy 2 = E[(Y µ Y ) 2 ] = k i=1 (y i µ Y ) 2 p i - deviazione standard: σ Y = σy 2
dispersione di una variable casuale di Bernoulli var(g) = σ 2 G = (0 p)2 (1 p)+(1 p) 2 p = p(1 p) σ G = p(1 p)
µ e σ 2 di funzione lineare di una variabile casuale Y= a+ bx - µ Y = a + bµ X - σy 2 = b2 σx 2 - σ Y = bσ X
asimmetria - Asimmetria = E[(Y µ Y ) 3 ] σ 3 Y - Asimmetria < 0 segnala coda sinistra lunga - Asimmetria > 0 segnala coda destra lunga
curtosi - curtosi = E[(Y µ Y ) 4 ] σ 4 Y - misura la frequenza di outlier - la curtosi di una distribuzione normale è 3 - distribuzione leptocurtica: curtosi > 3
momenti - momento primo di Y : µ Y - momento secondo µ 2 Y - momento r-esimo µ r Y
variabili casuali doppie - distribuzione di probabilità congiunta: Pr(X = x, Y = y) casa X = 0 trasferta X = 1 segna Y = 0 0.295 0.1746 0.4696 non segna Y = 1 0.205 0.3254 0.5304 totale 0.5 0.5 1 - Pr(Y = y X = x) = Pr(X=x,Y =y) Pr(X=x) - probabilità che segni in casa: 0.295/0.5 = 0.59
aspettativa condizionata - l aspettativa condizionata di Y data X (media condizionata) k E(Y X = x) = y i Pr(Y = y i X = x) i=1 - goal attesi in trasferta: Pr(NG = 1 X = 1) + Pr(NG = 2 X = 1) 2 + Pr(NG = 3 X = 1) 3 + Pr(NG = 4 X = 1) 4 +...
legge delle aspettative iterate se x può assumere valori 1,..., l che è equivalente a: l E(Y ) = E(Y X = x i )Pr(X = x i ) i=1 E(Y ) = E[E(Y X)] la media dei goal di Gomez è pari alla media ponderata dei goal attesi in trasferta e in casa
legge delle aspettative iterate cnt. - valida nel caso di variabili casuali multiple: X, Y, Z - esempio: numero di goal (Y); in trasferta, in casa (X); in coppa, in campionato (Z) - media goal = media ponderata dei goal segnati in casa e in trasferta sia in coppa che in campionato
varianza condizionata k var(y X = x) = (y i E(Y X = x)] 2 ) Pr(Y = y i X = x) i=1
indipendenza - due variabili casuali sono dette indipendenti quanto conoscere il valore d una non fornisce alcuna informazione riguardo l altra equivalente a Pr(Y = y X = x) = Pr(Y = y) Pr(X = x, Y = y) = Pr(X = x) Pr(Y = y)
covarianza - misura l intensità con la quale due variabili si muovono insieme cov(x, Y ) = σ XY = E[(X µ X )(Y µ Y )] k l σ XY = (x j µ X )(y i µ Y ) i=1 j=1 - < σ XY < + - se X Y σ XY = 0
correlazione - una misura indipendente dall unità di misura corr(x, Y ) = cov(x, Y ) var(x)var(y ) σ(x, Y ) σ X σ Y - le unità di misura si annullano a denominatore e numeratore - 1 < corr(xy ) < +1
distribuzione normale - p.d.f. di forma campanulare N (µ, σ 2 ) - simmetrica attorno alla media - il 95% della probabilità è concentrata fra i valori: µ 1.96σ, µ + 1.96σ - distribuzione normale standardizzata: Z = N (0, 1) - Pr(Z c) = Φ(c) [tavole] - ogni variabile casuale può essere standardizzata: sottraendo la media e dividendo il risultato per la deviazione standard - se Y = N (1, 4) e ci interessa Pr(Y 2) - dobbiamo trovare Φ( 2 µ 2 1 σ ) = Φ( ) = Φ(0.5) = 0.691 4