Variabili casuali. - di Massimo Cristallo -

Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 16 e 27 maggio 2013 - di Massimo Cristallo - Variabili casuali Una variabile casuale (detta anche variabile aleatoria) è una funzione a valori reali definita sullo spazio campionario Ω. Con essa si realizza, in pratica, una corrispondenza tra il dominio Ω degli eventi casuali (necessari e incompatibili) e il codominio R dell insieme dei numeri reali, che rappresentano le probabilità che ciascun evento ha di verificarsi. Una v.c., solitamente rappresentata con la lettera maiuscola (X, per esempio), assume diverse determinazioni ciascuna delle quali generata dal caso ed indicata con la corrispondente lettera minuscola (x, per esempio). E importante far notare che la variabile casuale è determinata da un processo casuale, per cui ad essa si associano le probabilità che taluni eventi hanno di verificarsi, a differenza della variabile statistica, che essendo il frutto di osservazioni concrete, è associata alle frequenze con cui si presentano le singole modalità del fenomeno in esame. Le due condizioni affinché una variabile possa dirsi casuale sono le seguenti: a) la probabilità di ciascun evento dello spazio Ω deve essere maggiore o uguale a 0; b) la somma delle probabilità di tutti gli eventi di Ω deve essere pari a 1. Le v.c. possono essere discrete o continue. L insieme Ω assume nel primo caso un numero finito o un infinità numerabile di valori x i ciascuno con probabilità p(x i )= p i di verificarsi, mentre nel secondo qualsiasi valore all interno di un certo intervallo con legge di probabilità espressa da una funzione detta di densità di probabilità f(x). Si dice quindi che una v.c. è nota quando si conosce la sua distribuzione di probabilità p(x i ) nel caso discreto, ovvero la sua funzione di densità di probabilità f(x) nel caso continuo. Un esempio di v.c. discreta è rappresentato dal lancio del dado, le cui possibili determinazioni sono le 6 facce, ciascuna delle quali con probabilità pari a 1/6 di verificarsi. L altezza, il tempo e la percentuale di pezzi difettosi sono invece esempi di v.c. continue, poiché in ciascuno dei predetti casi le determinazioni assumono valori nell ambito di un insieme continuo. Si osservi che per le v.c. continue non ha senso calcolare la probabilità puntuale di un evento x, in quanto essa è sempre nulla. Ha senso invece calcolare la probabilità di trovarsi all interno di un dato intervallo [x 1, x 2 ]. 1

In modo del tutto analogo alle variabile statistiche, ampiamente trattate nella parte di statistica descrittiva, è possibile definire il valore medio e la varianza anche nel caso di variabili casuali. E necessario però distinguere il caso discreto da quello continuo. Nel caso discreto, il valore medio (o valore atteso) è definito dal numero: μ== mentre la varianza è data da: = μ = μ Nel caso continuo, il valore medio (o valore atteso) è definito dal seguente integrale: mentre la varianza è data da: μ== = μ = μ A ciascuna variabile casuale risulta inoltre associata la c.d. funzione di ripartizione F(x) (detta anche di distribuzione cumulativa), che fornisce per ogni evento possibile di X la probabilità che la medesima variabile sia non superiore ad un dato valore. Di conseguenza la funzione F(x) assume per v.c. discrete la forma: mentre per v.c. continue diventa: = = = == = Osservando le precedenti espressioni, è facilmente desumibile che nel caso continuo la funzione di densità di probabilità è ottenibile derivando la funzione di ripartizione rispetto alla variabile x, mentre nel caso discreto la funzione di ripartizione è costante a tratti, in quanto presenta dei salti di altezza p i in corrispondenza dei valori x i assunti dalla medesima variabile. 2

La funzione di ripartizione ha, inoltre, le seguente proprietà: i) P(a < X = ii) è non decrescente iii) è continua a destra iv) si avvicina al valore 0 se x - ed al valore 1 se x +. Esempio. Considerando i rendimenti di un portafoglio azionario X sotto le tre seguenti possibili situazioni economiche (ciascuna con la relativa probabilità di verificarsi): situazioni economiche p i portafoglio X crescita 0,1 2.100 stabilità 0,5 600 recessione 0,4-300 si può parlare di v.c. discreta, essendo il dominio Ω degli eventi casuali costituito da un numero finito di valori x i (2.100, 600, -300) e risultando pari a 1 la somma delle singole probabilità (non negative) associate. Il valore atteso del rendimento del portafoglio è così ottenuto: E(X) = 2.100 0,1 + 600 0,5-300 0,4 = 390 mentre la varianza si ottiene nel seguente modo: σ X=2.100 390 0,1 + 600 390 0,5 + 300 390 0,4 = 504.900 e quindi la deviazione standard è pari al valore: (X) = 710,56. Si riportano di seguito le distribuzioni di alcune delle principali variabili casuali note in letteratura, insieme ai relativi valori caratteristici (valore atteso e varianza). 3

La v.c. di Bernoulli (o bernoulliana) è discreta e dicotomica, in quanto assume due possibili valori: 0 (insuccesso) con probabilità p(0) = (1-Π) e 1 (successo) con probabilità p(1)= Π. Tale v.c. presenta i seguenti valori caratteristici: =. 2 (X) = Π (1-Π) Esempi di v.c. bernoulliana sono: fumatore o non fumatore, vittoria o sconfitta in una partita di calcio, piove o non piove, ecc. Se abbiamo una serie di v.c. indipendenti e di uguale distribuzione di Bernoulli, ognuna con probabilità di successo pari a Π, il numero totale di successi X costituisce una nuova v.c. discreta, nota in letteratura come v.c binomiale. Essa è caratterizzata dai parametri Π e n, che indicano, rispettivamente, la probabilità di successo della singola prova di Bernoulli ed il numero di prove effettuate. La distribuzione di probabilità della v.c. binomiale può essere così rappresentata: P x=1 n x 3Π4 1 Π 54, con x = 0, 1, 2, n e presenta i seguenti valori caratteristici: = 6. 2 (X) = n Π (1-Π) La distribuzione binomiale può essere utilizzata per descrivere numerosi fenomeni, come ad esempio il numero di pezzi difettosi in un dato processo di produzione. La v.c. binomiale fa riferimento ad estrazioni con ripetizione, in cui la probabilità di successo rimane costante ad ogni estrazione. Nelle situazioni di estrazione senza ripetizione o in blocco, in cui la probabilità di successo si modifica da un estrazione ad un altra, si ricava un altra v.c. discreta, nota in letteratura come v.c. ipergeometrica. Essa è caratterizzata dalla distribuzione di probabilità: P x= 1 A x 31N A n x 3 1 N n 3 4

dove n indica il numero delle estrazioni effettuate senza reinserimento, N il numero degli oggetti considerati e A il numero dei successi, e presenta i seguenti valori caratteristici: = 69 : σ = 69 : : 9 : : 6 : 1 Un altra v.c. discreta molto usata è quella di Poisson (o poissoniana o degli eventi rari), che esprime le probabilità per il numero di eventi che si verificano successivamente ed in modo indipendente in un determinato intervallo di tempo, sapendo che in media se ne verifica un numero pari al parametro ;. La distribuzione di probabilità di tale v.c. è data da: e risulta: P x= e= λ 4 x! con x=0,1,2,.. EX=σ = ;. La distribuzione di Poisson può essere utilizzata, ad esempio, per misurare il numero di clienti che arriva all ufficio postale in un dato arco temporale. Si riporta infine una variabile casuale continua molto utilizzata in statistica. Si tratta della v.c. esponenziale, la cui funzione di densità di probabilità è fornita da:,;= ;D E per x>0 da cui consegue che la corrispondente funzione di ripartizione è:,;= 1 D E mentre i relativi valori caratteristici sono dati da: E(X) = 1/ ; σ = 1/ ; La distribuzione esponenziale può essere usata, ad esempio, per calcolare la probabilità di attendere un dato arco temporale prima dell arrivo di un cliente ad uno sportello bancario. 5