1. Richiami di Statistica Metodi Statistici per il Credito e la Finanza Stefano Di Colli
Dati: Fonti e Tipi I dati sperimentali sono provenienti da un contesto delimitato, definito per rispettare le caratteristiche del modello in esame e controllato I dati non sperimentali derivano dall osservazione del comportamento reale delle variabili di interesse, al di fuori di un contesto sperimentale 2
Dati: Fonti e Tipi I dati su entità diverse osservati per un solo periodo sono detti dati sezionali (cross section) I dati su una singola entità raccolti in momenti diversi scadenzati per unità temporali sono detti serie storiche (time series) I dati panel (o longitudinali) sono relativi a entità diverse e riferibili a due o più unità temporali 3
Definizione classica Probabilità La probabilità di un risultato è la proporzione tra il numero di casi in cui esso si verifica (favorevoli) e il totale dei casi possibili n Pr( e ) = lim e n n L insieme di tutti i casi possibili è detto spazio campionario Ω. L evento è un sottoinsieme dello spazio campionario 4
Definizione: Variabili casuali La Variabile Casuale (vc) è una funzione definita nello spazio campione Ω, l insieme degli eventi elementari. Essa associa ad ogni evento di Ω un numero reale L insieme dei valori che una vc può assumere in una prova specifica si dice supporto della vc Una vc può essere discreta o continua 5
Variabili casuali Esempio 1: La variabile casuale che descrive l esperimento lancio di un dado associa a ciascuna faccia del dado un numero intero compreso fra 1 e 6 Esempio 2: quotazione di un indice azionario. La gamma degli esiti possibili è infinita e la variabile casuale associa a ciascun risultato dell attività di contrattazione un numero reale positivo (il prezzo) 6
Variabili casuali discrete Una v.c. discreta è una corrispondenza tra gli eventi di Ω ed un insieme discreto (finito o numerabile) di numeri reali Una vc discreta è nota se si conoscono i valori che può assumere e le rispettive probabilità. In altre parole ne è nota la distribuzione di probabilità Condizione necessaria e sufficiente affinchè la vc sia ben definita è che le prob. p i soddisfino 1) p 0, i= 1,2,... 2) i i= 1 p i = 1 7
Variabili casuali continue Una vc è continua se può assumere tutti i valori in un qualsiasi intervallo reale Una vc continua è nota se, per ogni x 0 reale e prefissato, è nota la probabilità che tale vc assuma un valore in un intervallo di ampiezza infinitesima Pr( x < X x + dx) = f ( x ) dx 0 0 0 Dove f(x) è la funzione di densità della vc continua X 8
Variabili casuali continue (II) Alcune proprietà della funzione di densità Pr( x1 < X x2 ) = f ( xdx ) Pr( X = x ) = Pr( x < X x ) = f ( xdx ) = 0 0 0 0 x x 2 1 Condizioni necessarie e sufficienti perché una vc continua sia ben definita sono i) ( ) 0 ii) + f x f ( xdx ) = 1 x 0 x 0 9
Funzione di ripartizione La funzione di ripartizione è definita nello stesso modo per entrambi i tipi di vc, anche se il calcolo si sviluppa con metodi diversi La funzione di ripartizione F(x 0 ) di una vc X è definita dalle relazioni seguenti: F( x0 ) = Pr( X x0 ) = x 0 x x 0 p i f ( wdw ) 10
Funzione di ripartizione (II) È la distribuzione di probabilità cumulata, cioè la prob che una vc sia < o = a un certo valore La funzione di ripartizione ha le seguenti proprietà: 1) ( ) è non decrescente, cioè 2) Fx x1 < x2 F x1 F x2 lim F( x) = 0; lim F( x) = 0 x x + 3) Fx ( ) è continua da destra, cioè: 0 ( ) ( ) lim F( x) = F( x ) x x + 0 11
Valore medio di una vc Data una vc X ben definita, il valor medio di X è dato dalle seguenti quantità: E ( X ) = + i = 1 x p Il simbolo E(X) deriva dall inglese Expectation, ad indicare che si tratta di un termine di sintesi della vc X. i i xf ( x ) dx 12
Valore medio di una vc (II) Si può anche definire il valore medio di una funzione di X, come X 2, X 3,, X r. In questo caso i valori E(X), E(X 2 ), E(X 3 ),, E(X r ) si chiamano momenti della vc. Proprietà: Se esiste (finito) il valore E(X r ), allora esistono anche i momenti E(X s ) per tutti i valori s r 13
Valore medio di una vc (III) L operatore E è lineare, cioè per ogni α e β costanti si ha E( αx+ βy ) = αe( X) + βe( Y) da cui, ponendo β = 0, si ha E(αX) = αe(x). Invece, ponendo α = 1 e β =1: E( X± Y) = E( X) ± E( Y) cioè il valor medio di una somma o di una differenza è uguale alla somma (differenza) dei valori medi 14
Valore medio di una vc (IV) Dato che una costante c è una vc discreta X che assume valore c con prob 1, il valor medio di una costante è E(c)=c Pr (X=c)= c 1 = c La relazione di linearità può essere generalizzata ad una successione di costanti α i e di vc X i E( α X ) = α E( X ) i i i i i= 1 i= 1 15
La variabile casuale scarto Se si sottrae alla vc X una costante µ = E(X), la vc che ne deriva, X µ, si definisce scarto. Il valor medio dello scarto è sempre 0 E(X µ) = E(X) E[E(X)] = 0 La distribuzione della vc scarto consente di valutare il rischio attraverso il valor medio del quadrato dello scarto E(X µ) 2 16
La Varianza La varianza di una vc X è data dalla quantità 2 ( x i µ ) pi 2 i= 1 = = + 2 ( ) ( ) Var ( X) E( X µ ) x µ f x dx La varianza gode di alcune proprietà i) Var (X) = 0 se e solo se Pr (X = c) = 1 ii) Var (cx) = c 2 Var (X) iii) Var(X±c) = Var (X) iv) Var(X) = E(X 2 ) [E(X)] 2 17
Variabili casuali standardizzate Se la vc non è degenere e possiede valor medio E(X) = µ e varianza Var(X) = E(X µ) 2 =σ 2 si può definire la vc standardizzata Z come Z X E( X ) X µ = = Var ( X ) σ dove E(Z) = 0 e Var(Z) = 1 Il coefficiente di asimmetria e di curtosi di X 3 4 X µ X µ Asym ( X) = E E Z ; Kurt X E = = = E Z σ σ 18 ( 3) ( ) ( 4)
La Covarianza Date due vc discrete X e Y con valori medi E(X)= µ x e E(Y)= µ y, si definisce covarianza il valore medio del prodotto degli scarti: k h, = ( ) ( )( ) x y = i x j y ij i= 1 j= 1 (, ) ( )( ) Cov X Y E X µ Y µ x µ y µ p Da cui Cov(X,Y)=E(XY)-E(X)E(Y) La covarianza misura la variazione congiunta tra le vc considerate 19
La Covarianza Per qualsiasi costante a, b, c, d la covarianza gode delle seguenti proprietà i) Cov(X,Y)=Cov(Y,X) ii) Cov(X,X)=Var(X) iii) Cov(a +b X, Y)=Cov(X, a +by)=b Cov(X, Y) iv) Cov(a +b X, c +dy)= bd Cov(X,Y) 20
La Correlazione Si prenda la covarianza tra le variabili standard., si ottiene il coefficiente di correlazione lineare di Bravais e Pearson X µ x y (, ) xy, Y µ Cov X Y Corr ( X Y) = E = = σ σx σ y Var ( X ) Var ( X ) σx σ y Tenuto della relazione tra covarianza, varianza e valori medi, si può calcolare anche come E( XY) E( X) E( Y) Corr ( X, Y) = 2 2 ( 2) [ ( )] ( 2 ) ( ) [ ] E X E X E Y E Y 21
La variabile casuale Normale Una vc continua si dice Normale (o Gaussiana) con parametri µ e σ 2 e si indica con N~(µ, σ 2 ) se è definita su tutto l asse reale con funz. di densità f ( x ) = 1 2 σ 2 e 1 2 ( x µ ) 2 La Normale è importante per tre motivi: i) diversi fenomeni continui seguono una normale, ii) può approssimare varie distr. discrete; iii) è alla base dell inferenza statistica σ 2 22
La variabile casuale Normale (II) I momenti caratteristici della Normale sono E(X)= µ ; Var(X)= σ 2 ; Asym(X)=0; Kurt(X)=3 Le principali caratteristiche sono: i) La funzione f(x) è definita su tutto l asse reale ii) È simmetrica rispetto alla media (retta x = µ) iii) Moda e mediana coincidono con il valor medio iv) Ha forma a campana v) È completamente individuata da µ e σ 23
La Normale standardizzata La Normale standardizzata ha la funzione di densità: φ( z ) Ha media zero e varianza unitaria 1 z 2 Si dispone di appropriate tavole statistiche che forniscono valori delle aree sotto la curva (probabilità) = 1 2 La combinazione lineare di vc Normali e indipendenti è ancora una vc normale e 2 24
La Chi-quadrato La somma di g vc Normali standardizzate e indipendenti al quadrato è una vc continua sul supporto (0, + ) detta Chi-quadrato X~χ 2 (g) È caratterizzata dal parametro g, detto gradi di libertà della vc Chi-quadrato La funzione di densità è asimmetrica positiva I momenti caratteristici sono E(X)=g ; Var(X)=2g; Asym(X)= 8/ g ; Kurt(X)=3+12/g 25
La Chi-quadrato 26
La F di Fisher È il rapporto tra due vc Chi-quadrato indipendenti tra loro e divise per i rispettivi gradi di libertà Se X 1 ~χ 2 (g1) e X 2 ~χ 2 (g2) sono due Chi-quadrato indipendenti si definisce vc F di Fisher, indicata da X~F (g1, g2), la vc X / g X = X / g 1 1 2 2 Ha una funzione di densità asimmetrica positiva 27
La t di Student Se Z~N(0, 1) e indipendente da Y~χ 2 (g), allora si definisce t di Student (Y~ t (g) ) la vc X = Il quadrato di una t è una F con g 1 =1 e g 2 =2 Z Ha fd simmetrica, con media 0 e tende a una N Per valori di g piccoli è leptocurtica, il che la rende adatta a fenomeni che assumono con più frequenza valori estremi / Y g 28
La t di Student 29
Convergenza La successione di vc X n (per n =1,2, ) converge alla vc Y per n che tende a + se: Convergenza in distribuzione: la funzione di ripartizione di X n tende per n + ad approssimare la funzione di ripartizione di Y Convergenza in media quadratica: il valore medio E(X n - Y) 2 0 per n + 30
Legge dei grandi numeri Constatazioni sperimentali: a) Ripetendo nelle medesime condizioni un esperimento casuale, al crescere del numero delle prove la frequenza relativa di un evento tende a stabilizzarsi b) La media rilevata su un campione di osservazioni si stabilizza al crescere della dimensione campionaria convergendo verso la media della popolazione 31
Legge dei grandi numeri La frequenza relativa di un evento converge alla sua probabilità 32
Teorema del Limite Centrale Il Teorema del Limite Centrale è stato definito centrale da Polya (1920) perché vc di forma qualunque tendono a convergere verso una distribuzione centrata sulla media, la Normale Il TLC asserisce che la somma di una successione di vc iid e con varianza finita converge in distribuzione al vc Normale 33
Teorema del Limite Centrale Nella formulazione di Lindeberg e Lévy Se X n è una successione di vc iid co valore medio µ e varianza 0 < σ 2 < + allora la vc somma standardizzata Z n tende ad avere la stessa distribuzione della vc Normale standardizzata Z ~(0, 1) 1 n X µ S nµ n σ n σ/ n i n i= 1 d Zn = = Z N (0,1) 34
Variabili casuali doppie Distribuzioni congiunte: La distribuzione di probabilità congiunta di due variabili casuali discrete, X e Y, rappresenta la probabilità che tali vc assumano simultaneamente valori x e y La somma delle probabilità di tutte le possibili combinazioni (x, y) è pari a uno La distribuzione di probabilità congiunta è espressa dalla funzione Pr(X=x, Y=y) 35
Variabili casuali doppie Distribuzione di probabilità marginale: è la distribuzione di probabilità della singola variabile casuale Y, da distinguersi rispetto alla distribuzione congiunta di Y rispetto a X La distribuzione marginale di Y può essere calcolata a partire da quella congiunta di Y e X sommando le probabilità di tutti i possibili risultati per i quali Y assume un valore specifico l Pr( Y = y) = Pr( X = x, Y = y) i= 1 i 36
Variabili casuali doppie Distribuzione condizionata di Y data X: è la distribuzione di una vc Y condizionatamente al fatto che un altra vc X assuma uno specifico valore La probabilità condizionata di Y data X=x è Pr( Y = yx = x ) = Pr( X = x, Y = y ) Pr( X = x) Aspettativa condizionata di Y data X: è detta anche media condizionata di Y data X ed è la media della distribuzione condizionata di Y data X k E( Y X = x) = y Pr( Y= y, X = x) i= 1 i i 37
Variabili casuali doppie Legge delle aspettative iterate: E E ( Y X ) = E ( Y ) ovvero la media di Y è la media ponderata delle aspettative di Y data X, con pesi dati dalla distribuzione di probabilità di X. Se X assume l valori x 1,, x l l i= 1 ( i) E( Y ) = E Y X = x Pr( X = x ) Varianza condizionata di Y data X: è la varianza della distribuzione condizionata di Y data X k i= 1 ( ) 2 var( Y X = x) = yi E Y X = x Pr( Y = yi X = x) i 38
Variabili casuali doppie Indipendenza: due vc X e Y sono indipendentemente distribuite se conoscere il valore di una di esse non fornisce alcuna informazione circa l altra X e Y si dicono indipendenti se la distribuzione di Y data X è uguale alla distribuzione marginale di Y Pr( Y = y X = x) = Pr( Y = y) da cui si può affermare che la distribuzione congiunta di di due variabili casuali indipendenti è il prodotto delle loro distribuzioni marginali Pr( X = xy, = y) = Pr( X = x)pr( Y = y) 39
Variabili casuali doppie La distribuzione normale multivariata: la distribuzione normale può essere generalizzata per descrivere la distribuzione congiunta di un gruppo di vc Se si considerano soltanto due vc si dice normale bivariata 1) Se X e Y hanno una distribuzione normale bivariata con cov σ XY e a e b sono due costanti, allora ax+by ha una distribuzione normale ( 2 2 2 2 µ, 2 ) X µ Y σx σy abσ XY ax+ by a + b a + b + 40
Variabili casuali doppie 2) Se un gruppo di vc ha una distribuzione normale multivariata, la distribuzione marginale di ciascuna delle variabili è normale (segue dalla 1) ponendo a =1 e b =0) 3) Se vc con distribuzione normale mulivariata hanno covarianza nulla, tali variabili sono indipendenti 41