1. Richiami di Statistica. Stefano Di Colli



Documenti analoghi
1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

La variabile casuale Binomiale

Prova di autovalutazione Prof. Roberta Siciliano

Lezione n. 2 (a cura di Chiara Rossi)

STATISTICA GIUSEPPE DE NICOLAO. Dipartimento di Informatica e Sistemistica Università di Pavia

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice

VARIABILI ALEATORIE CONTINUE

Statistica inferenziale

1. Distribuzioni campionarie

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

UNIVERSITÀ DEGLI STUDI DI MILANO-BICOCCA A. A FACOLTÀ DI ECONOMIA. Programma del modulo di STATISTICA I (6 crediti)

1 Modelli di variabili aleatorie continue

Elementi di Calcolo delle Probabilità e Statistica per il corso di Analisi Matematica B

Il concetto di valore medio in generale

Facciamo qualche precisazione

11. Analisi statistica degli eventi idrologici estremi

La distribuzione Normale. La distribuzione Normale

Istituzioni di Statistica e Statistica Economica

ELEMENTI DI CALCOLO DELLE PROBABILITA

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Dott.ssa Caterina Gurrieri


Slide Cerbara parte1 5. Le distribuzioni teoriche

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Grafici delle distribuzioni di frequenza

E naturale chiedersi alcune cose sulla media campionaria x n

Statistica. Alfonso Iodice D Enza iodicede@unina.it

Metodi statistici per le ricerche di mercato

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

Corso di. Dott.ssa Donatella Cocca

Calcolo delle probabilità

u 1 u k che rappresenta formalmente la somma degli infiniti numeri (14.1), ordinati al crescere del loro indice. I numeri u k

INDICE PREFAZIONE VII

STATISTICA IX lezione

Soluzioni Esercizi elementari

La categoria «ES» presenta (di solito) gli stessi comandi

Il confronto fra proporzioni

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

INTEGRALI DEFINITI. Tale superficie viene detta trapezoide e la misura della sua area si ottiene utilizzando il calcolo di un integrale definito.

matematica probabilmente

LEZIONE n. 5 (a cura di Antonio Di Marco)

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

Probabilità II Variabili casuali discrete

Analisi di dati di frequenza

La distribuzione Gaussiana

VARIABILI ALEATORIE E VALORE ATTESO

MATEMATICA p = 4/6 = 2/3; q = 1-2/3 = 1/3. La risposta corretta è quindi la E).

DISTRIBUZIONI DI VARIABILI CASUALI DISCRETE

VARIABILI ALEATORIE MULTIPLE E TEOREMI ASSOCIATI. Dopo aver trattato delle distribuzioni di probabilità di una variabile aleatoria, che

Esercizio 1. Proprietà desiderabili degli stimatori (piccoli campioni)

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

Statistica. Lezione 6

Relazioni statistiche: regressione e correlazione

STATISTICA DESCRITTIVA BIVARIATA

VARIANZA CAMPIONARIA E DEVIAZIONE STANDARD. Si definisce scarto quadratico medio o deviazione standard la radice quadrata della varianza.

ESAME DI STATO DI LICEO SCIENTIFICO CORSO SPERIMENTALE P.N.I. 2004

Scheda n.5: variabili aleatorie e valori medi

Statistica descrittiva

Analisi statistica degli errori

Calcolo delle Probabilità

Capitolo 12 La regressione lineare semplice

SOLUZIONI ESERCITAZIONE NR. 6 Variabili casuali binomiale e normale

LA CORRELAZIONE LINEARE

Un gioco con tre dadi

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

Metodi statistici per le ricerche di mercato

Statistiche campionarie

LE FUNZIONI A DUE VARIABILI

Programmazione Disciplinare: Calcolo Classe: Quarte - Quinte

Lezione 6: Forma di distribuzione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Elementi di Statistica

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 7

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Tasso di interesse e capitalizzazione

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

La Funzione Caratteristica di una Variabile Aleatoria

ESAME DI STATISTICA Nome: Cognome: Matricola:

3. Confronto tra medie di due campioni indipendenti o appaiati

a) Osserviamo innanzi tutto che dev essere x > 0. Pertanto il dominio è ]0, + [. b) Poniamo t = log x. Innanzi tutto si ha:

DISTRIBUZIONI DI PROBABILITÀ

Esercitazione n.1 (v.c. Binomiale, Poisson, Normale)

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla

Statistica descrittiva: prime informazioni dai dati sperimentali

Successioni di funzioni reali

Prelazione. Lista delle Figure. Lista delle Tabelle

Corso di Automazione Industriale 1. Capitolo 4

Capitolo 2 Distribuzioni di frequenza

Gli eventi sono stati definiti come i possibili risultati di un esperimento. Ogni evento ha una probabilità

Esercizi di Statistica

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI

RAPPRESENTAZIONE DEI DATI

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Elementi di Psicometria con Laboratorio di SPSS 1

Capitolo 4 Probabilità

Esercizio 1. Svolgimento

CAPITOLO 16 SUCCESSIONI E SERIE DI FUNZIONI

ESERCIZI DI RIEPILOGO 2. 7 jj(addi

Transcript:

1. Richiami di Statistica Metodi Statistici per il Credito e la Finanza Stefano Di Colli

Dati: Fonti e Tipi I dati sperimentali sono provenienti da un contesto delimitato, definito per rispettare le caratteristiche del modello in esame e controllato I dati non sperimentali derivano dall osservazione del comportamento reale delle variabili di interesse, al di fuori di un contesto sperimentale 2

Dati: Fonti e Tipi I dati su entità diverse osservati per un solo periodo sono detti dati sezionali (cross section) I dati su una singola entità raccolti in momenti diversi scadenzati per unità temporali sono detti serie storiche (time series) I dati panel (o longitudinali) sono relativi a entità diverse e riferibili a due o più unità temporali 3

Definizione classica Probabilità La probabilità di un risultato è la proporzione tra il numero di casi in cui esso si verifica (favorevoli) e il totale dei casi possibili n Pr( e ) = lim e n n L insieme di tutti i casi possibili è detto spazio campionario Ω. L evento è un sottoinsieme dello spazio campionario 4

Definizione: Variabili casuali La Variabile Casuale (vc) è una funzione definita nello spazio campione Ω, l insieme degli eventi elementari. Essa associa ad ogni evento di Ω un numero reale L insieme dei valori che una vc può assumere in una prova specifica si dice supporto della vc Una vc può essere discreta o continua 5

Variabili casuali Esempio 1: La variabile casuale che descrive l esperimento lancio di un dado associa a ciascuna faccia del dado un numero intero compreso fra 1 e 6 Esempio 2: quotazione di un indice azionario. La gamma degli esiti possibili è infinita e la variabile casuale associa a ciascun risultato dell attività di contrattazione un numero reale positivo (il prezzo) 6

Variabili casuali discrete Una v.c. discreta è una corrispondenza tra gli eventi di Ω ed un insieme discreto (finito o numerabile) di numeri reali Una vc discreta è nota se si conoscono i valori che può assumere e le rispettive probabilità. In altre parole ne è nota la distribuzione di probabilità Condizione necessaria e sufficiente affinchè la vc sia ben definita è che le prob. p i soddisfino 1) p 0, i= 1,2,... 2) i i= 1 p i = 1 7

Variabili casuali continue Una vc è continua se può assumere tutti i valori in un qualsiasi intervallo reale Una vc continua è nota se, per ogni x 0 reale e prefissato, è nota la probabilità che tale vc assuma un valore in un intervallo di ampiezza infinitesima Pr( x < X x + dx) = f ( x ) dx 0 0 0 Dove f(x) è la funzione di densità della vc continua X 8

Variabili casuali continue (II) Alcune proprietà della funzione di densità Pr( x1 < X x2 ) = f ( xdx ) Pr( X = x ) = Pr( x < X x ) = f ( xdx ) = 0 0 0 0 x x 2 1 Condizioni necessarie e sufficienti perché una vc continua sia ben definita sono i) ( ) 0 ii) + f x f ( xdx ) = 1 x 0 x 0 9

Funzione di ripartizione La funzione di ripartizione è definita nello stesso modo per entrambi i tipi di vc, anche se il calcolo si sviluppa con metodi diversi La funzione di ripartizione F(x 0 ) di una vc X è definita dalle relazioni seguenti: F( x0 ) = Pr( X x0 ) = x 0 x x 0 p i f ( wdw ) 10

Funzione di ripartizione (II) È la distribuzione di probabilità cumulata, cioè la prob che una vc sia < o = a un certo valore La funzione di ripartizione ha le seguenti proprietà: 1) ( ) è non decrescente, cioè 2) Fx x1 < x2 F x1 F x2 lim F( x) = 0; lim F( x) = 0 x x + 3) Fx ( ) è continua da destra, cioè: 0 ( ) ( ) lim F( x) = F( x ) x x + 0 11

Valore medio di una vc Data una vc X ben definita, il valor medio di X è dato dalle seguenti quantità: E ( X ) = + i = 1 x p Il simbolo E(X) deriva dall inglese Expectation, ad indicare che si tratta di un termine di sintesi della vc X. i i xf ( x ) dx 12

Valore medio di una vc (II) Si può anche definire il valore medio di una funzione di X, come X 2, X 3,, X r. In questo caso i valori E(X), E(X 2 ), E(X 3 ),, E(X r ) si chiamano momenti della vc. Proprietà: Se esiste (finito) il valore E(X r ), allora esistono anche i momenti E(X s ) per tutti i valori s r 13

Valore medio di una vc (III) L operatore E è lineare, cioè per ogni α e β costanti si ha E( αx+ βy ) = αe( X) + βe( Y) da cui, ponendo β = 0, si ha E(αX) = αe(x). Invece, ponendo α = 1 e β =1: E( X± Y) = E( X) ± E( Y) cioè il valor medio di una somma o di una differenza è uguale alla somma (differenza) dei valori medi 14

Valore medio di una vc (IV) Dato che una costante c è una vc discreta X che assume valore c con prob 1, il valor medio di una costante è E(c)=c Pr (X=c)= c 1 = c La relazione di linearità può essere generalizzata ad una successione di costanti α i e di vc X i E( α X ) = α E( X ) i i i i i= 1 i= 1 15

La variabile casuale scarto Se si sottrae alla vc X una costante µ = E(X), la vc che ne deriva, X µ, si definisce scarto. Il valor medio dello scarto è sempre 0 E(X µ) = E(X) E[E(X)] = 0 La distribuzione della vc scarto consente di valutare il rischio attraverso il valor medio del quadrato dello scarto E(X µ) 2 16

La Varianza La varianza di una vc X è data dalla quantità 2 ( x i µ ) pi 2 i= 1 = = + 2 ( ) ( ) Var ( X) E( X µ ) x µ f x dx La varianza gode di alcune proprietà i) Var (X) = 0 se e solo se Pr (X = c) = 1 ii) Var (cx) = c 2 Var (X) iii) Var(X±c) = Var (X) iv) Var(X) = E(X 2 ) [E(X)] 2 17

Variabili casuali standardizzate Se la vc non è degenere e possiede valor medio E(X) = µ e varianza Var(X) = E(X µ) 2 =σ 2 si può definire la vc standardizzata Z come Z X E( X ) X µ = = Var ( X ) σ dove E(Z) = 0 e Var(Z) = 1 Il coefficiente di asimmetria e di curtosi di X 3 4 X µ X µ Asym ( X) = E E Z ; Kurt X E = = = E Z σ σ 18 ( 3) ( ) ( 4)

La Covarianza Date due vc discrete X e Y con valori medi E(X)= µ x e E(Y)= µ y, si definisce covarianza il valore medio del prodotto degli scarti: k h, = ( ) ( )( ) x y = i x j y ij i= 1 j= 1 (, ) ( )( ) Cov X Y E X µ Y µ x µ y µ p Da cui Cov(X,Y)=E(XY)-E(X)E(Y) La covarianza misura la variazione congiunta tra le vc considerate 19

La Covarianza Per qualsiasi costante a, b, c, d la covarianza gode delle seguenti proprietà i) Cov(X,Y)=Cov(Y,X) ii) Cov(X,X)=Var(X) iii) Cov(a +b X, Y)=Cov(X, a +by)=b Cov(X, Y) iv) Cov(a +b X, c +dy)= bd Cov(X,Y) 20

La Correlazione Si prenda la covarianza tra le variabili standard., si ottiene il coefficiente di correlazione lineare di Bravais e Pearson X µ x y (, ) xy, Y µ Cov X Y Corr ( X Y) = E = = σ σx σ y Var ( X ) Var ( X ) σx σ y Tenuto della relazione tra covarianza, varianza e valori medi, si può calcolare anche come E( XY) E( X) E( Y) Corr ( X, Y) = 2 2 ( 2) [ ( )] ( 2 ) ( ) [ ] E X E X E Y E Y 21

La variabile casuale Normale Una vc continua si dice Normale (o Gaussiana) con parametri µ e σ 2 e si indica con N~(µ, σ 2 ) se è definita su tutto l asse reale con funz. di densità f ( x ) = 1 2 σ 2 e 1 2 ( x µ ) 2 La Normale è importante per tre motivi: i) diversi fenomeni continui seguono una normale, ii) può approssimare varie distr. discrete; iii) è alla base dell inferenza statistica σ 2 22

La variabile casuale Normale (II) I momenti caratteristici della Normale sono E(X)= µ ; Var(X)= σ 2 ; Asym(X)=0; Kurt(X)=3 Le principali caratteristiche sono: i) La funzione f(x) è definita su tutto l asse reale ii) È simmetrica rispetto alla media (retta x = µ) iii) Moda e mediana coincidono con il valor medio iv) Ha forma a campana v) È completamente individuata da µ e σ 23

La Normale standardizzata La Normale standardizzata ha la funzione di densità: φ( z ) Ha media zero e varianza unitaria 1 z 2 Si dispone di appropriate tavole statistiche che forniscono valori delle aree sotto la curva (probabilità) = 1 2 La combinazione lineare di vc Normali e indipendenti è ancora una vc normale e 2 24

La Chi-quadrato La somma di g vc Normali standardizzate e indipendenti al quadrato è una vc continua sul supporto (0, + ) detta Chi-quadrato X~χ 2 (g) È caratterizzata dal parametro g, detto gradi di libertà della vc Chi-quadrato La funzione di densità è asimmetrica positiva I momenti caratteristici sono E(X)=g ; Var(X)=2g; Asym(X)= 8/ g ; Kurt(X)=3+12/g 25

La Chi-quadrato 26

La F di Fisher È il rapporto tra due vc Chi-quadrato indipendenti tra loro e divise per i rispettivi gradi di libertà Se X 1 ~χ 2 (g1) e X 2 ~χ 2 (g2) sono due Chi-quadrato indipendenti si definisce vc F di Fisher, indicata da X~F (g1, g2), la vc X / g X = X / g 1 1 2 2 Ha una funzione di densità asimmetrica positiva 27

La t di Student Se Z~N(0, 1) e indipendente da Y~χ 2 (g), allora si definisce t di Student (Y~ t (g) ) la vc X = Il quadrato di una t è una F con g 1 =1 e g 2 =2 Z Ha fd simmetrica, con media 0 e tende a una N Per valori di g piccoli è leptocurtica, il che la rende adatta a fenomeni che assumono con più frequenza valori estremi / Y g 28

La t di Student 29

Convergenza La successione di vc X n (per n =1,2, ) converge alla vc Y per n che tende a + se: Convergenza in distribuzione: la funzione di ripartizione di X n tende per n + ad approssimare la funzione di ripartizione di Y Convergenza in media quadratica: il valore medio E(X n - Y) 2 0 per n + 30

Legge dei grandi numeri Constatazioni sperimentali: a) Ripetendo nelle medesime condizioni un esperimento casuale, al crescere del numero delle prove la frequenza relativa di un evento tende a stabilizzarsi b) La media rilevata su un campione di osservazioni si stabilizza al crescere della dimensione campionaria convergendo verso la media della popolazione 31

Legge dei grandi numeri La frequenza relativa di un evento converge alla sua probabilità 32

Teorema del Limite Centrale Il Teorema del Limite Centrale è stato definito centrale da Polya (1920) perché vc di forma qualunque tendono a convergere verso una distribuzione centrata sulla media, la Normale Il TLC asserisce che la somma di una successione di vc iid e con varianza finita converge in distribuzione al vc Normale 33

Teorema del Limite Centrale Nella formulazione di Lindeberg e Lévy Se X n è una successione di vc iid co valore medio µ e varianza 0 < σ 2 < + allora la vc somma standardizzata Z n tende ad avere la stessa distribuzione della vc Normale standardizzata Z ~(0, 1) 1 n X µ S nµ n σ n σ/ n i n i= 1 d Zn = = Z N (0,1) 34

Variabili casuali doppie Distribuzioni congiunte: La distribuzione di probabilità congiunta di due variabili casuali discrete, X e Y, rappresenta la probabilità che tali vc assumano simultaneamente valori x e y La somma delle probabilità di tutte le possibili combinazioni (x, y) è pari a uno La distribuzione di probabilità congiunta è espressa dalla funzione Pr(X=x, Y=y) 35

Variabili casuali doppie Distribuzione di probabilità marginale: è la distribuzione di probabilità della singola variabile casuale Y, da distinguersi rispetto alla distribuzione congiunta di Y rispetto a X La distribuzione marginale di Y può essere calcolata a partire da quella congiunta di Y e X sommando le probabilità di tutti i possibili risultati per i quali Y assume un valore specifico l Pr( Y = y) = Pr( X = x, Y = y) i= 1 i 36

Variabili casuali doppie Distribuzione condizionata di Y data X: è la distribuzione di una vc Y condizionatamente al fatto che un altra vc X assuma uno specifico valore La probabilità condizionata di Y data X=x è Pr( Y = yx = x ) = Pr( X = x, Y = y ) Pr( X = x) Aspettativa condizionata di Y data X: è detta anche media condizionata di Y data X ed è la media della distribuzione condizionata di Y data X k E( Y X = x) = y Pr( Y= y, X = x) i= 1 i i 37

Variabili casuali doppie Legge delle aspettative iterate: E E ( Y X ) = E ( Y ) ovvero la media di Y è la media ponderata delle aspettative di Y data X, con pesi dati dalla distribuzione di probabilità di X. Se X assume l valori x 1,, x l l i= 1 ( i) E( Y ) = E Y X = x Pr( X = x ) Varianza condizionata di Y data X: è la varianza della distribuzione condizionata di Y data X k i= 1 ( ) 2 var( Y X = x) = yi E Y X = x Pr( Y = yi X = x) i 38

Variabili casuali doppie Indipendenza: due vc X e Y sono indipendentemente distribuite se conoscere il valore di una di esse non fornisce alcuna informazione circa l altra X e Y si dicono indipendenti se la distribuzione di Y data X è uguale alla distribuzione marginale di Y Pr( Y = y X = x) = Pr( Y = y) da cui si può affermare che la distribuzione congiunta di di due variabili casuali indipendenti è il prodotto delle loro distribuzioni marginali Pr( X = xy, = y) = Pr( X = x)pr( Y = y) 39

Variabili casuali doppie La distribuzione normale multivariata: la distribuzione normale può essere generalizzata per descrivere la distribuzione congiunta di un gruppo di vc Se si considerano soltanto due vc si dice normale bivariata 1) Se X e Y hanno una distribuzione normale bivariata con cov σ XY e a e b sono due costanti, allora ax+by ha una distribuzione normale ( 2 2 2 2 µ, 2 ) X µ Y σx σy abσ XY ax+ by a + b a + b + 40

Variabili casuali doppie 2) Se un gruppo di vc ha una distribuzione normale multivariata, la distribuzione marginale di ciascuna delle variabili è normale (segue dalla 1) ponendo a =1 e b =0) 3) Se vc con distribuzione normale mulivariata hanno covarianza nulla, tali variabili sono indipendenti 41