1 Endogeneità, variabili strumentali

Похожие документы
Stima dei sistemi di equazioni simultanee

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.

ANALISI DELLE SERIE STORICHE

Esercitazione del

Statistica Applicata all edilizia: il modello di regressione

Appunti di Econometria

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Il modello di regressione lineare multipla con regressori stocastici

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

Statistica Inferenziale

STATISTICA A K (60 ore)

Modelli lineari generalizzati

Regressione lineare multipla

Regressione lineare semplice: inferenza

Esercitazioni di Statistica

Dispensa di Statistica

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,

Regressione lineare semplice

Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2016/2017. Giovanni Lafratta

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

Contenuti: Capitolo 14 del libro di testo

Corso di Statistica Industriale

Regressione multipla

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5

Principi di analisi causale Lezione 3

Statistica di base per l analisi socio-economica

Minimi quadrati vincolati e test F

Statistica Applicata all edilizia Lezione: approccio stocastico all analisi delle serie storiche

La regressione logistica

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

Regressione Lineare Semplice e Correlazione

Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA Paolo Brunori

Test delle Ipotesi Parte I

Regressione lineare con un solo regressore

La regressione lineare. Rappresentazione analitica delle distribuzioni

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

Cognome e Nome:... Corso di laurea:...

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica 1 A.A. 2015/2016

Statistica Metodologica

Modelli lineari generalizzati

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA

Esercizi di statistica

Università di Pavia. Test diagnostici. Eduardo Rossi

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Modelli Multilineari e Misure di adeguatezza del modello

Analisi delle componenti principali

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

05. Errore campionario e numerosità campionaria

Il modello lineare misto

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017

Test per la correlazione lineare

Calcolo delle Probabilità e Statistica, Ingegneria Civile e A&T e Informatica I prova finale a.a. 2016/17

L indagine campionaria Lezione 3

Metodi computazionali per i Minimi Quadrati

Variabili strumentali

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica. Alfonso Iodice D Enza

Introduzione al rischio, rendimento e costo opportunità del capitale

Test per l omogeneità delle varianze

LEZIONE N. 11 ( a cura di MADDALENA BEI)

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

Descrizione per la costruzione del modello di regressione

STATISTICA ESERCITAZIONE

Esercizi di Probabilità e Statistica

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Appunti di Econometria

LE DISTRIBUZIONI CAMPIONARIE

Statistica Inferenziale

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

Test F per la significatività del modello

Previsioni Statistiche

Транскрипт:

1 Endogeneità, variabili strumentali 1.1 Proprieta dello stimatore OLS Modello statistico y t = β 1 +β 2 x t2 +...+β k x tk +ε t y t = x tβ+ε t, Brevesommario: y t ex t sonovariabiliosservablimentre ε t none osservataeede chiamataterminedierroreo di disturbo. β sono parametri ignoti relativi alla popolazione. IdaticonsistonosolodiuncampioneT diosservazioni. Il campione e una particolare realizzazione fra tutti i possibili campioni di numerosita T che avrebbero

potutoessereestrattidallamedesimapopolazione y t, x t,ε t sonov.c. y=xβ+ε Una delle ipotesi fondamentali del modello lineare e E[ε X]=0 levariabilixsonoesogene,εexsono indipendenti E[y X]=X βdatoche E[ε]=0 E[ε X]=0 Cio implica che una variabile esplicativa non e informativa sul valore atteso di qualsiasi termine di errore. In molti casi l ipotesi che X ed ε sono indipendenti e troppo forte. Esempio: Fama(1991) efficienza dei mercati debole, i rendimenti non possono essere previsti sulla base del proprio passato. cioe y t =β 1 +β 2 y t 1 +β 3 y t 2 +ε t H 0 :β 2 =β 3 =0

X=[1,y t 1,y t 2 ]secosi nonfossedunquee[ε X] 0 = stimatore OLS non corretto e non consistente. Considerando alcune ipotesi più deboli abbiamo 1. x t,ε t sonoindipendentiperognitmax s puo dipenderedaε t ses t 2. ε t iid(0,σ 2 ) sotto tali ipotesi si dimostra che b a N [ β,σ 2 Σ 1 xx Se Σ xx e finita ed invertibile tutti i test classici (test t, test F etc.) sono validi in forma approssimata a condizionechesianoverificateleipotesi1. e2. Inquesto caso lo stimatore OLS e consistente e asintoticamente efficiente, anche se le proprieta dei piccoli campioni non risultano piu valide. ]

E(x t ε t ) = 0 i termini di errore e le variabili esplicaive sono contemporaneamente non correlati Cosa succede quando questa ipotesi non viene verificata? 1.2 CasiincuilostimatoreOLSnonpuo essere utilizzato 1.2.1 Autocorrelazione con variabile dipendente ritardata Consideriamo dunque il seguente modello y t = β 1 +β 2 x t +β 3 y t 1 +ε t (1) ε t = ρε t 1 +υ t (2) sostituendo(2) in(1) otteniamo y t =β 1 +β 2 x t +β 3 y t 1 +ρε t 1 +υ t (3)

datoche,esprimendo(1)interminidit 1,otteniamo dacui y t 1 =β 1 +β 2 x t 1 +β 3 y t 2 +ε t 1 ε t 1 =y t 1 β 1 β 2 x t 1 β 3 y t 2 ε t e chiaramentecorrelatocony t 1 [vedi(3)]. Seρ 0 OLS non e piu consistente 1.2.2 Errori di misura Consideriamo il seguente modello y t =β 1 +β 2 w t +v t dovev t iid(0,σ 2 v)ee[v t w t ]=0. Assumiamoche x t e ilvaloremisurato(conerroreu t )diw t taleche x t = w t +u t w t = x t u t doveu t iid(0,σ 2 u);e(v t,u t )=0;E[u t w t ]=0

Sostituendo otteniamo che lo stimatore OLS e consistente? dunque dalla(5) y t = β 1 +β 2 x t +ε t (4) ε t = v t β 2 u t (5) plimb 2 =β 2 + E(x tε t ) V(x t ) E(x t ε t ) = E[(w t +u t )(v t β 2 u t )] = E[w t v t +u t v t β 2 u t u t β 2 u t w t ] = β 2 σ 2 u V(x t ) = V(w t +u t )=σ 2 w+σ 2 u ne consegue che ( ) plimb 2 =β 2 1 σ2 u σ 2 w +σ2 u lo stimatore OLS e distorto e non consistente. Otteniamounrisultatoanalogoe validoancheperb 1

1.2.3 Simultaneita Una delle variabili esplcative e determinata congiuntamente con la variable dipendente. In una economia chiusa senza settore pubblico: c t = β 1 +β 2 r t +ε t (6) r t = c t +i t (7) r t = reddito; c t = consumo; i t = investimento; r t e c t sono variabili endogene perche sono determinate congiuntamente nel modello. Nota che(6)-(7) è un modello aequazionisimultaneeinformastrutturale. E(i t ε t )=0 i t e esogeno. Sec t influenzar t attraverso(7) r t e correlatoconε t. LostimatoreOLSe correttoeconsistente? Considerando il sistema in forma ridotta β r t = 1 + 1 i t + 1 ε t (8) 1 β 2 1 β 2 1 β 2 β c t = 1 + β 2 i t + 1 ε t 1 β 2 1 β 2 1 β 2

dalla(8) deriva che Cov(r t ε t )= β 1 1 β 2 Cov(i t ε t )+ 1 1 β 2 Var(ε t )= σ2 1 β 2 OLS di β 2 in (6) sara distorto e non consistente. Un ulteriore problema di questo caso e l identificazione: i parametri della forma ridotta sono sufficienti a fornire una stima consistente dei parametri strutturali? 1.3 Stimatore delle variabili strumentali Consideriamo il seguente modello y i =x i1 β 1 +x i2β 2 +ε i y i, salario individuale, x i1 caratteristiche personali, x i2 numero di ore lavorate. Per assunzione dovremmo avere E(ε i x i1 ) = 0 (9) E(ε i x i2 ) = 0 (10)

in realta E(ε i x i2 ) 0 (11) cioe il numero di ore lavorate dipende da caratteristiche non osservate raccolte in ε i. x i2 e detta endogena OLS e distorto e non consistente. Occorrono ipotesi supplementari altrimenti il modello non risulta identificato: condizioni dei momenti(valori attesi impliciti nel modello) di numero sufficiente ad identificare i parametri ignoti nel modello. E [( y i x i1 β 1 x i2β 2 ) xi1 ] = 0 E [( y i x i1 β 1 x i2β 2 ) xi2 ] = 0 (12) Una volta stimato il modello i momenti corrispondenti saranno: 1 [( yi x i1 b ) ] 1 x i2 b 2 xi1 = 0 (13) N ΣN i=1 1 N ΣN i=1 [( yi x i1 b 1 x i2 b 2 ) xi2 ] = 0 (14) K condizioni. Nota che (11) che la (14) non vale piu. E necessario uno strumento, z i2, per mezzo del

quale possiamo sostituitre(12) con E [( y i x i1 β 1 x i2β 2 ) zi2 ] =0 ˆβ IV stimatoredellevariabilistrumentalipuo esserecalcolato risolvendo 1 [( yi x ) ] i1ˆβ IV1 x i2ˆβiv2 xi1 = 0(15) N ΣN i=1 1 N ΣN i=1 [( yi x i1ˆβ IV1 x i2ˆβiv2 ) zi ] = 0(16) la soluzione di questo sistema ci da ˆβ IV = ( Σ N i=1 z ix i) 1Σ N i=1 z i y i (17) dovex i =(x i1,x i2)ez i =(x i1,z i)sex i2 =z i questa espressione si riduce allo stimatore OLS. ˆβ IV e consistenteedasintoticamentenormalese e finita ed invertibile. Σ zx =plim 1 N ΣN i=1 z ix i Distribuzione asintotica dello stimatore IV T (ˆβ IV β ) N ( 0,σ 2 Σ zx Σ 1 zzσ zx ) (18)

doveσ zz =plimn 1 ΣN i=1 z iz ideveessereinvertibile. La varianzadi ˆβ IV puo esserestimatacon ˆV(ˆβ IV )=ˆσ 2[ ( Σ N i=1 x i z i )( Σ N i=1 z i z i ) 1 ( Σ N i=1 z i x i) ] 1 Proprieta fondamentali degli strumenti: uno strumento z i sidicevalidose 1. e correlato con le variabili endogene 2. none correlatoconilterminedierrore 1.3.1 Test di Hausman-Wu Loscopoe diverificaresex i2 e endogenoacondizione chez i siavalido. ConfrontofraglistimatoriOLSeIV

1. regredirex i2 sux i1 ez iconols 2. ottenereiresiduiˆv i dallaregressionein1. 3. Stimare la seguente regressione ausiliaria con OLS y i =x i1 β 1 +x i2β 2 +ˆv i γ+e i seγ=0medianteunt-test x i2 e esogena Modello Keynesiano Utilizzare le ipotesi a priori di teoria economica. Qualsiasi variabile esogena che abbia effetto sul regressore endogenopuo essereutilizzatacomestrumento, i.e. i t e unostrumentovalidoperr t. Errori di misurazione Spesso ignorato per la difficolta di trovare strumenti validi

1.4 Stimatore generalizzato delle variabili strumentali(iv) Seilnumero(R)deglistrumentie ugualealnumerodei regressori(k) lo stimatore IV(17) in termini matriciali sarà ˆβ IV = ( Z X ) 1 Z y Seilnumero(R)deglistrumentie maggiorealnumero dei regressori (K) scegliamo β in modo che gli R momenti campionari 1 N ΣN i=1 (y i x i β)z i 0 (19) cioe il piu possibile vicini a zero. Seguendo la metodologia dei minimi quadrati, minimizziamo la seguente forma quadratica [ ] 1 WN [ Q(β)= N ΣN i=1 (y i x 1 i β)z i N ΣN i=1 (y i x i i] β)z

dovew N e unamatricediponderazione(r R)simmetrica e definita positiva che stabilisce il peso da attirbuireaidiversimomenticampionari. W N attribuisceun peso per ogni momento. Risolvendo si ottiene ˆβ IV = [ X ZW N Z X ] 1 X ZW N Z y Ci possono essere 3 casi: 1. se R = K allora X Z e quadrata e invertibile di conseguenza ˆβ IV = [ (Z X ) 1 W 1 N ( X Z ) 1 ] X ZW N Z y ˆβ IV = ( Z X ) 1 Z y β e esattamente idenitficato ˆβ IV non dipende da W N e(19)=0 2. ser<k βe sottoidentificato 3. ser>k βe sovraidentificato

E possibile dimostrare che la matrice di ponderazione ottimale e proporzionale all inversa della matrice di covarianza dei momenti campionari(ai momenti camionari con varianza minore viene attribuito un maggior peso, maggiore efficienza) di conseguenza la W N ottima e data da ( 1 N Σ N i=1 z iz i) 1 = ( 1N Z Z ) 1 e lo stimatore delle Variabili Strumentali Generalizzato e dato da: ˆβ GIVE = [ (Z X ) 1 ( Z Z ) 1 ( X Z ) 1 ] X Z ( Z Z ) 1 Z y Varianza dello stimatore GIVE ˆV(ˆβ GIVE )=ˆσ 2[ X Z ( Z Z ) 1 Z X ] 1 Se R > K un alternativa piu utilizzata nei lavori empiricie lostimatoreaduepassi2sls(twostageleast Square): 1. ˆX=Z(Z Z) 1 Z X, i.e. regredire X su Z e ottenere i valori predetti di X,cioe ˆX

2. ˆβ IV = (ˆX ˆX ) 1ˆX y, regredireysu ˆX(alposto dix) 1.5 TestdiSargan Nel caso esattamente identificato R = K 1 N ΣN i=1 [ˆε iz i ]=0 1 N ΣN i=1 [ˆε iz i ] sono Nel caso sovraidentificato R > K, vicini a zero ma tendono asintoticamente a zero. = N Q N (ˆβ IV ) (20) ( ) NΣ ( i=1ˆε iz i ˆσ 2 N ) 1 ( ) NΣ Σ (z i z i ) i=1ˆε i=1 iz i χ 2 R K un modo semplice per calcolare(20) e : 1. calcolareareunaregressioneausiliariadiˆε i suz i 2. N R 2 dellaregressionein1. N R 2 χ 2 R K

1.6 Strumenti deboli Se lo strumento e valido, lo stimatore e consistente e converge verso β IV = Cov(z i,y i ) Cov(z i,x i ) se lostrumento e debole la correlazione fra z i e x i esiste ma non sufficiente affinche la distribuzione asintotica normale fornisca una buona approssimazione in campioni finiti,i.e. Cov(z i,x i ) 0 Consideriamo la seguente regressione: y i =x i1 β 1 +x i2β 2 +ε i sex i2 e endogenoeviene"strumentato"conz i2 allora in x i2 =x i1 π 1+z i2 π 2+v i π 2 0 se gli strumenti sono rilevanti, π 2 = 0 se gli strumenti sono irrilevanti. Una semplice regola: F statisticadisignificativita congiuntadiπ 2 =0deveessere maggiore di 10 affinche gli strumenti possano essere considerati validi.