1 Endogeneità, variabili strumentali 1.1 Proprieta dello stimatore OLS Modello statistico y t = β 1 +β 2 x t2 +...+β k x tk +ε t y t = x tβ+ε t, Brevesommario: y t ex t sonovariabiliosservablimentre ε t none osservataeede chiamataterminedierroreo di disturbo. β sono parametri ignoti relativi alla popolazione. IdaticonsistonosolodiuncampioneT diosservazioni. Il campione e una particolare realizzazione fra tutti i possibili campioni di numerosita T che avrebbero
potutoessereestrattidallamedesimapopolazione y t, x t,ε t sonov.c. y=xβ+ε Una delle ipotesi fondamentali del modello lineare e E[ε X]=0 levariabilixsonoesogene,εexsono indipendenti E[y X]=X βdatoche E[ε]=0 E[ε X]=0 Cio implica che una variabile esplicativa non e informativa sul valore atteso di qualsiasi termine di errore. In molti casi l ipotesi che X ed ε sono indipendenti e troppo forte. Esempio: Fama(1991) efficienza dei mercati debole, i rendimenti non possono essere previsti sulla base del proprio passato. cioe y t =β 1 +β 2 y t 1 +β 3 y t 2 +ε t H 0 :β 2 =β 3 =0
X=[1,y t 1,y t 2 ]secosi nonfossedunquee[ε X] 0 = stimatore OLS non corretto e non consistente. Considerando alcune ipotesi più deboli abbiamo 1. x t,ε t sonoindipendentiperognitmax s puo dipenderedaε t ses t 2. ε t iid(0,σ 2 ) sotto tali ipotesi si dimostra che b a N [ β,σ 2 Σ 1 xx Se Σ xx e finita ed invertibile tutti i test classici (test t, test F etc.) sono validi in forma approssimata a condizionechesianoverificateleipotesi1. e2. Inquesto caso lo stimatore OLS e consistente e asintoticamente efficiente, anche se le proprieta dei piccoli campioni non risultano piu valide. ]
E(x t ε t ) = 0 i termini di errore e le variabili esplicaive sono contemporaneamente non correlati Cosa succede quando questa ipotesi non viene verificata? 1.2 CasiincuilostimatoreOLSnonpuo essere utilizzato 1.2.1 Autocorrelazione con variabile dipendente ritardata Consideriamo dunque il seguente modello y t = β 1 +β 2 x t +β 3 y t 1 +ε t (1) ε t = ρε t 1 +υ t (2) sostituendo(2) in(1) otteniamo y t =β 1 +β 2 x t +β 3 y t 1 +ρε t 1 +υ t (3)
datoche,esprimendo(1)interminidit 1,otteniamo dacui y t 1 =β 1 +β 2 x t 1 +β 3 y t 2 +ε t 1 ε t 1 =y t 1 β 1 β 2 x t 1 β 3 y t 2 ε t e chiaramentecorrelatocony t 1 [vedi(3)]. Seρ 0 OLS non e piu consistente 1.2.2 Errori di misura Consideriamo il seguente modello y t =β 1 +β 2 w t +v t dovev t iid(0,σ 2 v)ee[v t w t ]=0. Assumiamoche x t e ilvaloremisurato(conerroreu t )diw t taleche x t = w t +u t w t = x t u t doveu t iid(0,σ 2 u);e(v t,u t )=0;E[u t w t ]=0
Sostituendo otteniamo che lo stimatore OLS e consistente? dunque dalla(5) y t = β 1 +β 2 x t +ε t (4) ε t = v t β 2 u t (5) plimb 2 =β 2 + E(x tε t ) V(x t ) E(x t ε t ) = E[(w t +u t )(v t β 2 u t )] = E[w t v t +u t v t β 2 u t u t β 2 u t w t ] = β 2 σ 2 u V(x t ) = V(w t +u t )=σ 2 w+σ 2 u ne consegue che ( ) plimb 2 =β 2 1 σ2 u σ 2 w +σ2 u lo stimatore OLS e distorto e non consistente. Otteniamounrisultatoanalogoe validoancheperb 1
1.2.3 Simultaneita Una delle variabili esplcative e determinata congiuntamente con la variable dipendente. In una economia chiusa senza settore pubblico: c t = β 1 +β 2 r t +ε t (6) r t = c t +i t (7) r t = reddito; c t = consumo; i t = investimento; r t e c t sono variabili endogene perche sono determinate congiuntamente nel modello. Nota che(6)-(7) è un modello aequazionisimultaneeinformastrutturale. E(i t ε t )=0 i t e esogeno. Sec t influenzar t attraverso(7) r t e correlatoconε t. LostimatoreOLSe correttoeconsistente? Considerando il sistema in forma ridotta β r t = 1 + 1 i t + 1 ε t (8) 1 β 2 1 β 2 1 β 2 β c t = 1 + β 2 i t + 1 ε t 1 β 2 1 β 2 1 β 2
dalla(8) deriva che Cov(r t ε t )= β 1 1 β 2 Cov(i t ε t )+ 1 1 β 2 Var(ε t )= σ2 1 β 2 OLS di β 2 in (6) sara distorto e non consistente. Un ulteriore problema di questo caso e l identificazione: i parametri della forma ridotta sono sufficienti a fornire una stima consistente dei parametri strutturali? 1.3 Stimatore delle variabili strumentali Consideriamo il seguente modello y i =x i1 β 1 +x i2β 2 +ε i y i, salario individuale, x i1 caratteristiche personali, x i2 numero di ore lavorate. Per assunzione dovremmo avere E(ε i x i1 ) = 0 (9) E(ε i x i2 ) = 0 (10)
in realta E(ε i x i2 ) 0 (11) cioe il numero di ore lavorate dipende da caratteristiche non osservate raccolte in ε i. x i2 e detta endogena OLS e distorto e non consistente. Occorrono ipotesi supplementari altrimenti il modello non risulta identificato: condizioni dei momenti(valori attesi impliciti nel modello) di numero sufficiente ad identificare i parametri ignoti nel modello. E [( y i x i1 β 1 x i2β 2 ) xi1 ] = 0 E [( y i x i1 β 1 x i2β 2 ) xi2 ] = 0 (12) Una volta stimato il modello i momenti corrispondenti saranno: 1 [( yi x i1 b ) ] 1 x i2 b 2 xi1 = 0 (13) N ΣN i=1 1 N ΣN i=1 [( yi x i1 b 1 x i2 b 2 ) xi2 ] = 0 (14) K condizioni. Nota che (11) che la (14) non vale piu. E necessario uno strumento, z i2, per mezzo del
quale possiamo sostituitre(12) con E [( y i x i1 β 1 x i2β 2 ) zi2 ] =0 ˆβ IV stimatoredellevariabilistrumentalipuo esserecalcolato risolvendo 1 [( yi x ) ] i1ˆβ IV1 x i2ˆβiv2 xi1 = 0(15) N ΣN i=1 1 N ΣN i=1 [( yi x i1ˆβ IV1 x i2ˆβiv2 ) zi ] = 0(16) la soluzione di questo sistema ci da ˆβ IV = ( Σ N i=1 z ix i) 1Σ N i=1 z i y i (17) dovex i =(x i1,x i2)ez i =(x i1,z i)sex i2 =z i questa espressione si riduce allo stimatore OLS. ˆβ IV e consistenteedasintoticamentenormalese e finita ed invertibile. Σ zx =plim 1 N ΣN i=1 z ix i Distribuzione asintotica dello stimatore IV T (ˆβ IV β ) N ( 0,σ 2 Σ zx Σ 1 zzσ zx ) (18)
doveσ zz =plimn 1 ΣN i=1 z iz ideveessereinvertibile. La varianzadi ˆβ IV puo esserestimatacon ˆV(ˆβ IV )=ˆσ 2[ ( Σ N i=1 x i z i )( Σ N i=1 z i z i ) 1 ( Σ N i=1 z i x i) ] 1 Proprieta fondamentali degli strumenti: uno strumento z i sidicevalidose 1. e correlato con le variabili endogene 2. none correlatoconilterminedierrore 1.3.1 Test di Hausman-Wu Loscopoe diverificaresex i2 e endogenoacondizione chez i siavalido. ConfrontofraglistimatoriOLSeIV
1. regredirex i2 sux i1 ez iconols 2. ottenereiresiduiˆv i dallaregressionein1. 3. Stimare la seguente regressione ausiliaria con OLS y i =x i1 β 1 +x i2β 2 +ˆv i γ+e i seγ=0medianteunt-test x i2 e esogena Modello Keynesiano Utilizzare le ipotesi a priori di teoria economica. Qualsiasi variabile esogena che abbia effetto sul regressore endogenopuo essereutilizzatacomestrumento, i.e. i t e unostrumentovalidoperr t. Errori di misurazione Spesso ignorato per la difficolta di trovare strumenti validi
1.4 Stimatore generalizzato delle variabili strumentali(iv) Seilnumero(R)deglistrumentie ugualealnumerodei regressori(k) lo stimatore IV(17) in termini matriciali sarà ˆβ IV = ( Z X ) 1 Z y Seilnumero(R)deglistrumentie maggiorealnumero dei regressori (K) scegliamo β in modo che gli R momenti campionari 1 N ΣN i=1 (y i x i β)z i 0 (19) cioe il piu possibile vicini a zero. Seguendo la metodologia dei minimi quadrati, minimizziamo la seguente forma quadratica [ ] 1 WN [ Q(β)= N ΣN i=1 (y i x 1 i β)z i N ΣN i=1 (y i x i i] β)z
dovew N e unamatricediponderazione(r R)simmetrica e definita positiva che stabilisce il peso da attirbuireaidiversimomenticampionari. W N attribuisceun peso per ogni momento. Risolvendo si ottiene ˆβ IV = [ X ZW N Z X ] 1 X ZW N Z y Ci possono essere 3 casi: 1. se R = K allora X Z e quadrata e invertibile di conseguenza ˆβ IV = [ (Z X ) 1 W 1 N ( X Z ) 1 ] X ZW N Z y ˆβ IV = ( Z X ) 1 Z y β e esattamente idenitficato ˆβ IV non dipende da W N e(19)=0 2. ser<k βe sottoidentificato 3. ser>k βe sovraidentificato
E possibile dimostrare che la matrice di ponderazione ottimale e proporzionale all inversa della matrice di covarianza dei momenti campionari(ai momenti camionari con varianza minore viene attribuito un maggior peso, maggiore efficienza) di conseguenza la W N ottima e data da ( 1 N Σ N i=1 z iz i) 1 = ( 1N Z Z ) 1 e lo stimatore delle Variabili Strumentali Generalizzato e dato da: ˆβ GIVE = [ (Z X ) 1 ( Z Z ) 1 ( X Z ) 1 ] X Z ( Z Z ) 1 Z y Varianza dello stimatore GIVE ˆV(ˆβ GIVE )=ˆσ 2[ X Z ( Z Z ) 1 Z X ] 1 Se R > K un alternativa piu utilizzata nei lavori empiricie lostimatoreaduepassi2sls(twostageleast Square): 1. ˆX=Z(Z Z) 1 Z X, i.e. regredire X su Z e ottenere i valori predetti di X,cioe ˆX
2. ˆβ IV = (ˆX ˆX ) 1ˆX y, regredireysu ˆX(alposto dix) 1.5 TestdiSargan Nel caso esattamente identificato R = K 1 N ΣN i=1 [ˆε iz i ]=0 1 N ΣN i=1 [ˆε iz i ] sono Nel caso sovraidentificato R > K, vicini a zero ma tendono asintoticamente a zero. = N Q N (ˆβ IV ) (20) ( ) NΣ ( i=1ˆε iz i ˆσ 2 N ) 1 ( ) NΣ Σ (z i z i ) i=1ˆε i=1 iz i χ 2 R K un modo semplice per calcolare(20) e : 1. calcolareareunaregressioneausiliariadiˆε i suz i 2. N R 2 dellaregressionein1. N R 2 χ 2 R K
1.6 Strumenti deboli Se lo strumento e valido, lo stimatore e consistente e converge verso β IV = Cov(z i,y i ) Cov(z i,x i ) se lostrumento e debole la correlazione fra z i e x i esiste ma non sufficiente affinche la distribuzione asintotica normale fornisca una buona approssimazione in campioni finiti,i.e. Cov(z i,x i ) 0 Consideriamo la seguente regressione: y i =x i1 β 1 +x i2β 2 +ε i sex i2 e endogenoeviene"strumentato"conz i2 allora in x i2 =x i1 π 1+z i2 π 2+v i π 2 0 se gli strumenti sono rilevanti, π 2 = 0 se gli strumenti sono irrilevanti. Una semplice regola: F statisticadisignificativita congiuntadiπ 2 =0deveessere maggiore di 10 affinche gli strumenti possano essere considerati validi.