Regressioni con Panel Data

Regressioni con Panel Data Un insieme di dati panel contiene osservazioni riguardanti più di un individuo, dove ogni entità è osservata in due o più periodi di tempo. Esempi ipotetici: Dati su 420 distretti Californiani nel 1999 e di nuovo nel 2000, totale 840 osservazioni. Dati su 50 stati americani, ogni stato è osservato per 3 anni, totale 150 osservazioni. Dati su 1000 individui, in 4 mesi diversi, total 4000 osservazioni. 1

Notazione Pedice doppio distingue entità (stati, individui, imprese) e periodi di tempo (mesi, quadrimestri, anni) i = entità, n = numero di entità, i = 1,,n t = periodo di tempo, T = numero di periodi di tempo t =1,,T Dati: Supponiamo di avere un regressore. I dati sono: (X it, Y it ), i = 1,,n, t = 1,,T 2

Dati Panel con k regressori: (X 1it, X 2it,,X kit, Y it ), i = 1,,n, t = 1,,T n = numero di entità (stati) T = numero di periodi di tempo (anni) dati longitudinali panel bilanciati 3

Perchè sono utili? Con dati panel possiamo controllare per fattori che: Variano fra (across) le entità (stati, individui, etc) ma non variano nel tempo In caso contrario questi fattori potrebbero causare bias dovuto a variabili omesse Sono non misurabili e non osservabili e perciò non possono essere inclusi tra i regressori di una regressione multipla 4

Esempio: # morti per il traffico e tasse sull alcool 48 stati Americani, n = 48 7 anni (1982,, 1988), T = 7 Panel bilanciato, ossevazioni = 7 48 = 336 Variabili: Tasso di fatalità (# morti per incidente stradale in uno anno in uno stato per 10,000 residenti) Tassa sulla birra altre 5

dati per il 1982: Più tasse, più morti? 6

Dati per il 1988 Più tasse, più morti? 7

Altri fattori che determinano il tasso di fatalità: Qualità (età) degli automobilisti Qualità delle strade Cultura del bere e del guidare Densità di macchine, intensità del traffico 8

Questi fattori omessi potrebbero causare bias. Ese #1: densità del traffico. Supponiamo che: (i) Traffico molto intenso si traduce in più morti, (correlato con la variabile dipendente Y) (ii) Stati con meno traffico hanno tasse più basse sugli alcolici (correlato con la variabile indipendente X) => se (i) e (ii) sono soddisfatte, si verificano le 2 condizioni delle variabili omesse. tasse alte potrebbero riflettere altà densità di traffico (coefficiente OLS biased positivamente) Un panel elimina la bias delle variabili omesse quando queste sono costanti nel tempo in uno stato 9

Es #2: attitudine culturale verso la guida in stato di ebbrezza (i) sono determinanti delle morti per il traffico (corr con Y) (ii) sono correlate potenzialmente con una tassa sulla birra, detta tassa potrebbe allora catturare l effetto delle differenza culturali (bias da variabile omessa). (corr con X) 10

Panel Data con 2 periodi di tempo FatalityRate it = β 0 + β 1 BeerTax it + β 2 Z i + u it Z i fattore che non cambia nel tempo (attitudine culturale), almeno negli anni del nostro campione. Supponiamo che Z i non è osservata,. L effetto di Z i può essere eliminate usando T = 2 anni. 11

Concetto chiave: ogni variazione nel tasso di fatalità dal 1982 al 1988 non può essere causato da Z i, poichè Z i per assunzione non cambia fra il 1982 e il 1988. Analiticamente: tasso di fatalità nel 1988 e 1982: FatalityRate i1988 = β 0 + β 1 BeerTax i1988 + β 2 Z i + u i1988 FatalityRate i1982 = β 0 + β 1 BeerTax i1982 + β 2 Z i + u i1982 Supponiamo che E(u it BeerTax it, Z i ) = 0. Sottraendo 1988 1982 (cioè calcolando la variazione) eliminiamo l effetto di Z i 12

FatalityRate i1988 = β 0 + β 1 BeerTax i1988 + β 2 Z i + u i1988 FatalityRate i1982 = β 0 + β 1 BeerTax i1982 + β 2 Z i + u i1982 Perciò FatalityRate i1988 FatalityRate i1982 = β 1 (BeerTax i1988 BeerTax i1982 ) + (u i1988 u i1982 ) Il nuovo termine di errore, (u i1988 u i1982 ), è non correlato con BeerTax i1988 o BeerTax i1982. Questa equazione in differenza può essere stimata usando OLS, anche se Z i non è osservata. La variabile omessa Z i non cambia e dunque non è un determinante della variazione in Y 13

Es: 1982: Fˆ R = 2.01 + 0.15BeerTax (n = 48) 1988: (.15) (.13) Fˆ R = 1.86 + 0.44BeerTax (n = 48) (.11) (.13) Regressione in differenza (n = 48) ˆ ˆ FR1988 FR1982 =.072 1.04(BeerTax 1988 BeerTax 1982 ) (.065) (.36) 14

FR v. BeerTax: 15

Regressione con effetti fissi Se T > 2 Y it = β 0 + β 1 X it + β 2 Z i + u it, i =1,,n, T = 1,,T Possiamo riscrivere: 1. regressione con n-1 regressori binari 2. regressione con Effetti Fissi 16

Effetti fissi N=3 Y it = β 0 + β 1 X it + β 2 Z i + u i, i =1,,n, T = 1,,T i = 1 (CA): Y CA,t = β 0 + β 1 X CA,t + β 2 Z CA + u CA,t oppure = (β 0 + β 2 Z CA ) + β 1 X CA,t + u CA,t Y CA,t = α CA + β 1 X CA,t + u CA,t α CA = β 0 + β 2 Z CA non cambia nel tempo α CA è intercetta propria di i= CA, e β 1 è il coefficiente angolare comune a tutti. 17

Per i=2, (TX) Y TX,t = β 0 + β 1 X TX,t + β 2 Z TX + u TX,t or = (β 0 + β 2 Z TX ) + β 1 X TX,t + u TX,t Y TX,t = α TX + β 1 X TX,t + u TX,t, where α TX = β 0 + β 2 Z TX Per tutti e 3 gli stati: Y CA,t = α CA + β 1 X CA,t + u CA,t Y TX,t = α TX + β 1 X TX,t + u TX,t Y MA,t = α MA + β 1 X MA,t + u MA,t oppure Y it = α i + β 1 X it + u it, i = CA, TX, MA, T = 1,,T 18

Una regressione per ogni stato Y Y = α CA + β 1 X α CA CA Y = α TX + β 1 X α TX α MA TX MA Y = α MA + β 1 X X 19

Y Y = α CA + β 1 X α CA CA Y = α TX + β 1 X α TX α MA TX MA Y = α MA + β 1 X In forma di regressione binaria : Y it = β 0 + γ CA DCA i + γ TX DTX i + β 1 X it + u it DCA i = 1 se lo stato è CA, = 0 altrimenti DTX t = 1 se lo stato è TX, = 0 altrimenti Non consideriamo DMA i (?) X 20

Sommario Regressione binaria Y it = β 0 + β 1 X it + γ 2 D2 i + + γ n Dn i + u it 1 for i=2 (state #2) dove D2 i =, etc. 0 otherwise Effetto Fisso : Y it = β 1 X it + α i + u it α i è chiamata effetto fisso dello stato o effetto stato è l effetto (fisso) di appartenere allo stato i 21

Regressione con Effetti Fissi. Stima 3 metodi: 1. regressioni OLS con n-1 regressori binari 2. regressioni OLS con Entity-demeaned 3. specificazione con le variazioni, senza intercetta (funziona solo per T = 2) questi 3 metodi danno origine agli stessi risultati sia per coefficienti che per standard errors. Metodo 3 solo per T = 2 Metodo #1 e #2 anche per T>2 Metodo #1 solo quando n non è troppo grande 22

Metodo 1. Y it = β 0 + β 1 X it + γ 2 D2 i + + γ n Dn i + u it (1) where D2 i = 1 for i=2 (state #2) 0 otherwise etc. Prima di tutto è necessario creare (n-1) dummy D2 i,,dn i (1) si stima con OLS Inferenza come al solito Non fattibile quando n è molto grande 23

Metodo 2. Regressione con effetti fissi: Y it = β 1 X it + α i + u it La media per ogni entità (stato) è 1 T Yit = α i + β 1 T 1 X it T t = 1 t 1 1 T it T + u = T t = 1 La deviazione dalla media è data da Y it 1 T Yit = β 1 T 1 it it T t = X X 1 T + 1 T uit t = T 1 t = 1 u it 24

or Y it 1 T Yit = β 1 T 1 it it T t = X X 1 T + 1 T uit t = T 1 t = 1 Y % it = β 1 X % it + u% it u it where Y % it = Y it 1 T Yit t 1 T = and X % it = X it 1 T X it t 1 T = per i=1 e t = 1982, it Y % è la differenza fra il tasso di fatalità nello stato 1 e il suo valore medio per tutti i 7 anni. 25

Y % it = β 1 X % it + u% it (2) dove Y % it = Y it 1 T Yit t 1 T =, etc. Prima costruiamo le variabili decurtate dalla media Y % it e Stimiamo (2) regredendo Y % it su X % it con OLS Inferenza come al solito X % it 26

Es. n = 48, T = 7, demeaned. areg vfrall beertax, absorb(state) r; Regression with robust standard errors Number of obs = 336 F( 1, 287) = 10.41 Prob > F = 0.0014 R-squared = 0.9050 Adj R-squared = 0.8891 Root MSE =.18986 ------------------------------------------------------------------------------ Robust vfrall Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- beertax -.6558736.2032797-3.23 0.001-1.055982 -.2557655 _cons 2.377075.1051515 22.61 0.000 2.170109 2.584041 -------------+---------------------------------------------------------------- state absorbed (48 categories) 27

Fˆ R =.66BeerTax + fisso effetto (.20) Quanti regressori binari avremmo dovuto includere? Nota: risultati diversi da quelli ottenuti con la stima delle variazioni (T = 2, n = 48) ˆ ˆ FR1988 FR1982 =.072 1.04(BeerTax 1988 BeerTax 1982 ) (.065) (.36) 28

Regressioni con Effetto fisso temporale Una variabile omessa potrebbe variare nel tempo e non fra gli stati: Macchine più sicure (air bags, etc.); cambiamenti nella legislazione Le itercette ora variano nel tempo Consideriamo una variabile, S t, che varia nel tempo. La retta di regressione: Y it = β 0 + β 1 X it + β 2 Z i + β 3 S t + u it 29

Y it = β 0 + β 1 X it + β 3 S t + u it Y i,1982 = β 0 + β 1 X i,1982 + β 3 S 1982 + u i,1982 = (β 0 + β 3 S 1982 ) + β 1 X i,1982 + u i,1982 oppure Y i,1982 = µ 1982 + β 1 X i,1982 + u i,1982, µ 1982 = β 0 + β 3 S 1982 ugualmente, Y i,1983 = µ 1983 + β 1 X i,1983 + u i,1983, µ 1983 = β 0 + β 3 S 1983 etc. 30

2 formulazioni alternative 1. regressione con T-1 regressori binari : Y it = β 0 + β 1 X it + δ 2 B2 t + δ T BT t + u it dove B2 t = 1 when t=2 (year #2), etc. 0 otherwise 2. regressione con Effetti temporali : Y it = β 1 X it + µ t + u it 31

1. regressione OLS con T-1 regressori binari Y it = β 0 + β 1 X it + δ 2 B2 it + δ T BT it + u it Creiamo delle variabili e dicotomiche B2,,BT B2 = 1 se t = anno #2, = 0 altrimenti Regrediamo Ysu X, B2,,BT con OLS B1? 2. regressione OLS Year-demeaned Deviazione di Y it, X it dalle medie temporali Stima tramite OLS usando i dati da cui sono state detratte le medie 32

. gen y83=(year==1983);. gen y84=(year==1984);. gen y85=(year==1985);. gen y86=(year==1986);. gen y87=(year==1987);. gen y88=(year==1988);. areg vfrall beertax y83 y84 y85 y86 y87 y88, absorb(state) r; Regression with robust standard errors Number of obs = 336 F( 7, 281) = 3.70 Prob > F = 0.0008 R-squared = 0.9089 Adj R-squared = 0.8914 Root MSE =.18788 ------------------------------------------------------------------------------ Robust vfrall Coef. Std. Err. t P> t [95% Conf. Interval] -------------+---------------------------------------------------------------- beertax -.6399799.2547149-2.51 0.013-1.141371 -.1385884 y83 -.0799029.0502708-1.59 0.113 -.1788579.0190522 y84 -.0724206.0452466-1.60 0.111 -.161486.0166448 y85 -.1239763.0460017-2.70 0.007 -.214528 -.0334246 y86 -.0378645.0486527-0.78 0.437 -.1336344.0579055 y87 -.0509021.0516113-0.99 0.325 -.1524958.0506917 y88 -.0518038.05387-0.96 0.337 -.1578438.0542361 _cons 2.42847.1468565 16.54 0.000 2.139392 2.717549 -------------+---------------------------------------------------------------- state absorbed (48 categories) 33

Effetti fissi combinati (entità e tempo) differenze & intercetta (solo per T = 2) differenza dalla media per le entità & T 1 dummy temporali differenza dalla media per le tempo & n 1 dummy entità T 1 dummy temporali & n 1 dummy entità differenza dalla media per entità e tempo 34

Estensioni alle assunzioni dei minimi quadrati per Dati Panel Consideriamo un regressore singolo, X: Y it = β 1 X it + α i + u it, i = 1,,n, t = 1,, T 1. E(u it X i1,,x it,α i ) = 0. 2. (X i1,,x it,y i1,,y it ), i = 1,,n sono i.i.d. estratte da una distribuzione congiunta 3. (X it, Y it ) hanno quarto momento finito. 4. Non c è perfetta multicollinearità (X multipla) 5. corr(u it,u is X it,x is,α i ) = 0 per t s. Ass. 3&4 sono le stesse di OLS Ass. 1&2&5 diverse da OLS 35

Ass.#1: E(u it X i1,,x it,α i ) = 0 u it ha media zero date X e l effetto fisso estensione dell Ass.1 OLS implica che non ci sono fattori omessi ritardati non c è nenache una relazione fra u e il futuro di X: se in uno stato c è un tasso di fatalità particolarmente alto quest anno, questo non si tramuterà sistematicamente in un incremento della tassa sulla birra. Assunzione pertinente alle serie storiche. 36

Ass. #2 (X i1,,x it,y i1,,y it ), i =1,,n, sono i.i.d. estratte da una distribuzione congiunta Estende Ass.#2 OLS È soddisfatta se le entità i sono campionate casualmente dalla popolazione (campionamento casuale semplice) e le osservazioni di queste entità sono a loro volta collezionate nel tempo. Non richiede che le osservazioni siano i.i.d. nel tempo per la stessa entità (se uno stato ha oggi una tassa sulla birra alta questo sarà infatti fortemente correlato al fatto di avere una tassa sulla birra alta il prossimo anno). 37

Ass. #5: corr(u it,u is X it,x is,α i ) = 0 per t s Dato X, i termini di errore sono non correlati nel tempo in uno stato. Per es, u CA,1982 e u CA,1983 sono non correlati richiede che i fattori omessi inclusi in u it non sono correlati nel tempo, per ogni entità. Che succede se Ass. #5 non è verificata? Problema simile a quello dell eteroschedasticità. Si risolve utilizzando standard error corretti. 38

Applicazione: legislazione sulla guida in stato di ebbrezza e morti sulle strade Approx. 40,000 morti sulle strade in U.S. 1/3 di morti sulle strade coinvolgono guidatori ubriachi 25% dei guidatori fra l 1:00 e le 3:00 a.m. hanno bevuto (stima) è 13 volte più probabile che un ubriaco rispetto ad un sobrio causi un incidente mortale (stime) 39

Politica economica Guidare ubriachi causa da luogo a grandissime esternalità (anche i sobri sono vittime, costi medici, etc. etc.) giustificazione per un intervento Qual è l effetto di leggi specifiche: Punizioni mandatorie Leggi sull età minima per bere Interventi economici (tasse sull alcool) 40

Panel data n = 48 U.S. stati, T = 7 anni (1982,,1988) (bilanciato) Variabili Mortalità dovuta al traffico Tasse sulle birre (Beertax) Età minima legale per bere Condanna minima per la prima violazione: Galera Servizi comunitari altrimenti, multa dati economici sullo stato di riferimento 41

Perchè i panel possono essere utili? Bias da variabili omesse che non variano nel tempo potenziale: cultura del bere e del guidare qualità delle strade usiamo l effetto stato fisso Bias da variabili omesse che variano nel tempo potenziale: Miglioramenti nella sicurezza delle automobili Modifica delle attitudini verso chi guida in stato di ebbrezza usiamo l effetto fisso temporale 42

Principali risultati Il segno del coefficiente della tassa sulla birra cambia quando gli effetti fissi sono inclusi Gli effetti fissi sono significativi ma non hanno un grande impatto sui coefficienti stimati Il coefficiente della tassa sulla birra descresce quando altre misure sono incluse come regressori L unica variabile di policy che sembra avere un impatto è la tassa sulla birra Altre variabili economiche hanno un coefficiente piuttosto grande: più alto reddito, più guida, più morti 45

Digressione: L idea di usare n-1 dummy è come usare una intercetta per ogni gruppo 46

Sommario: Vantaggi e limiti della regressione con effetti fissi Vantaggi Possiamo controllare per variabili non osservabili che:: Variano fra gli stati ma non nel tempo Variano nel tempo ma non fra gli stati Più osservazioni ci danno più informazioni Il metodo di stima è un estensione della regressione multipla 47

Effetti fissi possono essere calcolati in 3 modi 1. cambi T = 2 2. n-1 regressori binari quando n è piccolo 3. Entity-demeaned Metodi simili si applicano quando l effetto fisso è temporale Inferenza statistica: come nella regressione multipla. Limiti X deve necessariamente variare nel tempo e fra gli stati Gli operatori di ritardo potrebbero essere importanti Si devono usare standard error corretti 48