Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4)
Regressione con Variabili Dummy
Regressione con Variabili Dummy La variabile dummy assume valore 0 o 1. E utilizzata per trasformare dei valori qualitativi (Si/No) in 1/0. Esempio: Spiegare i prezzi delle case Variabile dipendente: Prezzo della casa Variabili Esplicative: D 1 = 1 se la casa ha un ingresso auto (=0 in caso negativo). D 2 = 1 se ha una stanza di ricreazione (=0 se non ha). D 3 = 1 se ha una cantina (=0 se non). D 4 = 1 se ha riscaldamento centralizzato (=0 se non). D 5 = 1 se ha condizionatori d aria (=0 se non).
Analisi della Varianza Analisi della Varianza = ANOVA E una tecnica statistica molto utilizzata in diverse discipline (ma poco utilizzata in economia). ANOVA è un caso speciale di regressione con variabili dummy. La regressione con variabili dummy è uno strumento più generico e più dettagliato.
Regressione Semplice con una Variabile Dummy Y = α + βd + e Stima OLS, intervalli di confidenza, test delle ipotesi, ecc. elaborati nel modo usuale. Interpretazione lievemente differente.
Regressione Semplice con una Variabile Dummy Valore stimato per l osservazione i (punto sulla retta di regressione): Ŷ = ˆ α + i βd ˆ i Poichè D i = 0 o 1 o Ŷ = i o αˆ Ŷ = ˆ α + ˆ β i
Esempio: prezzo delle case (continua) Regrediamo Y = prezzo della cassa su D = dummy per condizionatori d aria (=1 se la casa ha condizionatori d aria, = 0 altrimenti). Risultato: αˆ = 59,885 βˆ = 25,996 ˆ α + ˆ β = 85,881 Il prezzo medio della casa con aria condizionata è $85,881 Il prezzo medio della casa senza aria condizionata è $59,885
Regressione Multipla con variabili Dummy Y = α + β D +... + β D + e 1 1 k k Esempio: prezzo delle case (continua) Regrediamo Y = prezzo della casa su D 1 = accesso auto e D 2 = stanza di ricreazione (dummy) Quattro tipi di case: 1. Case con accesso auto e stanza di ricreazione (D 1 =1, D 2 =1) 2. Case con accesso auto ma senza stanza di ricreazione (D 1 =1, D 2 =0) 3. Case con stanza di ricreazione ma senza accesso auto (D 1 =0, D 2 =1) 4. Case senza stanza di ricreazione e senza accesso auto (D 1 =0, D 2 =0)
Esempio: prezzo delle case (continua) Esempio: prezzo delle case (continua) Coeff. St. Error t Stat P- value Lower 95% Upper 95% Inter. 47099.1 2837.6 16.60 2.E-50 41525 52673 D1 21159.9 3062.4 6.91 1.E-11 15144 27176 D2 16023.7 2788.6 5.75 1.E-08 10546 21502 1. Se D 1 =1 e D 2 =1, allora Yˆ = ˆ α + ˆ β + ˆ β = 47,099 + 21,160 + 16,024 = 1 2 84,283 Il prezzo medio delle case con accesso auto e stanza di ricreazione è $84,283.
Esempio: prezzo delle case (continua) 1. Se D 1 = 1 e D 2 =0, allora Y ˆ = ˆ α + ˆ β = 47,099 + 21,160 = 1 68,259 Il prezzo medio delle case con accesso auto ma non stanza di ricreazione è $68,259. 2. Se D 1 =0 e D 2 =1, allora Y ˆ = ˆ α + ˆ β = 47,099 + 16,024 = 2 63,123 Il prezzo medio delle case con stanza di ricreazione ma non accesso auto è $63,123. 3. Se D 1 =0 e D 2 =0, allora Y ˆ = ˆ α = 47,099 Il prezzo medio delle case senza accesso auto e senza stanza di ricreazione è $47,099.
Regressione Multipla con Dummy e non- Dummy Variabili Esplicative Y = α + β D + β X + e 1 2 Esempio: prezzo delle case (continua) Regrediamo Y = prezzo casa su D = aria condizionata e X = dimensione del lotto. Stime OLS : αˆ = 32,693 βˆ 1 = 20,175 βˆ 2 = 5.64
Esempio: Prezzo delle Case (continua) Per case con condizionatore d aria D = 1 e Ŷ = 52,868 + i 5.64X i Per case senza condizionatore d aria D=0 e Ŷ = 32,693 + i 5.64X i Due regressioni differenti in relazione alla presenza o meno di condizionatori d aria. Le due linee di regressione avranno intercetta diversa ma stessa pendenza (perciò stesso effetto marginale)
Esempio: prezzo delle case (continua) Come spiegare i risultati OLS : Un metro quadrato in più nella dimensione della casa determina un aumento del prezzo pari a $5.64 (Nota: no ceteris paribus poiché l effetto marginale è lo stesso sia per case con condizionatore d aria che per case senza condizionatore d aria) Case con condizionatori d aria tendono a valere $20,175 in più di case senza condizionatori d aria, ceteris paribus (Nota: in questo caso abbiamo la qualificazione ceteris paribus ) Se consideriamo case con dimensioni simili, quelle con condizionatori d aria tendono a valere $20,175 in più
Un altra Regressione relativa al Prezzo delle Case Y = α + β D + β D + β X + β X + e 1 1 2 2 3 1 4 2 Regrediamo Y = prezzo della casa su D 1 = variabile dummy relativa all accesso auto, D 2 = variabile dummy per la stanza di ricreazione, X 1 = dimensione del lotto e X 2 = numero di stanze da letto Stime OLS: αˆ =-2736 βˆ 1=12,598 βˆ 2=10,969 βˆ 3=5.197 βˆ 4=10,562
Un altra Regressione relativa al Prezzo delle Case (cont.) 1. Se D 1 =1 e D 2 =1, allora Y ˆ = 20,831 + 5.197X + 10,562X. 1 2 Questa è la retta di regressione per le case con accesso auto e stanza di ricreazione. 2. Se D 1 =1 e D 2 =0, allora Y ˆ = 9,862 + 5.197 X + 10,562 1 X. 2 Questa è la retta di regressione per le case con accesso auto ma senza stanza di ricreazione.
Un altra Regressione relativa al Prezzo delle Case (cont.) 1. Se D 1 =0 e D 2 =1, allora Y ˆ = 8,233 + 5.197X + 10,562X. 1 2 Questa è la retta di regressione per le case con la stanza di ricreazione e non accesso auto. 2. Se D 1 =0 e D 2 =0, allora Y ˆ = 2,736 + 5.197X + 10,562X. 1 2 Questa è la retta di regressione per le case senza accesso auto e senza stanza di ricreazione.
Un altra Regressione relativa al Prezzo delle Case (cont.) Esempi esplicativi: Case con accesso auto tendono a valere $12,598 di più di case simili senza accesso auto. Se consideriamo case con lo stesso numero di stanze da letto, aggiungendo un metro quadrato alla dimensione del lotto queste tenderanno ad avere un prezzo maggiorato di $5.197. Una stanza da letto aggiuntiva tenderà ad aumentare di $10,562 il valore della casa, ceteris paribus
Termini Moltiplicativi di Variabili Dummy e Non- Dummy Y = α + β D + β X + β Z + 1 2 3 dove Z=D X. e. Z è o 0 (per osservazioni con D=0) o X (per osservazioni con D=1) Se D=1 allora Yˆ = ( ˆ α + ˆ β ) + ( ˆ β + ˆ β ). Se D=0, allora Yˆ = ˆ α + ˆ β 2 X. X 1 2 3 Due diverse rette di regressione corrispondenti a D=0 e D=1 con intercette e pendenza diverse. L effetto marginale di X su Y è differente per D=0 e D=1.
Ancora un Esempio Diverso del Prezzo delle Case Regrediamo Y = prezzo della casa su D = dummy per l aria condizionata, X = dimensione della casa e Z = D X Stime OLS: αˆ = 35,684 βˆ 1 = 7,613 βˆ 2 = 5.02 βˆ 3 = 2.25. L effetto marginale della dimensione della casa è 7.27 per case con aria condizionata ma solo $5.02 per case senza aria condizionata. Incrementando la dimensione della casa il suo valore tenderà ad aumentare di più nel caso vi sia aria condizionata.
Variabili Dipendenti Dummy Esempio: La variabile dipendente rappresenta la scelta del mezzo di trasporto. 1 = Si, vado a lavoro in macchina 0 = No, non vado a lavoro in macchina Non discuteremo questo caso. Nota solo i seguenti punti: Ci sono problemi con lo stimatore dei minimi quadrati ordinari (OLS estimation). Tuttavia lo stimatore OLS è adeguato in molti casi. Stime migliori sono ottenute utilizzato il metodo Logit e Probit. Excel non ha procedure automatiche per questi metodi, abbiamo bisogno di un applicativo econometrico differente (es. Gretl).