Lineamenti di econometria 2



Documenti analoghi
Lineamenti di econometria 2

Lineamenti di econometria 2

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Capitolo 12 La regressione lineare semplice

Il metodo della regressione

Analisi statistica delle funzioni di produzione

Domande a scelta multipla 1

Econometria. lezione 17. variabili dipendenti binarie. Econometria. lezione 17. AA Paolo Brunori

RISCHIO E CAPITAL BUDGETING

(liberamente interpretato da SCHEDA ALUNNI. Descrizione dell attività:

Inferenza statistica. Statistica medica 1

E naturale chiedersi alcune cose sulla media campionaria x n

lezione 18 AA Paolo Brunori

Economia del Lavoro 2010

Statistica. Lezione 6

Test statistici di verifica di ipotesi

Relazioni statistiche: regressione e correlazione

Limitazioni cognitive e comportamento del consumatore (Frank, Capitolo 8)

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate

Regressione Mario Guarracino Data Mining a.a. 2010/2011

1 Università di Trento ed Euricse 2 Università dell Insubria, Varese

LA CORRELAZIONE LINEARE

Slide Cerbara parte1 5. Le distribuzioni teoriche

Esercitazione n.2 Inferenza su medie

Correzione dell Esame di Statistica Descrittiva (Mod. B) 1 Appello - 28 Marzo 2007 Facoltà di Astronomia

Ai fini economici i costi di un impresa sono distinti principalmente in due gruppi: costi fissi e costi variabili. Vale ovviamente la relazione:

Modulo didattico sulla misura di grandezze fisiche: la lunghezza

Elaborazione dei dati su PC Regressione Multipla

Capitolo 2 Distribuzioni di frequenza

Regressione logistica. Strumenti quantitativi per la gestione

1 Associazione tra variabili quantitative COVARIANZA E CORRELAZIONE

LA REVISIONE LEGALE DEI CONTI La comprensione

UD 6.2. Misurare il costo della vita

La regressione lineare multipla

Dall italiano al linguaggio della logica proposizionale

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

Massimizzazione del Profitto e offerta concorrenziale. G. Pignataro Microeconomia SPOSI

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

Multicollinearità Strumenti quantitativi per la gestione

Finanza Aziendale. Lezione 13. Introduzione al costo del capitale

PIL : produzione e reddito

PROGETTO REGIONALE MISURAZIONE E VALUTAZIONE DELLE BIBLIOTECHE VENETE

MICROECONOMIA La teoria del consumo: Alcuni Arricchimenti. Enrico Saltari Università di Roma La Sapienza

SPC e distribuzione normale con Access

Metodi statistici per le ricerche di mercato

LE RICERCHE DI MERCATO

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010

b. Che cosa succede alla frazione di reddito nazionale che viene risparmiata?

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

Parimenti una gestione delle scorte in maniera non oculata può portare a serie ripercussioni sul rendimento sia dei mezzi propri che di terzi.

La distribuzione Normale. La distribuzione Normale

TUTTI I MUTUI DI CHEBANCA! Condizioni valide al 1 luglio 2010

come nasce una ricerca

[ Analisi della. concentrazione] di Luca Vanzulli. Pag. 1 di 1

u 1 u k che rappresenta formalmente la somma degli infiniti numeri (14.1), ordinati al crescere del loro indice. I numeri u k

Disoccupazione e salario reale

Il modello generale di commercio internazionale

TUTTI I MUTUI DI CHEBANCA! Condizioni valide al 1 gennaio 2011

BANCA ALETTI & C. S.p.A. PER DUE CERTIFICATE e PER DUE CERTIFICATES DI TIPO QUANTO CONDIZIONI DEFINITIVE D OFFERTA

Capitolo V. I mercati dei beni e i mercati finanziari: il modello IS-LM

Il calcolo letterale per risolvere problemi e per dimostrare

FONDAMENTI DI PSICOMETRIA - 8 CFU

BANCA ALETTI & C. S.p.A.

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

Metodi Matematici e Informatici per la Biologia Maggio 2010

Metodologia per l analisi dei dati sperimentali L analisi di studi con variabili di risposta multiple: Regressione multipla

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni

(a cura di Francesca Godioli)

13 Aprile 2012 Padova Italy «SPIN SELLING»

ANALISI DEL CONDIZIONAMENTO DI UN SISTEMA LINEARE

mese richiesta

Capitolo 13: L offerta dell impresa e il surplus del produttore

Misure della dispersione o della variabilità

Economia Applicata ai sistemi produttivi Lezione II Maria Luisa Venuta 1

LE PREVISIONI DELLE FAMIGLIE

Capitolo 25: Lo scambio nel mercato delle assicurazioni

IL RISCHIO D IMPRESA ED IL RISCHIO FINANZIARIO. LA RELAZIONE RISCHIO-RENDIMENTO ED IL COSTO DEL CAPITALE.

Famiglie e povertà: l esperienza trentina del Reddito di Garanzia e la sua valutazione

Lezione 10 Funzione di produzione ed

Esercizi di Calcolo delle Probabilità con Elementi di Statistica Matematica

SERVIZIO NAZIONALE DI VALUTAZIONE

LEZIONE n. 5 (a cura di Antonio Di Marco)

1. Sia dato un poliedro. Dire quali delle seguenti affermazioni sono corrette.

Approfondimenti. Gli investimenti immobiliari secondo lo IAS 40. di Paolo Moretti

Temi di Esame a.a Statistica - CLEF

Esercitazione 23 maggio 2016

1. Distribuzioni campionarie

L EFFICACIA DELLE MISURE DI POLITICA ATTIVA DEL LAVORO REALIZZATE IN PROVINCIA DI TORINO NEL

Capitolo Terzo Valore attuale e costo opportunità del capitale

1 Serie di Taylor di una funzione

La variabile casuale Binomiale

ECONOMIA DEL LAVORO. Lezioni di maggio (testo: BORJAS) L offerta di lavoro

ARISTIDE. Analisi del Rischio del portafoglio crediti e Tassi Interni di Decadimento

Econometria applicata all intermediazione finanziaria Esercizi regressione multipla

Transcript:

Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4)

La Regressione Multipla

La Regressione Multipla La regressione multipla estende il concetto della regressione semplice (regressione con due sole variabili) al caso in cui vi siano due o più variabili esplicative: X 1, X 2,..., X k Intuizioni e derivazione della regressione multipla sono molto simili a quelle della regressione semplice. Enfatizzeremo solo poche differenze tra regressione semplice e multipla.

Esempio: La determinazione del prezzo delle abitazioni Dati su N=546 case vendute nel Windsor, Canada Variabile dipendente: Y = prezzo di vendita delle case Variabili Esplicative : X 1 = dimensione del lotto della proprietà (in metri quadrati) X 2 = numero di stanze da letto X 3 = numero di bagni X 4 = numero di ripostigli (escludendo lo scantinato)

Stime OLS Modello di regressione multipla: Y i = α + β X +... + β X 1 1i k ki + e i ˆβ ˆβ 2 Stime OLS: αˆ, 1,, k, βˆ Minimizziamo la somma dei quadrati dei residui: SSR = (Y ˆ α ˆ β X... ˆ β X ) 2 i 1 1i k ki Le formule risultanti sono però complesse e non vengono qui presentate Tutti i programmi econometrici (Grtl, Stata, ecc.) incluso Excel fornisce automaticamente le stime OLS.

Aspetti Statistici della Regressioni Multipla Sono essenzialmente identici a quelli del caso della regressione semplice. Le formule sono solo leggermente differenti. R 2 è una misura dell adattamento e viene calcolato nello stesso modo della regressione semplice (sebbene non è semplicemente l indice di correlazione al quadrato tra Y e X).

Aspetti Statistici della Regressioni Multipla(cont.) Si può verificare l ipotesi R 2 =0 nello stesso modo della regressione semplice. Se troviamo che R 2 0 allora possiamo concludere che le variabili considerate nella regressione, prese congiuntamente contribuiscono a spiegare la variabile dipendente (Nota: questo non necessariamanete significa che ogni variabile esplicativa è significativa). Gli intervalli di confidenza possono essere calcolati per ciascun coefficiente come prima. Si può verificare l ipotesi che β j =0 per ogni singolo coefficiente (j=1,2,..,k) come prima.

Interpretazione delle stime OLS Intuizione matematica Derivata totale vs. derivata parziale Regressione Semplice: dy dx = β Regressione Multipla: Y X j = β j

Intuizione Interpretazione delle stime OLS (cont.) β j rappresenta l effetto marginale di X j su Y, ceteris paribus β j rappresenta l effetto marginale della variabile esplicativa j sulla variabile dipendente, mantenendo le altre variabili costanti.

Esempio: La determinazione del prezzo delle abitazioni (cont.) Coeff. St.Err t-stat P-val. Lower 95% Upper 95% Interc. -4010 3603-1.113 0.266-11087 3068 Size 5.429 0.369 14.703 2.E-41 4.704 6.155 Bed. 2825 1215 2.325 0.020 438.3 5211 Bath. 17105 1734 9.862 3.E-21 13698 20512 Storeys 7635 1008 7.574 1.E-13 5655 9615 R 2 =.54 e il P-value per verificare l ipotesi che R 2 =0 (che viene denominato in Excel F ) è 1.18E-88. La retta di regressione stimata: Ŷ = -4010 + 5.429X 1 + 2825X 2 + 17105X 3 + 7635X 4

La determinazione del prezzo delle abitazioni (cont.) Poiché βˆ 1 = 5.43: Un metro quadrato in più del lotto tende a far aumentare di $5.43 il prezzo di una casa, ceteris paribus. Se consideriamo case con lo stesso numero di camera da letto, bagni e ripostigli, un metro quadrato in più di lotto tende a far aumentare di $5.43 il prezzo dell abitazione. Se confrontiamo case con lo stesso numero di stanze da letto, bagni e ripostigli, quelle che hanno lotti più grandi tendono a valere di più. In particolare, un metro quadrato in più di lotto è associato a un aumento del valore di una casa di $5.43.

La determinazione del prezzo delle abitazioni (cont.) Poiché βˆ 2 = 2824,61: Abitazioni con una stanza da letto in più tendono a valere $2824,61 in più, ceteris paribus. Se consideriamo abitazioni confrontabili (ad esempio case con lotti di 5000 metri quadrati, due bagni e due ripostigli), quelle che hanno tre camere da letto tendono a valere $2824,61 in più di quelle che hanno solo due stanze da letto.

Problemi nell uso di una regressione semplice in un contesto di regressione multipla Nella regressione multipla considerata precedentemente, il coefficiente del numero di stanze da letto era di 2824,61. In una regressione semplice di Y = prezzo di vendita della casa su X = numero di stanze da letto, otteniamo una stima del coefficiente pari a 13269,98. Perché questi due coefficienti sulla stessa variabile esplicativa sono talmente differenti? perciò 13269,98>>>2824,61. Risposta 1: Sono ottenuti da due regressioni diverse che controllano per diverse variabili esplicative (differenti condizioni ceteris paribus).

Problemi nell uso di una regressione semplice in un contesto di regressione multipla (cont.) Risposta 2: Si immagini di avere un amico che voglia costruire una stanza da letto in più nella sua casa e chieda a voi, in quanto economista, di quanto aumenti il valore della casa dopo la costruzione di una stanza da letto aggiuntiva. Cosa rispondete? Regressione semplice: Case con 3 stanze da letto tendono a costare $13269,98 più di case con 2 stanze da letto Questo però non significa necessariamente che, aggiungendo una stanza da letto alla casa, il valore della casa aumenti di $13269,98. La ragione è che esistono molti altri fattori, oltre il numero delle stanze da letto, che potenzialmente influenzano il prezzo delle case. Inoltre questi fattori potrebbero essere tra loro fortemente correlati (ossia, in pratica, case grandi tendono ad avere più stanze da letto, più bagni, più ripostigli e lotti più grandi). La regressione semplice indica che case migliori tendono a valere di più.

Problemi nell uso di una regressione semplice in un contesto di regressione multipla (cont.) Il numero di stanze da letto agisce come proxy di tutte le altre caratteristiche di queste buone case e perciò il suo coefficiente diviene molto alto (13269,98) nella regressione semplice. La regressione multipla può stimare l effetto separato dovuto alla dimensione del lotto, al numero di stanze da letto, di bagni e di ripostigli. Dirai al tuo amico: Una stanza da letto in più tenderà a far aumentare il valore della casa di $2824,61. La regressione multipla che include tutte (o la maggior parte) le caratteristiche della casa tenderà a dare stime più accurate rispetto alla regressione semplice.

Problemi nell uso di una regressione semplice in un contesto di regressione multipla (cont.) Evidenza Statistica: Matrice di correlazione: Sale price 1 Sale Price Lot size 0.5358 1 #bed 0.3664 0.1519 1 Lot size #bed #bath #storey #bath 0.5167 0.1938 0.3738 1 #storeys 0.4212 0.0837 0.4080 0.3241 1 La correlazione positiva tra le variabili esplicative indica che case con più stanze da letto tendono anche ad avere larghi lotti, più bagni e più ripostigli.

Distorsione da variabili omesse Distorsione da variabili omesse è il termine statistico per le questioni discusse precedentemente. SE 1. Escludiamo variabili esplicative che dovrebbero essere presenti nella regressione, E 2. Queste variabili omesse sono correlate con le variabili esplicative incluse, ALLORA 3. Le stime OLS dei coefficienti relativi alle variabili esplicative incluse nel modello non sono esatte.

Distorsione da variabili omesse(cont.) Esempio: Regressione semplice Y = prezzo di vendita della casa e X = numero di stanze da letto. Molte variabili rilevanti per la determinazione del prezzo delle abitazioni sono omesse. Queste varibili omesse sono correlate con il numero di stanze da letto. Pertanto la stima OLS ottenuta dalla regressione semplice è inaffidabile, βˆ =13269,98 era distorto.

Suggerimenti Pratici per la selezione delle variabili esplicative da includere Includere il maggior numero di variabili esplicative che riteniamo spieghino la variabile dipendente. In questo modo riduciamo il rischio di distorsione nelle stime dovuta all omissione di variabili rilevanti. Tuttavia, l inclusione di variabili irrilevanti fa diminuire l accuratezza delle stime di tutti i coefficienti (non solo quelli associati alle variabili irrilevanti). Perciò elaborare la verifica delle ipotesi, con la statistica t e decidere se le variabili sono statisticamente significative. Stimare una nuova regressione che non include le variabili esplicative che non sono significative.

Multicollinearità Intuizione: Se alcune delle variabili esplicative sono molto correlate tra loro allora il modello di regressione ha difficoltà a distinguere quali siano le variabili esplicative che influenzano Y. Sintomo: Coefficienti individuali non significativi, ma la regressione nel complesso significativa (perciò R 2 è elevato, F-stat grande). Esaminare la matrice di correlazione delle variabili esplicative può aiutare a rilevare l esistenza e la causa del problema di collinearità.

Multicollinearità (cont.) Esempio: Y = tasso di cambio Variabili esplicative = tasso di interesse X 1 = tasso primario praticato dalle banche X 2 = tasso di interesse sui buoni del tesoro Se usiamo sia X 1 che X 2 probabilmente causeremo un problema di collinearità Soluzione: Includere o X 1 o X 2 ma non entrambi. In alcuni casi questa soluzione non è soddisfacente se comporta l esclusione di variabili esplicative che la teoria economica o il buon senso suggerisce di includere.

Esempio: La Multicollinearità illustrata con dati simulati Modello vero: Y.5X + X + = 2 1 2 e Correlazione tra X 1 e X 2 =.98 Coeff. St. t-stat P-val. Lower Upper Error 95% 95% Inter..1662.1025 1.579.1211 -.0456.3780 X1 2.084.9529 2.187.0338.1667 4.001 X2.1478.9658.1530.8790-1.795 2.091 R 2 =.76 P-value verificare che R 2 =0 è 1.87E-15. Vogliamo dei coefficienti stimati intorno a.5 e 2 ma otteniamo stime differenti. Inoltre X2 non è statisticamente significativa.

Esempio: La Multicollinearità illustrata con dati simulati(cont.) Escludiamo X 2 e eseguiamo nuovamente la regressione: Coeff. St. Error t-stat P-val. Lower 95% Upper 95% Inter..1667.1041 1.601.1160 -.0427.3761 X1 2.227.1788 12.454 1.E-16 1.867 2.586 R 2 =.76 P-value per verificare l ipotesi che R 2 =0 è pari a 1.2E-16. Il coefficiente della variabile X1 è significativo ma non si trova vicino al vero valore!