Appunti di Econometria
|
|
|
- Marina Vecchio
- 9 anni fa
- Visualizzazioni
Transcript
1 Appunti di Econometria ARGOMENTO [3]: VARIABILI STRUMENTALI Tommaso Nannicini Università Bocconi Novembre 2010 E ho visto causa ad effetto che si scambiavano il ruolo Lorenzo Jovanotti Cherubini, Un buco nella tasca, Problemi di endogeneità Se quello sbruffone di Archimede chiedeva una leva per sollevare il mondo, l econometrico si accontenta (il più delle volte) di una variabile strumentale per spiegarlo. Per una serie di problemi che in parte abbiamo anticipato nella trattazione del modello di regressione lineare, è spesso arduo dare un interpretazione causale alle stime ottenute con i metodi discussi finora (si riveda anche l argomento 0 di queste dispense). Problemi di endogeneità e causalità inversa sono endemici in tutti quei contesti empirici in cui è difficile sostenere che la condizione di esogeneità (anche nella sua versione più debole) regga. Gli stimatori OLS diventano quindi inconsistenti. In questo paragrafo, ricorderemo alcuni dei casi più frequenti. Nel prossimo paragrafo, analizzeremo la soluzione a questi problemi offerta dagli stimatori con variabili strumentali. Variabili omesse Nell argomento 2 di queste dispense, abbiamo già discusso formalmente il problema delle variabili omesse. Richiamamolo brevemente per il caso bivariato, in cui il vero modello nella popolazione è y = β 1 +β 2 x 2 +β 3 x 3 +ɛ, mentre, non osservando x 3, il modello stimato è y = β 1 +β 2x 2 +ɛ. In questo caso: E[ ˆβ σ 2 ] = β2 + β 23 3 σ 2, 2 dove σ 23 è la covarianza tra il regressore x 2 e la variabile omessa x 3, e σ 2 2 la varianza di x 2. Inoltre, β 3 può essere interpretato come l outcome effect della variabile omessa e σ 23 come il suo selection effect. Abbiamo quindi quattro possibili casi di distorsione da variabile omessa. σ 23 > 0 σ 23 < 0 β 3 > 0 distorsione positiva distorsione negativa β 3 > 0 distorsione negativa distorsione positiva 1
2 In sintesi, se possiamo ragionevolmente prevedere una distorsione positiva da variabile omessa (come nel caso in cui y è il salario, x 2 l istruzione, e x 3 l istruzione del padre), l effetto stimato può essere interpretato come un limite superiore (upper bound) del vero effetto nella popolazione; viceversa, in presenza di una distorsione negativa, l effetto stimato ci fornisce un limite inferiore (lower bound). Se ˆβ 2 > 0 e significativo, sapere che possiamo interpretarlo come un lower bound significa avere un test (la cui potenza è quindi aumentata) che ci dice che l effetto di x 2 su y è senz altro positivo (anche se non riusciamo a quantificarlo). In maniera simile, se ˆβ 2 < 0 e significativo, sapere che possiamo interpretarlo come un upper bound significa avere un test che ci dice che l effetto di x 2 su y è senz altro negativo. Prima di passare agli altri casi di endogeneità, si ripassi l argomento 2 di queste dispense per la formulazione multivariata del problema delle variabili omesse. Errori di misura In alcuni casi, la variabile che crea problemi potrebbe essere osservata, ma con un certo grado di approssimazione. Nel caso di errore di misura della variabile dipendente, gli stimatori OLS sono corretti e consistenti, a patto che l errore non sia correlato con i regressori. Gli errori del modello stimato sono invece maggiori di quelli del vero modello, e le stime sono meno accurate. Nel caso di errore di misura di una variabile esplicativa, tuttavia, i problemi possono essere ben maggiori. Si consideri il caso che segue. Definiamo l errore di misura (e x ) come la differenza tra la variabile osservata (x) e quella vera (x 2 ). Se il vero modello è y = β 1 +β 2 x +ɛ, il modello stimato diventa y = β 1 +β 2 x+η, dove η = ɛ β 2 e x. Se l errore di misura e x non è correlato con x, è per definizione correlato con la variabile osservata x, che sarà quindi correlata con l errore del modello stimato η. Gli OLS sono quindi inconsistenti, dato che: Cov(x, η) = β 2 σ 2 e, dove σ 2 e è la varianza dell errore di misura. Definendo σ2 x come la varianza di x, si può far vedere che: plim( ˆβ 2 ) = β 2 + Cov(x, η) V ar(x) = β 2 β 2σ 2 e σ 2 x + σ2 e ( σ 2 ) x = β 2 σ 2 + < β 2. x σ2 e Di conseguenza, la stima ottenuta sarà sempre più piccola (in valore assoluto) del vero valore di β 2. Si parla in questo caso di attenuation bias: se l effetto è statisticamente significativo, quindi, siamo sicuri della sua direzione, ma non riusciamo a quantificarlo. Equazioni simultanee Un altro esempio classico di endogeneità (forse il più classico, visto che anche la terminologia delle variabili strumentali nasce in questo contesto) è rappresentato dalle equazioni simultanee. Consideriamo il caso della domanda e dell offerta di lavoro nel settore agricolo. La domanda di lavoro, per esempio a livello provinciale, può essere espressa come: L d = α 1 w + β 1 z 1 + ɛ 1, dove w è il salario, z 1 una variabile esogena che influenza la domanda (per esempio, le condizioni metereologiche), ed ɛ 1 l errore stocastico. L offerta di lavoro è invece data da: L s = α 2 w + β 2 z 2 + ɛ 2, dove z 2 è una variabile esogena che influenza l offerta (per esempio, il salario nel settore manifatturiero), ed ɛ 2 l errore stocastico. Noi vorremmo stimare separatamente queste due equazioni strutturali, per valutare la relazione tra le due variabili endogene L e w, ma il compito risulta impossibile per il fatto che osserviamo soltanto la quantità di lavoro e il salario d equilibrio in ogni provincia. È facile far vedere che le due equazioni strutturali di cui sopra ci consegnano questa equazione in forma ridotta (dove una variabile endogena viene espressa in funzione delle variabili esogene) per il salario: w = π 1 z 1 + π 2 z 2 + η, 2
3 dove π j = β j /(α 2 α 1 ) ed η = [ɛ 1 /(α 2 α 1 )] + [ɛ 2 /(α 2 α 1 )]. Ne consegue che: Cov(w, ɛ j ) = V ar(ɛ j) (α 2 α 1 ) 2 > 0, per j = 1, 2. Quindi, in entrambe le equazioni strutturali, la variabile endogena è correlata con l errore, e le stime OLS sono inconsistenti. Come vedremo, le variabili esogene z 1 e z 2, grazie al fatto che ognuna di esse compare in una equazione strutturale ma non nell altra (restrizione di esclusione), possono aiutarci a identificare e stimare i parametri d interesse α 1 e α 2. 2 Stimatori con variabili strumentali I problemi appena visti possono essere sintetizzati nel fatto che la variabile esplicativa d interesse (x) è correlata con il termine d errore (ɛ), ed è per questo definita endogena. x ɛ y In questi casi, una soluzione all inconistenza degli OLS può arrivare dall esisttenza di una o più variabili strumentali (z) correlate con il regressore endogeno, ma non con l errore. z x y ɛ Questo schema contiene tre assunzioni chiave sulle variabili z: a) che sono correlate con il regressore endogeno x (rilevanza); b) che non sono correlate con l errore ɛ (esogeneità); c) che non influenzano direttamente la variabile dipendente y (esclusione). Se la b) e la c) sono verificate (assunzioni che non possiamo testare ma soltanto giustificare o, come vedremo, valutare in forma indiretta), gli strumenti sono validi. L assunzione a) può essere testata direttamente analizzando l equazione in forma ridotta che esprime la variabile endogena in funzione degli strumenti esogeni: se la correlazione tra z e x è bassa, lo strumento è ancora valido ma debole. Si veda la Tabella 1 in Angrist e Krueger (2001) per alcuni esempi di variabili strumentali usate (con maggiore o minore successo) in noti studi empirici. Caso bivariato Nel modello di regressione bivariato y = α + βx + ɛ, se la x è endogena e una variabile z soddisfa le tre assunzioni appena viste, abbiamo che: Cov(z, y) = Cov(z, α+βx+ɛ) = βcov(z, x)+cov(z, ɛ) β = Cov(z, y) Cov(z, ɛ) Cov(z, y) = Cov(z, x) Cov(z, x) Cov(z, x), dove l ultima eguaglianza deriva dall esogeneità della z. Questa relazione ci suggerisce un semplice stimatore per β: = (zi z)(y i ȳ) (xi x)(z i z). 3
4 Infatti, per la legge dei grandi numeri: [ ] (zi z)(y i ȳ)/n plim[ ] = plim = (xi x)(z i z)/n Cov(z, y) Cov(z, x) = β. Lo stimatore delle variabili strumentali di β è quindi consistente. Lo stesso vale per: ˆα IV = ȳ x. Lo stimatore ha anche un interpretazione molto intuitiva: si assuma che un aumento di una unità di z provochi, nello stesso tempo, un aumento di 0.2 anni di studio e di 500 euro di stipendio. Poiché z non ha effetti diretti sullo stipendio (restrizione di esclusione) possiamo attribuire la variazione di 500 euro all aumento nell istruzione indotto da z. Quindi, l effetto di un anno in più di istruzione sul salario (secondo questo stimatore delle variabili strumentali fatto a mano) è dato da: 500/0.2=2,500 euro. 1 Nel caso particolare in cui la variabile z è binaria, lo stimatore delle variabili diventa: = ȳ1 ȳ 0 x 1 x 0, dove ȳ j è la media di y per z = j e x j è la media di x per z = j, con j = 0, 1. Questa formulazione è chiamata stimatore di Wald. Sotto l assunzione di omoschedasticità (E(ɛ 2 z) = σ 2 ), la varianza asintotica dello stimatore delle variabili strumentali è data da: σ2 V ar.as.( ) = Nσxρ 2 2, xz dove σx 2 è la varianza di x e ρ 2 xz il coefficiente di correlazione tra x e z (nella popolazione) al quadrato. Questa quantità può essere stimata inserendovi gli analoghi campionari: lo stimatore s 2 al posto di σ 2, la varianza campionaria di x al posto di σx, 2 e R 2 xz al posto di ρ 2 xz. Questo ci permette di calcolare l errore standard dello stimatore e applicare le procedure inferenziali che già conosciamo. Un altro aspetto di questa formula merita di essere sottolineato: se R 2 xz ha un valore piccolo (cioè, se lo strumento è debole) la varianza dello stimatore è grande e le stime perdono di accuratezza. La perdita di accuratezza non è il solo problema degli strumenti deboli. Si consideri la possibile distorsione asintotica di nel caso in cui le condizioni di validità non sono rispettate in pieno: plim[ ] = Cov(z, y) Cov(z, ɛ) = β + Cov(z, x) Cov(z, x) = β + Corr(z, ɛ)σ ɛ, Corr(z, x)σ x dato che, in generale, Cov(z, w) = Corr(z, w)σ z σ w. In maniera simile, data la presenza di endogeneità, si può riscrivere la distorsione asintotica di ˆβ OLS come: plim[ˆβ OLS ] = β + Cov(x, ɛ) V ar(x) = β + Corr(x, ɛ)σ ɛ σ x. Di conseguenza, abbiamo che: plim[ ] β plim[ˆβ OLS ] β Corr(z, ɛ)/corr(x, ɛ) =. Corr(z, x) Questa formula ci dice che, in presenza di uno strumento debole, anche se il problema di endogeneità della z è molto più piccolo di quello della x, la distorsione asintotica dello stimatore con variabili strumentali può 1 È facile far vedere che = (dy/dz)/(dx/dz), sostituendo le stime OLS dei due effetti marginali della z. 4
5 essere maggiore della distorsione OLS. La debolezza dello strumento, quindi, esaspera l eventuale problema di non validità dello stesso. Caso multivariato appena identificato Passiamo adesso al caso multivariato: y = Xβ + ɛ. In particolare, assumiamo che k 1 regressori siano endogeni (X 1 ) e k 2 regressori siano esogeni (X 2 ), con k = k 1 + k 2 : X = [X 1 X 2 ]. Assumiamo anche di disporre di r variabili esogene (Z), tra cui includiamo le X 2 più r k 2 variabili strumentali che soddisfano le condizioni di rilevanza e validità già discusse (Z 1 ): Z = [Z 1 X 2 ]. Una prima condizione di identificazione è quella di poter disporre di abbastanza variabili strumentali per quante sono le variabili endogene: r k, o r k 2 k 1 (condizione d ordine). Se questa condizione è soddisfatta come eguaglianza abbiamo un numero appena sufficiente di variabili strumentali e il modello è detto just identified. In questo caso, la semplice estensione dello stimatore delle variabili strumentali visto nel modello bivariato è data da: = (Z X) 1 Z y, dove a quella d ordine dobbiamo aggiungere un altra condizione per l identificazione: rango(z X) = k (condizione di rango). Lo stimatore può essere riscritto come: = (Z X) 1 Z (Xβ + ɛ) = β + (Z X) 1 Z ɛ. Da cui, visto che stiamo assumendo che plim[(1/n)z ɛ] = 0 (esogeneità) e plim[(1/n)z X] 0 (rilevanza), si ricava che: plim[ ] = β (consistenza). 2 Sotto l assunzione di omoschedasticità, la varianza asintotica dello stimatore delle variabili strumentali è data da: V ar.as.( ) = σ 2 (Z X) 1 (Z Z)(Z X) 1. E possiamo stimarla sostituendo σ 2 con s 2, per poi applicare le procedure inferenziali che già conosciamo. Nel caso di errori non sferici, la formula della varianza asintotica (e quindi il suo stimatore) possono essere modificati tenendo conto che: V ar.as.( ) = σ 2 (Z X) 1 (Z ΩZ)(Z X) 1. Come nel caso bivariato, strumenti deboli provocano una perdita di accuratezza. Infine, si può dimostrare (anche se non lo faremo qui) che quanto abbiamo visto per il caso bivariato riguardo al problema d inconsistenza si estende al caso multivariato: strumenti deboli aumentano l eventuale distorsione asintotica dello stimatore delle variabili strumentali. Infatti: 2 Si noti che lo stimatore delle variabili strumentali è consistente, ma distorto in campioni finiti anche se vale E(ɛ Z) = 0. E[ ] = β + E Z,X,ɛ [(Z X) 1 Z ɛ] = β + E Z,X [(Z X) 1 Z E(ɛ Z,X)], dove l ultimo passaggio segue dalla legge delle aspettative iterate. Di conseguenza, E[ ] = β soltanto se E(ɛ Z, X) = 0, ma questa assunzione è troppo forte visto che implicherebbe anche che E(ɛ X) = 0, nel qual caso non esisterebbe un problema di endogeneità neanche per gli stimatori OLS. 5
6 Caso multivariato sovraidentificato Se abbiamo più strumenti che variabili endogene (r > k o r k 2 > k 1 ), lo stimatore discusso sopra non ha senso per un problema di conformità. Una soluzione potrebbe essere quella di buttare nel cestino un po di strumenti per tornare al caso appena identificato. Ma non è mai efficiente rinunciare alle informazioni contenute in alcune variabili. Molto meglio usare una combinazione degli strumenti Z che ci restituisca una matrice Z di dimensioni [N k]. Un metodo per farlo è quello dei cosiddetti minimi quadrati a due stati o two-stage least squares (2SLS). Nel primo stadio, si regredisce ogni variabile x j sulle Z e si ottengono i valori predetti che possono essere organizzati nella matrice [N k]: ˆX = Z ˆΠ = Z(Z Z) 1 Z X = P z X, dove P z è la matrice di proiezione, simmetrica (P z = P z ) e idempotente (P zp z = P z ). Nel secondo stadio, si regredisce la variabile y sui valori predetti ˆX invece che sui regressori osservati X, ottenendo lo stimatore 2SLS: 3 ˆβ2SLS = ( ˆX ˆX) 1 ˆX y = (X P z X) 1 X P z y. Un altro modo per interpretare questo stimatore è quello di accorgersi che non è altro che uno stimatore delle variabili strumentali che usa i valori fittati del primo stadio come strumenti: Z = P z X = ˆX. Se torniamo al caso in cui r = k, le matrici X Z, Z Z e X X sono tutte quadrate di ordine [k k] e invertibili (per le condizioni di rango e di assenza di perfetta multicollinearità). Di conseguenza, è facile far vedere che lo stimatore 2SLS non è altro che lo stimatore IV: ˆβ 2SLS = (X P z X) 1 X P z y = (X Z(Z Z) 1 Z X) 1 X Z(Z Z) 1 Z y = (Z X) 1 (Z Z)(X Z) 1 (X Z)(Z Z) 1 Z y = (Z X) 1 y =. Sotto l assunzione di omoschedasticità, la varianza asintotica dello stimatore 2SLS è data da: 4 V ar.as.(ˆβ 2SLS ) = σ 2 (X P z X) 1. Sostituendo σ 2 con s 2 possiamo stimare la varianza asintotica e l errore standard dello stimatore, per poi applicare le procedure inferenziali che conosciamo. 3 Le variabili strumentali all opera Lo stimatore delle variabili strumentali, come detto, si fonda sull esogeneità delle variabili strumentali e sulla loro esclusione dall equazione strutturale. Queste assunzioni non sono testabili, neanche la restrizione di esclusione, dato che anche includendo le Z nell equazione strutturale i parametri stimati sarebbero inconsistenti per via dell endogeneità delle X 1. La scelta di una variabile strumentale, quindi, deve innanzitutto essere sorretta da solide argomentazioni di carattere teorico o istituzionale. Esistono alcune procedure di test, tuttavia, che possono fornire qualche pezza d appoggio alle argomentazioni sulla validità degli strumenti usati. La condizione di rilevanza, inoltre, può essere testata direttamente attraverso la stima dell equazione in forma ridotta, che esprime la variabile endogena in funzione di quelle esogene. 3 Si noti che, nel modello trasformato y = ˆXβ + (X ˆX)β + ɛ = ˆXβ + v, i nuovi regressori ˆX sono incorrelati con l errore v per via dell esogeneità delle Z e della condizione di ortogonalità tra valori predetti ˆX e residui (X ˆX). 4 Di nuovo, l estensione della formula al caso con eteroschedasticità è possibile. 6
7 Test di Hausman Gli stimatori IV dovrebbero essere usati soltanto quando ce n è bisogno (cioè, in presenza di endogeneità), altrimenti gli stimatori OLS sono più efficienti. E, come sappiamo, la perdita di efficienza può essere rilevante, specialmente di fronte a strumenti deboli. Sotto l assunzione che gli strumenti siano validi, il test di Hausman può essere usato per testare l ipotesi nulla di non endogeneità dei regressori, H 0 : Cov(x, ɛ) = 0. Infatti, se H 0 fosse vera, gli OLS sarebbero consistenti ed efficienti, gli stimatori IV consistenti ma inefficienti. Se H 0 fosse falsa, gli OLS sarebbero inconsistenti e gli stimatori IV consistenti. Quindi, intuitivamente, se le due stime sono simili, preferiamo gli OLS, e viceversa. Formalmente: H = ( ˆβ OLS ) [V ar( ) V ar(ˆβ OLS )] 1 ( ˆβ OLS ) χ 2 k. Se il valore osservato della statistica è maggiore del valore critico prescelto, abbiamo un problema di endogeneità ed è meglio usare gli stimatori IV. Ma tutto si basa, ricordiamocelo, sull assunzione che gli strumenti che stiamo usando siano validi. Test di sovraidentificazione Anche se non è testabile nel caso just identified, l assunzione di esogeneità può essere valutata, almeno in parte, nel caso sovraidentificato. Per esempio, se abbiamo due strumenti per un unico regressore endogeno, assumendo che almeno uno dei due sia valido, il coefficiente dell altro nell equazione strutturale può essere consistentemente stimato: se il coefficiente è significativo, la restrizione di esclusione per questo secondo strumento non regge. Sviluppando questa intuizione, se r > k, il test di sovraidentificazione (o test di Sargan) sottopone a verifica l ipotesi nulla H 0 : Cov(z, ɛ) = 0, sotto l assunzione (cruciale) che almeno k strumenti siano validi. La statistica test è pari a: S = e P z e e e/(n k) χ2 r k. In pratica, una versione particolare di questo test può essere implementata in tre passaggi: a) si stima l equazione strutturale con la procedura 2SLS e si ottengono i residui; b) si regrediscono i residui su tutte le variabili esogene e si calcola l R 2 ; c) si sottopone a test H 0 usando la statistica N R 2 χ 2 r k. Se rifiutiamo H 0, c è evidenza empirica che alcuni strumenti non sono esogeni. Ma, ricordiamocelo, tutto si basa sull assunzione che almeno k < r strumenti siano validi. Meglio, quindi, se gli strumenti che usiamo provengono da storie diverse. Alla caccia di strumenti deboli Visti i problemi provocati da strumenti deboli, è importante valutare la dimensione della correlazione tra gli strumenti e i regressori endogeni. L R 2 e il test F dell equazione in forma ridotta (x 1 = z 1 π 1 + x 2 π 2 + v, assumendo che sia presente una singola variabile endogena) non sono del tutto indicativi a riguardo, visto che i risultati potrebbero essere determinati dalle X 2 piuttosto che dalle Z 1. Meglio usare, allora, il test F p parziale (H 0 : π 1 = 0) con soltanto r k 2 restrizioni. E l R 2 p parziale della regressione: x 1 x 1 = (z 1 z 1 ) γ + η, dove x 1 sono i valori predetti della regressione di x 1 sulle X 2 e z 1 i valori predetti delle regressioni di tutte le variabili in Z 1 su X 2 (separatamente). Se l R 2 p e la statistica F p non sono abbastanza grandi, ne concludiamo che gli strumenti contenuti in Z 1 sono deboli. 7
Stima dei sistemi di equazioni simultanee
Università di Pavia Stima dei sistemi di equazioni simultanee Eduardo Rossi University of Pavia Stima dei SES Limited Information OLS 2STLS K CLASS H CLASS Full Information FIMLE 3STLS FIIV Eduardo Rossi
Università di Pavia Econometria Esercizi 4 Soluzioni
Università di Pavia Econometria 2008-2009 Esercizi 4 Soluzioni Maggio, 2009 Istruzioni: I commenti devono essere concisi! 1. Dato il modello di regressione lineare, con K regressori con E(ɛ) = 0 e E(ɛɛ
1 Endogeneità, variabili strumentali
1 Endogeneità, variabili strumentali 1.1 Proprieta dello stimatore OLS Modello statistico y t = β 1 +β 2 x t2 +...+β k x tk +ε t y t = x tβ+ε t, Brevesommario: y t ex t sonovariabiliosservablimentre ε
Appunti di Econometria
Appunti di Econometria ARGOMENTO [1]: IL MODELLO DI REGRESSIONE LINEARE Tommaso Nannicini Università Bocconi Settembre 2010 1 Antipasto: proprietà algebriche del metodo dei minimi quadrati In questa parte
Il modello di regressione lineare multivariata
Il modello di regressione lineare multivariata Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2015 Rossi MRLM Econometria - 2015 1 / 39 Outline 1 Notazione 2 il MRLM - Assunzioni 3 OLS 4 Proprietà
Il modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
Regressione lineare multipla
Regressione lineare multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2014 Rossi Regressione lineare Econometria - 2014 1 / 31 Outline 1 La distorsione da variabili omesse 2 Causalità 3 Misure
Esercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
Statistica 1 A.A. 2015/2016
Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione
Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi
Minimi quadrati ordinari Interpretazione geometrica Eduardo Rossi Il MRLM Il modello di regressione lineare multipla è usato per studiare le relazioni tra la variabile dipendente e diverse variabili indipendenti
Università di Pavia. Test diagnostici. Eduardo Rossi
Università di Pavia Test diagnostici Eduardo Rossi Test diagnostici Fase di controllo diagnostico: controllo della coerenza tra quanto direttamente osservato e le ipotesi statistiche adottate Ipotesi MRLM
Esercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
Statistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: [email protected] 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo [email protected] Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
Il modello di regressione lineare multipla con regressori stocastici
Università di Pavia Il modello di regressione lineare multipla con regressori stocastici Eduardo Rossi Il valore atteso condizionale Modellare l esperimento casuale bivariato nel quale le variabili casuali
Analisi della regressione multipla
Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,
Microeconometria Day # 3 L. Cembalo. Regressione con due variabili e metodo dei minimi quadrati
Microeconometria Day # 3 L. Cembalo Regressione con due variabili e metodo dei minimi quadrati SRF: sample regression function Il passaggio dalla regressione sulla popolazione a quella sul campione è cruciale
Proprietà asintotiche dello stimatore OLS
Università di Pavia Proprietà asintotiche dello stimatore OLS Eduardo Rossi Sequenze Consideriamo un infinita sequenza di variabili indicizzate con i numeri naturali: X 1, X 2, X 3,...,X N,... = {X N }
MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,
MODELLO DI REGRESSIONE LINEARE le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, teorema di Gauss-Markov, verifica di ipotesi e test di
Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
Minimi quadrati vincolati e test F
Minimi quadrati vincolati e test F Impostazione del problema Spesso, i modelli econometrici che stimiamo hanno dei parametri che sono passibili di interpretazione diretta nella teoria economica. Consideriamo
Dispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
Analisi della correlazione canonica
Analisi della correlazione canonica Su un collettivo di unità statistiche si osservano due gruppi di k ed m variabili L analisi della correlazione canonica ha per obiettivo lo studio delle relazioni di
Università di Pavia Econometria. Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi
Università di Pavia Econometria Minimi quadrati ordinari Interpretazione geometrica Eduardo Rossi Università di Pavia Introduzione L econometria si interessa all analisi dei dati economici. I dati economici
9.3 Il metodo dei minimi quadrati in formalismo matriciale
9.3. IL METODO DEI MINIMI QUADRATI IN FORMALISMO MATRICIALE 121 9.3 Il metodo dei minimi quadrati in formalismo matriciale Per applicare il MMQ a funzioni polinomiali, ovvero a dipendenze di una grandezza
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni
Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori
AA 2014-2015 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.
Lezione 14 (a cura di Ludovica Peccia) MULTICOLLINEARITA La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. In un modello di regressione Y= X 1, X 2, X 3
Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1
Statistica Capitolo 1 Verifica di Ipotesi su una Singola Popolazione Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Formulare ipotesi nulla ed ipotesi alternativa
Esercizi su Regressione e Connessione
Esercizi su Regressione e Connessione Stefano Cabras 31 marzo 2009 Sommario Questa serie di esercizi è principalmente incentrata sulla regressione e la connessione, tuttavia in alcuni esercizi le soluzioni
Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.
Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive
Esercitazione 8 maggio 2014
Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un
Regressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
Corso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
Regressione multipla
Regressione multipla L obiettivo è costruire un modello probabilistico per spiegare la variabile y tramite più di una variabile indipendente x 1, x 2,..., x k. Esempio: Per un efficiente progettazione
ANALISI DELLE SERIE STORICHE
ANALISI DELLE SERIE STORICHE De Iaco S. [email protected] UNIVERSITÀ del SALENTO DIP.TO DI SCIENZE ECONOMICHE E MATEMATICO-STATISTICHE FACOLTÀ DI ECONOMIA 24 settembre 2012 Indice 1 Funzione di
STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
Regressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
Test delle Ipotesi Parte I
Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test
Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer
Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Inferenza statistica: insieme di tecniche che si utilizzano per ottenere informazioni su una
Regressione lineare semplice: inferenza
Regressione lineare semplice: inferenza Eduardo Rossi 2 2 Università di Pavia (Italy) Marzo 2014 Rossi Regressione lineare semplice Econometria - 2014 1 / 60 Outline 1 Introduzione 2 Verifica di ipotesi
Statistica Inferenziale
Statistica Inferenziale Prof. Raffaella Folgieri Email: [email protected] aa 2009/2010 Riepilogo lezione 6 Abbiamo visto: Definizione di popolazione, di campione e di spazio campionario Distribuzione
5. Per determinare il miglior grado del polinomio di una regressione polimoniale
Principi di Econometria 55 di tempo prof. Brunori Nome e cognome 16/01/2017 Matricola versione A Potete consegnare solo le risposte multiple o sia le risposte multiple che quelle aperte. Nel secondo caso
STATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani [email protected] http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
