Minimi quadrati vincolati e test F

Documenti analoghi
Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Esercizi di statistica

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,

Massimi e minimi vincolati

Test F per la significatività del modello

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

Contenuti: Capitolo 14 del libro di testo

CAPITOLO 1 LA FUNZIONE DI PRODUZIONE E LA CRESCITA ECONOMICA

04 - Numeri Complessi

Analisi della varianza

Modelli Log-lineari Bivariati

Statistica Applicata all edilizia: il modello di regressione

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

ESERCITAZIONE SUI PUNTI STAZIONARI DI FUNZIONI LIBERE E SULLE FUNZIONI OMOGENEE

COME CALCOLARE LA COMBINAZIONE DI MINIMO COSTO DEI FATTORI

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

Sviluppi e derivate delle funzioni elementari

Esercitazione del

Corso di Statistica Industriale

Premessa: la dipendenza in media

ESERCIZI SUI PUNTI DI NON DERIVABILITÀ TRATTI DA TEMI D ESAME

Cognome e Nome:... Corso di laurea:...

Teorema delle Funzioni Implicite

11. Misure con segno.

Geometria e Topologia I (U1-4) 2006-mag-10 61

Esercitazione 8 del corso di Statistica 2

Statistica 1 A.A. 2015/2016

1 Il polinomio minimo.

Limiti di successioni

Riassumiamo le proprietà dei numeri reali da noi utilizzate nel corso di Geometria.

Il modello di regressione lineare multipla con regressori stocastici

Appunti sui Codici di Reed Muller. Giovanni Barbarino

Il teorema di Schwarz

Note sulle funzioni convesse/concave

Metodo dei minimi quadrati e matrice pseudoinversa

Il teorema di Rouché-Capelli

4.11 Massimi e minimi relativi per funzioni di più variabili

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

1 Ampliamento del piano e coordinate omogenee

Esistenza ed unicità per equazioni differenziali

Esercizi sulle radici

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

STATISTICA ESERCITAZIONE 13

IL TEOREMA DEGLI ZERI Una dimostrazione di Ezio Fornero

Test delle Ipotesi Parte I

MATEMATICA PER LO STUDIO DELLE INTERAZIONI STRATEGICHE: TEORIA DEI GIOCHI. Anna TORRE

Regressione multipla

a + 2b + c 3d = 0, a + c d = 0 c d

Esercizi di ottimizzazione vincolata

Le Derivate. Appunti delle lezioni di matematica di A. Pisani Liceo Classico Dante Alighieri

Analisi della regressione multipla

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

Ulteriori applicazioni del test del Chi-quadrato (χ 2 )

Sistemi lineari. Lorenzo Pareschi. Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara

Alcune nozioni di calcolo differenziale

04 - Logica delle dimostrazioni

LeLing12: Ancora sui determinanti.

I teoremi della funzione inversa e della funzione implicita

Fissiamo nel piano un sistema di riferimento cartesiano ortogonale O, x, y, u.

FUNZIONI DI DUE VARIABILI

Il test (o i test) del Chi-quadrato ( 2 )

Spazi vettoriali euclidei.

1 Forme quadratiche 1. 2 Segno di una forma quadratica Il metodo dei minori principali Soluzioni degli esercizi 7.

Alcune nozioni preliminari di teoria elementare di insiemi e funzioni

Tutti i numeri qui considerati sono interi. Se si tratta in particolare di numeri Naturali (quindi non negativi) verrà specificato.

Gli errori nella verifica delle ipotesi

Metodi per la risoluzione di sistemi lineari

Elementi di matematica - dott. I. GRASSI

L indagine campionaria Lezione 3

1 Polinomio di Taylor 1. 2 Formula di Taylor 2. 3 Alcuni sviluppi notevoli 2. 4 Uso della formula di Taylor nel calcolo dei limiti 4

CORSO ZERO DI MATEMATICA

I. Foglio di esercizi su vettori linearmente dipendenti e linearmente indipendenti. , v 2 = α v 1 + β v 2 + γ v 3. α v 1 + β v 2 + γ v 3 = 0. + γ.

Statistica 2. Esercitazioni. Dott. Luigi Augugliaro 1. Università di Palermo

IV-2 Forme quadratiche

Queste note (attualmente, e probabilmente per un bel po ) sono altamente provvisorie e (molto probabilmente) non prive di errori.

Esercitazione 8 maggio 2014

MATEMATICA CORSO A CORSO DI LAUREA IN SCIENZE BIOLOGICHE I PROVA IN ITINERE COMPITO PROVA 1

Appunti su Indipendenza Lineare di Vettori

LOGICA MATEMATICA PER INFORMATICA (A.A. 12/13)

Test sull ellisse (vai alla soluzione) Quesiti

Metodi per la risoluzione di sistemi lineari

Transcript:

Minimi quadrati vincolati e test F Impostazione del problema Spesso, i modelli econometrici che stimiamo hanno dei parametri che sono passibili di interpretazione diretta nella teoria economica. Consideriamo ad esempio una funzione di produzione Cobb-Douglas Q = AK α 1 L α 2. È noto dalla teoria microeconomica (o almeno, dovrebbe) che la Cobb-Douglas ha rendimenti di scala costanti se e solo se α + α 2 = 1. Scrivendo la funzione in logaritmi si ha q = a + α 1 k + α 2 l Supponiamo di condurre un esperimento in cui facciamo variare a nostro piacimento k e l, e osserviamo i cambiamenti in q. Se le ipotesi classiche sono rispettate, è naturale pensare di stimare il vettore di parametri β = con i minimi quadrati. Se però sapessimo o congetturassimo che la funzione è a rendimenti di scala costanti, vorremmo che la nostra stima di β incorporasse l informazione α 1 + α 2 = 1. Ovviamente, non c è alcuna garanzia che β rispetti questa condizione. In altri termini, cerchiamo uno stimatore β, che rispetti per costruzione il vincolo R β = d dove R = [0 1 1] e d = 1. Più in generale, vogliamo uno stimatore del modello y = Xβ + u che soddisfi a priori un insieme di l restrizioni che possiamo scrivere come Rβ = d. Soluzione Per trovarlo, minimizziamo la somma dei quadrati dei residui sotto vincolo. Definendo i residui come e(β) = y Xβ il Lagrangiano sarà a α 1 α 2 L = 1 2 e e + λ (Rβ d). Poiché la derivata di e rispetto a β è X, la condizione di primo ordine può essere scritta X ẽ = R λ, (1) dove indichiamo con β il vettore che rende vera la (1) e con ẽ il vettore y X β. 1

β 2 Figura 1: Esempio: vettore di due parametri ˆβ 2 β 2. ˆβ 1. β1 β 1 Le ellissi sono le curve di livello della funzione e e. Il vincolo è β 1 = 3β 2. Il numero di parametri k è uguale a 2 e il numero di vincoli l è pari a 1. Il punto di minimo non vincolato è β 1, β 2 ; Il punto di minimo vincolato è β 1, β 2. 2

L equazione (1) può essere riscritta in modo tale da rendere evidenti le relazioni che esistono fra il problema di minimo vincolato (e la sua soluzione) e il problema di minimo libero (e la sua soluzione, che è ovviamente lo stimatore OLS). In particolare, possiamo considerare le implicazioni della (1) 1. nello spazio dei parametri (R k ) 2. nello spazio dei vincoli (R l ) 3. nello spazio delle osservazioni (R T ) 4. nello spazio della funzione obiettivo (R). Cominciamo coi parametri: premoltiplicando la (1) per (X X) 1 si ottiene β β = (X X) 1 R λ da cui si può ricavare una relazione interessante fra lo stimatore vincolato e quello libero: β = β (X X) 1 R λ (2) Lo stimatore vincolato, quindi, è uguale a quello libero a cui viene aggiunto un fattore di correzione proporzionale a λ. La seconda cosa che si può dire riguarda lo spazio dei vincoli, e quindi il valore di λ: premoltiplicando la (2) per R si ha che λ = [ R(X X) 1 R ] 1 (R β d) (3) perché R β = d per costruzione. Dovrebbe essere chiaro dalla (3) che, se lo stimatore non vincolato rispetta già di per sé il vincolo (R β = d), allora λ = 0 e quindi lo stimatore vincolato coincide con quello libero. In questo senso, si può dire che il vettore λ ci dà una misura di quanto lo stimatore vincolato è diverso da quello libero; sarò più preciso fra poco. La formula che si trova di solito nei libri di testo la si ottiene combinando le equazioni (2) e (3): β = β (X X) 1 R [ R(X X) 1 R ] 1 (R β d) (4) Possiamo esaminare cosa succede nello spazio delle osservazioni premoltiplicando la (2) per X: X β = ỹ = ŷ X(X X) 1 R λ da cui discende ẽ = ê + X(X X) 1 R λ 3

Consideriamo ora lo spazio della funzione obiettivo: la somma dei quadrati dei residui vincolati (cioè il minimo vincolato) ẽ ẽ può essere scritta nel seguente modo: ẽ ẽ = ê ê + λ R(X X) 1 R λ (5) dove abbiamo sfruttato il fatto che, per costruzione, X ê = 0. Ora, la (5) ci dice una cosa importante: la differenza che c è fra il minimo vincolato e il minimo libero (che è evidentemente sempre positiva) può essere scritta come una forma quadratica in λ. Mettendo assieme la equazioni (3) e (5) si arriva alla seguente uguaglianza: ẽ ẽ ê ê = λ R(X X) 1 R λ = (R β d) [ R(X X) 1 R ] 1 (R β d) (6) L espressione (6) è molto interessante, perché ci dice che la stessa quantità può essere interpretata in tre modi diversi ed equivalenti: 1. ẽ ẽ ê ê è la differenza che c è fra la funzione obiettivo vincolata e non. Maggiore è questa differenza, maggiore è la perdita di capacità che il modello vincolato ha di accostarsi ai dati empiricamente osservati; 2. λ R(X X) 1 R λ è una forma quadratica che vale 0 solo se λ = 0. poiché abbiamo già visto che λ = 0 solo se le stime vincolate coincidono con quelle libere, questa grandezza varia sostanzialmente con la distanza fra il vettore β ed il vettore β; poiché λ è il vettore dei moltiplicatori di Lagrange del problema di minimo vincolato è possibile come è noto darne una lettura in termini di prezzo ombra: l i-esimo elemento del vettore λ ci dice quanto migliora la funzione obiettivo ad una variazione piccola del vincolo corrispondente 1 ; 3. la grandezza (R β d) [ R(X X) 1 R ] 1 (R β d) è una forma quadratica (definita positiva) in (R β d), ossia in un vettore che è pari a 0 solo se lo stimatore libero rispetta già di per sé il vincolo. Prova di ipotesi Sotto le ipotesi classiche è possibile utilizzare i risultati esposti fin qui a fini di prova di ipotesi: in questo caso il nostro vincolo (Rβ d) rappresenta l ipotesi nulla che intendiamo sottoporre a verifica. Sulla base delle considerazioni fatte in precedenza ci si potrebbe attendere che una statistica test ragionevole possa essere basata sulle diverse capacità di adattamento ai dati dei modelli libero e vincolato. In effetti, è proprio così. a d. 1 Formalmente, si può dimostrare che λ è il vettore di derivate parziali di ẽ ẽ/2 rispetto 4

Consideriamo la differenza ẽ ẽ ê ê. Come abbiamo visto prima, questa grandezza può essere scritta anche come (R β d) [ R(X X) 1 R ] 1 (R β d). Se valgono le ipotesi classiche, sappiamo che β N [ β, (X X) 1]. Di conseguenza, date le proprietà della normale, (R β d) N [ Rβ d, R(X X) 1 R ] Se effettivamente il vincolo vale (e quindi Rβ = d), allora il valore atteso di (R β d) è 0 e, più in generale, (R β d) N [ 0, R(X X) 1 R ], cosicché l espressione (R β d) [ R(X X) 1 R ] 1 (R β d) è proporzionale (a meno di un fattore 1 ) ad una variabile casuale χ 2 con l gradi di libertà (tanti quante sono le righe di R). Questa quantità può essere quindi presa come base per un test sull ipotesi H 0 : Rβ d. Infatti, se quest ipotesi è vera, allora la grandezza nella (6) divisa per si distribuisce come una χ 2, e valori grandi possono verificarsi o in casi eccezionali o quando l ipotesi nulla è falsa. Sulla base di questa considerazione, possiamo decidere di rifiutare H 0 quando ẽ ẽ ê ê assume valori grandi (relativamente alle tavole del χ 2 ). C è solo un problema: normalmente non è una grandezza nota. Abbiamo però una sua stima s 2 = ê ê T k che, come sappiamo, è corretta. Per derivare una statistica test con una distribuzione trattabile, si consideri che la grandezza ê ê s2 = (T k) si distribuisce anch essa come una χ 2 con T k gradi di libertà. Se riuscissimo a dimostrare che s 2 è indipendente da ẽ ẽ ê ê, allora potremmo sfruttare le proprietà 2 delle distribuzioni χ 2 ed F. 2 Se 8 < : A χ 2 n B χ 2 d A B allora A/n si distribuisce come una F con gradi di libertà pari a n e d. B/d 5

Consideriamo il rapporto ẽ ẽ ê ê ê ê T k, (7) l che può essere visto come il rapporto fra due variabili casuali χ 2 divise per i rispettivi gradi di libertà. Da quanto detto sopra, se riuscissimo a provare che il denominatore ed il numeratore sono indipendenti, avremmo che la statistica F = ẽ ẽ ê ê ê ê T k l (ottenuta semplicemente semplificando il fattore dall equazione (7)) si distribuisce come una F di Snedecor. La dimostrazione, tuttavia, è immediata, in quanto abbiamo già visto che s 2 è indipendente da β. Poiché, in forza della (6), si ha che ẽ ẽ ê ê può essere scritta come una forma quadratica in β dove la matrice in mezzo è nonstocastica, se ne può dedurre anche il risultato che ci serve 3. 3 Può essere un simpatico esercizio dimostrare che il test F può anche essere scritto come F = ẽ P X ẽ ẽ M X ẽ T k l e dimostrare l indipendenza di numeratore e denominatore per questa via. 6