Modelli Statistici per l Economia. Regressione lineare con un singolo regressore (terza parte)

Modelli Statistici per l Economia Regressione lineare con un singolo regressore (terza parte) 1

Verifica di ipotesi su β 1 H 0 : β 1 = β 1,0 H 1 : β 1 β 1,0 Se è vera H 0 (cioè sotto H 0 ) e n è grande, la statistica ha distribuzione N(0,1) 2

Indichiamo con i il valore della stima OLS di β 1 Il valore osservato della statistica test è 3

Sotto H 0 distribuzione di valore osservato N(0,1) 00 4

Notazione: Indichiamo con Z la Normale standard e con Allora 5

Un valore-p piccolo fornisce evidenza contro l ipotesi nulla, poiché è piccola la probabilità di osservare un valore almeno pari a quello effettivamente osservato quando H 0 è vera se valore-p piccolo rifiutiamo H 0 Se il valore-p è grande non c è sufficiente evidenza per rifiutare l ipotesi nulla e non la rifiutiamo, almeno provvisoriamente, in attesa di ulteriori evidenze 6

Se fissiamo un livello di significatività α = P(rif. H 0 H 0 ) ad es. α = 0.05 0.025 0.025 0 7

Rifiutiamo H 0 se valore-p < α Livello di significatività α Valore-p 0 8

In alternativa Rifiutiamo H 0 se Se fissiamo un livello di significatività α = P(rif. H 0 H 0 ) ad es. α = 0.05-1.96 0 1.96 Valore critico 9

Spesso siamo interessati a verificare le ipotesi: H 0 : β 1 = 0 H 1 : β 1 0 indica che la X non ha nessun effetto su Y la retta relativa alla popolazione è orizzontale Si dice che il risultato, con riferimento alla stima di un parametro, non è (statisticamente) significativo quando non ci fornisce evidenza sufficiente per rifiutare H 0 10

Esempio: Dimensione della classe e risultato dell istruzione (output di R) 11

Un intervallo di confidenza al 95% per β 1 è 12

Esempio: Dimensione della classe e risultato dell istruzione Abbiamo ricavato che Un intervallo di confidenza al 95% per β 1 è [-2.28-1.96 0.52, -2.28 + 1.96 0.52] cioè [-3.30, -1.26] 13

Bisogna utilizzare gli errori standard classici o quelli robusti? Dipende dalle applicazioni Analisi esplorativa 14

ˆ u hanno media 0 x 15

ˆ u ˆ y 16

u ˆ ˆ y17

Proviamo a calcolare sia gli errori standard classici che quelli robusti nei confronti dell eteroschedasticità 18

Esempio: Dimensione della classe e risultato dell istruzione (output di R) Errori standard classici 19

Errori standard classici Errori standard robusti 20

Esempio: Dimensione della classe e risultato dell istruzione (output di R) Intervalli di confidenza al 95% Con standard error robusti -3.30-1.26 21

In pratica spesso accade che SE robusti > SE classici Se gli errori sono eteroschedastici e usiamo SE classici abbiamo una sovrastima della precisione delle stime, intervalli di confidenza meno ampi e test meno conservativi nei confronti di H 0 Se gli errori sono omoschedastici ed utilizziamo SE robusti otteniamo una sottostima della precisione delle stime, intervalli di confidenza più ampi e test più conservativi nei confronti di H 0 22

Errori standard classici o robusti? analisi esplorativa li calcoliamo entrambi e ne confrontiamo i valori L eteroschedasticità è una caratteristica frequente dei dati in cross-section. Soluzione prudente: assumiamo che gli errori siano eteroschedastici e calcoliamo gli errori standard degli stimatori con le formule robuste 23

Se gli errori sono eteroschedastici, gli stimatori OLS non sono BLUE. Se, per ogni i, var(u i X i ) è nota possiamo ottenere stimatori con varianza minore degli OLS applicando il metodo dei minimi quadrati dopo aver pesato ciascuna osservazione con var(u i X i ) -1! stimatori dei minimi quadrati ponderati (WLS Weighted Least Squares) raramente accade 24

La regressione quando X è una variabile binaria Finora abbiamo considerato il caso in cui il regressore è una variabile continua. La regressione può essere usata anche quando il regressore si presenta con due modalità che possiamo codificare con 0 e 1 è una variabile binaria (si dice anche variabile indicatrice o dummy). Ad esempio: 25

Esempio: Dimensione della classe e risultato dell istruzione Variabile esplicativa dummy Qual è il significato di β 1? 26

Se D i = 0 (il rapporto studenti/insegnanti è alto): E(Y i D i = 0) = β 0 poiché E(u i D i = 0) = 0 Se D i = 1 (il rapporto studenti/insegnanti è basso): E(Y i D i = 1) = β 0 + β 1 poiché E(u i D i = 1) = 0 E(Y i D i = 1) - E(Y i D i = 0) = β 1 27

Intervalli di confidenza al 95% N.B. non contiene 0 31

Data set crescita (disponibile sul sito) Per n = 65 paesi: crescita è la crescita media annua del paese, espressa in percentuale del PIL reale, dal 1960 al 1995 commercio è la media degli scambi commerciali tra il 1960 al 1995, misurata come la somma di esportazioni ed importazioni, divisa per il PIL del paese 32

r = 0.35 33