Lineamenti di econometria 2

Похожие документы

Lineamenti di econometria 2

Lineamenti di econometria 2

Capitolo 12 La regressione lineare semplice

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Elementi di Psicometria con Laboratorio di SPSS 1

LEZIONE n. 5 (a cura di Antonio Di Marco)

Soluzioni degli Esercizi del Parziale del 30/06/201 (Ippoliti-Fontanella-Valentini)

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 8

Statistiche campionarie

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

Esame di Statistica del 17 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Metodi statistici per le ricerche di mercato

Esercizi test ipotesi. Prof. Raffaella Folgieri aa 2009/2010

La distribuzione Normale. La distribuzione Normale

Statistica. Lezione 6

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

Econometria. lezione 17. variabili dipendenti binarie. Econometria. lezione 17. AA Paolo Brunori

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Inferenza statistica. Statistica medica 1

Indici di dispersione

Elementi di Psicometria con Laboratorio di SPSS 1

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Relazioni statistiche: regressione e correlazione

Il metodo della regressione

Elementi di Psicometria con Laboratorio di SPSS 1

Metodi Matematici e Informatici per la Biologia Maggio 2010

STATISTICA IX lezione

Tema A Se due eventi A e B sono indipendenti e tali che P (A) = 1/2 e P (B) = 2/3, si può certamente concludere che

Regressione Mario Guarracino Data Mining a.a. 2010/2011

Università del Piemonte Orientale. Corso di laurea in biotecnologia. Corso di Statistica Medica. Intervalli di confidenza

1. Scopo dell esperienza.

Analisi sensitività. Strumenti per il supporto alle decisioni nel processo di Valutazione d azienda

Misure della dispersione o della variabilità

Test statistici di verifica di ipotesi

Il confronto fra proporzioni

Il concetto di valore medio in generale

Verifica di ipotesi

Rapporto dal Questionari Insegnanti

La regressione lineare multipla

Corso di Psicometria Progredito

Soluzione di equazioni quadratiche

Concetto di potenza statistica

E naturale chiedersi alcune cose sulla media campionaria x n

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

Esercizio 1. Verifica di ipotesi sulla media (varianza nota), p-value del test

Approssimazione polinomiale di funzioni e dati

3. Confronto tra medie di due campioni indipendenti o appaiati

Elementi di Psicometria con Laboratorio di SPSS 1

La logica statistica della verifica (test) delle ipotesi

CAPITOLO 7 LE DISTRIBUZIONI CAMPIONARIE E GLI INTERVALLI DI CONFIDENZA

Prova di autovalutazione Prof. Roberta Siciliano

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

1 Serie di Taylor di una funzione

Corso di Psicometria Progredito

R - Esercitazione 5. Lorenzo Di Biagio dibiagio@mat.uniroma3.it. Lunedì 2 Dicembre Università Roma Tre

LA CORRELAZIONE LINEARE

FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA

Test di restrizioni lineari nel MRLM: Esempi

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate

VERIFICA DELLE IPOTESI

INTRODUZIONE AL DOE come strumento di sviluppo prodotto Francesca Campana Parte 3 Piani a fattore singolo e relativi test di interpretazione

ANALISI DELLE FREQUENZE: IL TEST CHI 2

Statistica. Esercitazione 15. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Applicazione alla domanda di sigarette (SW Par 12.4)

LE CARTE DI CONTROLLO (4)

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

Facoltà di Psicologia Università di Padova Anno Accademico

INTRODUZIONE AL DESIGN OF EXPERIMENTS (Parte 1)

L analisi dei dati. Capitolo Il foglio elettronico

L analisi dei rischi: l aspetto statistico Ing. Pier Giorgio DELLA ROLE Six Sigma Master Black Belt

Il farmaco generico. Contenuti tecnico-scientifici del farmaco generico: comunicazione a corrente alternata

Esame del corso di MACROECONOMIA Del VERSIONE A) COGNOME NOME

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

General Linear Model. Esercizio

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 6

1. Distribuzioni campionarie

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

Temi di Esame a.a Statistica - CLEF

Elaborazione dei dati su PC Regressione Multipla

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Esercitazione n.2 Inferenza su medie

Lezioni di Matematica 1 - I modulo

Regressione Lineare con un Singolo Regressore

Equazione della Circonferenza - Grafico di una Circonferenza - Intersezione tra Circonferenza e Retta

lezione 18 AA Paolo Brunori

Analisi della performance temporale della rete

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

Errori di una misura e sua rappresentazione

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni

RISCHIO E CAPITAL BUDGETING

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

Pro e contro delle RNA

(a cura di Francesca Godioli)

f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

L analisi statistica

INDICE PREFAZIONE VII

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Транскрипт:

Lineamenti di econometria 2 Camilla Mastromarco Università di Lecce Master II Livello "Analisi dei Mercati e Sviluppo Locale" (PIT 9.4)

Aspetti Statistici della Regressione

Aspetti Statistici della Regressione αˆ e βˆ sono solo stime di α e β Domanda chiave: Quanto accurate sono queste stime? Tecniche statistiche ci permettono di rispondere formalmente a questa domanda.

Quali Fattori Influenzano l Accuratezza delle Stime OLS? Intuizione Grafica: Figure 5.1 (numero basso di osservazioni) Figure 5.2 (numero alto di osservazioni ma molto disperse) Figure 5.3 (basso numero di osservazioni ma non molto disperse) Figure 5.4 (numero alto di osservazioni, ma concentrate vicino ad un unico valore della X)

Quali Fattori Influenzano l Accuratezza delle Stime OLS? Supponiamo di interpolare una linea tra I punti del grafico a dispersione (XY-plots) mostrano nelle figure 5.1-5.4. Intuitivamente la retta che interpola la nuvola di punti della figura 5.3 dovrebbe essere quella più accurata Disporre di più osservazione + errori più ridotti (perciò minore variabilità negli errori ) + disporre di una più ampia gamma di valori (ossia maggiore variabilità) della variabile esplicativa = migliore l accuratezza della stima. Nota: Le Figure 5.1, 5.2, 5.3 e 5.4 sono costruite con 4 data set per X e Y, artificialmente simulati da modelli di regressione con α=0, β=1.

L intervallo di Confidenza di β L intervallo di confidenza riflette l incertezza che circonda l accuratezza della stima puntuale La formula analitica per l intervallo di confidenza di β (di solito al 95%) è: [ ˆ β t s, ˆ β + b b t s b b ] t b è il valore critico dalla distribuzione t di Student --- calcolato automaticamente in Excel (o altri softwares econometrici es. Gretl) s b = errore standard (deviazione standard) di βˆ, è una misura dell accuratezza di βˆ s b = ( N SSR 2) ( X i X 2 )

L intervallo di Confidenza di βˆ (cont.) t b aumenta al crescere del livello di confidenza (perciò t b è più grande per un intervallo di confidenza del 95% rispetto ad uno di 90%). s b misura la variabilità o incertezza di beta stimato. s b varia direttamente con SSR (ossia tanto più sono variabili gli errori/residui tanto meno accurata è la stima) s b varia inversamente con N, ( numero di osservazioni) s b varia inversamente con (X X ) 2 i, che è una componente chiave della deviazione standard di X (varianza/variabilità di X). Nota: Excel (e softwares e econometrici) calcola automaticamente l intervallo di confidenza e denomina gli estremi dell intervallo con il termine 95% inferiore e 95% superiore

Intervallo di Confidenza: Un Interpretazione Intuitiva Utile (anche se formalmente sbagliata) approssimazione sugli intervalli di confidenza del 95%: Esiste una probabilità del 95% che il vero valore del coefficiente β cada nell intervallo di confidenza al 95%. Interpretazione corretta (anche se meno intuitiva): Se usate ripetutamente la precedente formula per calcolare gli intervalli di confidenza, il 95% degli intervalli così costruiti conterrà il vero valore del coefficiente β. Analoghe affermazioni valgono per intervalli di confidenza diversi (per esempio al 90%, 99%).

Esempio: Intervalli di Confidenza per I Data set nelle Figure 5.1-5.4 Data Set βˆ 90% Confid. Interval 95% Confid. Interval 99% Confid. Interval Figure 5.1.91 [-.92,2.75] [-1.57,3.39] [-3.64,5.47] Figure 5.2 1.04 [.75,1.32] [.70,1.38] [.59,1.49] Figure 5.3 1.00 [.99,1.01] [.99,1.02] [.98,1.03] Figure 5.4 1.52 [-1.33,4.36] [-1.88,4.91] [-2.98,6.02]

Esempio: La Regressione della Deforestazione sulla Densità della Popolazione Y = deforestazione X = densità della popolazione βˆ =.000842 95% Intervallo di confidenza: [.00061,.001075]

Esempio: La Determinazione del Prezzo delle Abitazioni Risultati OLS : Y = 34,136 + 6.59X, La stima OLS dell effetto marginale di X su Y è pari a 6.59. La nostra previsione migliore dice dunque che L aumento dell ampiezza del lotto di un metro quadrato è associato a un incremento di $6.59 nel prezzo della casa. L intervallo di confidenza al 95% per β è [5.72,7.47]. Siamo fiduciosi al 95% che l effetto della dimensione del lotto sul prezzo dell abitazione sia almeno di $5.72 e al massimo di $7.47.

Verifica delle Ipotesi La verifica di β=0 (perciò se X non ha alcun potere esplicativo sulla variabile dipendente). Un modo per verificare questa ipotesi: accertarsi che l intervallo di confidenza per β contenga il valore zero. Se non lo contiene, siamo fiduciosi che β 0. Un modo alternativo (ma equivalente) è quello di calcolare una statistica test. Nel caso della verifica β=0, la statistica test è nota come statistica t ( o t-ratio ). ˆ β t = s b Elevati valori di t indicano che β 0. Bassi valori di t indicano che β = 0.

Verifica delle Ipotesi (cont.) Domanda: Il problema è su cosa si intende per t alto e basso? Risposta: Il P-value fornisce una misura diretta per vedere se t è elevato o basso. Se il P-value.05 allora t è alto e si può concludere che β 0. If P-value >.05 allora t è basso e si può concludere che β=0. Utile (sebbene formalmente non corretta) intuizione: P-value fornisce una misura della probabilità che β = 0..05 = 5% = livello di significatività Altri livelli di significatività (per esempio 1% o 10%)

Esempio: La Regressione della Deforestazione sulla Densità della Popolazione (cont.) 95% Intervallo di Confidenza: [.00061,.001075] L intervallo di confidenza non include zero, pertanto siamo fiduciosi al 95% che β 0. Alternativamente: t-ratio è 7.227937. E alto? Si, il P-value è 5.5 10-10 pertanto molto inferiore a.05. Perciò, questo significa che β 0.

Terminologia Il coefficiente della densità della popolazione è significativamente diverso da zero. La densità della popolazione ha un potere esplicativo statisticamente significativo sulla deforestazione. L ipotesi che β = 0 può essere rifiutata al 5% livello di significatività.

La verifica delle Ipotesi Riguardanti R 2 : La Statistica F Verificare l ipotesi che R 2 =0 (perciò se X non ha un potere esplicativo su Y) Nota: Nel caso della regressione semplice, questo test R 2 =0 è equivalente al test per β=0, ma nel caso della regressione multipla i due test sono differenti. La statistica test F è simile alla statistica test t (perciò bassi valori indicano R 2 =0). F ( N 2) R 2 = (1 R 2 )

La verifica delle Ipotesi Riguardanti R 2 : La Statistica F (cont.) Nel caso di test al 5% livello di significatività: Se P-value è >.05 concludiamo che R 2 =0. Se P-value è.05 concludiamo che R 2 0. Excel (Gretl, ecc-) indica il P-value per questa statistica test come Significatività di F

Esempio: La Regressione della Deforestazione sulla Densità della Popolazione (cont.) P-value = Significatività di F= 5.5 10-10. Poiché P-value <.05 possiamo concludere che R 2 0. La densità della popolazione ha un potere esplicativo statisticamente significativo su Y.