lezione 10 AA Paolo Brunori

Documenti analoghi
lezione 11 AA Paolo Brunori

lezione 9 AA Paolo Brunori

lezione 5 AA Paolo Brunori

lezione 8 AA Paolo Brunori

lezione 6 AA Paolo Brunori

lezione 7 AA Paolo Brunori

Funzioni di regressione non lineari

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Regressioni Non Lineari

Regressione Lineare Semplice e Correlazione

Statistica multivariata Donata Rodi 17/10/2016

LEZIONE N. 11 ( a cura di MADDALENA BEI)

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Statistica Applicata all edilizia: il modello di regressione

Esercitazione del

Statistica di base per l analisi socio-economica

Giorno n. clienti di attesa

Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

A cura di Giuseppe Gori e Gianluca Antonecchia ΔY con g Y. Più in generale, la notazione g x indicherà

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

Correzione secondo compitino, testo B

Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA Paolo Brunori

Regressione lineare semplice

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

Stima dei parametri di modelli lineari

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

STATISTICA A K (60 ore)

Capitolo 9 La produzione

Principi di analisi causale Lezione 3

Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a.

Regressione lineare. Lo studio della relazione lineare tra due variabili. X e Y caratteri entrambi quantitativi. variabile dipendente

REGRESSIONE E CORRELAZIONE

Settimana 3. G. M. Marchetti. Marzo 2017

Statistica economica

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i

PROBABILITÀ ELEMENTARE

La regressione lineare multipla

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

Regressione Lineare Multipla

Lezione 11 Argomenti

Analisi della regressione multipla

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

In un ora rispondere alle dieci domande a risposta multipla, alla domanda a risposta aperta, e risolvere l esercizio.

Statistica Inferenziale

Statistica. Alfonso Iodice D Enza

La regressione lineare. Rappresentazione analitica delle distribuzioni

ESERCIZI DI RIEPILOGO 1

Esercizi di statistica

PIANO CARTESIANO:EQUAZIONI

Derivazione numerica. Introduzione al calcolo numerico. Derivazione numerica (II) Derivazione numerica (III)

Curve Spline. Scelta dei valori dei nodi

Regressione. Monica Marabelli. 15 Gennaio 2016

SPESA STORICA E FABBISOGNI STANDARD. METODOLOGIA ED APPLICAZIONE

Tema d esame del 15/02/12

Microeconomia, Esercitazione 1. 1 Esercizi. 1.1 Equilibrio di mercato/ Equilibrio di mercato/2. A cura di Giuseppe Gori

Convergenza non condizionata

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

Metodologie Quantitative

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

SCHEDA DIDATTICA N 7

Statistica. Alfonso Iodice D Enza

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

Quiz di verifica Classificazione

Sia y una grandezza che varia, in funzione del tempo, secondo la legge

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica

Metodologie Quantitative

Produzione. Giancarlo Gozzi. Marzo Dipartimento di Scienze Economiche Università di Bologna

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Maria Prandini Dipartimento di Elettronica e Informazione Politecnico di Milano

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

La stima dei costi di produzione

Istituzioni di Statistica e Statistica Economica

STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006

Esame di Calcolo Numerico per Informatica A.A. 2010/11 Proff. S. De Marchi e M. R. Russo 20 giugno 2011

PIANO CARTESIANO: un problema di programmazione lineare

STATISTICA ESERCITAZIONE 13

ANALISI MULTIVARIATA

BOZZA BOZZA BOZZA. Funzioni per effettuare delle interpolazioni su dati tabellati: interp1, interp2, interp3.

DISTRIBUZIONE CAMPIONARIA CONGIUNTA

11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici

Lezioni di Microeconomia

Corso di Psicometria Progredito

origine asse delle ascisse unità di misura e orientamento sull asse delle ascisse

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.

ELEMENTI DI ECONOMIA TEORIA DEI COSTI

METODI E TECNICHE DELLA RICERCA IN PSICOLOGIA CLINICA E LABORATORIO MEDIAZIONE

PERCORSO SUI PRINCIPALI CONCETTI ECONOMICI ANALISI DEI COSTI DELL IMPRESA

Test delle Ipotesi Parte I

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

Strumenti di indagine per la valutazione psicologica

Lezioni di Economia Politica

Esercitazione 9 del corso di Statistica (parte seconda)

Esame di Istituzioni di Matematiche II del 11 luglio 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola

Capitolo 6. La produzione. A.A Microeconomia - Cap. 6-1

Proprietà della varianza

Esercizio 1. Esercizio 2

Il Test di Ipotesi Lezione 5

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

Transcript:

AA 2016-2017 Paolo Brunori

Redditi svedesi - il dataset contiene i dati di reddito di 838 individui - il dataset contiene le variabili: sex = sesso age = età edu = anni di istruzione y_gross = reddito lordo

Redditi svedesi

l effetto di X su Y è fisso? - nelle realtà economiche spesso l effetto di una variabile indipendente dipende dalla variabile stessa - la produttività di un fattore produttivo - l utilità del consumo di un unità di bene - l aumento di qualità di un bene dovuto ad un euro in più speso per produrlo - in questi casi l approssimazione lineare potrebbe essere insoddisfacente

funzioni di non lineari - è possibile che Y sia funzione non lineare di X - in questo caso Y dato X cambia a seconda del valore di X - quindi in teoria il β dovrebbe dipendere dal valore di X

Andamenti lineari e non lineari

Il legame età - reddito - la relazione fra età e reddito è tipicamente considerata non lineare - le retribuzioni crescono nella prima fase della vita lavorativa - ma col passare del tempo la crescita rallenta - e durante la pensione tipicamente diminuisce - quindi sarebbe meglio utilizzare una funzione non lineare del regressore per interpolare i dati

Regressioni con trasformazione non lineare della variabile indipendente - un modo per catturare un andamento non-lineare consiste nell utilizzare come regressore una trasformazione dello stesso - supponete di regredire Y come funzione di X e poi di X = 12X quale coefficienti ottenete? - se la relazione originaria è Y = β 0 + β 1 X - la relazione diventa Y = β 0 + β 1 12 X - se la retribuzione (Y ) aumenta di 120 (β 1 ) euro per ogni anno di anzianità (X) - allora Y aumenta di 10 ( β 1 12 ) euro per ogni mese di anzianità ( X)

Regressioni con trasformazione non lineare della variabile indipendente - trasformare un regressore quindi implica modificare il suo coefficiente - se si modifica il regressore aumentandone il valore il β diminuisce, se si diminuisce il valore del regressore il β aumenta - se si utilizza una trasformazione non lineare del regressore ad esempio creando la variabile X = X 2 si modifica il coefficiente - β non coglie più la relazione fra Y e X ma fra Y e una variabile che cresce con il quadrato di X (è minore di X se X < 1 ed è maggiore di X per valori maggiori di 1)

Regressioni con trasformazione non lineare della variabile indipendente - il modello che spiega il reddito Y = β 0 + β 1 età + β 2 età 2 - ci aspettiamo β 1 > 0 - β 2 > 0 significa che il tasso di crescita del salario all aumentare dell esperienza è crescente - β 2 < 0 significa che il tasso di crescita del salario all aumentare dell esperienza è decrescente

Regressione multipla redditi svedesi coefficiente errore standard t p value β 0-1166.809 4030.44-0.289 0.7720 β age 1251.04 178.30 7.016 0.0000 β age 2-12.509 1.843-6.786 0.0000 - R 2 = 0.05652, R 2 corretto = 0.05426 - errore standard di = 12920

Redditi svedesi: regressioni con trasformazione non lineare della variabile indipendente Valori stimati reddito 0e+00 4e+04 8e+04 20 30 40 50 60 70 80 età attenzione: un outlier è stato rimosso dal grafico

Regressione multipla redditi svedesi coefficiente errore standard t p value β 0-14693.729 4149.33-3.541 0.0004 β age 1119.13 171.52 6.522 0.0000 β age 2-10.407 1.785-5.831 0.0000 β sex 1054.07 122.67 8.592 0.0000 β edu 1776.77 856.584 2.074 0.0383 - R 2 = 0.138, R 2 corretto = 0.1339 - errore standard di = 12370

l effetto di una variazione di X quando il regressore è una trasformazione non lineare di X - nel modello: Y = β 0 + β 1 X 2 - dalla stima ottengo β 0 = 0.38, β 1 = 0.005 come varia Y a seguito della variazione X? Y = [β 0 + β 1 (X + X) 2 ] [β 0 + β 1 X 2 ] Y = X 2 β 1 = X 2 0.005

l effetto di una variazione di X quando il regressore è una trasformazione non lineare di X - ma una variazione unitaria di X implica una variazione non unitaria di X 2 - X 2 dovuto ad una variazione unitaria di X dipende dal valore iniziale di X - ad esempio se X varia da 3 a 4: X 2 = 16 9 = 7 se X varia da 7 a 8: X 2 = 64 49 = 25

l effetto di una variazione di X quando il regressore è una trasformazione non lineare di X - tornando al nostro esempio: Y = X 2 β 1 = X 2 0.005 - come varia Y al variare unitario di X? Y 0 10 20 30 40 50 0 20 40 60 80 100

l effetto di una variazione di X quando il regressore è una trasformazione non lineare di X - nel caso dei redditi svedesi X è presente sia linearmente che al quadrato - ci sono due effetti: lineare positivo e non lineare negativo Y = β 1 X β 2 X 2 Y = 1119.13 X 10.407 X 2 - per uno svedese che passa da 20 a 21 anni questo implica: Y = 1119.13 (21 20) 10.407 (441 400) = 692.45

l effetto di una variazione di X quando il regressore è una trasformazione non lineare di X - per uno svedese che passa da 65 a 66 anni questo implica: Y = 1119.13 (66 65) 10.407 (4356 4225) = 1252.43

l effetto di una variazione di X quando il regressore è una trasformazione non lineare di X - col tempo l interpretazione diventa automatica ma se avete dei dubbi dovete mettere per scritto la variazione di Y dovuta ad una variazione di Y - calcolate Y prima e dopo la variazione e poi semplificate per ottenere Y dovuto a una variazione di X

come procedere? 1 identificare una possibile relazione non lineare 2 stimare un OLS con funzione non lineare 3 testare se costituisce un miglioramento rispetto a quella lineare 4 rappresentare quello che stiamo facendo graficamente 5 stimare l effetto di una variazione di X su Y

Regressione - se la relazione è non lineare potrebbe essere meglio approssimata da una funzione più complessa di quella quadratica - il modello di grado r: Y i = β 0 + β 1 X i + β 2 X 2 i +... + β r X r i + u i - stesse tecniche di inferenza usate nel caso lineare

quale grado di polinomio usare? - sappiamo che se usiamo r = n 1 avremo un interpolazione perfetta dei dati (r regressori +β 0 =n) - d altra parte stiamo usando tutte le informazioni a disposizione - restiamo senza gradi di libertà: l errore di stima sul campione è zero ma non sappiamo nulla riguardo quanto accurata sia la nostra stima! - ma non abbiamo variabilità per valutare l affidabilità delle stime - mi devo chiedere che modello sceglierei se potessi osservare tutta la popolazione e non solo un campione

Popolazione y -3-2 -1 0 1 2 3 0 200 400 600 800 1000 x

Campione n = 10 y -3-2 -1 0 1 2 3 200 400 600 800 x

Y = β 0 + β 1 X y -3-2 -1 0 1 2 3 degree 1 200 400 600 800 x

Y = β 0 + β 1 X + β 2 X 2 y -3-2 -1 0 1 2 3 degree 2 200 400 600 800 x

Y = β 0 + β 1 X + β 2 X 2 +... + β 4 X 4 y -3-2 -1 0 1 2 3 degree 4 200 400 600 800 x

Y = β 0 + β 1 X + β 2 X 2 +... + β n X n y -3-2 -1 0 1 2 3 degree 10 200 400 600 800 x

Y = β 0 + β 1 X + β 2 X 2 +... + β n X n y -3-2 -1 0 1 2 3 degree 10 0 200 400 600 800 1000 x

Quale grado di polinomio usare? - un interpolazione perfetta sul campione non implica una buona capacità di spiegare la relazione nella popolazione - interpolare perfettamente un campione significa interpretare anche la componente casuale come parte della relazione - il potere predittivo di un modello ottenuto così è inferiore al potere predittivo di un modello di grado inferiore - quindi non dobbiamo cercare il polinomio che meglio interpola i dati del campione!

Polinomi coefficiente errore standard t p value β 0 1.0812 0.2509 4.309 0.00258 β X 0.8836 0.7934 1.114 0.29777 - R 2 = 0.1342, R 2 corretto = 0.026 - errore standard di = 1 n k ni u 2 i = 0.7934

Polinomi coefficiente errore standard t p value β 0 1.0812 0.2509 4.096 0.00459 β X 0.8836 0.8347 1.059 0.32494 β X 2 0.3990 0.8347 0.478 0.64718 - R 2 = 0.1616, R 2 corretto = 0.07795 - errore standard di = 1 n k ni u 2 i =0.8347

Polinomi coefficiente errore standard t p value β 0 1.0812 NA NA NA β X -0.8836 NA NA NA β X 2 0.3990 NA NA NA β X 3-0.3463 NA NA NA β X 4-1.3649 NA NA NA β X 5-0.1688 NA NA NA β X 6 0.2984 NA NA NA β X 7-0.6287 NA NA NA β X 8-0.8308 NA NA NA β X 9 1.3003 NA NA NA - R 2 = 1.0000, R 2 corretto = NAN - errore standard di = 1 n k ni u 2 i =NAN

Regressione multipla redditi svedesi: quale polinomio usare? coefficiente errore standard t p value β 0-14693.729 4149.33-3.541 0.0004 β age 1119.13 171.52 6.522 0.0000 β age 2-10.407 1.785-5.831 0.0000 β sex 1054.07 122.67 8.592 0.0000 β edu 1776.77 856.584 2.074 0.0383 - R 2 = 0.138, R 2 corretto = 0.1339 - errore standard di = 1 n k ni u 2 i =12370

Regressione multipla redditi svedesi: quale polinomio usare? coefficiente errore standard t p value β 0 19625.42 10123.7622 1.939 0.05289 β age -1486.15 722.42-2.057 0.0399 β age 2 48.51 15.97 3.037 0.00247 β age 3-0.412 0.1111-3.711 0.00022 β edu 1094.39 122.23 8.953 0.0000 β sex 1851.75 850.32 2.178 0.02971 - R 2 = 0.1521, R 2 corretto = 0.147 - errore standard di = 1 n k ni u 2 i =12270

Redditi svedesi, l effetto di una variazione unitaria dell età con stima di terzo grado - ora abbiamo tre coefficienti che si riferiscono all età - in questi casi è quasi obbligatorio scrivere la variazione e chiedersi come cambia al variare di X Y = 1486.15 X + 48.51 X 2 0.412 X 3

Redditi svedesi, l effetto di una variazione unitaria dell età con stima di terzo grado Yc -60000-40000 -20000 0 0 20 40 60 80 100 X

Redditi svedesi, l effetto di una variazione unitaria dell età con stima di terzo grado: all interno dell intervallo di età nel campione Yc[18:80] -20000-15000 -10000-5000 20 30 40 50 60 70 80 X[18:80]