OLS multivariato: effetti parziali, multicollinearità

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "OLS multivariato: effetti parziali, multicollinearità"

Transcript

1 OLS multivariato: effetti parziali, multicollinearità CONCETTI DA RECUPERARE Per stimare questo modello utilizziamo le seguenti variabili esplicative educ, exper e tenure Primo passo da compiere sarà quello di valutare se sono tra di loro correlate, al fine di evitare futuri problemi di multicollinearità tra le stime. Per prima cosa analizziamo le variabili graficamente in uno scatter plot.. graph7 wage educ exper tenure, matrix half label average hourly earnings years of education 0 years potential experience years with current employer

2 Lo scatter plot a matrice ci permette di osservare una relazione positiva tra wage e educ, quindi ad incremento degli anni di educazione si incrementa il salario orario, mentre la correlazione tra exper e wage è un po meno evidente. Quello che è interessante è che si ha anche un correlazione negativa tra educ e exper che potrebbe influenzare la nostra analisi. Inoltre sembra presente anche una relazione significativa tra exper e tenure, relazione in parte attesa dal momento che entrambe le variabili fanno riferimento all esperienza lavorativa dei lavoratori, e potrebbero quindi esser correlate. La relazione tra le variabili si può osservare tramite il comando corr, che evidenzia la correlazione tra la dipendente e le esplicative o le esplicative.. pwcorr wage educ exper tenure, star (.05) wage educ exper tenure wage educ * exper * * tenure * * Dal comando corr e pwcorr si osserva che si ha correlazione tra alcune esplicative. La stella del pwcorr vorrebbe individuare quando la correlazione è significativamente diversa da 0, ma è sempre meglio considerare che se la correlazione <30 essa non è preoccupante. Tale considerazione ci spinge a dover fare una scelta tra tenure ed educ, in quanto l inclusione di entrambe le variabili nella stessa regressione OLS potrebbe generare problemi di multicollinearità. Diversa invece la considerazione relativa alla relazione negativa tra educ e exper, in questo caso la correlazione non è altissima, non supera cioè la regola del pollice che ci siamo dati di cancellare correlazioni maggiori all.30. E consigliabile però, dato queste premesse effettuare dopo le regressioni gli opportuni test di multicollinearità, come ad esempio il variace inflative factor.. reg wage educ exper Source SS df MS Number of obs = F( 2, 523) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = educ exper _cons

3 Prima di passare ad una valutazione di significatività dei parametri, controlliamo per la presenza di multicollinearità e effettuiamo i test di scorretta specificazione.. qui reg wage educ exper. vif Variable VIF 1/VIF educ exper Mean VIF 1.10 Il comando vif, eseguito dopo la regressione, permette di calcolare il variance inflation factor, quindi la variabilità dello stimatore (coefficiente di educ o exper). La regola applicata generalmente è che se vif>10 e la tolerance (1/vif) <0.1 allora si hanno problemi di collinearità e quindi sono opportune ulteriori analisi, mentre in caso contrario questi non si hanno. In questo caso quindi non abbiamo problemi di multicollinearità.. collin educ exper Collinearity Diagnostics SQRT Cond R- Variable VIF VIF Tolerance Eigenval Index Squared educ exper Mean VIF 1.10 Condition Number Determinant of correlation matrix Analisi dei residui di regressione. qui reg wage educ exper. predict wagehatmultiv (option xb assumed; fitted values). predict resmultiv, res

4 Residuals. summ wage wagehatmultiv resmultiv Variable Obs Mean Std. Dev. Min Max wage wagehatmul~v resmultiv e version 7: rvfplot,oneway twoway box yline(0) ylabel xlabel Fitted values I residui mostrano molti problemi potenziali nelle nostre stime: - Presenza di outliers - Probabile eteroschedasticità - Probabile non linearità della relazione Pur non sapendo ancora di preciso quale sia il problema reale, e se uno o più di uno non possiamo prendere i risultati di regressione precedenti come affidabili. Se andiamo poi a valutare con l opzione summ la distribuzione dei residui, vediamo come essi soffrano di un eccesso di Kurtosis, e come il test di normalità non passi. I residui non sono quindi disposti normalmente. Cosa significa questo??

5 . summ resmultiv, d Residuals Percentiles Smallest 1% % % Obs % Sum of Wgt % Mean 2.44e-09 Largest Std. Dev % % Variance % Skewness % Kurtosis sktest resmultiv Skewness/Kurtosis tests for Normality joint Variable Pr(Skewness) Pr(Kurtosis) adj chi2(2) Prob>chi resmultiv Test di Scorretta specificazione: heteroschedasticità. qui reg wage educ exper. hettest, rhs Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: educ exper. hettest chi2(2) = Prob > chi2 = Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: fitted values of wage chi2(1) = Prob > chi2 =

6 . whitetst White's general test statistic : Chi-sq( 5) P-value = 1.9e-10 Ognuno di questi tipi di test assume che l eteroschedasticità dipenda da un fattore differente: Hettest Fa dipendere l eteroschedasticità dai fitted values Hettest, rhs assume che la varianza residua dipenda dalle variabili esplicative nel modello Whitetst è basato su una regressione ausiliaria tra il quadrato dei residui e i regressori del modello i loro quadrati e i doppi prodotti.. reg wage educ exper, robust Linear regression Number of obs = 526 F( 2, 523) = Prob > F = R-squared = Root MSE = Robust educ exper _cons Reset Test. ovtest Ramsey RESET test using powers of the fitted values of wage Ho: model has no omitted variables F(3, 520) = Prob > F = La relazione potrebbe esser non lineare o soffrire di variabili omesse. Outliers. qui reg wage educ exper. predict D, cooksd. graph7 resmultiv wagehatmultiv [iweight=d], ylabel xlabel yline(0)

7 Residuals Fitted values rreg wage educ exper Huber iteration 1: maximum difference in weights = Huber iteration 2: maximum difference in weights = Huber iteration 3: maximum difference in weights = Huber iteration 4: maximum difference in weights = Huber iteration 5: maximum difference in weights = Biweight iteration 6: maximum difference in weights = Biweight iteration 7: maximum difference in weights = Biweight iteration 8: maximum difference in weights = Biweight iteration 9: maximum difference in weights = Biweight iteration 10: maximum difference in weights = Robust regression Number of obs = 526 F( 2, 523) = Prob > F = educ exper _cons Il coefficiente delle variabili diminuisce, questo cosa vi porta a pensare?

8 . qreg wage educ exper Iteration 1: WLS sum of weighted deviations = Iteration 1: sum of abs. weighted deviations = Iteration 2: sum of abs. weighted deviations = Iteration 3: sum of abs. weighted deviations = Iteration 4: sum of abs. weighted deviations = Iteration 5: sum of abs. weighted deviations = Iteration 6: sum of abs. weighted deviations = Iteration 7: sum of abs. weighted deviations = Iteration 8: sum of abs. weighted deviations = Iteration 9: sum of abs. weighted deviations = Median regression Number of obs = 526 Raw sum of deviations (about ) Min sum of deviations Pseudo R2 = educ exper _cons Si può infine provare a fare una regressione escludendo gli outliers. reg wage educ exper if wage<12 Source SS df MS Number of obs = F( 2, 487) = Model Prob > F = Residual R-squared = Adj R-squared = Total Root MSE = educ exper _cons hettest Breusch-Pagan / Cook-Weisberg test for heteroskedasticity Ho: Constant variance Variables: fitted values of wage

9 . whitetst chi2(1) = Prob > chi2 = White's general test statistic : Chi-sq( 5) P-value = 2.5e-05. ovtest Ramsey RESET test using powers of the fitted values of wage Ho: model has no omitted variables F(3, 484) = 2.24 Prob > F = reg wage educ exper if wage<12, robust Linear regression Number of obs = 490 F( 2, 487) = Prob > F = R-squared = Root MSE = Robust educ exper _cons Permane il problema dell eteroschedasticità ma il test di ramsey non rifiuta l ipotesi nulla di non omissione di variabili rilevanti.

LA MODELLAZIONE EMPIRICA DELLE RELAZIONI ECONOMICHE: APPLICAZIONI IN STATA 7. Maria Elena Bontempi e.bontempi@economia.unife.it

LA MODELLAZIONE EMPIRICA DELLE RELAZIONI ECONOMICHE: APPLICAZIONI IN STATA 7. Maria Elena Bontempi e.bontempi@economia.unife.it LA MODELLAZIONE EMPIRICA DELLE RELAZIONI ECONOMICHE: APPLICAZIONI IN STATA 7 Maria Elena Bontempi e.bontempi@economia.unife.it VI LEZIONE: Analisi dei residui di stima: outlier, eteroschedasticità. Leverage.

Dettagli

ESERCITAZIONE REGRESSIONE MULTIPLA

ESERCITAZIONE REGRESSIONE MULTIPLA ESERCITAZIONE REGRESSIONE MULTIPLA Dati delle Nazioni Unite del 2005 riferiti, per diverse nazioni, al tasso di feconditá (bambini per donna) (variabile Fert), alla percentuale di donne che usa contraccettivi

Dettagli

Esercizio 4 (Regressione multipla)

Esercizio 4 (Regressione multipla) Esercizio (Regressione multipla) DATI Il data set employee.sav (o employee.xls; fonte SPSS) contiene 7 dati relativi agli impiegati di un azienda. Le variabili sono ID Employee Code BDATE Date of Birth

Dettagli

βˆ (pendenza della retta) =

βˆ (pendenza della retta) = LA MODELLAZIONE EMPIRICA DELLE RELAZIONI ECONOMICHE: APPLICAZIONI IN STATA 7 Maria Elena Bontempi e.bontempi@economia.unife.it V LEZIONE: OLS multivariato: effetti parziali, multicollinearità Scopo dell

Dettagli

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141 Regressione Semplice Analisi Per avere una prima idea della struttura di dipendenza fra le variabili in esame, possiamo cominciare col costruire la matrice di correlazione delle variabili presenti nel

Dettagli

Esempio 1 (Regressione semplice, punti influenti, regressione multipla, multicollinearità)

Esempio 1 (Regressione semplice, punti influenti, regressione multipla, multicollinearità) Esempio (Regressione semplice, punti influenti, regressione multipla, multicollinearità) DATI Il data set cigarettes.sav (fonte http://www.amstat.org/publications/jse/jse_data_archive.html) contiene dati

Dettagli

VARIETÀ. zona geografica A B C D

VARIETÀ. zona geografica A B C D Anova a 2 vie con repliche (( chiarire che non devono essere esattamente nello stesso numero per ogni cella ovvero per le ripetizioni dei de fattori ma che excel li legge così) Esercizio-esempio 1 Il valore

Dettagli

ESERCITAZIONE ANCOVA

ESERCITAZIONE ANCOVA ESERCITAZIONE ANCOVA I dati provengono da un articolo di Cyril Burt del 1996 intitolato The genetic determination of differences in intelligence: A study of monozygotic twins reared apart. I dati contengono

Dettagli

Regressione. Monica Marabelli. 15 Gennaio 2016

Regressione. Monica Marabelli. 15 Gennaio 2016 Regressione Monica Marabelli 15 Gennaio 2016 La regressione L analisi di regressione é una tecnica statistica che serve a studiare la relazione tra variabili. In particolare, nel modello di regressione

Dettagli

mercato A.A. 2014/15 modello di regressione lineare

mercato A.A. 2014/15 modello di regressione lineare Statistica per le ricerche di mercato A.A. 2014/15 12. Violazione delle ipotesi nel modello di regressione lineare La violazione delle ipotesi Fino ad ora le assunzioni ipotizzate per il modello di regressione

Dettagli

LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE

LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE LABORATORIO 5. ANALISI DELLA VARIANZA AD UN CRITERIO DI CLASSIFICAZIONE 5.1 ESEMPIO DI ANOVA AD UNA VIA In un esperimento un gruppo di bambini è stato assegnato a caso a 3 trattamenti, allo scopo di determinare

Dettagli

Metodi Statistici per il Management

Metodi Statistici per il Management Metodi Statistici per il Management Statistica Multivariata I Simone Borra - Roberto Rocci Introduzione e obiettivi La statistica multivariata si occupa di analizzare e studiare in modo simultaneo un set

Dettagli

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Laboratorio di Statistica Aziendale Modello di regressione lineare multipla Michela Pasetto michela.pasetto2@unibo.it Definizione del modello OLS (semplice) L obiettivo della regressione lineare è di valutare

Dettagli

Regressioni Non Lineari

Regressioni Non Lineari Regressioni Non Lineari Fino ad ora abbiamo solo considerato realazioni lineari Ma le relazioni lineari non costituiscono sempre le migliori approssimazioni La regressione multipla può anche essere formulata

Dettagli

Metodi Quantitativi per Economia, Finanza e Management

Metodi Quantitativi per Economia, Finanza e Management Metodi Quantitativi per Economia, Finanza e Management Lezione n 9 Regressione lineare multipla: la valutazione del modello, multicollinearità, metodi automatici di selezione dei regressor, analisi di

Dettagli

Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011

Anova e regressione. Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Anova e regressione Andrea Onofri Dipartimento di Scienze Agrarie ed Ambientali Universitá degli Studi di Perugia 22 marzo 2011 Nella sperimentazione agronomica e biologica in genere è normale organizzare

Dettagli

Es. la performance all esame in relazione alle ore di studio a casa e alle abilità cognitive

Es. la performance all esame in relazione alle ore di studio a casa e alle abilità cognitive Regressione Tale tecnica esamina e studia la relazione tra una o più variabili indipendenti e una variabile dipendente. L insieme dei parametri riassumono la relazione tra VD e VI, sotto le ipotesi che

Dettagli

Multicollinearità. Strumenti quantitativi per la gestione

Multicollinearità. Strumenti quantitativi per la gestione Multicollinearità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3c_mc.html#(1) 1/13 Quando non tutto va come dovrebbe Si parla di multi-collinearità

Dettagli

Obiettivi: dimostrare l efficacia della diagnosi e della terapia precoci adottate presso l Associazione A.R.C. di Verona Popolazione: 250 soggetti

Obiettivi: dimostrare l efficacia della diagnosi e della terapia precoci adottate presso l Associazione A.R.C. di Verona Popolazione: 250 soggetti Obiettivi: dimostrare l efficacia della diagnosi e della terapia precoci adottate presso l Associazione A.R.C. di Verona Popolazione: 250 soggetti circa dei quali 96 con Case Report Form (CRF) idoneo alle

Dettagli

Esercizio 5 (Scelta delle variabili)

Esercizio 5 (Scelta delle variabili) Esercizio (Scelta delle variabili) DATI Il data set macro.sav (o macro.xls) contiene dati relativi al e riferiti a stati, raccolti dall UNDP (United Nations Development Programme). Le variabili sono COUNTRY

Dettagli

0.1 Percorrenza e Cilindrata

0.1 Percorrenza e Cilindrata 0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,

Dettagli

Modelli che spiegano l attività fotosintetica alla luce di parametri fisiologici della vegetazione. Dr. Alessandro Ferrarini

Modelli che spiegano l attività fotosintetica alla luce di parametri fisiologici della vegetazione. Dr. Alessandro Ferrarini Modelli che spiegano l attività fotosintetica alla luce di parametri fisiologici della vegetazione Dr. Alessandro Ferrarini variabile dipendente: NDVI (indice di attività fotosintetica) variabili indipendenti:

Dettagli

LA MODELLAZIONE EMPIRICA DELLE RELAZIONI ECONOMICHE: APPLICAZIONI IN STATA 7. Maria Elena Bontempi

LA MODELLAZIONE EMPIRICA DELLE RELAZIONI ECONOMICHE: APPLICAZIONI IN STATA 7. Maria Elena Bontempi LA MODELLAZIONE EMPIRICA DELLE RELAZIONI ECONOMICHE: APPLICAZIONI IN STATA 7 L'econometria delle serie storiche Maria Elena Bontempi e.bontempi@economia.unife.it 1. Alcuni concetti di base...1 2. Come

Dettagli

Ex. 1 & 2: Costi, curve apprendimento ed economie di scala

Ex. 1 & 2: Costi, curve apprendimento ed economie di scala Ex. 1 & 2: Costi, curve apprendimento ed economie di scala Economia Applicata M Andrea Bastianin Argomenti 1. Rendimenti di scala 2. Curve di apprendimento Riferimenti: Berndt, cap. 3 Nerlove, M. (1963).

Dettagli

Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR

Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR Materiale ad uso dei ricercatori che hanno seguito il corso di formazione interna in Statistica, edizione

Dettagli

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value Inferenza: singolo parametro Sistema di ipotesi: H 0 : β j = β j0 H 1 : β j β j0 statistica test t b j - b s a jj j0 > t a, 2 ( n-k) confronto con valore t o p-value Se β j0 = 0 X j non ha nessuna influenza

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le

Dettagli

Modelli Statistici per l Economia. Regressione lineare con un singolo regressore (terza parte)

Modelli Statistici per l Economia. Regressione lineare con un singolo regressore (terza parte) Modelli Statistici per l Economia Regressione lineare con un singolo regressore (terza parte) 1 Verifica di ipotesi su β 1 H 0 : β 1 = β 1,0 H 1 : β 1 β 1,0 Se è vera H 0 (cioè sotto H 0 ) e n è grande,

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico )

Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico ) Laboratorio R Corso di Algebra e Modelli lineari (Anno Accademico 05-6) REGRESSIONE LINEARE SEMPLICE OPEN STATISTICA 8.44 Per 8 settimanali, appartenenti alla medesima fascia di prezzo e presenti in edicola

Dettagli

Regressione semplice: come applicarla come interpretare i risultati

Regressione semplice: come applicarla come interpretare i risultati Regressione semplice: come applicarla come interpretare i risultati Questo materiale è utile ai fini dell esecuzione della regressione con software statistico. Questo materiale non è in alcun modo utile

Dettagli

CAPITOLO 3 Esperimenti con un singolo fattore: l Analisi della Varianza

CAPITOLO 3 Esperimenti con un singolo fattore: l Analisi della Varianza Douglas C. Montgomery Progettazione e analisi degli esperimenti 006 McGraw-Hill CAPITOLO 3 Esperimenti con un singolo fattore: l Analisi della Varianza Metodi statistici e probabilistici per l ingegneria

Dettagli

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. Lezione 14 (a cura di Ludovica Peccia) MULTICOLLINEARITA La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. In un modello di regressione Y= X 1, X 2, X 3

Dettagli

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice STATISTICA Regressione-3 L inferenza per il modello lineare semplice Regressione lineare: GRAFICO DI DISPERSIONE & & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

Descrizione per la costruzione del modello di regressione

Descrizione per la costruzione del modello di regressione Descrizione per la costruzione del modello di regressione Formulazione delle Ipotesi Ricerca delle variabili esplicative Dati Modello Stima dei parametri Verifica Modello IL MODELLO DI REGRESSIONE LINEARE

Dettagli

Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione

Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione Quiz di verifica - Alberi e FC Strumenti Quantitativi per la gestione Le domande 1-6 si riferiscono al seguente problema Un data set contiene i dati sui consumi di diversi tipi di automobili e alcune loro

Dettagli

Fasi del modello di regressione

Fasi del modello di regressione Fasi del modello di regressione Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori

Dettagli

ECONOMETRIA: Laboratorio III

ECONOMETRIA: Laboratorio III ECONOMETRIA: Laboratorio III Luca De Angelis CLASS - Università di Bologna Programma Laboratorio III Analisi della specificazione del modello e test diagnostici: Test per la forma funzionale del modello

Dettagli

CAPITOLO 5 Introduzione ai piani fattoriali

CAPITOLO 5 Introduzione ai piani fattoriali Douglas C. Montgomery Progettazione e analisi degli esperimenti 2006 McGraw-Hill CAPITOLO 5 Introduzione ai piani fattoriali Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria

Dettagli

Università di Pavia Econometria Esercizi 5

Università di Pavia Econometria Esercizi 5 Università di Pavia Econometria 2007-2008 Esercizi 5 Maggio, 2008 1. Una regressione lineare multipla di y su una costante, x 2 e x 3 produce i seguenti risultati: ŷ t = 4 + 0.4x t2 + 0.9x t3 con X X =

Dettagli

Università di Padova

Università di Padova Università di Padova Dipartimento di Tecnica e Gestione dei sistemi industriali Corso di Laurea Specialistica in Ingegneria Civile Elaborato di analisi statistica a.a. 5-6 Prof. L. Salmaso Dott. L. Corain

Dettagli

Metodologia della ricerca sul singolo e gruppi di individui

Metodologia della ricerca sul singolo e gruppi di individui TIPI DI RICERCA Metodologia della ricerca sul singolo e gruppi di individui Chiara Valeria Marinelli Chiaravaleria.marinelli@unisalento.it DESCRITTIVA. Obiettivo: osservare e registrare la frequenza con

Dettagli

Statistica per le ricerche di mercato. 12. Violazione delle ipotesi nel modello di regressione lineare

Statistica per le ricerche di mercato. 12. Violazione delle ipotesi nel modello di regressione lineare Statistica per le ricerche di mercato A.A. 2012/13 Dr. Luca Secondi 12. Violazione delle ipotesi nel modello di regressione lineare La violazione delle ipotesi Fino ad ora le assunzioni ipotizzate per

Dettagli

Maria Elena Bontempi Roberto Golinelli this version: 26 August 2006

Maria Elena Bontempi Roberto Golinelli this version: 26 August 2006 INSTRUMENTAL VARIABLES (IV) ESTIMATION A Maria Elena Bontempi e.bontempi@economia.unife.it Roberto Golinelli golinell@spbo.unibo.it this version: 26 August 2006 1. L approccio delle variabili strumentali

Dettagli

Regressione Lineare con regressori multipli

Regressione Lineare con regressori multipli Regressione Lineare con regressori multipli L idea chiave della regressione multipla è che, se sono disponibili i dati sulle variabili omesse, possiamo aggiungerle come regressori addizionali. In altre

Dettagli

Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti

Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti Professor Paolo Vitale Anno Accademico 2017-8 UdA, Scuola d Economia Domanda 1 [6 punti]. (a) La multi-collineartità

Dettagli

Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo

Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo 1 Controllo di ipotesi sui parametri In questo contesto risulta necessario avvalersi dell assunzione di normalita

Dettagli

lezione 9 AA Paolo Brunori

lezione 9 AA Paolo Brunori AA 2016-2017 Paolo Brunori Dove siamo arrivati? - la regressione lineare multipla ci permette di stimare l effetto della variabile X sulla Y tenendo ferme tutte le altre variabili osservabili che hanno

Dettagli

Il primo passo è consistito nel progettare e pianificare un piano fattoriale generale a tre fattori con due repliche e due blocchi.

Il primo passo è consistito nel progettare e pianificare un piano fattoriale generale a tre fattori con due repliche e due blocchi. Il primo passo è consistito nel progettare e pianificare un piano fattoriale generale a tre fattori con due repliche e due blocchi. Successivamente all ottenimento dei dati sperimentali si è provveduto

Dettagli

Metodi di regressione multivariata

Metodi di regressione multivariata Metodi di regressione multivariata Modellamento dei dati per risposte quantitative I metodi di regressione multivariata sono strumenti utilizzati per ricercare relazioni funzionali quantitative tra un

Dettagli

Regressione multipla

Regressione multipla Regressione multipla L obiettivo è costruire un modello probabilistico per spiegare la variabile y tramite più di una variabile indipendente x 1, x 2,..., x k. Esempio: Per un efficiente progettazione

Dettagli

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice STATISTICA Regressione-3 L inferenza per il modello lineare semplice La bontà della regressione Per fare un buon modello lineare serve: una correlazione alta, che dice che i dati stanno vicini alla retta

Dettagli

Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi

Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi Minimi quadrati ordinari Interpretazione geometrica Eduardo Rossi Il MRLM Il modello di regressione lineare multipla è usato per studiare le relazioni tra la variabile dipendente e diverse variabili indipendenti

Dettagli

METODI CON PREFERENZE RIVELATE PREZZI EDONICI E COSTO DI VIAGGIO

METODI CON PREFERENZE RIVELATE PREZZI EDONICI E COSTO DI VIAGGIO METODI CON PREFERENZE RIVELATE PREZZI EDONICI E COSTO DI VIAGGIO METODO DEI PREZZI EDONICI Il metodo dei prezzi edonici utilizza un mercato surrogato. L ipotesi è che il valore del bene sia implicitamente

Dettagli

IL METODO ECONOMETRICO

IL METODO ECONOMETRICO IL METODO ECONOMETRICO 8 maggio 2017 L obiettivo di questa lezione è quello di fornire alcuni strumenti necessari per l analisi empirica In particolare, approfondiremo il metodo econometrico come strumento

Dettagli

Regressione in SAS : Proc Reg. L output della procedura è il seguente :

Regressione in SAS : Proc Reg. L output della procedura è il seguente : Regressione in SAS : Proc Reg I dati da analizzare si riferiscono ad un indagine condotta su 61 città di Inghilterra e Galles riguardante l indice annuale di mortalità su 100.000 abitanti maschi calcolato

Dettagli

Economia Pubblica e Storia Economica Fausto Pacicco

Economia Pubblica e Storia Economica Fausto Pacicco Economia Pubblica e Storia Economica Fausto Pacicco fpacicco@liuc.it 1 Possiamo estendere il modello di regressione lineare includendo più di una xx, ottenendo un modello di regressione lineare multipla

Dettagli

ANOVA 2. Monica Marabelli. 15 Gennaio 2016

ANOVA 2. Monica Marabelli. 15 Gennaio 2016 ANOVA 2 Monica Marabelli 15 Gennaio 2016 ANOVA a una via Nella scorsa esercitazione abbiamo visto che nell Analisi della Varianza (ANOVA) si considerano le medie di una variabile dipendente (quantitativa)

Dettagli

Esercitazione finale - corso R base Francesco Vidoli Ottobre 2018

Esercitazione finale - corso R base Francesco Vidoli Ottobre 2018 Esercitazione finale - corso R base Francesco Vidoli Ottobre 2018 Passo 1: Leggere il file di input (il file si trova a questo indirizzo: https://fvidoli.weebly.com/uploads/2/3/0/8/ 23088460/dati_medici.csv),

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Laboratorio 8. Regressione multipla. 8.1 Analisi del dataset HOOK.DAT

Laboratorio 8. Regressione multipla. 8.1 Analisi del dataset HOOK.DAT Laboratorio 8 Regressione multipla 8.1 Analisi del dataset HOOK.DAT I dati contenuti nel file hook.dat, raccolti da Joseph Hooker sulle montagne dell Himalaya, riportano le temperature di ebollizione dell

Dettagli

Indice. Prefazione all edizione italiana, di Piero Veronese » XI. Prefazione

Indice. Prefazione all edizione italiana, di Piero Veronese » XI. Prefazione Indice Prefazione all edizione italiana, di Piero Veronese pag. IX Prefazione 1. EE: un introduzione alle distribuzioni di probabilità e ai metodi di stima statistica 1.1. EE: incertezza e probabilità

Dettagli

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta

Dettagli

5. Per determinare il miglior grado del polinomio di una regressione polimoniale

5. Per determinare il miglior grado del polinomio di una regressione polimoniale Principi di Econometria 55 di tempo prof. Brunori Nome e cognome 16/01/2017 Matricola versione A Potete consegnare solo le risposte multiple o sia le risposte multiple che quelle aperte. Nel secondo caso

Dettagli

Analisi della varianza a due fattori

Analisi della varianza a due fattori Laboratorio 11 Analisi della varianza a due fattori 11.1 Analisi del dataset PENICILLIN.DAT I dati contenuti nel file penicillin.dat, si riferiscono ad un esperimento di produzione di penicillina tendente

Dettagli

ANOVA 2. Silvia Parolo. January 16, 2015

ANOVA 2. Silvia Parolo. January 16, 2015 ANOVA 2 Silvia Parolo January 16, 2015 Verifica degli assunti normalità dei residui entro gruppi omoschedasticità dei residui entro gruppi indipendenza dei residui entro gruppi Esempio è stato condotto

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2015-2016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

LABORATORIO DI PROBABILITA E STATISTICA

LABORATORIO DI PROBABILITA E STATISTICA UNIVERSITA DEGLI STUDI DI VERONA LABORATORIO DI PROBABILITA E STATISTICA Docente: Bruno Gobbi 6 ESERCIZI RIEPILOGATIVI PRIME 3 LEZIONI REGRESSIONE LINEARE: SPORT - COLESTEROLO ESERCIZIO 8: La tabella seguente

Dettagli

Università di Pavia Econometria. Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi

Università di Pavia Econometria. Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi Università di Pavia Econometria Minimi quadrati ordinari Interpretazione geometrica Eduardo Rossi Università di Pavia Introduzione L econometria si interessa all analisi dei dati economici. I dati economici

Dettagli

STATISTICA MULTIVARIATA SSD MAT/06

STATISTICA MULTIVARIATA SSD MAT/06 Università degli studi di Ferrara Dipartimento di Matematica A.A. 2018/2019 I semestre STATISTICA MULTIVARIATA SSD MAT/06 LEZIONE 4 - Questioni di analisi e applicazione della regressione lineare Pratica

Dettagli

ANALISI DELLA VARIANZA

ANALISI DELLA VARIANZA ANALISI DELLA VARIANZA Il data set coagulation contenuto nella libreria faraway contiene i tempi di coagulazione del sangue (misurato in secondi) di 24 animali sottoposti casualmente a quattro tipi di

Dettagli

Regressione lineare con un solo regressore

Regressione lineare con un solo regressore Regressione lineare con un solo regressore La regressione lineare è uno strumento che ci permette di stimare e di fare inferenza sui coefficienti incogniti di una retta. Lo scopo principale è di stimare

Dettagli

APPLICAZIONI. Analisi della varianza ad un fattore

APPLICAZIONI. Analisi della varianza ad un fattore Douglas C. Montgomery Controllo statistico della qualità /ed 6 McGraw-Hill APPLICAZIONI Analisi della varianza ad un fattore Insegnamento: Metodi ed Applicazioni Statistiche Corso di Laurea Specialistica

Dettagli

ESERCIZI 1) A fianco sono riportati i risultati di due rilevazioni quantitative su 10 elementi. Per questi dati si ha: 10

ESERCIZI 1) A fianco sono riportati i risultati di due rilevazioni quantitative su 10 elementi. Per questi dati si ha: 10 ESERCIZI 1) A fianco sono riportati i risultati di due rilevazioni quantitative su elementi. Per questi dati si ha: x i = 1 y i = 1 x y i = 1 i = 6514 i i = 1 i = 1 i = 281627 x y 2 i 2 i = 18629 = 62260

Dettagli

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova

Dettagli

IL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi. Statistica Economica A.A. 2011/2012. Prof.ssa Tiziana Laureti

IL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi. Statistica Economica A.A. 2011/2012. Prof.ssa Tiziana Laureti IL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi Statistica Economica A.A. 2011/2012 Prof.ssa Tiziana Laureti *Libro di testo: Stock J.H. e Watson, M.W. Introduzione all

Dettagli

STIMA DELLA PIENA INDICE

STIMA DELLA PIENA INDICE STIMA DELLA PIENA INDICE STIMA LOCALE - Anche se basata su un numero molto limitato di osservazioni (5-6) STIMA REGIONALE 1) Metodi basati su regressioni rispetto a parametri morfo-climatici 2) Metodi

Dettagli

lezione 4 AA Paolo Brunori

lezione 4 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente

Dettagli

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE

Dettagli

0.1 Veri ca di ipotesi

0.1 Veri ca di ipotesi 0.1 Veri ca di ipotesi Test bilaterale Sistema di ipotesi h H 0 : k = 0 k H 1 : k 6= 0 k Dalla quarta proprieta OLS per il singolo coe ciente b N(; 2 (X 0 X) 1 ) b k N( k ; 2 c kk ) =) b k k q 2 c kk N(0;

Dettagli

GRUPPO QUATTRO RUOTE. Alessandro Tondo Laura Lavazza Matteo Scordo Alessandro Giosa Gruppo Quattro Ruote 1

GRUPPO QUATTRO RUOTE. Alessandro Tondo Laura Lavazza Matteo Scordo Alessandro Giosa Gruppo Quattro Ruote 1 GRUPPO QUATTRO RUOTE Alessandro Tondo 19632 Laura Lavazza 19758 Matteo Scordo 19813 Alessandro Giosa 19894 Gruppo Quattro Ruote 1 3.1 Analisi fattoriale (continua) Confrontando dal punto di vista interpretativo

Dettagli

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura

Analisi grafica residui in R. Da output grafico analisi regressionelm1.csv Vedi dispensa. peso-statura Analisi grafica residui in R Da output grafico analisi regressionelm1.csv Vedi dispensa peso-statura 1) Il plot in alto a sinistra mostra gli errori residui contro i loro valori stimati. I residui devono

Dettagli

Esercitazione su outliers e osservazioni influenti

Esercitazione su outliers e osservazioni influenti Esercitazione su outliers e osservazioni influenti Quando si stima un modello di regressione è fondamentale identificare eventuali osservazioni influenti. Una osservazione si definisce influente se la

Dettagli

Statistiche di sintesi

Statistiche di sintesi Esercizio 2 E stato condotto uno studio per valutare la variazione della pressione sistolica in funzione dell etá. I dati sono riportati nel file sbp.xls. Effettua un analisi di regressione e disegna gli

Dettagli

Inferenza statistica Donata Rodi 04/10/2016

Inferenza statistica Donata Rodi 04/10/2016 Inferenza statistica Donata Rodi 04/10/2016 Popolazione Campionamento Campione Parametri Inferenza Statistiche µ, ϭ 2 descrittive Stima X, s 2 Quale test? Parametrico o no Scala di misura 1 gruppo 2 gruppi

Dettagli

1. variabili dicotomiche: 2 sole categorie A e B

1. variabili dicotomiche: 2 sole categorie A e B Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili

Dettagli

6 Analisi della regressione lineare

6 Analisi della regressione lineare 6 Analisi della regressione lineare L'obiettivo dell'analisi della regressione è quello di studiare la distribuzione di una variabile, diciamo Y, per valori fissi di una'altra variabile che indichiamo

Dettagli

lezione 7 AA Paolo Brunori

lezione 7 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice

Dettagli

lezione 13 AA Paolo Brunori

lezione 13 AA Paolo Brunori AA 2016-2017 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci

Dettagli

ESERCIZIO 1. Di seguito vengono riportati i risultati di una regressione multipla effettuata secondo il metodo standard (o per blocchi )

ESERCIZIO 1. Di seguito vengono riportati i risultati di una regressione multipla effettuata secondo il metodo standard (o per blocchi ) ESERCIZIO. Di seguito vengono riportati i risultati di una regressione multipla effettuata secondo il metodo standard (o per blocchi ) a. b. Riepilogo del modello b R-quadrato Errore std. Durbin-W R R-quadrato

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

INTRODUZIONE A R Lezione 4

INTRODUZIONE A R Lezione 4 INTRODUZIONE A R Lezione 4 Silvia Bacci e Silvia Pandolfi 1 La regressione lineare 1.1 Regressioni lineare semplice Per applicare il metodo di regressione lineare scegliamo il dataset cars relativo alle

Dettagli

Regressione lineare. Metodi Quantitativi per Economia, Finanza e Management. Esercitazione n 9

Regressione lineare. Metodi Quantitativi per Economia, Finanza e Management. Esercitazione n 9 Regressione lineare Metodi Quantitativi per Economia, Finanza e Management Esercitazione n 9 Metodi Quantitativi per Economia, Finanza e Management Obiettivi di questa esercitazione: 1 2 3 4 Proc Reg Variabili

Dettagli

Correlazione e regressione

Correlazione e regressione Correlazione e regressione Il termine associazione è largamente usato nella letteratura scientifica ed esprime la relazione che esiste tra due variabili Per studiare l associazione tra due variabili bisogna

Dettagli

FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA

FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA FACOLTÀ DI ECONOMIA Soluzione della Prova di autovalutazione 2012 (primi 6 CFU) ANALISI STATISTICA PER L IMPRESA NB Come potete vedere facendo la somma dei punteggi il numero di quesiti è superiore a quello

Dettagli

Università di Pavia Econometria Esercizi 4 Soluzioni

Università di Pavia Econometria Esercizi 4 Soluzioni Università di Pavia Econometria 2008-2009 Esercizi 4 Soluzioni Maggio, 2009 Istruzioni: I commenti devono essere concisi! 1. Dato il modello di regressione lineare, con K regressori con E(ɛ) = 0 e E(ɛɛ

Dettagli

Stima dei parametri di modelli lineari

Stima dei parametri di modelli lineari Stima dei parametri di modelli lineari Indice Introduzione................................ 1 Il caso studio................................ 2 Stima dei parametri............................ 3 Bontà delle

Dettagli