Regressione con una variabile dipendente binaria
|
|
- Arianna Quaranta
- 7 anni fa
- Visualizzazioni
Transcript
1 Regressione con una variabile dipendente binaria Fino ad ora abbiamo considerato solo variabili dipendenti countinue: Che succede se Y è binaria? Y = va al college, o no; X = anni di istruzione Y = fumatore, o no; X = reddito Y = richiesta di mutuo accettata, o no; X = reddito, caratteristiche della casa, stato civile, etnia 1
2 Es: etnia e richiesta di mutuo The Boston Fed HMDA data set Richieste individuali per mutui fatte nel 1990 nella zona di Boston 2380 observationi Variabili Variabile dipendente: Il mutuo è accettato o rifiutato? Variabili indipendente: reddito, ricchezza, occupazione altri prestiti, caratteristiche di povertà etnia 2
3 Il modello lineare di probabilità Un punto di partenza naturale è una regressione lineare con un singolo regressore: ma: Y i = β 0 + β 1 X i + u i Che significato ha β 1 quando Y è binaria? β 1 = Che senso ha β 0 + β 1 X quando Y è binaria? Che significato ha Y ˆ? Per es., Y ˆ = 0.26? Y X? 3
4 Modello lineare Y i = β 0 + β 1 X i + u i Ass #1: E(u i X i ) = 0, dunque E(Y i X i ) = E(β 0 + β 1 X i + u i X i ) = β 0 + β 1 X i quando Y è binaria, E(Y) = 1 Pr(Y=1) + 0 Pr(Y=0) = Pr(Y=1) dunque E(Y X) = Pr(Y=1 X) 4
5 Quando Y è binaria, il modello di regressione lineare Y i = β 0 + β 1 X i + u i È chiamato modello di probabilità lineare Il valore previsto è una probabilità: E(Y X=x) = Pr(Y=1 X=x) = prob. che Y = 1 dato x ˆ Y = la probabilita prevista che Yi = 1, dato X β 1 = cambiamento nella probabilità che Y = 1 per una dato x: β 1 = Pr( Y = 1 X = x + x ) Pr( Y = 1 X = x ) x 5
6 Es: HMDA data Domande di mutuo non accolte e rapporto fra pagamenti di debiti e reddito (P/I ratio) nei dati HMDA 6
7 Rˆifiuto = PI (n = 2380) (.032) (.098) Qual è il valore previsto quando PI = 0.3? P ( Rifiuto ˆ = 1 PI = 0.3) = =.151 Calcoliamo gli effetti di un incremento di PI da.3 a.4: P ( Rifiuto ˆ = 1 PI = 0.4) = =.212 L effetto sulla probabilità di rifiuto di un cambiamento di PI da 0.3 a 0.4 è pari ad un incremento della probabilità di 0.061, cioè, di 6.1% 7
8 Includiamo un altro regressore, black : Rˆifiuto = PI +.177black (.032) (.098) (.025) Probabilità prevista di rifiuto: Per i richiedenti neri con PI = 0.3: P ( Rifiuto ˆ = 1) = =.254 Per i bianchi con PI = 0.3: P ( Rifiuto ˆ = 1) = =.077 La differenza =.177 = 17.7 % Il coefficient di black è significativo al 5% Tuttavia ci possono essere ancora delle variabili omesse 8
9 Sommario Modelliamo Pr(Y=1 X) come funzione lineare di X Vantaggi: Semplice da stimare e interpretare Inferenza è la stessa di una regressione multipla Svantaggi: Ha senso imporre che la probabilità è lineare in X? Le probabilità previste possono essere <0 o >1! Questi svantaggi possono essere risolti usando un un modello di probabilità non lineare: probit o logit 9
10 Regressioni Probit e Logit Quando il modello di probabilità di Y=1 è lineare abbiamo: Pr(Y = 1 X) = β 0 + β 1 X D altro canto vorremmo che: 1. 0 Pr(Y = 1 X) 1 per tutte le X 2. Pr(Y = 1 X) deve crescere con X (se β 1 >0) Questo richiede una forma funzionale nonlineare per la probabilità. Come una curva a S 10
11 Un probit soddisfa le 2 condizioni dette sopra 11
12 Regressione Probit: modella la probabilità che Y=1 usando la funzione cumulata di una normale standardizzata quando z = β 0 + β 1 X: Pr(Y = 1 X) = Φ(β 0 + β 1 X) Φ è la funzione cumulata di una normale standardizzata. z = β 0 + β 1 X è il z-value o z-index del modello probit Es: Supponiamo: β 0 = -2, β 1 = 3, X =.4, dunque Pr(Y = 1 X=.4) = Φ( ) = Φ(-0.8) Pr(Y = 1 X=.4) = area sotto la funzione di densità normale a sinistra di z = -.8, graficamente 12
13 Pr(Z -0.8) =
14 Perchè utilizzare la funzione cumulate normale? La forma a S soddisfa le 2 proprietà: 1. 0 Pr(Y = 1 X) 1 per tutti X 2. Pr(Y = 1 X) cresce con X (per β 1 >0) Facile da usare utilizzando le tavole statistiche L interpretazione è abbastanza intuitiva: z-value = β 0 + β 1 X ˆ β 0 + ˆ β 1 X è lo z-value predetto, date le X β 1 misura il cambiamento dello z-value per un cambiamento di una unità in X 14
15 Es. probit deny p_irat, r; Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = We ll discuss this later Probit estimates Number of obs = 2380 Wald chi2(1) = Prob > chi2 = Log likelihood = Pseudo R2 = Robust deny Coef. Std. Err. z P> z [95% Conf. Interval] p_irat _cons ( Rifiuto 1 PI ) ˆ = = Φ( PI) P (.16) (.47) 15
16 ( Rifiuto 1 PI ) ˆ = = Φ( PI) P (.16) (.47) Coefficiente positivo: ha senso? Standard errors ha la solita interpretazione Probabilità prevista: ( Rifiuto ˆ = 1 PI = 0.3) P = Φ( ) = Φ(-1.30) =.097 Effetto del cambamento in PI da 0.3 a 0.4: ( Rifiuto ˆ = 1 PI = 0.4) P = Φ( ) =.159 Probabilità prevista di rifiuto cresce da a
17 Regressione multipla Probit Pr(Y = 1 X 1, X 2 ) = Φ(β 0 + β 1 X 1 + β 2 X 2 ) Φ come prima. z = β 0 + β 1 X 1 + β 2 X 2 come prima β 1 è l effetto su z-valore di un cambiamento di una unità in X 1, tenendo constante X 2 17
18 . probit deny p_irat black, r; Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Probit estimates Number of obs = 2380 Wald chi2(2) = Prob > chi2 = Log likelihood = Pseudo R2 = Robust deny Coef. Std. Err. z P> z [95% Conf. Interval] p_irat black _cons
19 ( Rifiuto ˆ = 1 PI black ) P, = Φ( PI +.71 black) (.16) (.44) (.08) il coefficiente della variabile black è statisticamente significativo? effetto stimato di black per PI =.3: P ( Rifiuto ˆ = 1 0.3,1) = Φ( ) =.233 P ( Rifiuto ˆ = 1 0.3,0) = Φ( ) =.075 differenza della probabilità di rifiuto =.158 (15.8%) nota che il problema di eventuali variabili omesse non è stato ancora risolto 19
20 Logit Regression Regressione Logit modella la probabilità di che Y=1 come una funzione distribuzione cumulata logistica, valutata a z = β 0 + β 1 X: Pr(Y = 1 X) = F(β 0 + β 1 X) F è una funzione distribuzione cumulata logistica: F(β 0 + β 1 X) = 1+ 1 ( 0 1X ) e β + β 20
21 Pr(Y = 1 X) = F(β 0 + β 1 X) dove F(β 0 + β 1 X) = 1+ 1 ( 0 1X ) e β + β. Es: β 0 = -3, β 1 = 2, X =.4, di conseguenza β 0 + β 1 X = = -2.2 dunque Pr(Y = 1 X=.4) = 1/(1+e ( 2.2) ) =.0998 perchè usare un logit al posto del probit? I calcoli sono più semplici In pratica, logit e probit sono molto simili 21
22 Es. logit deny p_irat black, r; Iteration 0: log likelihood = Later Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Iteration 4: log likelihood = Logit estimates Number of obs = 2380 Wald chi2(2) = Prob > chi2 = Log likelihood = Pseudo R2 = Robust deny Coef. Std. Err. z P> z [95% Conf. Interval] p_irat black _cons dis "Pred prob, p_irat=.3, white: " > 1/(1+exp(-(_b[_cons]+_b[p_irat]*.3+_b[black]*0))); Pred prob, p_irat=.3, white: NOTE: the probit predicted probability is
23 23
24 Es: Studiamo le caratteristiche di Background dei militanti Hezbollah Fonte: Alan Krueger and Jitka Maleckova, Education, Poverty and Terrorism: Is There a Causal Connection? Journal of Economic Perspectives, 2003, Logit: 1 = individuo morto in un azione militare Hezbollah 24
25 25
26 26
27 Calcoliamo l effetto dell istruzione paragonando le probabilità previste usando i risultati della colonna (3): Pr(Y=1 secondary = 1, poverty = 0, age = 20) Pr(Y=0 secondary = 0, poverty = 0, age = 20): Pr(Y=1 secondary = 1, poverty = 0, age = 20) = 1/[1+e ( ) ] = 1/[1 + e ] = Pr(Y=1 secondary = 0, poverty = 0, age = 20) = 1/[1+e ( ) ] = 1/[1 + e ] =
28 Cambiamento in prob previsto Pr(Y=1 secondary = 1, poverty = 0, age = 20) Pr(Y=1 secondary = 1, poverty = 0, age = 20) = = le conclusioni che seguono sono tutte corrette: la probabilità di essere un militante Hezbollah cresce del %, se la scuola secondaria è stata frequentata. 28
29 Stima e inferenza nei modelli probit e logit modello Probit Pr(Y = 1 X) = Φ(β 0 + β 1 X) stima e inferenza come si stimano β 0 e β 1? qual è la distribuzione campionaria di questi stimatori? perchè usiamo i soliti metodi per fare inferenza? prima di tutto guardiamo al metodo dei minimi quadrati non lineari poi consideriamo il metodo più usato in pratica, quello della funzione di massimoverosimiglianza (maximum 29
30 Nonlinear Least Squares (NLS) OLS: n min [ Y ( b + b X )] b0, b1 i 0 1 i i= 1 il risultato sono gli stimatori OLS ˆ β 0 e ˆ β 1 NLS di un probit: n min [ Y Φ ( b + b X )] b0, b1 i 0 1 i i= 1 Come risolviamo questo problema di minimizzazione? numericamente usando algoritmi specifici In pratica non viene usato perchè non efficiente
31 Stime di massimoverosimiglianza di Probit La funzione di massimoverosimiglianza è la funzione di densità di Y 1,,Y n date X 1,,X n, trattata come una funzione di parametri sconosciuti β 0 e β 1. Lo stimatore di massimoverosimiglianza (maximum likelihood estimator, MLE) è il valore di (β 0, β 1 ) che massimizza la funzione di massimoverosimiglianza. MLE è quel valore di (β 0, β 1 ) che meglio descrive l intera distribuzione dei dati. In grandi campioni, MLE è: consistente normalmente distribuito efficiente 31
32 La massimoverosimiglianza di un probit con una X Si calcola partendo dalla densità di Y 1, prima osservazione, dato X 1 : Pr(Y 1 = 1 X 1 ) = Φ(β 0 + β 1 X 1 ) Pr(Y 1 = 0 X 1 ) = 1 Φ(β 0 + β 1 X 1 ) dato che le y sono i.i.d., la distribuzione di probabilità condizionata per la osservazione y 1 sarà y1 1 Pr(Y 1 = y 1 X 1 ) = 1 y Φ ( β0 + β1x1) [1 Φ ( β0 + β1x1)] La funzione di massimoverosimiglianza probit è una densità congiunta di Y 1,,Y n date X 1,,X n, trattate come una funzione di β 0, β 1 : f(β 0,β 1 ; Y 1,,Y n X 1,,X n ) Y1 1 Y1 = { Φ ( β0 + β1x1) [1 Φ ( β0 + β1x1)] } Yn 1 Yn { Φ ( β + β X ) [1 Φ ( β + β X )] } 0 1 n 0 1 n 32
33 f(β 0,β 1 ; Y 1,,Y n X 1,,X n ) Y1 1 = { 1 Y Φ ( β0 + β1x1) [1 Φ ( β0 + β1x1)] } Yn 1 Yn { Φ ( β0 + β1x n ) [1 Φ ( β0 + β1x n )] } Non si può risolvere esplicitamente per il massimo Bisogna massimizzare usando metodi numerici In grandi campioni: ˆ β MLE 0, ˆ β MLE 1 sono consistenti ˆ β MLE 0, ˆ β MLE 1 sono normalmente distribuiti ˆ β MLE 0, ˆ β MLE 1 sono asintoticamente efficienti S.E. ˆ β MLE 0, ˆ β MLE 1 sono calcolati automaticamente Test e intervalli di confidenza come al solito 33
34 La funzione ML per un logit la sola differenza fra probit e logit è la forma funzionale usata per la probabilità: al posto di Φ si utilizza una funzione cumulata logisitca. come per il probit, ˆ β MLE 0, ˆ β MLE 1 sono consistenti ˆ MLE 0 ˆ MLE β, β 1 sono normalmente distribuiti gli SE possono essere calcolati test e intervalli di confidenza come al solito 34
35 Misure di bontà della regressioneper logit e probit R 2 2 e R non hanno senso in questo contesto, dunque si usano: 1. La frazione correttamente prevista. Dato che se Y i =1 e la probabilità predetta è >50% o se se Y i =0 e e la probabilità predetta è <50% allora Y i è predetto correttamente. La fpc è la frazione delle n osservazioni che sono predette correttamente 2. Lo pseudo-r 2 che utilizza la funzione di massimoverosimiglianza: misura di quanto migliora il valore del log della massimoverosimiglianza, rispetto al caso in cui non ci sono X 35
36 Esempio Dati MDA Mutui per la casa sono una parte essenziale dell acquisto di una casa. c è differenza fra le etnie? c è differenza nella probabilità di rifiuto? 36
37 The HMDA Data Set in lab Dati sulle caratteristiche individuali, caratteristiche della proprietà richesta di mutuo : la banca decide cercando di tenere basso il più possibile il rischio 37
38 La decisione della banca variabili finanziarie chiave: P/I housing expense-to-income ratio loan-to-value ratio personal credit history la regola per prendere la decisione è non lineare: loan-to-value ratio > 80% loan-to-value ratio > 95% credit score 38
39 Regressione Pr(Rifiuto=1 black, altre X) = modello di probabilità lineare probit probabile bias da variabili omesse che (i) potrebbero essere incluse nella funzione di decisione della banca (ii) potrebbero essere correlate con la variabile dell etnia: ricchezza, tipo di occupazione storia del credito stato di famiglia 39
40 40
41 41
42 42
43 Table 11.2, ctd. 43
44 Table 11.2, ctd. 44
45 Sommario I coefficienti sulle variabili finanziarie hanno senso. Black è sempre statisticamente significativo le interazioni non sono significative. includere altre variabili riduce l effetto dell etnia sulla probabilità di rifiuto. Modello di probabilità lineare, probit, logit: stime simili sull effetto dell etnia. 45
46 Minacce alla validità interna ed esterna validità interna 1. bias dovuto a variabili omesse 2. forma funzionale errata (no) 3. errore di misurazione (no) 4. selezione del campione 5. simultaneous causality (no) validità esterna tutto ciò è valido per Boston nel , possiamo assumere che sia ancora valido oggi? 46
47 Sommario Se Y i è binaria, allora E(Y X) = Pr(Y=1 X) Tre modelli: Modello Lineare di Probabilità probit logit LPM, probit, logit forniscono valori di probabilità previste L effetto di X è il cambiamento nella probabilità condizionata che Y=1. Probit e logit sono stimeti con ML I coefficienti sono normalmente distribuiti per grandi n Test di ipotesi, intervalli di confidenza come sempre 47
Regressioni Non Lineari
Regressioni Non Lineari Fino ad ora abbiamo solo considerato realazioni lineari Ma le relazioni lineari non costituiscono sempre le migliori approssimazioni La regressione multipla può anche essere formulata
DettagliRegressione lineare con un solo regressore
Regressione lineare con un solo regressore La regressione lineare è uno strumento che ci permette di stimare e di fare inferenza sui coefficienti incogniti di una retta. Lo scopo principale è di stimare
DettagliEconometria. lezione 17. variabili dipendenti binarie. Econometria. lezione 17. AA 2014-2015 Paolo Brunori
AA 2014-2015 Paolo Brunori domande di mutui rigettate - nei dati raccolti a Boston negli anni 90 il tasso di rifiuto è 28% per i neri e 9% per i bianchi - si può parlare di discriminazione? - è possibili
DettagliRegressione Lineare con regressori multipli
Regressione Lineare con regressori multipli L idea chiave della regressione multipla è che, se sono disponibili i dati sulle variabili omesse, possiamo aggiungerle come regressori addizionali. In altre
DettagliModelli Statistici per l Economia. Regressione lineare con un singolo regressore (terza parte)
Modelli Statistici per l Economia Regressione lineare con un singolo regressore (terza parte) 1 Verifica di ipotesi su β 1 H 0 : β 1 = β 1,0 H 1 : β 1 β 1,0 Se è vera H 0 (cioè sotto H 0 ) e n è grande,
Dettagli0.1 Veri ca di ipotesi
0.1 Veri ca di ipotesi Test bilaterale Sistema di ipotesi h H 0 : k = 0 k H 1 : k 6= 0 k Dalla quarta proprieta OLS per il singolo coe ciente b N(; 2 (X 0 X) 1 ) b k N( k ; 2 c kk ) =) b k k q 2 c kk N(0;
DettagliESERCITAZIONE REGRESSIONE MULTIPLA
ESERCITAZIONE REGRESSIONE MULTIPLA Dati delle Nazioni Unite del 2005 riferiti, per diverse nazioni, al tasso di feconditá (bambini per donna) (variabile Fert), alla percentuale di donne che usa contraccettivi
Dettaglilezione 4 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente
DettagliLa likelihood. , x 2. } sia prodotto a partire dal particolare valore di a: ; a... f x N. La probabilità che l'i ma misura sia compresa tra x i
La likelihood E' dato un set di misure {x 1, x 2, x 3,...x N } (ciascuna delle quali puo' essere multidimensionale) Supponiamo che la pdf (f) dipenda da un parametro a (anch'esso eventualmente multidimensionale)
DettagliAnalisi di Regressione Multipla
Analisi di Regressione Multipla Stima OLS della relazione Test Score/STR : TestScore! = 698.9.8 STR, R =.05, SER = 18.6 (10.4) (0.5) E una stima credibile dell effetto causale sul rendimento nei test di
DettagliStatistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
DettagliStatistica per le ricerche di mercato. 16. Il modello di regressione logistica: definizione, specificazione e
Statistica per le ricerche di mercato A.A. 2011/12 Prof.ssa Tiziana Laureti Dott. Luca Secondi 16. Il modello di regressione logistica: definizione, specificazione e stima L analisi delle variabili dipendenti
DettagliEsame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016
Esame di Statistica 0 o CFU) CLEF febbraio 06 Esercizio Si considerino i seguenti dati, relativi a 00 clienti di una banca a cui è stato concesso un prestito, classificati per età e per esito dell operazione
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliMetodi Statistici per il Management
Metodi Statistici per il Management Modelli statistici di dipendenza Simone Borra - Roberto Rocci Modelli statistici di dipendenza Modelli: strutture formali che hanno l obiettivo di descrivere, spiegare
DettagliStatistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
DettagliSchema della lezione. 1. Non correttezza ( bias ) dovuta a variabili omesse
Schema della lezione 1. Non correttezza ( bias ) dovuta a variabili omesse 2. Causalità e analsi di regressione 3. Regressione multipla e OLS 4. Misure di bontà della regressione 5. Distribuzione campionaria
DettagliModelli per variabili dipendenti limitate. Amedeo Argentiero.
Modelli per variabili dipendenti limitate Amedeo Argentiero amedeo.argentiero@unipg.it Problema 1. Si desidera stimare la probabilità di accadimento di un evento (essere disoccupato, probabilità di sposarsi,
DettagliAnalisi della regressione multipla
Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,
DettagliIntroduzione alla Regressione Logistica
Introduzione alla Regressione Logistica Contenuto regressione lineare semplice e multipla regressione logistica lineare semplice La funzione logistica Stima dei parametri Interpretazione dei coefficienti
DettagliStima dei parametri. I parametri di una pdf sono costanti che caratterizzano la sua forma. r.v. parameter. Assumiamo di avere un campione di valori
Stima dei parametri I parametri di una pdf sono costanti che caratterizzano la sua forma r.v. parameter Assumiamo di avere un campione di valori Vogliamo una funzione dei dati che permette di stimare i
DettagliIl modello di regressione lineare multipla
Il modello di regressione lineare multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2014 Rossi MRLM Econometria - 2014 1 / 31 Outline 1 Notazione 2 3 Collinearità Rossi MRLM Econometria - 2014
DettagliR - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
DettagliRegressioni con Panel Data
Regressioni con Panel Data Un insieme di dati panel contiene osservazioni riguardanti più di un individuo, dove ogni entità è osservata in due o più periodi di tempo. Esempi ipotetici: Dati su 420 distretti
DettagliComputazione per l interazione naturale: Regressione probabilistica
Computazione per l interazione naturale: Regressione probabilistica Corso di Interazione Naturale Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano boccignone@di.unimi.it boccignone.di.unimi.it/in_2016.html
Dettaglilezione 7 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice
DettagliLa statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.
RICHIAMI DI STATISTICA La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. Quale è la media della distribuzione del reddito dei neolaureati? Per rispondere dovremmo
DettagliMetodi statistici per la ricerca sociale Capitolo 15. Regressione logistica: modellare variabili risposta categoriali
Metodi statistici per la ricerca sociale Capitolo 15. Regressione logistica: modellare variabili risposta categoriali Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università
DettagliUniversità di Pavia Econometria Esercizi 5
Università di Pavia Econometria 2007-2008 Esercizi 5 Maggio, 2008 1. Una regressione lineare multipla di y su una costante, x 2 e x 3 produce i seguenti risultati: ŷ t = 4 + 0.4x t2 + 0.9x t3 con X X =
DettagliMetodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello
Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le
DettagliECONOMETRIA APPLICATA PER L IMPRESA. Test di Radici Unitarie - Esercizio 5
Modelli Dinamici - Esercizio 5 1 ECONOMETRIA APPLICATA PER L IMPRESA Test di Radici Unitarie - Esercizio 5 Davide Raggi davide.raggi@unibo.it 16 marzo 2010 Modelli Dinamici - Esercizio 5 2 Introduzione
DettagliStatistica Applicata all edilizia: Stime e stimatori
Statistica Applicata all edilizia E-mail: orietta.nicolis@unibg.it 15 marzo 2011 Statistica Applicata all edilizia: Indice 1 2 Statistica Applicata all edilizia: Uno dei problemi principali della statistica
Dettagli0 altimenti 1 soggetto trova lavoroentro 6 mesi}
Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta
DettagliFunzioni di Regressioni Non Lineari
Funzioni di Regressioni Non Lineari Nelle precedenti lezioni abbiamo assunto che le funzioni di regressione della popolazione siano lineari. Cioè che l effetto su Y di una variazione unitaria di X non
DettagliFunzioni di regressione non lineari
Funzioni di regressione non lineari Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2013 Rossi Regressione nonlineare Econometria - 2013 1 / 25 Sommario Funzioni di regressione non lineari - note
Dettaglilezione 13 AA Paolo Brunori
AA 2016-2017 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci
DettagliCorso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti
Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti Professor Paolo Vitale Anno Accademico 2017-8 UdA, Scuola d Economia Domanda 1 [6 punti]. (a) La multi-collineartità
DettagliSTATISTICA. Regressione-3 L inferenza per il modello lineare semplice
STATISTICA Regressione-3 L inferenza per il modello lineare semplice Regressione lineare: GRAFICO DI DISPERSIONE & & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione
Dettagli1. variabili dicotomiche: 2 sole categorie A e B
Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili
DettagliESERCITAZIONE ANCOVA
ESERCITAZIONE ANCOVA I dati provengono da un articolo di Cyril Burt del 1996 intitolato The genetic determination of differences in intelligence: A study of monozygotic twins reared apart. I dati contengono
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
Dettaglilezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
DettagliUniversità di Pavia Econometria. Richiami di Statistica. Eduardo Rossi
Università di Pavia Econometria Richiami di Statistica Eduardo Rossi Università di Pavia Campione casuale Siano (Y 1, Y 2,..., Y N ) variabili casuali tali che le y i siano realizzazioni mutuamente indipendenti
Dettaglilezione 9 AA Paolo Brunori
AA 2016-2017 Paolo Brunori Dove siamo arrivati? - la regressione lineare multipla ci permette di stimare l effetto della variabile X sulla Y tenendo ferme tutte le altre variabili osservabili che hanno
DettagliFACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011
FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi
DettagliMinimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi
Minimi quadrati ordinari Interpretazione geometrica Eduardo Rossi Il MRLM Il modello di regressione lineare multipla è usato per studiare le relazioni tra la variabile dipendente e diverse variabili indipendenti
DettagliMODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,
MODELLO DI REGRESSIONE LINEARE le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, teorema di Gauss-Markov, verifica di ipotesi e test di
DettagliComputazione per l interazione naturale: Regressione probabilistica
Computazione per l interazione naturale: Regressione probabilistica Corso di Interazione Naturale Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano boccignone@di.unimi.it boccignone.di.unimi.it/in_2017.html
DettagliRichiami di Statistica
Università di Pavia Richiami di Statistica Eduardo Rossi Popolazione e campione casuale Un idea centrale della statistica è che un campione sia una rappresentazione della popolazione. Si possono sfruttare
DettagliMultiple Logistic Regression
Multiple Logistic Regression f(- ) Logistic function ( ) + e 0 + e /2 0 f( + ) (+ ) + e + e +. ก. ก Fitting Multiple Logistic Regression ก (Outcome, Dependent, Response) discrete (two
DettagliMetodi Statistici per il Management
Metodi Statistici per il Management Statistica Multivariata I Simone Borra - Roberto Rocci Introduzione e obiettivi La statistica multivariata si occupa di analizzare e studiare in modo simultaneo un set
DettagliRegressione logistica. Strumenti quantitativi per la gestione
Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/4a_rlg.html#(22) 1/28 Metodi di classificazione I
DettagliInferenza su una popolazione
Inferenza su una popolazione La distribuzione di x(m) ha media pari a μ, quindi x(m) è uno stimatore non distorto della media della popolazione μ. Per fare inferenza sulla media dobbiamo avere un CCS,
DettagliDispensa di Statistica
Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza
DettagliStima dei parametri. La v.c. multipla (X 1, X 2,.., X n ) ha probabilità (o densità): Le f( ) sono uguali per tutte le v.c.
Stima dei parametri Sia il carattere X rappresentato da una variabile casuale (v.c.) che si distribuisce secondo la funzione di probabilità f(x). Per investigare su tale carattere si estrae un campione
DettagliUniversità di Pavia Econometria. Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi
Università di Pavia Econometria Minimi quadrati ordinari Interpretazione geometrica Eduardo Rossi Università di Pavia Introduzione L econometria si interessa all analisi dei dati economici. I dati economici
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliUniversità del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Intervalli di confidenza
Università del Piemonte Orientale Corsi di laurea triennale di area tecnica Corso di Statistica Medica Intervalli di confidenza Corsi di laurea triennale di area tecnica - Corso di Statistica Medica -
DettagliComputazione per l interazione naturale: Regressione probabilistica
Computazione per l interazione naturale: Regressione probabilistica Corso di Interazione Naturale Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano boccignone@di.unimi.it boccignone.di.unimi.it/in_2018.html
Dettaglilezione 10 AA Paolo Brunori
AA 2016-2017 Paolo Brunori Redditi svedesi - il dataset contiene i dati di reddito di 838 individui - il dataset contiene le variabili: sex = sesso age = età edu = anni di istruzione y_gross = reddito
Dettaglilezione 8 AA Paolo Brunori
AA 2016-2017 Paolo Brunori regressione multipla con n = k Immaginate di voler studiare i determinanti del voto all esame di econometria Y = β 1 X 1 + u Y i = β 1 H i + u i H=ore studiate alla settimana
DettagliCampionamento. Una grandezza fisica e' distribuita secondo una certa PDF
Campionamento Una grandezza fisica e' distribuita secondo una certa PDF La pdf e' caratterizzata da determinati parametri Non abbiamo una conoscenza diretta della pdf Possiamo determinare una distribuzione
DettagliStima dell intervallo per un parametro
Stima dell intervallo per un parametro In aggiunta alla stima puntuale di un parametro dobbiamo dare l intervallo che rappresenta l incertezza statistica. Questo intervallo deve: comunicare in modo obbiettivo
DettagliRegressione lineare multipla
Regressione lineare multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2014 Rossi Regressione lineare Econometria - 2014 1 / 31 Outline 1 La distorsione da variabili omesse 2 Causalità 3 Misure
DettagliCorso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano
Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione
DettagliUniversità del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Intervalli di confidenza
Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso
DettagliLaudatio. pronunciata dal Professor Franco Peracchi in occasione della Laurea Honoris Causa al Professor Charles F. Manski
Laudatio pronunciata dal Professor Franco Peracchi in occasione della Laurea Honoris Causa al Professor Charles F. Manski Tor Vergata, 24 maggio 2006 Il conferimento della Laurea Honoris Causa al Professor
Dettaglilezione 11 AA Paolo Brunori
AA 2016-2017 Paolo Brunori Cos è successo in US? - andamento dei sondaggi Come si prevede un risultato elettorale? - Y = β i X i + u - quali variabili includedereste nel modello? - perchè hanno sbagliato?
DettagliOld Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.
Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful
DettagliAnalisi di Regressione Multivariata. β matrice incognita dei coeff. di regressione (regr. lineare in β)
Analisi di Regressione Multivariata Regressione: metodologia per dedurre info e per anticipare risposte di una variabile dip. Modello classico di regressione lineare: Y {z} n k = {z} X β + ρ {z} {z} n
DettagliCapitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
DettagliStatistica multivariata! Analisi fattoriale
Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Statistica multivariata! Analisi
DettagliECONOMETRIA: Laboratorio I
ECONOMETRIA: Laboratorio I Luca De Angelis CLASS - Università di Bologna Programma Laboratorio I Valori attesi e varianze Test di ipotesi Stima di un modello lineare attraverso OLS Valore atteso Data una
DettagliIL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA
Metodi per l Analisi dei Dati Sperimentali AA009/010 IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Sommario Massima Verosimiglianza Introduzione La Massima Verosimiglianza Esempio 1: una sola misura sperimentale
Dettagli1.1 Obiettivi della statistica Struttura del testo 2
Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza
DettagliQuiz di verifica Classificazione
Quiz di verifica Classificazione Strumenti Quantitativi per la gestione Le domande 1 4 si riferiscono al seguente problema: Supponiamo di raccogliere dati per un gruppo di studenti della classe di SQG
DettagliElementi di Psicometria con Laboratorio di SPSS 1
Elementi di Psicometria con Laboratorio di SPSS 1 28-Intervalli di confidenza vers. 1.1 (21 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca
DettagliSTATISTICA. Inferenza: Stima & Intervalli di confidenza, 1
STATISTICA Inferenza: Stima & Intervalli di confidenza, 1 Inferenza per la media Siano,,, variabili casuali i.i.d media campionaria: v.c. che predice il valore della media aritmetica dei dati nel campione
DettagliPROBABILITÀ ELEMENTARE
Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti
Dettagli5. Per determinare il miglior grado del polinomio di una regressione polimoniale
Principi di Econometria 55 di tempo prof. Brunori Nome e cognome 16/01/2017 Matricola versione A Potete consegnare solo le risposte multiple o sia le risposte multiple che quelle aperte. Nel secondo caso
DettagliEsperimentazioni di Fisica 1. Prova d esame del 20 febbraio 2018 SOLUZIONI
Esperimentazioni di Fisica 1 Prova d esame del 20 febbraio 2018 SOLUZIONI Esp-1-Soluzioni - - Page 2 of 6 01/02/2018 1. (12 Punti) Quesito. In un esperimento è stata misurata la grandezza Y in funzione
DettagliUniversità di Siena. Teoria della Stima. Lucidi del corso di. Identificazione e Analisi dei Dati A.A
Università di Siena Teoria della Stima Lucidi del corso di A.A. 2002-2003 Università di Siena 1 Indice Approcci al problema della stima Stima parametrica Stima bayesiana Proprietà degli stimatori Stime
DettagliFacoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a.
Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a. 2008 PARTE I 1. Si consideri il seguente modello di regressione lineare su dati cross
Dettaglis a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value
Inferenza: singolo parametro Sistema di ipotesi: H 0 : β j = β j0 H 1 : β j β j0 statistica test t b j - b s a jj j0 > t a, 2 ( n-k) confronto con valore t o p-value Se β j0 = 0 X j non ha nessuna influenza
DettagliUniversity of Messina, Italy
ERRORI CASUALI NELL ANALISI CHIMICA 1 Errori casuali Gli errori casuali si incontrano tutte le volte che un sistema di misura viene usato al massimo della sua sensibilità. In queste circostanze i risultati
DettagliCOGNOME.NOME...MATR..
STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità
DettagliStatistica multivariata
Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire le relazioni
DettagliStatistica multivariata
Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire
DettagliIl modello di regressione lineare multivariata
Il modello di regressione lineare multivariata Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2015 Rossi MRLM Econometria - 2015 1 / 39 Outline 1 Notazione 2 il MRLM - Assunzioni 3 OLS 4 Proprietà
DettagliIl metodo della regressione
Il metodo della regressione Il matching statistico Il matching statistico si basa sull idea di abbinare a ciascun soggetto trattato un soggetto non trattato tendenzialmenre equivalente, ovvero molto simile
DettagliMicroeconometria Day # 3 L. Cembalo. Regressione con due variabili e metodo dei minimi quadrati
Microeconometria Day # 3 L. Cembalo Regressione con due variabili e metodo dei minimi quadrati SRF: sample regression function Il passaggio dalla regressione sulla popolazione a quella sul campione è cruciale
DettagliSTATISTICA ESERCITAZIONE 13
STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla
DettagliSi assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato
Regressione Lineare Semplice Si assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato QUANTITA' DI ALIMENTO PRODUZIONE 2 10 2 9 1.5 5 1 2 1 3 1.5 4 2 7 2 9
DettagliCalcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità
Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte Cap.1: Probabilità 1. Esperimento aleatorio (definizione informale): è un esperimento che a priori può avere diversi esiti possibili
DettagliLuigi Santoro. Hyperphar Group S.p.A., MIlano
Come modellare il rischio Luigi Santoro Hyperphar Group S.p.A., MIlano Gli argomenti discussi Le definizioni del termine rischio L utilità di un modello predittivo di rischio Come costruire modelli predittivi
DettagliPROVA SCRITTA DI STATISTICA (COD COD ) 7 luglio 2005 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A
PROVA SCRITTA DI STATISTICA (COD. 047 - COD. 403-37-377) 7 luglio 200 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A Esercizio (9 punti) Supponiamo di aver osservato la seguente
DettagliPresentazione dell edizione italiana
1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli
Dettagli