Regressione con una variabile dipendente binaria

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Regressione con una variabile dipendente binaria"

Transcript

1 Regressione con una variabile dipendente binaria Fino ad ora abbiamo considerato solo variabili dipendenti countinue: Che succede se Y è binaria? Y = va al college, o no; X = anni di istruzione Y = fumatore, o no; X = reddito Y = richiesta di mutuo accettata, o no; X = reddito, caratteristiche della casa, stato civile, etnia 1

2 Es: etnia e richiesta di mutuo The Boston Fed HMDA data set Richieste individuali per mutui fatte nel 1990 nella zona di Boston 2380 observationi Variabili Variabile dipendente: Il mutuo è accettato o rifiutato? Variabili indipendente: reddito, ricchezza, occupazione altri prestiti, caratteristiche di povertà etnia 2

3 Il modello lineare di probabilità Un punto di partenza naturale è una regressione lineare con un singolo regressore: ma: Y i = β 0 + β 1 X i + u i Che significato ha β 1 quando Y è binaria? β 1 = Che senso ha β 0 + β 1 X quando Y è binaria? Che significato ha Y ˆ? Per es., Y ˆ = 0.26? Y X? 3

4 Modello lineare Y i = β 0 + β 1 X i + u i Ass #1: E(u i X i ) = 0, dunque E(Y i X i ) = E(β 0 + β 1 X i + u i X i ) = β 0 + β 1 X i quando Y è binaria, E(Y) = 1 Pr(Y=1) + 0 Pr(Y=0) = Pr(Y=1) dunque E(Y X) = Pr(Y=1 X) 4

5 Quando Y è binaria, il modello di regressione lineare Y i = β 0 + β 1 X i + u i È chiamato modello di probabilità lineare Il valore previsto è una probabilità: E(Y X=x) = Pr(Y=1 X=x) = prob. che Y = 1 dato x ˆ Y = la probabilita prevista che Yi = 1, dato X β 1 = cambiamento nella probabilità che Y = 1 per una dato x: β 1 = Pr( Y = 1 X = x + x ) Pr( Y = 1 X = x ) x 5

6 Es: HMDA data Domande di mutuo non accolte e rapporto fra pagamenti di debiti e reddito (P/I ratio) nei dati HMDA 6

7 Rˆifiuto = PI (n = 2380) (.032) (.098) Qual è il valore previsto quando PI = 0.3? P ( Rifiuto ˆ = 1 PI = 0.3) = =.151 Calcoliamo gli effetti di un incremento di PI da.3 a.4: P ( Rifiuto ˆ = 1 PI = 0.4) = =.212 L effetto sulla probabilità di rifiuto di un cambiamento di PI da 0.3 a 0.4 è pari ad un incremento della probabilità di 0.061, cioè, di 6.1% 7

8 Includiamo un altro regressore, black : Rˆifiuto = PI +.177black (.032) (.098) (.025) Probabilità prevista di rifiuto: Per i richiedenti neri con PI = 0.3: P ( Rifiuto ˆ = 1) = =.254 Per i bianchi con PI = 0.3: P ( Rifiuto ˆ = 1) = =.077 La differenza =.177 = 17.7 % Il coefficient di black è significativo al 5% Tuttavia ci possono essere ancora delle variabili omesse 8

9 Sommario Modelliamo Pr(Y=1 X) come funzione lineare di X Vantaggi: Semplice da stimare e interpretare Inferenza è la stessa di una regressione multipla Svantaggi: Ha senso imporre che la probabilità è lineare in X? Le probabilità previste possono essere <0 o >1! Questi svantaggi possono essere risolti usando un un modello di probabilità non lineare: probit o logit 9

10 Regressioni Probit e Logit Quando il modello di probabilità di Y=1 è lineare abbiamo: Pr(Y = 1 X) = β 0 + β 1 X D altro canto vorremmo che: 1. 0 Pr(Y = 1 X) 1 per tutte le X 2. Pr(Y = 1 X) deve crescere con X (se β 1 >0) Questo richiede una forma funzionale nonlineare per la probabilità. Come una curva a S 10

11 Un probit soddisfa le 2 condizioni dette sopra 11

12 Regressione Probit: modella la probabilità che Y=1 usando la funzione cumulata di una normale standardizzata quando z = β 0 + β 1 X: Pr(Y = 1 X) = Φ(β 0 + β 1 X) Φ è la funzione cumulata di una normale standardizzata. z = β 0 + β 1 X è il z-value o z-index del modello probit Es: Supponiamo: β 0 = -2, β 1 = 3, X =.4, dunque Pr(Y = 1 X=.4) = Φ( ) = Φ(-0.8) Pr(Y = 1 X=.4) = area sotto la funzione di densità normale a sinistra di z = -.8, graficamente 12

13 Pr(Z -0.8) =

14 Perchè utilizzare la funzione cumulate normale? La forma a S soddisfa le 2 proprietà: 1. 0 Pr(Y = 1 X) 1 per tutti X 2. Pr(Y = 1 X) cresce con X (per β 1 >0) Facile da usare utilizzando le tavole statistiche L interpretazione è abbastanza intuitiva: z-value = β 0 + β 1 X ˆ β 0 + ˆ β 1 X è lo z-value predetto, date le X β 1 misura il cambiamento dello z-value per un cambiamento di una unità in X 14

15 Es. probit deny p_irat, r; Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = We ll discuss this later Probit estimates Number of obs = 2380 Wald chi2(1) = Prob > chi2 = Log likelihood = Pseudo R2 = Robust deny Coef. Std. Err. z P> z [95% Conf. Interval] p_irat _cons ( Rifiuto 1 PI ) ˆ = = Φ( PI) P (.16) (.47) 15

16 ( Rifiuto 1 PI ) ˆ = = Φ( PI) P (.16) (.47) Coefficiente positivo: ha senso? Standard errors ha la solita interpretazione Probabilità prevista: ( Rifiuto ˆ = 1 PI = 0.3) P = Φ( ) = Φ(-1.30) =.097 Effetto del cambamento in PI da 0.3 a 0.4: ( Rifiuto ˆ = 1 PI = 0.4) P = Φ( ) =.159 Probabilità prevista di rifiuto cresce da a

17 Regressione multipla Probit Pr(Y = 1 X 1, X 2 ) = Φ(β 0 + β 1 X 1 + β 2 X 2 ) Φ come prima. z = β 0 + β 1 X 1 + β 2 X 2 come prima β 1 è l effetto su z-valore di un cambiamento di una unità in X 1, tenendo constante X 2 17

18 . probit deny p_irat black, r; Iteration 0: log likelihood = Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Probit estimates Number of obs = 2380 Wald chi2(2) = Prob > chi2 = Log likelihood = Pseudo R2 = Robust deny Coef. Std. Err. z P> z [95% Conf. Interval] p_irat black _cons

19 ( Rifiuto ˆ = 1 PI black ) P, = Φ( PI +.71 black) (.16) (.44) (.08) il coefficiente della variabile black è statisticamente significativo? effetto stimato di black per PI =.3: P ( Rifiuto ˆ = 1 0.3,1) = Φ( ) =.233 P ( Rifiuto ˆ = 1 0.3,0) = Φ( ) =.075 differenza della probabilità di rifiuto =.158 (15.8%) nota che il problema di eventuali variabili omesse non è stato ancora risolto 19

20 Logit Regression Regressione Logit modella la probabilità di che Y=1 come una funzione distribuzione cumulata logistica, valutata a z = β 0 + β 1 X: Pr(Y = 1 X) = F(β 0 + β 1 X) F è una funzione distribuzione cumulata logistica: F(β 0 + β 1 X) = 1+ 1 ( 0 1X ) e β + β 20

21 Pr(Y = 1 X) = F(β 0 + β 1 X) dove F(β 0 + β 1 X) = 1+ 1 ( 0 1X ) e β + β. Es: β 0 = -3, β 1 = 2, X =.4, di conseguenza β 0 + β 1 X = = -2.2 dunque Pr(Y = 1 X=.4) = 1/(1+e ( 2.2) ) =.0998 perchè usare un logit al posto del probit? I calcoli sono più semplici In pratica, logit e probit sono molto simili 21

22 Es. logit deny p_irat black, r; Iteration 0: log likelihood = Later Iteration 1: log likelihood = Iteration 2: log likelihood = Iteration 3: log likelihood = Iteration 4: log likelihood = Logit estimates Number of obs = 2380 Wald chi2(2) = Prob > chi2 = Log likelihood = Pseudo R2 = Robust deny Coef. Std. Err. z P> z [95% Conf. Interval] p_irat black _cons dis "Pred prob, p_irat=.3, white: " > 1/(1+exp(-(_b[_cons]+_b[p_irat]*.3+_b[black]*0))); Pred prob, p_irat=.3, white: NOTE: the probit predicted probability is

23 23

24 Es: Studiamo le caratteristiche di Background dei militanti Hezbollah Fonte: Alan Krueger and Jitka Maleckova, Education, Poverty and Terrorism: Is There a Causal Connection? Journal of Economic Perspectives, 2003, Logit: 1 = individuo morto in un azione militare Hezbollah 24

25 25

26 26

27 Calcoliamo l effetto dell istruzione paragonando le probabilità previste usando i risultati della colonna (3): Pr(Y=1 secondary = 1, poverty = 0, age = 20) Pr(Y=0 secondary = 0, poverty = 0, age = 20): Pr(Y=1 secondary = 1, poverty = 0, age = 20) = 1/[1+e ( ) ] = 1/[1 + e ] = Pr(Y=1 secondary = 0, poverty = 0, age = 20) = 1/[1+e ( ) ] = 1/[1 + e ] =

28 Cambiamento in prob previsto Pr(Y=1 secondary = 1, poverty = 0, age = 20) Pr(Y=1 secondary = 1, poverty = 0, age = 20) = = le conclusioni che seguono sono tutte corrette: la probabilità di essere un militante Hezbollah cresce del %, se la scuola secondaria è stata frequentata. 28

29 Stima e inferenza nei modelli probit e logit modello Probit Pr(Y = 1 X) = Φ(β 0 + β 1 X) stima e inferenza come si stimano β 0 e β 1? qual è la distribuzione campionaria di questi stimatori? perchè usiamo i soliti metodi per fare inferenza? prima di tutto guardiamo al metodo dei minimi quadrati non lineari poi consideriamo il metodo più usato in pratica, quello della funzione di massimoverosimiglianza (maximum 29

30 Nonlinear Least Squares (NLS) OLS: n min [ Y ( b + b X )] b0, b1 i 0 1 i i= 1 il risultato sono gli stimatori OLS ˆ β 0 e ˆ β 1 NLS di un probit: n min [ Y Φ ( b + b X )] b0, b1 i 0 1 i i= 1 Come risolviamo questo problema di minimizzazione? numericamente usando algoritmi specifici In pratica non viene usato perchè non efficiente

31 Stime di massimoverosimiglianza di Probit La funzione di massimoverosimiglianza è la funzione di densità di Y 1,,Y n date X 1,,X n, trattata come una funzione di parametri sconosciuti β 0 e β 1. Lo stimatore di massimoverosimiglianza (maximum likelihood estimator, MLE) è il valore di (β 0, β 1 ) che massimizza la funzione di massimoverosimiglianza. MLE è quel valore di (β 0, β 1 ) che meglio descrive l intera distribuzione dei dati. In grandi campioni, MLE è: consistente normalmente distribuito efficiente 31

32 La massimoverosimiglianza di un probit con una X Si calcola partendo dalla densità di Y 1, prima osservazione, dato X 1 : Pr(Y 1 = 1 X 1 ) = Φ(β 0 + β 1 X 1 ) Pr(Y 1 = 0 X 1 ) = 1 Φ(β 0 + β 1 X 1 ) dato che le y sono i.i.d., la distribuzione di probabilità condizionata per la osservazione y 1 sarà y1 1 Pr(Y 1 = y 1 X 1 ) = 1 y Φ ( β0 + β1x1) [1 Φ ( β0 + β1x1)] La funzione di massimoverosimiglianza probit è una densità congiunta di Y 1,,Y n date X 1,,X n, trattate come una funzione di β 0, β 1 : f(β 0,β 1 ; Y 1,,Y n X 1,,X n ) Y1 1 Y1 = { Φ ( β0 + β1x1) [1 Φ ( β0 + β1x1)] } Yn 1 Yn { Φ ( β + β X ) [1 Φ ( β + β X )] } 0 1 n 0 1 n 32

33 f(β 0,β 1 ; Y 1,,Y n X 1,,X n ) Y1 1 = { 1 Y Φ ( β0 + β1x1) [1 Φ ( β0 + β1x1)] } Yn 1 Yn { Φ ( β0 + β1x n ) [1 Φ ( β0 + β1x n )] } Non si può risolvere esplicitamente per il massimo Bisogna massimizzare usando metodi numerici In grandi campioni: ˆ β MLE 0, ˆ β MLE 1 sono consistenti ˆ β MLE 0, ˆ β MLE 1 sono normalmente distribuiti ˆ β MLE 0, ˆ β MLE 1 sono asintoticamente efficienti S.E. ˆ β MLE 0, ˆ β MLE 1 sono calcolati automaticamente Test e intervalli di confidenza come al solito 33

34 La funzione ML per un logit la sola differenza fra probit e logit è la forma funzionale usata per la probabilità: al posto di Φ si utilizza una funzione cumulata logisitca. come per il probit, ˆ β MLE 0, ˆ β MLE 1 sono consistenti ˆ MLE 0 ˆ MLE β, β 1 sono normalmente distribuiti gli SE possono essere calcolati test e intervalli di confidenza come al solito 34

35 Misure di bontà della regressioneper logit e probit R 2 2 e R non hanno senso in questo contesto, dunque si usano: 1. La frazione correttamente prevista. Dato che se Y i =1 e la probabilità predetta è >50% o se se Y i =0 e e la probabilità predetta è <50% allora Y i è predetto correttamente. La fpc è la frazione delle n osservazioni che sono predette correttamente 2. Lo pseudo-r 2 che utilizza la funzione di massimoverosimiglianza: misura di quanto migliora il valore del log della massimoverosimiglianza, rispetto al caso in cui non ci sono X 35

36 Esempio Dati MDA Mutui per la casa sono una parte essenziale dell acquisto di una casa. c è differenza fra le etnie? c è differenza nella probabilità di rifiuto? 36

37 The HMDA Data Set in lab Dati sulle caratteristiche individuali, caratteristiche della proprietà richesta di mutuo : la banca decide cercando di tenere basso il più possibile il rischio 37

38 La decisione della banca variabili finanziarie chiave: P/I housing expense-to-income ratio loan-to-value ratio personal credit history la regola per prendere la decisione è non lineare: loan-to-value ratio > 80% loan-to-value ratio > 95% credit score 38

39 Regressione Pr(Rifiuto=1 black, altre X) = modello di probabilità lineare probit probabile bias da variabili omesse che (i) potrebbero essere incluse nella funzione di decisione della banca (ii) potrebbero essere correlate con la variabile dell etnia: ricchezza, tipo di occupazione storia del credito stato di famiglia 39

40 40

41 41

42 42

43 Table 11.2, ctd. 43

44 Table 11.2, ctd. 44

45 Sommario I coefficienti sulle variabili finanziarie hanno senso. Black è sempre statisticamente significativo le interazioni non sono significative. includere altre variabili riduce l effetto dell etnia sulla probabilità di rifiuto. Modello di probabilità lineare, probit, logit: stime simili sull effetto dell etnia. 45

46 Minacce alla validità interna ed esterna validità interna 1. bias dovuto a variabili omesse 2. forma funzionale errata (no) 3. errore di misurazione (no) 4. selezione del campione 5. simultaneous causality (no) validità esterna tutto ciò è valido per Boston nel , possiamo assumere che sia ancora valido oggi? 46

47 Sommario Se Y i è binaria, allora E(Y X) = Pr(Y=1 X) Tre modelli: Modello Lineare di Probabilità probit logit LPM, probit, logit forniscono valori di probabilità previste L effetto di X è il cambiamento nella probabilità condizionata che Y=1. Probit e logit sono stimeti con ML I coefficienti sono normalmente distribuiti per grandi n Test di ipotesi, intervalli di confidenza come sempre 47

Regressioni Non Lineari

Regressioni Non Lineari Regressioni Non Lineari Fino ad ora abbiamo solo considerato realazioni lineari Ma le relazioni lineari non costituiscono sempre le migliori approssimazioni La regressione multipla può anche essere formulata

Dettagli

Regressione lineare con un solo regressore

Regressione lineare con un solo regressore Regressione lineare con un solo regressore La regressione lineare è uno strumento che ci permette di stimare e di fare inferenza sui coefficienti incogniti di una retta. Lo scopo principale è di stimare

Dettagli

Econometria. lezione 17. variabili dipendenti binarie. Econometria. lezione 17. AA 2014-2015 Paolo Brunori

Econometria. lezione 17. variabili dipendenti binarie. Econometria. lezione 17. AA 2014-2015 Paolo Brunori AA 2014-2015 Paolo Brunori domande di mutui rigettate - nei dati raccolti a Boston negli anni 90 il tasso di rifiuto è 28% per i neri e 9% per i bianchi - si può parlare di discriminazione? - è possibili

Dettagli

Regressione Lineare con regressori multipli

Regressione Lineare con regressori multipli Regressione Lineare con regressori multipli L idea chiave della regressione multipla è che, se sono disponibili i dati sulle variabili omesse, possiamo aggiungerle come regressori addizionali. In altre

Dettagli

Modelli Statistici per l Economia. Regressione lineare con un singolo regressore (terza parte)

Modelli Statistici per l Economia. Regressione lineare con un singolo regressore (terza parte) Modelli Statistici per l Economia Regressione lineare con un singolo regressore (terza parte) 1 Verifica di ipotesi su β 1 H 0 : β 1 = β 1,0 H 1 : β 1 β 1,0 Se è vera H 0 (cioè sotto H 0 ) e n è grande,

Dettagli

0.1 Veri ca di ipotesi

0.1 Veri ca di ipotesi 0.1 Veri ca di ipotesi Test bilaterale Sistema di ipotesi h H 0 : k = 0 k H 1 : k 6= 0 k Dalla quarta proprieta OLS per il singolo coe ciente b N(; 2 (X 0 X) 1 ) b k N( k ; 2 c kk ) =) b k k q 2 c kk N(0;

Dettagli

ESERCITAZIONE REGRESSIONE MULTIPLA

ESERCITAZIONE REGRESSIONE MULTIPLA ESERCITAZIONE REGRESSIONE MULTIPLA Dati delle Nazioni Unite del 2005 riferiti, per diverse nazioni, al tasso di feconditá (bambini per donna) (variabile Fert), alla percentuale di donne che usa contraccettivi

Dettagli

lezione 4 AA Paolo Brunori

lezione 4 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - abbiamo individuato la regressione lineare semplice (OLS) come modo immediato per sintetizzare una relazione fra una variabile dipendente (Y) e una indipendente

Dettagli

La likelihood. , x 2. } sia prodotto a partire dal particolare valore di a: ; a... f x N. La probabilità che l'i ma misura sia compresa tra x i

La likelihood. , x 2. } sia prodotto a partire dal particolare valore di a: ; a... f x N. La probabilità che l'i ma misura sia compresa tra x i La likelihood E' dato un set di misure {x 1, x 2, x 3,...x N } (ciascuna delle quali puo' essere multidimensionale) Supponiamo che la pdf (f) dipenda da un parametro a (anch'esso eventualmente multidimensionale)

Dettagli

Analisi di Regressione Multipla

Analisi di Regressione Multipla Analisi di Regressione Multipla Stima OLS della relazione Test Score/STR : TestScore! = 698.9.8 STR, R =.05, SER = 18.6 (10.4) (0.5) E una stima credibile dell effetto causale sul rendimento nei test di

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Statistica per le ricerche di mercato. 16. Il modello di regressione logistica: definizione, specificazione e

Statistica per le ricerche di mercato. 16. Il modello di regressione logistica: definizione, specificazione e Statistica per le ricerche di mercato A.A. 2011/12 Prof.ssa Tiziana Laureti Dott. Luca Secondi 16. Il modello di regressione logistica: definizione, specificazione e stima L analisi delle variabili dipendenti

Dettagli

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016 Esame di Statistica 0 o CFU) CLEF febbraio 06 Esercizio Si considerino i seguenti dati, relativi a 00 clienti di una banca a cui è stato concesso un prestito, classificati per età e per esito dell operazione

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Metodi Statistici per il Management

Metodi Statistici per il Management Metodi Statistici per il Management Modelli statistici di dipendenza Simone Borra - Roberto Rocci Modelli statistici di dipendenza Modelli: strutture formali che hanno l obiettivo di descrivere, spiegare

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

Schema della lezione. 1. Non correttezza ( bias ) dovuta a variabili omesse

Schema della lezione. 1. Non correttezza ( bias ) dovuta a variabili omesse Schema della lezione 1. Non correttezza ( bias ) dovuta a variabili omesse 2. Causalità e analsi di regressione 3. Regressione multipla e OLS 4. Misure di bontà della regressione 5. Distribuzione campionaria

Dettagli

Modelli per variabili dipendenti limitate. Amedeo Argentiero.

Modelli per variabili dipendenti limitate. Amedeo Argentiero. Modelli per variabili dipendenti limitate Amedeo Argentiero amedeo.argentiero@unipg.it Problema 1. Si desidera stimare la probabilità di accadimento di un evento (essere disoccupato, probabilità di sposarsi,

Dettagli

Analisi della regressione multipla

Analisi della regressione multipla Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,

Dettagli

Introduzione alla Regressione Logistica

Introduzione alla Regressione Logistica Introduzione alla Regressione Logistica Contenuto regressione lineare semplice e multipla regressione logistica lineare semplice La funzione logistica Stima dei parametri Interpretazione dei coefficienti

Dettagli

Stima dei parametri. I parametri di una pdf sono costanti che caratterizzano la sua forma. r.v. parameter. Assumiamo di avere un campione di valori

Stima dei parametri. I parametri di una pdf sono costanti che caratterizzano la sua forma. r.v. parameter. Assumiamo di avere un campione di valori Stima dei parametri I parametri di una pdf sono costanti che caratterizzano la sua forma r.v. parameter Assumiamo di avere un campione di valori Vogliamo una funzione dei dati che permette di stimare i

Dettagli

Il modello di regressione lineare multipla

Il modello di regressione lineare multipla Il modello di regressione lineare multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2014 Rossi MRLM Econometria - 2014 1 / 31 Outline 1 Notazione 2 3 Collinearità Rossi MRLM Econometria - 2014

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

Regressioni con Panel Data

Regressioni con Panel Data Regressioni con Panel Data Un insieme di dati panel contiene osservazioni riguardanti più di un individuo, dove ogni entità è osservata in due o più periodi di tempo. Esempi ipotetici: Dati su 420 distretti

Dettagli

Computazione per l interazione naturale: Regressione probabilistica

Computazione per l interazione naturale: Regressione probabilistica Computazione per l interazione naturale: Regressione probabilistica Corso di Interazione Naturale Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano boccignone@di.unimi.it boccignone.di.unimi.it/in_2016.html

Dettagli

lezione 7 AA Paolo Brunori

lezione 7 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice

Dettagli

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. RICHIAMI DI STATISTICA La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. Quale è la media della distribuzione del reddito dei neolaureati? Per rispondere dovremmo

Dettagli

Metodi statistici per la ricerca sociale Capitolo 15. Regressione logistica: modellare variabili risposta categoriali

Metodi statistici per la ricerca sociale Capitolo 15. Regressione logistica: modellare variabili risposta categoriali Metodi statistici per la ricerca sociale Capitolo 15. Regressione logistica: modellare variabili risposta categoriali Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università

Dettagli

Università di Pavia Econometria Esercizi 5

Università di Pavia Econometria Esercizi 5 Università di Pavia Econometria 2007-2008 Esercizi 5 Maggio, 2008 1. Una regressione lineare multipla di y su una costante, x 2 e x 3 produce i seguenti risultati: ŷ t = 4 + 0.4x t2 + 0.9x t3 con X X =

Dettagli

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello 1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le

Dettagli

ECONOMETRIA APPLICATA PER L IMPRESA. Test di Radici Unitarie - Esercizio 5

ECONOMETRIA APPLICATA PER L IMPRESA. Test di Radici Unitarie - Esercizio 5 Modelli Dinamici - Esercizio 5 1 ECONOMETRIA APPLICATA PER L IMPRESA Test di Radici Unitarie - Esercizio 5 Davide Raggi davide.raggi@unibo.it 16 marzo 2010 Modelli Dinamici - Esercizio 5 2 Introduzione

Dettagli

Statistica Applicata all edilizia: Stime e stimatori

Statistica Applicata all edilizia: Stime e stimatori Statistica Applicata all edilizia E-mail: orietta.nicolis@unibg.it 15 marzo 2011 Statistica Applicata all edilizia: Indice 1 2 Statistica Applicata all edilizia: Uno dei problemi principali della statistica

Dettagli

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

0 altimenti 1 soggetto trova lavoroentro 6 mesi} Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta

Dettagli

Funzioni di Regressioni Non Lineari

Funzioni di Regressioni Non Lineari Funzioni di Regressioni Non Lineari Nelle precedenti lezioni abbiamo assunto che le funzioni di regressione della popolazione siano lineari. Cioè che l effetto su Y di una variazione unitaria di X non

Dettagli

Funzioni di regressione non lineari

Funzioni di regressione non lineari Funzioni di regressione non lineari Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2013 Rossi Regressione nonlineare Econometria - 2013 1 / 25 Sommario Funzioni di regressione non lineari - note

Dettagli

lezione 13 AA Paolo Brunori

lezione 13 AA Paolo Brunori AA 2016-2017 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci

Dettagli

Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti

Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti Corso di Laurea: Numero di Matricola: Esame del 31 maggio 2018 Tempo consentito: 120 minuti Professor Paolo Vitale Anno Accademico 2017-8 UdA, Scuola d Economia Domanda 1 [6 punti]. (a) La multi-collineartità

Dettagli

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice STATISTICA Regressione-3 L inferenza per il modello lineare semplice Regressione lineare: GRAFICO DI DISPERSIONE & & analisi residui A. Valutazione preliminare se una retta possa essere una buona approssimazione

Dettagli

1. variabili dicotomiche: 2 sole categorie A e B

1. variabili dicotomiche: 2 sole categorie A e B Variabile X su scala qualitativa (due categorie) modello di regressione: variabili quantitative misurate almeno su scala intervallo (meglio se Y è di questo tipo e preferibilmente anche le X i ) variabili

Dettagli

ESERCITAZIONE ANCOVA

ESERCITAZIONE ANCOVA ESERCITAZIONE ANCOVA I dati provengono da un articolo di Cyril Burt del 1996 intitolato The genetic determination of differences in intelligence: A study of monozygotic twins reared apart. I dati contengono

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi

Università di Pavia Econometria. Richiami di Statistica. Eduardo Rossi Università di Pavia Econometria Richiami di Statistica Eduardo Rossi Università di Pavia Campione casuale Siano (Y 1, Y 2,..., Y N ) variabili casuali tali che le y i siano realizzazioni mutuamente indipendenti

Dettagli

lezione 9 AA Paolo Brunori

lezione 9 AA Paolo Brunori AA 2016-2017 Paolo Brunori Dove siamo arrivati? - la regressione lineare multipla ci permette di stimare l effetto della variabile X sulla Y tenendo ferme tutte le altre variabili osservabili che hanno

Dettagli

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011 FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 1/9/11 ESERCIZIO 1 (+3++3) La seguente tabella riporta la distribuzione di frequenza dei valori di emoglobina nel sangue (espressi

Dettagli

Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi

Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi Minimi quadrati ordinari Interpretazione geometrica Eduardo Rossi Il MRLM Il modello di regressione lineare multipla è usato per studiare le relazioni tra la variabile dipendente e diverse variabili indipendenti

Dettagli

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, MODELLO DI REGRESSIONE LINEARE le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, teorema di Gauss-Markov, verifica di ipotesi e test di

Dettagli

Computazione per l interazione naturale: Regressione probabilistica

Computazione per l interazione naturale: Regressione probabilistica Computazione per l interazione naturale: Regressione probabilistica Corso di Interazione Naturale Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano boccignone@di.unimi.it boccignone.di.unimi.it/in_2017.html

Dettagli

Richiami di Statistica

Richiami di Statistica Università di Pavia Richiami di Statistica Eduardo Rossi Popolazione e campione casuale Un idea centrale della statistica è che un campione sia una rappresentazione della popolazione. Si possono sfruttare

Dettagli

Multiple Logistic Regression

Multiple Logistic Regression Multiple Logistic Regression f(- ) Logistic function ( ) + e 0 + e /2 0 f( + ) (+ ) + e + e +. ก. ก Fitting Multiple Logistic Regression ก (Outcome, Dependent, Response) discrete (two

Dettagli

Metodi Statistici per il Management

Metodi Statistici per il Management Metodi Statistici per il Management Statistica Multivariata I Simone Borra - Roberto Rocci Introduzione e obiettivi La statistica multivariata si occupa di analizzare e studiare in modo simultaneo un set

Dettagli

Regressione logistica. Strumenti quantitativi per la gestione

Regressione logistica. Strumenti quantitativi per la gestione Regressione logistica Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/google%20drive/2%20corsi/3%20sqg/classes/4a_rlg.html#(22) 1/28 Metodi di classificazione I

Dettagli

Inferenza su una popolazione

Inferenza su una popolazione Inferenza su una popolazione La distribuzione di x(m) ha media pari a μ, quindi x(m) è uno stimatore non distorto della media della popolazione μ. Per fare inferenza sulla media dobbiamo avere un CCS,

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

Stima dei parametri. La v.c. multipla (X 1, X 2,.., X n ) ha probabilità (o densità): Le f( ) sono uguali per tutte le v.c.

Stima dei parametri. La v.c. multipla (X 1, X 2,.., X n ) ha probabilità (o densità): Le f( ) sono uguali per tutte le v.c. Stima dei parametri Sia il carattere X rappresentato da una variabile casuale (v.c.) che si distribuisce secondo la funzione di probabilità f(x). Per investigare su tale carattere si estrae un campione

Dettagli

Università di Pavia Econometria. Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi

Università di Pavia Econometria. Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi Università di Pavia Econometria Minimi quadrati ordinari Interpretazione geometrica Eduardo Rossi Università di Pavia Introduzione L econometria si interessa all analisi dei dati economici. I dati economici

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Intervalli di confidenza

Università del Piemonte Orientale. Corsi di laurea triennale di area tecnica. Corso di Statistica Medica. Intervalli di confidenza Università del Piemonte Orientale Corsi di laurea triennale di area tecnica Corso di Statistica Medica Intervalli di confidenza Corsi di laurea triennale di area tecnica - Corso di Statistica Medica -

Dettagli

Computazione per l interazione naturale: Regressione probabilistica

Computazione per l interazione naturale: Regressione probabilistica Computazione per l interazione naturale: Regressione probabilistica Corso di Interazione Naturale Prof. Giuseppe Boccignone Dipartimento di Informatica Università di Milano boccignone@di.unimi.it boccignone.di.unimi.it/in_2018.html

Dettagli

lezione 10 AA Paolo Brunori

lezione 10 AA Paolo Brunori AA 2016-2017 Paolo Brunori Redditi svedesi - il dataset contiene i dati di reddito di 838 individui - il dataset contiene le variabili: sex = sesso age = età edu = anni di istruzione y_gross = reddito

Dettagli

lezione 8 AA Paolo Brunori

lezione 8 AA Paolo Brunori AA 2016-2017 Paolo Brunori regressione multipla con n = k Immaginate di voler studiare i determinanti del voto all esame di econometria Y = β 1 X 1 + u Y i = β 1 H i + u i H=ore studiate alla settimana

Dettagli

Campionamento. Una grandezza fisica e' distribuita secondo una certa PDF

Campionamento. Una grandezza fisica e' distribuita secondo una certa PDF Campionamento Una grandezza fisica e' distribuita secondo una certa PDF La pdf e' caratterizzata da determinati parametri Non abbiamo una conoscenza diretta della pdf Possiamo determinare una distribuzione

Dettagli

Stima dell intervallo per un parametro

Stima dell intervallo per un parametro Stima dell intervallo per un parametro In aggiunta alla stima puntuale di un parametro dobbiamo dare l intervallo che rappresenta l incertezza statistica. Questo intervallo deve: comunicare in modo obbiettivo

Dettagli

Regressione lineare multipla

Regressione lineare multipla Regressione lineare multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2014 Rossi Regressione lineare Econometria - 2014 1 / 31 Outline 1 La distorsione da variabili omesse 2 Causalità 3 Misure

Dettagli

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano Corso di STATISTICA EGA - Classe 1 aa 2017-2018 Docenti: Luca Frigau, Claudio Conversano Il corso è organizzato in 36 incontri, per un totale di 72 ore di lezione. Sono previste 18 ore di esercitazione

Dettagli

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Intervalli di confidenza

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso di Statistica Medica Intervalli di confidenza Università del Piemonte Orientale Corso di laurea in medicina e chirurgia Corso

Dettagli

Laudatio. pronunciata dal Professor Franco Peracchi in occasione della Laurea Honoris Causa al Professor Charles F. Manski

Laudatio. pronunciata dal Professor Franco Peracchi in occasione della Laurea Honoris Causa al Professor Charles F. Manski Laudatio pronunciata dal Professor Franco Peracchi in occasione della Laurea Honoris Causa al Professor Charles F. Manski Tor Vergata, 24 maggio 2006 Il conferimento della Laurea Honoris Causa al Professor

Dettagli

lezione 11 AA Paolo Brunori

lezione 11 AA Paolo Brunori AA 2016-2017 Paolo Brunori Cos è successo in US? - andamento dei sondaggi Come si prevede un risultato elettorale? - Y = β i X i + u - quali variabili includedereste nel modello? - perchè hanno sbagliato?

Dettagli

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione. Coppie o vettori di dati Spesso i dati osservati sono di tipo vettoriale. Ad esempio studiamo 222 osservazioni relative alle eruzioni del geyser Old Faithful. Old Faithful, Yellowstone Park. Old Faithful

Dettagli

Analisi di Regressione Multivariata. β matrice incognita dei coeff. di regressione (regr. lineare in β)

Analisi di Regressione Multivariata. β matrice incognita dei coeff. di regressione (regr. lineare in β) Analisi di Regressione Multivariata Regressione: metodologia per dedurre info e per anticipare risposte di una variabile dip. Modello classico di regressione lineare: Y {z} n k = {z} X β + ρ {z} {z} n

Dettagli

Capitolo 12 La regressione lineare semplice

Capitolo 12 La regressione lineare semplice Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università

Dettagli

Statistica multivariata! Analisi fattoriale

Statistica multivariata! Analisi fattoriale Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Statistica multivariata! Analisi

Dettagli

ECONOMETRIA: Laboratorio I

ECONOMETRIA: Laboratorio I ECONOMETRIA: Laboratorio I Luca De Angelis CLASS - Università di Bologna Programma Laboratorio I Valori attesi e varianze Test di ipotesi Stima di un modello lineare attraverso OLS Valore atteso Data una

Dettagli

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Metodi per l Analisi dei Dati Sperimentali AA009/010 IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Sommario Massima Verosimiglianza Introduzione La Massima Verosimiglianza Esempio 1: una sola misura sperimentale

Dettagli

1.1 Obiettivi della statistica Struttura del testo 2

1.1 Obiettivi della statistica Struttura del testo 2 Prefazione XV 1 Introduzione 1.1 Obiettivi della statistica 1 1.2 Struttura del testo 2 2 Distribuzioni di frequenza 2.1 Informazione statistica e rilevazione dei dati 5 2.2 Distribuzioni di frequenza

Dettagli

Quiz di verifica Classificazione

Quiz di verifica Classificazione Quiz di verifica Classificazione Strumenti Quantitativi per la gestione Le domande 1 4 si riferiscono al seguente problema: Supponiamo di raccogliere dati per un gruppo di studenti della classe di SQG

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 28-Intervalli di confidenza vers. 1.1 (21 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca

Dettagli

STATISTICA. Inferenza: Stima & Intervalli di confidenza, 1

STATISTICA. Inferenza: Stima & Intervalli di confidenza, 1 STATISTICA Inferenza: Stima & Intervalli di confidenza, 1 Inferenza per la media Siano,,, variabili casuali i.i.d media campionaria: v.c. che predice il valore della media aritmetica dei dati nel campione

Dettagli

PROBABILITÀ ELEMENTARE

PROBABILITÀ ELEMENTARE Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti

Dettagli

5. Per determinare il miglior grado del polinomio di una regressione polimoniale

5. Per determinare il miglior grado del polinomio di una regressione polimoniale Principi di Econometria 55 di tempo prof. Brunori Nome e cognome 16/01/2017 Matricola versione A Potete consegnare solo le risposte multiple o sia le risposte multiple che quelle aperte. Nel secondo caso

Dettagli

Esperimentazioni di Fisica 1. Prova d esame del 20 febbraio 2018 SOLUZIONI

Esperimentazioni di Fisica 1. Prova d esame del 20 febbraio 2018 SOLUZIONI Esperimentazioni di Fisica 1 Prova d esame del 20 febbraio 2018 SOLUZIONI Esp-1-Soluzioni - - Page 2 of 6 01/02/2018 1. (12 Punti) Quesito. In un esperimento è stata misurata la grandezza Y in funzione

Dettagli

Università di Siena. Teoria della Stima. Lucidi del corso di. Identificazione e Analisi dei Dati A.A

Università di Siena. Teoria della Stima. Lucidi del corso di. Identificazione e Analisi dei Dati A.A Università di Siena Teoria della Stima Lucidi del corso di A.A. 2002-2003 Università di Siena 1 Indice Approcci al problema della stima Stima parametrica Stima bayesiana Proprietà degli stimatori Stime

Dettagli

Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a.

Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a. Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a. 2008 PARTE I 1. Si consideri il seguente modello di regressione lineare su dati cross

Dettagli

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value Inferenza: singolo parametro Sistema di ipotesi: H 0 : β j = β j0 H 1 : β j β j0 statistica test t b j - b s a jj j0 > t a, 2 ( n-k) confronto con valore t o p-value Se β j0 = 0 X j non ha nessuna influenza

Dettagli

University of Messina, Italy

University of Messina, Italy ERRORI CASUALI NELL ANALISI CHIMICA 1 Errori casuali Gli errori casuali si incontrano tutte le volte che un sistema di misura viene usato al massimo della sua sensibilità. In queste circostanze i risultati

Dettagli

COGNOME.NOME...MATR..

COGNOME.NOME...MATR.. STATISTICA 29.01.15 - PROVA GENERALE (CHALLENGE) Modalità A (A) ai fini della valutazione verranno considerate solo le risposte riportate dallo studente negli appositi riquadri bianchi: in caso di necessità

Dettagli

Statistica multivariata

Statistica multivariata Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire le relazioni

Dettagli

Statistica multivariata

Statistica multivariata Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire

Dettagli

Il modello di regressione lineare multivariata

Il modello di regressione lineare multivariata Il modello di regressione lineare multivariata Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2015 Rossi MRLM Econometria - 2015 1 / 39 Outline 1 Notazione 2 il MRLM - Assunzioni 3 OLS 4 Proprietà

Dettagli

Il metodo della regressione

Il metodo della regressione Il metodo della regressione Il matching statistico Il matching statistico si basa sull idea di abbinare a ciascun soggetto trattato un soggetto non trattato tendenzialmenre equivalente, ovvero molto simile

Dettagli

Microeconometria Day # 3 L. Cembalo. Regressione con due variabili e metodo dei minimi quadrati

Microeconometria Day # 3 L. Cembalo. Regressione con due variabili e metodo dei minimi quadrati Microeconometria Day # 3 L. Cembalo Regressione con due variabili e metodo dei minimi quadrati SRF: sample regression function Il passaggio dalla regressione sulla popolazione a quella sul campione è cruciale

Dettagli

STATISTICA ESERCITAZIONE 13

STATISTICA ESERCITAZIONE 13 STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla

Dettagli

Si assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato

Si assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato Regressione Lineare Semplice Si assuma di avere portato a termine le seguenti rilevazioni di produzione e di alimento somministrato QUANTITA' DI ALIMENTO PRODUZIONE 2 10 2 9 1.5 5 1 2 1 3 1.5 4 2 7 2 9

Dettagli

Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità

Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte Cap.1: Probabilità 1. Esperimento aleatorio (definizione informale): è un esperimento che a priori può avere diversi esiti possibili

Dettagli

Luigi Santoro. Hyperphar Group S.p.A., MIlano

Luigi Santoro. Hyperphar Group S.p.A., MIlano Come modellare il rischio Luigi Santoro Hyperphar Group S.p.A., MIlano Gli argomenti discussi Le definizioni del termine rischio L utilità di un modello predittivo di rischio Come costruire modelli predittivi

Dettagli

PROVA SCRITTA DI STATISTICA (COD COD ) 7 luglio 2005 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A

PROVA SCRITTA DI STATISTICA (COD COD ) 7 luglio 2005 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A PROVA SCRITTA DI STATISTICA (COD. 047 - COD. 403-37-377) 7 luglio 200 APPROSSIMARE TUTTI I CALCOLI ALLA QUARTA CIFRA DECIMALE SOLUZIONI MODALITÀ A Esercizio (9 punti) Supponiamo di aver osservato la seguente

Dettagli

Presentazione dell edizione italiana

Presentazione dell edizione italiana 1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli

Dettagli