Regressione lineare semplice: inferenza

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Regressione lineare semplice: inferenza"

Transcript

1 Regressione lineare semplice: inferenza Eduardo Rossi 2 2 Università di Pavia (Italy) Marzo 2014 Rossi Regressione lineare semplice Econometria / 60

2 Outline 1 Introduzione 2 Verifica di ipotesi 3 Intervalli di confidenza 4 Variabili binarie 5 Omoschedasticità 6 Errori standard con omoschedasticità 7 Teorema di Gauss-Markov Rossi Regressione lineare semplice Econometria / 60

3 Introduzione Sommario L errore standard di ˆβ 1 Verifiche di ipotesi concernenti β 1 Intervalli di confidenza per β 1 La regressione quando X è variabile binaria Eteroschedasticità e omoschedasticità Efficienza OLS e distribuzione t di Student Rossi Regressione lineare semplice Econometria / 60

4 Introduzione Sommario Vogliamo conoscere la pendenza della retta di regressione. Disponiamo dei dati di un campione, perciò sussiste l incertezza dovuta al campionamento. Per raggiungere l obiettivo si procede in cinque passaggi: Definire la popolazione oggetto di interesse Fornire uno stimatore di questa popolazione Derivare la distribuzione campionaria dello stimatore (ciò richiede alcune assunzioni). In grandi campioni questa distribuzione campionaria sarà normale per il TLC. La radice quadrata della varianza stimata della distribuzione campionaria è l errore standard (SE) dello stimatore Utilizzare SE per costruire statistiche- t (per le verifiche di ipotesi) e intervalli di confidenza. Rossi Regressione lineare semplice Econometria / 60

5 Introduzione L oggetto di interesse: β 1 Y i = β 0 + β 1 X i + u i i = 1, 2,..., n β 1 = Y Y per una variazione autonoma in X (effetto casuale). Sotto le assunzioni degli OLS: 1 E[u i X i ] = 0 (prima assunzione) 2 {Y i, X i }, i = 1, 2,..., n sono i.i.d. (seconda assunzione). 3 X, Y hanno momenti quarti finiti non nulli (terza assunzione) Rossi Regressione lineare semplice Econometria / 60

6 Introduzione La distribuzione campionaria di ˆβ 1 Sotto le assunzioni dei minimi quadrati, per n grande, la distribuzione di ˆβ 1 è approssimata da ( σ ˆβ 2 ) v 1 N β 1, n(σx 2 )2 Rossi Regressione lineare semplice Econometria / 60

7 Verifica di ipotesi Verifica di ipotesi ed errore standard L obiettivo è di verificare un ipotesi, quale β 1 = 0, utilizzando i dati - per determinare sperimentalmente se l ipotesi (nulla) è corretta. Impostazione generale Ipotesi nulla e alternativa bilaterale: H 0 : β 1 = β 1,0 vs. H 1 : β 1 β 1,0 dove β 1,0 è il valore ipotizzato sotto l ipotesi nulla. Ipotesi nulla e alternativa unilaterale: H 0 : β 1 = β 1,0 vs. H 1 : β 1 < β 1,0 Rossi Regressione lineare semplice Econometria / 60

8 Verifica di ipotesi Soluzione generale: costruire la statistica-t In generale: t = stimatore valore ipotizzato errore standard dello stimatore dove l SE dello stimatore è la radice quadrata di uno stimatore della varianza dello stimatore. Per verificare la media di Y : t = Ȳ µ Y,0 s Y / n Per verificare β 1 t = ˆβ 1 β 1,0 SE( ˆβ 1 ), dove SE( ˆβ 1 ) è la radice quadrata di uno stimatore della varianza della distribuzione campionaria di ˆβ 1. Rossi Regressione lineare semplice Econometria / 60

9 Verifica di ipotesi Formula per calcolare lo SE( ˆβ 1 ) Si ricordi l espressione per la varianza di (n grande): Var [ ˆβ 1 ] = Var [(X i µ X )u i ] n(σ 2 X )2, dove v i = (X i µ X )u i. Lo stimatore della varianza di ˆβ 1 sostituisce i valori di popolazione ignoti di σv 2 e σx 2 con gli stimatori ricavati dai dati: ˆσ 2ˆβ1 = 1 stimatore di σv 2 n (stimatore di σx 2 )2 i ˆv2 i = 1 n [ 1 n 1 n 2 i (X i X) 2 ] 2 Rossi Regressione lineare semplice Econometria / 60

10 Verifica di ipotesi Formula per calcolare lo SE( ˆβ 0 ) Dato lo stimatore dove Var[ ˆβ 0 ] = Var[H iu i ] n[e(hi 2)]2 [ ] µx H i = 1 E(Xi 2) X i ˆσ 2ˆβ0 = 1 n Ĥ i = 1 1 n 2 ( 1 n [ i=1 Ĥ2 i û2 i n i=1 Ĥ2 i ) 2 X 1 n i=1 X2 i ] X i Rossi Regressione lineare semplice Econometria / 60

11 Verifica di ipotesi Formula per calcolare lo SE E leggermente complicato, tuttavia: lo è meno di quanto sembri. La varianza Var[v] è stimata dal numeratore, mentre Var[X] 2 è stimata dal denominatore. Perchè la correzione dei gradi di libertà n 2? Perchè sono stati stimati due coefficienti β 0 e β 1. SE( ˆβ 1 ) viene calcolato dal software di regressione Rossi Regressione lineare semplice Econometria / 60

12 Verifica di ipotesi Riepilogo Per verificare: H 0 : β 1 = β 1,0 vs H 1 : β 1 β 1,0 Costruire la statistica-t t = ˆβ 1 β 1,0 SE( ˆβ 1 ) = ˆβ 1 β 1,0 ˆσ 2ˆβ1 Si rifiuta al livello di significatività del 5% se t > 1, 96. Il valore p è p = P r[ t > t act ] = probabilità nell area delle code della normale, cioè > t act ; si rifiuta al livello di significatività del 5% se il valore p è < 5%. Questa procedura si affida all approssimazione di n grande che ˆβ 1 sia distribuito normalmente; in generale n = 50 è grande abbastanza per un approssimazione eccellente. Rossi Regressione lineare semplice Econometria / 60

13 Verifica di ipotesi Esempio: Punteggi nei test e STR dati della California Regressione lineare stimata: Test Score = 698, 9 2, 28ŜT R Il software di regressione segnala gli errori standard: SE( ˆβ 0 ) = 10, 4 SE( ˆβ 1 ) = 0, 52 Verifica dell ipotesi nulla β 1,0 = 0. Rapporto t t = ˆβ 1 β 1,0 SE( ˆβ 1 ) = 2, , 52 = 4, 38 Il livello di significatività bilaterale dell 1 % è 2,58, perciò rifiutiamo l ipotesi nulla al livello di significatività dell 1%. In alternativa, possiamo calcolare il valore p... Il valore p basato sull approssimazione normale standard con n grande alla statistica t è 0,00001 (10 5) Rossi Regressione lineare semplice Econometria / 60

14 Verifica di ipotesi P-value Rossi Regressione lineare semplice Econometria / 60

15 Intervalli di confidenza Intervalli di confidenza per β 1 Si ricordi che un intervallo di confidenza al 95% equivale a: la serie di punti che non può essere rifiutata al livello di significatività del 5%; una funzione polidroma (un intervallo funzione dei dati) che contiene il reale valore del parametro il 95% delle volte nei campioni ripetuti. Poichè la statistica t per β 1 è N(0, 1) in grandi campioni, la costruzione di un intervallo di confidenza al 95% per β 1 equivale al caso della media campionaria: intervallo di confidenza al 95% per β 1 { ˆβ 1 ± 1, 96 SE( ˆβ 1 )} Rossi Regressione lineare semplice Econometria / 60

16 Intervalli di confidenza Esempio di intervallo di confidenza Retta di regressione stimata Test Score = 698, 9 2, 28ŜT R SE( ˆβ 0 ) = 10, 4 SE( ˆβ 1 ) = 0, 52 Intervallo di confidenza al 95% per ˆβ 1 : { ˆβ 1 ± 1, 96SE( ˆβ 1 )} = { 2, 28 ± } = { 3, 30; 1, 26} Le due affermazioni seguenti sono equivalenti: L intervallo di confidenza al 95% non include lo zero; L ipotesi β 1 = 0 è rifiutata al livello del 5%. Rossi Regressione lineare semplice Econometria / 60

17 Intervalli di confidenza Riepilogo di inferenza statistica Stima: Gli stimatori OLS hanno approssimativamente distribuzioni campionarie normali in grandi campioni Verifica: H 0 : β 1 = β 1,0 vs β 1 β 1,0 (β 1,0 è il valore di β 1 sotto H 0 ) T ( ˆβ 1 β 1,0 )/SE( ˆβ 1 ) valore-p = area sotto la normale standard al di fuori di t act (n grande) Intervalli di confidenza: l intervallo di confidenza al 95% per β 1 è { ˆβ 1 ± 1, 96 SE( ˆβ 1 )} Questo è l insieme di β 1 che non è rifiutato al livello del 5% L IC al 95% contiene il β 1 reale nel 95% di tutti i campioni. Rossi Regressione lineare semplice Econometria / 60

18 Variabili binarie La regressione quando X è una variabile binaria A volte un regressore è binario: { 1 se classe piccola X = 0 altrimenti { 1 femmina X = 0 maschio { 1 se trattato (farmaco sperimentale) X = 0 altrimenti I regressori binari sono a volte chiamati variabili dummy. Fin qui β 1 è stato chiamato pendenza ma ciò non ha senso se la variabile X è binaria. Come interpretiamo la regressione con un regressore binario? Rossi Regressione lineare semplice Econometria / 60

19 Variabili binarie Interpretazione delle regressioni con un regressore binario Y i = β 0 + β 1 X i + u i Quando X i = 0: Y i = β 0 + u i E[Y i X i = 0] = β 0 quando X i = 1 Y i = β 0 + β 1 + u i E[Y i X i = 1] = β 0 + β 1 quindi β 1 = E[Y i X i = 1] E[Y i X i = 0] è pari alla differenza tra medie. Rossi Regressione lineare semplice Econometria / 60

20 Variabili binarie Esempio Sia Regressione OLS: D i = { 1 se ST R 20 0 se ST R > 20 Test Score = , 4 D i (1,3) (1,8) Dimensione classe Punteggio medio Ȳ Dev.Stand. (s Y ) N Piccola STR ,4 19,4 238 Grande STR > ,9 182 Differenza tra medie: Y piccola Y grande = 657, = 7, 4 s 2 p SE = + s2 g 19, , 92 = + n p n g = 1, 8 Rossi Regressione lineare semplice Econometria / 60

21 Variabili binarie Riepilogo: regressione quando la variabile X è binaria β 0 media di Y i quando X = 0 β 0 + β 1 = media di Y i quando X = 1 β 1 = differenza tra medie, X =1 meno X = 0 SE( ˆβ 1 ) ha l interpretazione consueta statistica-t, intervalli di confidenza costruiti come di consueto. Questo è un altro modo (facile) per eseguire l analisi della differenza tra medie La formulazione della regressione è particolarmente utile quando abbiamo regressori supplementari. Rossi Regressione lineare semplice Econometria / 60

22 Omoschedasticità Eteroschedasticità e omoschedasticità Conseguenze dell omoschedasticità Implicazioni per il calcolo degli errori standard Che cosa significano questi due termini? Se Var[u X = x] è costante - ossia se la varianza della distribuzione di u condizionata a X non dipende da X allora u è detto omoschedastico. In caso contrario, u è eteroschedastico. Rossi Regressione lineare semplice Econometria / 60

23 Omoschedasticità Esempio: etero/omoschedasticità nel caso di un regressore binario Errore standard quando le varianze sono ineguali: s 2 p SE = + s2 g n p n g Errore standard quando le varianze sono uguali: 1 SE = s p + 1 n p n g Vedi SW, Paragrafo 3.6 s 2 p = (n s 1)s 2 s + (n g 1)s 2 g n p + n g 2 s p stimatore di σ 2 quando σ 2 p = σ 2 g. Varianze uguali = omoschedasticità Varianze ineguali = eteroschedasticità Rossi Regressione lineare semplice Econometria / 60

24 Errori standard con omoschedasticità Omoschedasticità in un immagine: E[u X] = 0 (u soddisfa l assunzione dei minimi quadrati n. 1) La varianza di u non dipende da x Rossi Regressione lineare semplice Econometria / 60

25 Errori standard con omoschedasticità Un esempio con dati reali dall economica del lavoro La retribuzione oraria media rispetto agli anni di istruzione (fonte dati: Current Population Survey): Eteroschedasticità o omoschedasticità? Rossi Regressione lineare semplice Econometria / 60

26 Errori standard con omoschedasticità Quale assunzione sulla varianza degli errori? Le tre assunzioni dei minimi quadrati: E[u X] = 0 (X i, Y i ), i = 1, 2,..., n, sono i.i.d. Gli outlier sono rari Eteroschedasticità e omoschedasticità concernono Var[u X]. Poichè non abbiamo assunto esplicitamente gli errori omoschedastici, abbiamo ammesso implicitamente l eteroschedasticità. Rossi Regressione lineare semplice Econometria / 60

27 Errori standard con omoschedasticità Errori omoschedastici-var[ ˆβ 1 ] Si può dimostrare che l OLS ha la varianza minore tra gli stimatori lineari in Y... un risultato chiamato teorema di Gauss-Markov. La formula per la varianza di ˆβ 1 e per l errore standard OLS si semplifica: se Var[u i X i = x] = σ 2 dato σ 2 v Var[ ˆβ 1 ] = V ar[ v] [V ar(x i )] 2 = 1 n (σx 2 = σ2 u )2 nσ 2 X Var[(X i µ X )u i ] = E { [v i E(v i )] 2} = E[vi 2 ] = E[(X i µ X ) 2 u 2 i ] = E[(X i µ X ) 2 E(u 2 i X i )] = σ 2 Xσ 2 u da cui Rossisegue Regressione lineare semplice Econometria / 60

28 Errori standard con omoschedasticità Errori omoschedastici-var[ ˆβ 0 ] La formula per la varianza di ˆβ 0 nel caso eteroschedastico dato che Var[ ˆβ 0 ] = Var[H iu i ] n[e(hi 2)]2 [ ] µx H i = 1 E(Xi 2) X i E[H i u i ] = E[H i E(u i X i )] = 0 Var[H i u i ] = E[H 2 i u 2 i ] = E[H 2 i E(u 2 i X i )] = σ 2 ue[h 2 i ] Rossi Regressione lineare semplice Econometria / 60

29 Errori standard con omoschedasticità Errori omoschedastici Var[ ˆβ 0 ] Ora [ Hi 2 µx = 1 + E(Xi 2) [ E[Hi 2 ] = 1 + µ 2 X E(X 2 i )2 ] 2 Xi 2 2 ] E[Xi 2 ] 2 [ µx E(X 2 i ) ] X i [ µx E(X 2 i ) ] E[X i ] = 1 µ2 X E(X 2 i ) = E(X2 i ) µ2 X E(X 2 i ) segue che = σ2 X E(X 2 i ) σ 2ˆβ0 = 1 n E(Xi 2) σx 2 σu 2 Rossi Regressione lineare semplice Econometria / 60

30 Errori standard con omoschedasticità Due formule per gli errori standard Errori standard nel caso di omoschedasticità: ( 1 ) n i ˆσ ˆβ1 = X2 i s 2 u i (X i X) 2 ˆσ ˆβ1 = s 2 u i (X i X) 2 Errori standard per l omoschedasticità sono validi solo se gli errori sono omoschedastici. Gli errori standard consueti per differenziare i due, è convenzione chiamarli errori standard robusti all eteroschedasticità, poichè sono validi a prescindere dall eteroschedasticità o meno degli errori. Il principale vantaggio degli errori standard per l omoschedasticità pura è che la formula è più semplice. Lo svantaggio, però, è che la formula è corretta solo se gli errori sono omoschedastici. Rossi Regressione lineare semplice Econometria / 60

31 Errori standard con omoschedasticità Implicazioni pratiche... La formula dell omoschedasticità pura per l errore standard di e la formula robusta all eteroschedasticità sono diverse - quindi, in generale, si ottengono errori standard diversi utilizzando formule differenti. Gli errori standard per l omoschedasticità pura sono l impostazione predefinita nei software di regressione - a volte l unica impostazione (per esempio in Excel). Per ottenere gli errori standard robusti all eteroschedasticità generale occorre modificare l impostazione di default. Se non si modifica l impostazione di default e vi è eteroschedasticità, gli errori standard (e la statistica-t e gli intervalli di confidenza) saranno errati - generalmente, gli SE per l omoschedasticità pura sono troppo piccoli. Rossi Regressione lineare semplice Econometria / 60

32 Errori standard con omoschedasticità Il punto essenziale Se gli errori sono omoschedastici o eteroschedastici e si utilizzano errori standard robusti all eteroschedasticità, va bene Se gli errori sono eteroschedastici e si utilizza la formula dell omoschedasticità pura per gli errori standard, gli errori standard saranno errati (lo stimatore dell omoschedasticità pura della varianza di β 1 è incoerente in presenza di eteroschedasticità). Le due formule coincidono (quando n è grande) nel caso speciale di omoschedasticità Quindi si dovrebbero sempre utilizzare errori standard robusti all eteroschedasticità. Rossi Regressione lineare semplice Econometria / 60

33 Errori standard con omoschedasticità Fondamenti teorici dei minimi quadrati ordinari Abbiamo già appreso molto sugli stimatori dei minimi quadrati ordinari: lo stimatore OLS è non distorto e consistente; abbiamo una formula per gli errori standard robusti all eteroschedasticità e possiamo costruire intervalli di confidenza e statistiche di test. Una buona ragione per utilizzare i minimi quadrati ordinari è anche l impiego universale, perciò gli altri saranno in grado di capire ciò che fate. In effetti, l OLS è il linguaggio dell analisi di regressione, e se utilizzate uno stimatore diverso, parlerete un linguaggio differente. Rossi Regressione lineare semplice Econometria / 60

34 Teorema di Gauss-Markov Eppure potreste ancora chiedervi... Tutto quanto detto è davvero una buona ragione per utilizzare OLS? Non esistono altri stimatori che potrebbero essere migliori in particolare che potrebbero avere una varianza inferiore? Inoltre, che ne è stato della distribuzione t di Student? Ora risponderemo a queste domande ma per farlo abbiamo bisogno di assunzioni più forti delle tre relative ai minimi quadrati che abbiamo già visto. Rossi Regressione lineare semplice Econometria / 60

35 Teorema di Gauss-Markov Le assunzioni dei minimi quadrati estese Consistono nelle tre assunzioni dei minimi quadrati, più altre due: 1 E[u i X i ] = 0, i = 1, 2,..., n; 2 (X i, Y i ), i = 1, 2,..., n, sono i.i.d.; 3 Gli outlier sono rari E[Y 4 i ] <, E[X4 i ] < ; 4 u i è omoschedastico 5 u i ha distribuzione N(0, σ 2 ) Le assunzioni 4 e 5 sono più restrittive perciò si applicano a un numero inferiori di casi pratici. Tuttavia, facendo queste assunzioni, determinati calcoli matematici si semplificano e si possono dimostrare risultati più robusti che valgono se tali assunzioni aggiuntive sono vere. Iniziamo con una discussione sull efficienza dello stimatore OLS Rossi Regressione lineare semplice Econometria / 60

36 Teorema di Gauss-Markov Efficienza dello stimatore OLS, parte I: il teorema di Gauss-Markov Nelle assunzioni dei minimi quadrati ordinari estese 1-4 (le tre di base, più l omoschedasticità), ˆβ 1 ha la varianza minima tra tutti gli stimatori lineari (stimatori che sono funzioni lineari di Y 1, Y 2,..., Y n. Questo è il teorema di Gauss-Markov. Rossi Regressione lineare semplice Econometria / 60

37 Teorema di Gauss-Markov Il teorema di Gauss-Markov Date le condizioni 1 E[u i X 1,..., X n ] = 0, i = 1, 2,..., n 2 Var[u i X 1,..., X n ] = σ 2 u < 3 E[u i u j X 1,..., X n ] = 0, i j, i, j = 1, 2,..., n Le condizioni di G-M derivano dalle tre assunzioni degli OLS 1 Poichè le osservazioni sono i.i.d. (A.2) E[u i X 1,..., X n ] = E[u i X i ] = 0, i = 1, 2,..., n 2 L A.3 (monenti quarti finiti) assicura che σ 2 u < 3 Per l A.1 E[u i u j X 1,..., X n ] = E[u i u j X i, X j ], i j, i, j = 1, 2,..., n. Per la stessa A.2 E[u i u j X i, X j ] = E[u i X i ]E[u j X j ] = 0, i j Rossi Regressione lineare semplice Econometria / 60

38 Teorema di Gauss-Markov Il teorema di Gauss-Markov ˆβ 1 è uno stimatore lineare: ˆβ 1 = n i=1 (X i X)Y i n i=1 (X i X) 2 = i â i Y y dove â i = (X i X) n i=1 (X i X) 2 i pesi â i, i = 1, 2,..., n dipendono da X 1,..., X n ma non da Y 1, Y 2,..., Y n, lo stimatore OLS ˆβ 1 è uno stimatore lineare. Sotto le condizioni di G-M lo stimatore OLS è condizionatamente non distorto la varianza della distribuzione di ˆβ 1 condizionata a X 1, X 2,..., X n Var[ ˆβ 1 X 1,..., X n ] = σ 2 u i=1 (X i X) 2 Rossi Regressione lineare semplice Econometria / 60

39 Teorema di Gauss-Markov Il teorema di Gauss-Markov-Prova Per ogni stimatore lineare del tipo n β 1 = a i Y i i=1 ( n ) ( n ) β 1 = β 0 a i + β 1 a i X i + i=1 i=1 Per la prima condizione i=1 i=1 n a i u i i=1 n n E[ a i X i X 1,..., X n ] = a i E[u i X 1,..., X n ] = 0 ( n ) ( n ) E[ β 1 X 1,..., X n ] = β 0 a i + β 1 a i X i i=1 i=1 Rossi Regressione lineare semplice Econometria / 60

40 Teorema di Gauss-Markov Il teorema di Gauss-Markov-Prova Affinchè β 1 sia condizionamente non distorto: ( n ) ( n ) E[ β 1 X 1,..., X n ] = β 0 a i + β 1 a i X i = β 1 i=1 i=1 deve valere che da cui n n a i = 0 a i X i = 1 i=1 i=1 n β 1 β 1 = a i u i i=1 Rossi Regressione lineare semplice Econometria / 60

41 Teorema di Gauss-Markov Il teorema di Gauss-Markov-Prova Sotto le condizioni del Teorema, la varianza condizionale di β 1 [ [ ] n ] Var β1 X 1,..., X n = Var a i u i X 1,..., X n = i i=1 a i a j Cov [u i, u j X 1,..., X n ] Applicando la seconda e terza condizione di G-M, i termini incrociati nella doppia sommatoria si annullano inoltre Var[ β 1 X 1,..., X n ] = σ 2 u Var[ ˆβ 1 X 1,..., X n ] = σ 2 u j Rossi Regressione lineare semplice Econometria / 60 n i=1 n i=1 a 2 i â 2 i

42 Teorema di Gauss-Markov Il teorema di Gauss-Markov-Prova Sia quindi a i = â i + d i a 2 i = (â i + d i ) 2 = i i i â i d i = i i(x i X)d i i (X i X) 2 â 2 i + 2 i â i d i + i i = d ix i X i d i i (X i [ X) 2 ( ai X i â i X i ) X ( a i â i ) ] = = 0 i (X i X) 2 d 2 i Rossi Regressione lineare semplice Econometria / 60

43 Teorema di Gauss-Markov Il teorema di Gauss-Markov-Prova Pertanto, σu 2 i a 2 i = σu 2 â 2 i + σu 2 i i d 2 i = Var[ ˆβ 1 X 1,..., X n ] + σ 2 u i d 2 i segue che Var[ β 1 X 1,..., X n ] = σu 2 n a 2 i = Var[ ˆβ 1 X 1,..., X n ] + σu 2 i=1 i Var[ β 1 X 1,..., X n ] Var[ ˆβ 1 X 1,..., X n ] = σ 2 u i d 2 i d 2 i Rossi Regressione lineare semplice Econometria / 60

44 Teorema di Gauss-Markov Il teorema di Gauss-Markov-Prova Lo stimatore β 1 ha varianza condizionata maggiore di quella di ˆβ 1 se d i è diverso da zero per ogni i = 1, 2,..., n. Ma se d i = 0, i, allora a i = â i e β 1 = ˆβ 1 Conclusione: OLS è BLUE (best linear unbised estimator) Rossi Regressione lineare semplice Econometria / 60

45 Teorema di Gauss-Markov Efficienza dello stimatore OLS, parte II In tutte e cinque le assunzioni dei minimi quadrati estese - compresa la distribuzione normale degli errori - β 1 ha la varianza più piccola di tutti gli estimatori consistenti (funzioni lineari o non lineari di Y 1, Y 2,..., Y n ), per n. Questo è un risultato assai sorprendente - afferma che, se (in aggiunta alle assunzioni dei minimi quadrati 1-3) gli errori sono omoschedastici e normalmente distribuiti, OLS è la scelta migliore rispetto a qualsiasi altro stimatore consistente. E poichè uno stimatore che non sia consistente è una scelta scadente, ciò afferma che l OLS è davvero la miglior scelta che si possa fare - se valgono tutte e cinque le assunzioni dei minimi quadrati estese. (La dimostrazione di questo risultato va oltre l ambito di questo corso e non è fornita nel testo). Rossi Regressione lineare semplice Econometria / 60

46 Teorema di Gauss-Markov Alcuni aspetti critici di OLS I risultati precedenti sono impressionanti, tuttavia tali risultati - e lo stimatore OLS - hanno limitazioni importanti. Il teorema di G-M non è poi così avvincente: La condizione di omoschedasticità spesso non regge (l omoschedasticità è speciale) Il risultato vale solo per gli stimatori lineari - solo un piccolo sottoinsieme di stimatori (ulteriori informazioni a breve) Il risultato di ottimalità più robusto (parte II precedente) richiede errori normali omoschedastici cosa non plausibile nelle applicazioni (si pensi ai dati delle retribuzioni orarie!) Rossi Regressione lineare semplice Econometria / 60

47 Teorema di Gauss-Markov Inferenza con omoschedasticità e gaussianità 1 E[u i X i ] = 0, i = 1, 2,..., n; 2 (X i, Y i ), i = 1, 2,..., n, sono i.i.d.; 3 Gli outlier sono rari E[Y 4 i ] <, E[X4 i ] < ; 4 u i è omoschedastico 5 u i ha distribuzione N(0, σ 2 ) Se tutte le cinque assunzioni valgono, allora: ˆβ 0 e ˆβ 1 sono normalmente distribuiti per tutti gli n la statistica-t ha una distribuzione t di Student con n 2 gradi di libertà, questo vale esattamente per tutti gli n. Rossi Regressione lineare semplice Econometria / 60

48 Teorema di Gauss-Markov Distribuzione campionaria gaussiana di ˆβ 1 dove ˆβ 1 β 1 = i(x i X)u i i (X i X) 2 = 1 w i u i n w i = 1 n i (X i X) n i=1 (X i X) 2 Qual è la distribuzione di una media ponderata di normali? E[ ˆβ 1 β 1 ] = 1 w i E[u i ] = 0 n i ( ) 2 Var[ ˆβ 1 β 1 ] = 1 n 2 E w i u i i Rossi Regressione lineare semplice Econometria / 60

49 Teorema di Gauss-Markov Distribuzione campionaria gaussiana di ˆβ 1 Var[ ˆβ 1 β 1 ] = 1 n 2 wi 2 E[u 2 i ] = 1 n 2 σ2 u i i w 2 i Rossi Regressione lineare semplice Econometria / 60

50 Teorema di Gauss-Markov Assunzioni Assunzioni MRL semplice: Y i = β 0 + β 1 X i + u i i = 1, 2,..., n E[u i X i ] = 0 {X i, Y i } i.i.d X i, u i momenti quarti finiti non nulli e finiti. Var[u i X i ] = σ 2 u, omoschedasticità Distribuzione di u i data X i è normale (errori normali): u i i.i.d.n(0, σ 2 u). Stimatori OLS: ˆβ 0 = Ȳ ˆβ 1 X n i=1 ˆβ 1 = (Y i Ȳ )(X i X) n i=1 (X i X) 2 Rossi Regressione lineare semplice Econometria / 60

51 Teorema di Gauss-Markov Distribuzioni campionarie esatte Quando gli errori (u i ) si distribuiscono normalmente e sono omoschedastici le distribuzioni campionarie degli stimatori OLS e delle statistiche test sono note: Lo stimatore OLS si distribuisce in modo normale. la statistica t si distribuisce come una t di Student. Rossi Regressione lineare semplice Econometria / 60

52 Teorema di Gauss-Markov Distribuzione di ˆβ 1 dove ˆβ 1 X 1,..., X n N(β 1, σ 2ˆβ1 X ) σ 2ˆβ1 X = i=1 (X i ˆX) 2 Per dimostrare che la distribuzione condizionale è normale, si noti che ˆβ 1 β 1 è una media ponderata di u 1,..., u n 1 n i=1 ˆβ 1 = β 1 + (X i X)u i i=1 (X i X) 2 1 n Medie ponderate di variabili casuali che si distribuiscono in modo normale si distribuiscono normalmente. σ 2 u Rossi Regressione lineare semplice Econometria / 60

53 Teorema di Gauss-Markov Non distorsione di ˆβ 1 Abbiamo visto che: E[ ˆβ 1 X 1,..., X n ] = β 1 + = β 1 ˆβ 1 è condizionatamente non distorto. n i=1 (X i X)E[u i X 1,..., X n ] n i=1 (X i X) 2 Rossi Regressione lineare semplice Econometria / 60

54 Teorema di Gauss-Markov Varianza condizionale di ˆβ 1 Per mostrare che σ 2ˆβ1 X = σ 2 u i=1 (X i ˆX) 2 sfruttiamo l ipotesi che u i i.i.d.n(0, σu) 2 [ n Var[ ˆβ i=1 1 X 1,..., X n ] = Var (X i X)u ] i n i=1 (X i X) 2 X 1,..., X n = n i=1 (X i X) 2 Var[u i X 1,..., X n ] [ n i=1 (X i X) 2] 2 = n i=1 (X i X) 2 σ 2 u [ n i=1 (X i X) 2] 2 = σ 2 u [ n i=1 (X i X) 2] Rossi Regressione lineare semplice Econometria / 60

55 Teorema di Gauss-Markov Distribuzione della statistica t La statistica t per verificare l ipotesi nulla β 1 = β 1,0 è t = ˆβ 1 β 1,0 SE( ˆβ 1 ) Sostituendo la formula per SE( ˆβ 1 ) SE( ˆβ s 1 ) ˆσ ˆβ1 = 2 u n i=1 (X i X) 2 Rossi Regressione lineare semplice Econometria / 60

56 Teorema di Gauss-Markov Distribuzione della statistica t t = = = ˆβ 1 β 1,0 s 2 u n i=1 (X i X) 2 ˆβ 1 β 1,0 s 2 u n i=1 (X i X) σ 2 2 u σu 2 ˆβ 1 β 1,0 / σu 2 n i=1 (X i X) 2 = s 2 u σ 2 u ˆβ 1 β 1,0 σu 2 s 2 n i=1 (X i X) u 2 σ 2 u = ( ˆβ 1 β 1,0 )/σ ˆβ1 X, W = W/(n 2) n û 2 i σ 2 i=1 u Rossi Regressione lineare semplice Econometria / 60

57 Teorema di Gauss-Markov Distribuzione della statistica t Sotto l ipotesi nulla ˆβ 1 X 1,..., X n N(β 1, σ 2ˆβ1 X ) quindi ˆβ 1 β 1,0 X 1,..., X n N(0, 1) σ ˆβ1 X il numeratore della statistica t è N(0, 1). La variabile casuale W si distribuisce come una chi-quadrato con n 2 gradi di libertà. W è indipendente da ˆβ 1 β 1,0 σ. ˆβ1 X Rossi Regressione lineare semplice Econometria / 60

58 Teorema di Gauss-Markov Distribuzione della statistica t Lo stimatore s 2 u ha una distribuzione proporzionale a una distribuzione chi-quadrato con n 2 gradi di libertà: quindi s 2 u s 2 u σu 2 σ2 u n 2 χ2 n 2 1 n 2 χ2 n 2 Rossi Regressione lineare semplice Econometria / 60

59 Teorema di Gauss-Markov Distribuzione della statistica t Se Z ha una distribuzione normale standard, se W χ 2 m e Z e W sono indipendentemente distribuite, allora la variabile casuale t = Z W/m t m Nel caso della statistica t N(0, 1) χ 2 n 2 /(n 2) t n 2 Per n < 30 i valori critici t possono essere un po più grandi dei valori critici N(0, 1) Per n > 50 o simile, la differenza nelle distribuzioni t n2 e N(0, 1) è trascurabile. Rossi Regressione lineare semplice Econometria / 60

60 Teorema di Gauss-Markov Implicazioni pratiche Se n < 50 e credete davvero che, per la vostra applicazione, u sia omoschedastico e normalmente distribuito, utilizzate t n 2 invece dei valor critici N(0, 1) per le verifiche di ipotesi e gli intervalli di confidenza. Nella maggior parte delle applicazioni econometriche, non vi è alcun motivo di ritenere che u sia omoschedastico e normale - solitamente vi sono ottime ragioni per credere che né l una né l altra assunzione valga. Fortunatamente, nelle applicazioni moderne n > 50, così possiamo affidarci ai risultati per n grande presentati in precedenza, basati sul teorema limite centrale, per eseguire verifiche di ipotesi e costruire intervalli di confidenza usando l approssimazione normale per n grande Rossi Regressione lineare semplice Econometria / 60

Regressione lineare con un solo regressore

Regressione lineare con un solo regressore Regressione lineare con un solo regressore La regressione lineare è uno strumento che ci permette di stimare e di fare inferenza sui coefficienti incogniti di una retta. Lo scopo principale è di stimare

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Richiami di statistica

Richiami di statistica Richiami di statistica Eduardo Rossi 2 2 Università di Pavia (Italy) Marzo 2014 Rossi Statistica Econometria - 2014 1 / 61 Indice 1 Esempio 2 Elementi di probabilità 3 Stima 4 Verifica di ipotesi Rossi

Dettagli

Analisi della regressione multipla

Analisi della regressione multipla Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,

Dettagli

Regressione lineare multipla

Regressione lineare multipla Regressione lineare multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2014 Rossi Regressione lineare Econometria - 2014 1 / 31 Outline 1 La distorsione da variabili omesse 2 Causalità 3 Misure

Dettagli

lezione 9 AA Paolo Brunori

lezione 9 AA Paolo Brunori AA 2016-2017 Paolo Brunori Dove siamo arrivati? - la regressione lineare multipla ci permette di stimare l effetto della variabile X sulla Y tenendo ferme tutte le altre variabili osservabili che hanno

Dettagli

Il modello di regressione lineare multivariata

Il modello di regressione lineare multivariata Il modello di regressione lineare multivariata Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2015 Rossi MRLM Econometria - 2015 1 / 39 Outline 1 Notazione 2 il MRLM - Assunzioni 3 OLS 4 Proprietà

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

Test delle Ipotesi Parte I

Test delle Ipotesi Parte I Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test

Dettagli

Il modello di regressione lineare multipla con regressori stocastici

Il modello di regressione lineare multipla con regressori stocastici Università di Pavia Il modello di regressione lineare multipla con regressori stocastici Eduardo Rossi Il valore atteso condizionale Modellare l esperimento casuale bivariato nel quale le variabili casuali

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

Esercizi di Probabilità e Statistica

Esercizi di Probabilità e Statistica Esercizi di Probabilità e Statistica Samuel Rota Bulò 6 giugno 26 Statistica Esercizio Sia {X n } n una famiglia di v.a. di media µ e varianza σ 2. Verificare che X = n n X i σ 2 = n (X i µ) 2 S 2 = n

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

lezione 8 AA Paolo Brunori

lezione 8 AA Paolo Brunori AA 2016-2017 Paolo Brunori regressione multipla con n = k Immaginate di voler studiare i determinanti del voto all esame di econometria Y = β 1 X 1 + u Y i = β 1 H i + u i H=ore studiate alla settimana

Dettagli

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

La verifica delle ipotesi

La verifica delle ipotesi La verifica delle ipotesi Se abbiamo un idea di quale possa essere il valore di un parametro incognito possiamo sottoporlo ad una verifica, che sulla base di un risultato campionario, ci permetta di decidere

Dettagli

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II Fondamenti di statistica per il miglioramento genetico delle piante Antonio Di Matteo Università Federico II Modulo 2 Variabili continue e Metodi parametrici Distribuzione Un insieme di misure è detto

Dettagli

Esercitazione 8 maggio 2014

Esercitazione 8 maggio 2014 Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un

Dettagli

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo 1. Gli studi di simulazione possono permetterci di apprezzare alcune delle proprietà di distribuzioni campionarie ricavate

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Presentazione dell edizione italiana

Presentazione dell edizione italiana 1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli

Dettagli

I modelli probabilistici

I modelli probabilistici e I modelli probabilistici Finora abbiamo visto che esistono modelli probabilistici che possiamo utilizzare per prevedere gli esiti di esperimenti aleatori. Naturalmente la previsione è di tipo probabilistico:

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

Proprietà asintotiche stimatori OLS e statistiche collegate

Proprietà asintotiche stimatori OLS e statistiche collegate Proprietà asitotiche stimatori OLS e statistiche collegate Eduardo Rossi 2 2 Uiversità di Pavia (Italy) Maggio 2014 Rossi Proprietà asitotiche Ecoometria - 2014 1 / 30 Sommario Risultati prelimiari Distribuzioe

Dettagli

Note sulla probabilità

Note sulla probabilità Note sulla probabilità Maurizio Loreti Dipartimento di Fisica Università degli Studi di Padova Anno Accademico 2002 03 1 La distribuzione del χ 2 0.6 0.5 N=1 N=2 N=3 N=5 N=10 0.4 0.3 0.2 0.1 0 0 5 10 15

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Confronto tra due popolazioni Lezione 6

Confronto tra due popolazioni Lezione 6 Last updated May 9, 06 Confronto tra due popolazioni Lezione 6 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Concetti visti nell ultima lezione Le media

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25 Sommario Presentazione dell edizione italiana Prefazione xv xiii Capitolo 1 I dati e la statistica 1 Statistica in pratica: BusinessWeek 1 1.1 Le applicazioni in ambito aziendale ed economico 3 Contabilità

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA Lezione n.11 - Principi dell inferenza statistica - Campionamento - Distribuzione campionaria di una media e di una proporzione - Intervallo di confidenza di una media e di

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Test per una media - varianza nota

Test per una media - varianza nota Situazione Test per una media - varianza nota Popolazione N(µ,σ 2 ); varianza σ 2 nota. µ 0 numero reale fissato. Test di livello α per µ Statistica: Z n = X n µ 0 σ/ n. H 0 H 1 Rifiutiamo H 0 se p-value

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, MODELLO DI REGRESSIONE LINEARE le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, teorema di Gauss-Markov, verifica di ipotesi e test di

Dettagli

PROBABILITÀ ELEMENTARE

PROBABILITÀ ELEMENTARE Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti

Dettagli

ESAME. 9 Gennaio 2017 COMPITO B

ESAME. 9 Gennaio 2017 COMPITO B ESAME 9 Gennaio 2017 COMPITO B Cognome Nome Numero di matricola 1) Approssimare tutti i calcoli alla quarta cifra decimale. 2) Ai fini della valutazione si terrà conto solo ed esclusivamente di quanto

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2

1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2 Statistica N. Crediti: Cognome: Laurea Triennale in Biologia Nome: 4 settembre 2012 Matricola: 1. Parte A 1.1. Siano x 1, x 2,..., x 10 i dati relativi al peso di 10 neonati espressi in chilogrammi e y

Dettagli

Minimi quadrati vincolati e test F

Minimi quadrati vincolati e test F Minimi quadrati vincolati e test F Impostazione del problema Spesso, i modelli econometrici che stimiamo hanno dei parametri che sono passibili di interpretazione diretta nella teoria economica. Consideriamo

Dettagli

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011

Politecnico di Milano - Scuola di Ingegneria Industriale. II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011 Politecnico di Milano - Scuola di Ingegneria Industriale II Prova in Itinere di Statistica per Ingegneria Energetica 25 luglio 2011 c I diritti d autore sono riservati. Ogni sfruttamento commerciale non

Dettagli

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. I Esonero - 29 Ottobre Tot.

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014. I Esonero - 29 Ottobre Tot. UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2013/2014 I Esonero - 29 Ottobre 2013 1 2 3 4 5 6 7 8 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

Cognome e Nome:... Corso di laurea:...

Cognome e Nome:... Corso di laurea:... Statistica - corso base Prof. B. Liseo Prova di esame dell 8 gennaio 201 Cognome e Nome:................................................................... Corso di laurea:.......................................................................

Dettagli

ESERCITAZIONE 21 : VARIABILI ALEATORIE CONTINUE

ESERCITAZIONE 21 : VARIABILI ALEATORIE CONTINUE ESERCITAZIONE 21 : VARIABILI ALEATORIE CONTINUE e-mail: tommei@dm.unipi.it web: www.dm.unipi.it/ tommei Ricevimento: su appuntamento Dipartimento di Matematica, piano terra, studio 114 7 Maggio 2013 Esercizio

Dettagli

Università di Siena. Teoria della Stima. Lucidi del corso di. Identificazione e Analisi dei Dati A.A

Università di Siena. Teoria della Stima. Lucidi del corso di. Identificazione e Analisi dei Dati A.A Università di Siena Teoria della Stima Lucidi del corso di A.A. 2002-2003 Università di Siena 1 Indice Approcci al problema della stima Stima parametrica Stima bayesiana Proprietà degli stimatori Stime

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili

Dettagli

Le statistiche campionarie sono stime dei parametri ignoti della popolazione al cui valore siamo interessati.

Le statistiche campionarie sono stime dei parametri ignoti della popolazione al cui valore siamo interessati. Una volta selezionato il campione, la variabile di interesse viene misurata sugli elementi che lo costituiscono. I valori che la variabile assume vengono poi sintetizzati utilizzando le statistiche opportune

Dettagli

Funzioni di regressione non lineari

Funzioni di regressione non lineari Funzioni di regressione non lineari Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2013 Rossi Regressione nonlineare Econometria - 2013 1 / 25 Sommario Funzioni di regressione non lineari - note

Dettagli

Il Test di Ipotesi Lezione 5

Il Test di Ipotesi Lezione 5 Last updated May 23, 2016 Il Test di Ipotesi Lezione 5 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Il test di ipotesi Cuore della statistica inferenziale!

Dettagli

Il campionamento e l inferenza. Il campionamento e l inferenza

Il campionamento e l inferenza. Il campionamento e l inferenza Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento

Dettagli

Statistica Inferenziale

Statistica Inferenziale Statistica Inferenziale a) L Intervallo di Confidenza b) La distribuzione t di Student c) La differenza delle medie d) L intervallo di confidenza della differenza Prof Paolo Chiodini Dalla Popolazione

Dettagli

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017 Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 3/5/017 Contents 1 Intervalli di confidenza 1 Intervalli su un campione 1.1 Intervallo di confidenza per la media................................

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016 Esame di Statistica 0 o CFU) CLEF febbraio 06 Esercizio Si considerino i seguenti dati, relativi a 00 clienti di una banca a cui è stato concesso un prestito, classificati per età e per esito dell operazione

Dettagli

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA. Lezione 4 DISTRIBUZIONE DI FREQUENZA 1 DISTRIBUZIONE DI PROBABILITA Una variabile i cui differenti valori seguono una distribuzione di probabilità si chiama variabile aleatoria. Es:il numero di figli maschi

Dettagli

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

Università di Pavia. Test diagnostici. Eduardo Rossi

Università di Pavia. Test diagnostici. Eduardo Rossi Università di Pavia Test diagnostici Eduardo Rossi Test diagnostici Fase di controllo diagnostico: controllo della coerenza tra quanto direttamente osservato e le ipotesi statistiche adottate Ipotesi MRLM

Dettagli

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza Test 1: Concetti base di inferenza 1. Se uno stimatore T n è non distorto per il parametro θ, allora A T n è anche consistente B lim Var[T n] = 0 n C E[T n ] = θ, per ogni θ 2. Se T n è uno stimatore con

Dettagli

Analisi della varianza

Analisi della varianza Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.

Dettagli

Prova d'esame di Statistica I - Corso Prof.ssa S. Terzi

Prova d'esame di Statistica I - Corso Prof.ssa S. Terzi Prova d'esame di Statistica I - Corso Prof.ssa S. Terzi Esercizio 1 Data la variabile casuale X con funzione di densità f(x) = 2x, per 0 x 1; f(x) = 0 per x [0, 1], determinare: a) P( - 0,5 < X< 0,7) b)

Dettagli

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE

Dettagli

STATISTICA ESERCITAZIONE

STATISTICA ESERCITAZIONE STATISTICA ESERCITAZIONE Dott. Giuseppe Pandolfo 1 Giugno 2015 Esercizio 1 Una fabbrica di scatole di cartone evade il 96% degli ordini entro un mese. Estraendo 300 campioni casuali di 300 consegne, in

Dettagli

Il modello di regressione lineare multivariata

Il modello di regressione lineare multivariata Il modello di regressione lineare multivariata Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2013 Rossi MRLM Econometria - 2013 1 / 39 Outline 1 Notazione 2 il MRLM 3 Il modello partizionato 4 Collinearità

Dettagli

obbligatorio - n. iscrizione sulla lista

obbligatorio - n. iscrizione sulla lista 02.09.2015 - appello di STATISTICA per studenti ENE - docente: E. Piazza obbligatorio - n. iscrizione sulla lista il presente elaborato si compone di 5 (cinque) pagine se non ve lo ricordate siete fritti;

Dettagli

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

Verifica di ipotesi e intervalli di confidenza nella regressione multipla Verifica di ipotesi e intervalli di confidenza nella regressione multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Maggio 2014 Rossi MRLM Econometria - 2014 1 / 23 Sommario Variabili di controllo

Dettagli

Lezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice

Lezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 45 Outline 1 2 3 4 5 () Statistica 2 / 45 Modello di In molte applicazioni il ruolo delle variabili

Dettagli

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = + ESERCIZIO 6.1 Si considerino i 0 campioni di ampiezza n = estratti da una popolazione X di N = 5 elementi distribuiti normalmente, con media µ = 13,6 e σ = 8,33. A partire dalle 0 determinazioni della

Dettagli

Analisi di Regressione Multivariata. β matrice incognita dei coeff. di regressione (regr. lineare in β)

Analisi di Regressione Multivariata. β matrice incognita dei coeff. di regressione (regr. lineare in β) Analisi di Regressione Multivariata Regressione: metodologia per dedurre info e per anticipare risposte di una variabile dip. Modello classico di regressione lineare: Y {z} n k = {z} X β + ρ {z} {z} n

Dettagli

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici SOLUZIONI ESERCITAZIONE NR. 8 Test statistici ESERCIZIO nr. 1 Un campione casuale di dieci pazienti di sesso maschile in cura per comportamenti aggressivi nell ambito del contesto familiare è stato classificato

Dettagli

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali /e S. Borra, A. Di Ciaccio - McGraw Hill Es.. Soluzione degli esercizi del capitolo 4 4. Il sistema d ipotesi è: μ 7, H : μ 7, Essendo 0 : t,

Dettagli

STATISTICA ESERCITAZIONE 13

STATISTICA ESERCITAZIONE 13 STATISTICA ESERCITAZIONE 13 Dott. Giuseppe Pandolfo 9 Marzo 2015 Errore di I tipo: si commette se l'ipotesi nulla H 0 viene rifiutata quando essa è vera Errore di II tipo: si commette se l'ipotesi nulla

Dettagli

La regressione Generalità sulla regressione

La regressione Generalità sulla regressione Capitolo VIII La regressione 8.1. Generalità sulla regressione L analisi di regressione è una tecnica statistica semplice e potente che esamina la relazione esistente tra una variabile dipendente ed una

Dettagli

Vedi: Probabilità e cenni di statistica

Vedi:  Probabilità e cenni di statistica Vedi: http://www.df.unipi.it/~andreozz/labcia.html Probabilità e cenni di statistica Funzione di distribuzione discreta Istogrammi e normalizzazione Distribuzioni continue Nel caso continuo la probabilità

Dettagli

Test di ipotesi su due campioni

Test di ipotesi su due campioni 2/0/20 Test di ipotesi su due campioni Confronto tra due popolazioni Popolazioni effettive: unità statistiche realmente esistenti. Esempio: Confronto tra forze lavoro di due regioni. Popolazioni ipotetiche:

Dettagli

Approssimazione normale alla distribuzione binomiale

Approssimazione normale alla distribuzione binomiale Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N

Dettagli

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1 Elementi di Psicometria con Laboratorio di SPSS 1 10-Significatività statistica per la correlazione vers. 1.0 (5 novembre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università

Dettagli

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n. 5 STIMA PUNTUALE DEI PARAMETRI [Adattato dal libro Excel per la statistica di Enzo Belluco] Sia θ un parametro incognito della distribuzione di un carattere in una determinata popolazione. Il problema

Dettagli

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.

Dettagli

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75 00PrPag:I-XIV_prefazione_IAS 8-05-2008 17:56 Pagina V Prefazione XI 1 La rilevazione dei fenomeni statistici 1 1.1 Introduzione 1 1.2 Caratteri, unità statistiche e collettivo 1 1.3 Classificazione dei

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Approssimazione normale della Poisson (TLC) In un determinato tratto di strada il numero di incidenti

Dettagli

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Applicata Corsi di Laurea in "Scienze e tecnologie Alimentari"

Dettagli

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson Levine, Krehbiel, Berenson Statistica II ed. Casa editrice: Pearson Capitolo 10 Test basati su due campioni e ANOVA a una via Insegnamento: Statistica Corsi di Laurea Triennale in Economia Dipartimento

Dettagli

Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi

Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi Minimi quadrati ordinari Interpretazione geometrica Eduardo Rossi Il MRLM Il modello di regressione lineare multipla è usato per studiare le relazioni tra la variabile dipendente e diverse variabili indipendenti

Dettagli

Test d ipotesi: confronto fra medie

Test d ipotesi: confronto fra medie Test d ipotesi: confronto fra medie Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona CONFRONTO FRA MEDIE 1) confronto fra una media campionaria e una media di popolazione

Dettagli

lezione 5 AA Paolo Brunori

lezione 5 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - le stime OLS ci consentono di approssimare linearmente la relazione fra una variabile dipendente (Y) e una indipendente (X) - i parametri stimati su un

Dettagli

DISTRIBUZIONI DI CAMPIONAMENTO

DISTRIBUZIONI DI CAMPIONAMENTO DISTRIBUZIONI DI CAMPIONAMENTO 12 DISTRIBUZIONE DI CAMPIONAMENTO DELLA MEDIA Situazione reale Della popolazione di tutti i laureati in odontoiatria negli ultimi 10 anni, in tutte le Università d Italia,

Dettagli

Intervalli di confidenza

Intervalli di confidenza Probabilità e Statistica Esercitazioni a.a. 2006/2007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile

Dettagli

Teorema del limite centrale TCL

Teorema del limite centrale TCL Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazione lineare di N variabili aleatorie le cui funzioni

Dettagli

Esercitazione 8 del corso di Statistica 2

Esercitazione 8 del corso di Statistica 2 Esercitazione 8 del corso di Statistica Prof. Domenico Vistocco Dott.ssa Paola Costantini 6 Giugno 8 Decisione vera falsa è respinta Errore di I tipo Decisione corretta non è respinta Probabilità α Decisione

Dettagli

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi) CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON

Dettagli