Descrizione per la costruzione del modello di regressione

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Descrizione per la costruzione del modello di regressione"

Transcript

1 Descrizione per la costruzione del modello di regressione Formulazione delle Ipotesi Ricerca delle variabili esplicative Dati Modello Stima dei parametri Verifica Modello

2 IL MODELLO DI REGRESSIONE LINEARE MULTIPLA L analisi della regressione multipla è una tecnica statistica che può essere impiegata per analizzare la relazione tra una variabile dipendente e diverse variabili indipendenti (predittori). L OBIETTIVO dell analisi è prevedere i valori assunti da una variabile dipendente a partire dalla conoscenza di quelli osservati su più variabili indipendenti. Se il problema coinvolge una sola variabile indipendente, la tecnica statistica viene definita regressione semplice. Quando invece il problema coinvolge due o più variabili indipendenti, è detta, appunto, regressione multipla.

3 La relazione tra le variabili esplicative e la variabile dipendente può essere scritta come: Y f X, X,..., X ) + ε f ( ) + ε ( m X Se si esplicita una relazione di tipo lineare si ottiene l equazione: Y β + β X + β X β + ε Xβ + ε 0 m X m nella quale dovranno essere stimati i parametri β i Metodo dei minimi quadrati A tal scopo è necessario osservare le variabili esplicative e la variabile dipendente su un campione di n osservazioni

4 Regressione lineare semplice ( dip, indip) Y a + bx i i + ε i intercetta pendenza variabile indipendente errore Y i b + b X + b X 0 i i + ε i Regressione lineare multipla ( indip, dip)

5 RAPPRESENTAZIONE MATRICIALE Dato il modello ε Xβ Y + la rappresentazione dei dati campionari potrà allora essere la seguente: y n y y... y nm n n m m x x x x x x x x x X β m β β... 0 β ε n ε ε... ε

6 Y i b + b X + b X 0 i i + ε i y 3 X X 3β 0 +β +β +e 3 5 β 0 +3β +5β +e β 0 +5β +3β +e β 0 +7β +6β +e β 0 +8β +7β +e 5

7 3β 0 +β +β +e β 0 +3β +5β +e 4β 0 +5β +3β +e 3 5β 0 +7β +6β +e 4 8β 0 +8β +7β +e y Xβ e 5 β 0 3 β 6 β 7 + e e e e e 3 4 5

8 IPOTESI DEL MODELLO DI REGRESSIONE MULTIPLA Corretta specificazione del modello E ( ) 0 E( Y) VAR ε Xβ ( ε) E( ε ε) I VAR( Y) σ σ n Normalità distributiva della variabile d errore e, da cui segue la normalità distributiva della variabile dipendente Matrice di osservazioni X non stocastica, e rango(x) m+ Quando m queste ipotesi coincidono con quelle del modello di regressione semplice. OSSERVAZIONI La terza ipotesi include sia la omoschedasticità ( ) I n VAR ε i σ che l incorrelazione delle variabili casuali errori (, ) 0 COVAR ε per ogni i e j L assunzione riguardante il rango della matrice X impone in pratica che il numero di informazioni campionarie non ridondanti sia almeno pari al numero dei parametri da stimare. ε i j

9

10

11 STIMA DEI PARAMETRI: METODO DEI MINIMI QUADRATI L obiettivo è determinare, sulla base dei dati campionari, il vettore b delle stime che minimizza: Φ n ( β) ε i ε ε ( y Xβ) ( y Xβ) i y y y Xβ β X y + β X Xβ y y β X y + β X Xβ Derivando rispetto a b e uguagliando a zero di ottiene: Φ β ( β) X y + ( X X) βˆ 0 da cui si ricava il vettore b delle stime dell intercetta e dei coefficienti di regressione: b ( X X) X y

12 βˆ (X'X) X'y N x, x X X x, x x x X X 30 0

13 0,8 0,098 0,07 0,098 0,4.38 0, , X X inversa Calcolare l inversa Calcolare l inversa La diamo per scontata

14 X'y (X'X) β ˆ y y x y x X y X y

15 ,8 0,098 0,07 0,098 0,4.38 0, ,0 i i i X X Y ).5 (.50 ˆ + +

16 La correlazione fra variabili è la somma delle influenze dirette e indirette delle due variabili.50 X Z b* b*.65 Y.70 r xz.5 r xy.65 r zy.70 r xy b* +b* r zx r zy b* +b* r zx b* r xy -r xz b* b* b* r zy -r xz b* b*

17 Sviluppando poniamo XX, ZX r xy b +b r zx r zy b +b r zx r y b r +b r b r +b r r y b r +b r b r +b r r r r yx y y R r r xx b * yx r r b b * *

18 r R b* yx xx yx yxrxxb* b*r - r r y b* y.3 r +b* y.3 r +b* y3. r 3 r y b* y.3 r +b* y.3 r +b* y3. r 3 r y3 b* y.3 r 3 +b* y.3 r 3 +b* y3. r 33 con r ij r ji b * yx b b b * y.3 * y.3 * y3. R XX r r 3 r r 3 r r 3 3 r yx r r r y y y3

19 Regressione matriciale β formule alternative: β β * (X'X) C xx R c xx yx r yx X'y C xx è la matrice varianza/covarianza fra le X c yx è il vettore delle covarianze fra le x e la y R xx è la matrice di correlazione fra le X r yx è il vettore delle correlazioni fra le x e la y

20 Esempio di bc - c C XX c xy varianza e covarianza calcolate con N b 0.5 b b 0 Y ( b X i i ) 4.4 (5) (.5)

21 Beta standardizzati b b * i yx yx i i b yx b * yx i i s s s s x y x y i Con i dati dell esempio precedente: *.54 b yx.09.3 *.408 b yx (.5)

22 Esempio con b*r - r RXX r xy b 0 0

23 Propor Propor. di. di varianza varianza spiegata spiegata generico * X con *. *. ˆ ) ( ˆ) ( ) ( ) ( ) ˆ ( + i yi y y y y yy b r b r b r Y Y Y Y Y Y Y Y Y Y totale spiegata r r

24 Stimatore dei Minimi Quadrati: le proprietà B ( X ' X ) Var( B) X ' Y E( B) β Stimatore Corretto ( X ' X ) σ Cosa fare se σ è incognito? Stimare σ ˆ σ MSE SSE n m n i ( y i yˆ n m i ) Var( Bi ) MSE * cii con i,,..., m c ii Dove rappresenta l i-esimo elemento sulla diagonale della matrice ( X X)

25 MISURE DI BONTA DEL MODELLO: INDICE DI DETERMINAZIONE LINEARE Devianza di regressione R Devianza totale Nel modello di regressione multipla l indice di determinazione lineare può presentare alcuni problemi calcolatori e di interpretazione. Ad esempio, in caso di assenza di relazione lineare non è pari a zero. R tende ad aumentare al numero delle X E bene ricorrere perciò all indice R corretto: che varia sempre tra zero e uno. R mnumero di variabili indipendenti (X) m n R n n m n adjr ( R ) n m

26 CONTROLLO D IPOTESI SUL MODELLO: esiste un legame effettivo tra la variabile dipendente e i regressori? Si tratta di saggiare l ipotesi nulla H 0 : β β... β m 0 Tale ipotesi si controlla con il test F di Fisher. La statistica test si ottiene dal rapporto tra la varianza di regressione e la varianza di dispersione del modello: F Dev( Y ) regr m Dev( Y ) n m residua Var( Y ) Var( Y ) regr residua SSR / m MSE L ipotesi nulla viene rigettata se, a un prefissato livello di significatività α, la F così calcolata sui dati campionari è maggiore del valore della F di Fisher tabulato in corrispondenza di m e (n-m-) gradi di libertà: F α, m, n m

27 un test globale: che include tutte le variabili Confronto fra: Y b 0 + ε df r N- (ristretto) Y b + b X + b X 0 + ε df f N-3 (completo) H : b b 0 0 Usiamo la statistica F di Fisher Se è significativa, c è una relazione consistente fra le x e la y; la regressione ha senso. N.B.: In genere è significativa

28 F ( Rf Rr )/( dr d f ) ( Rf ) / d f ˆ ( Y Y) ( Y Y) /( dr d f ) ˆ ( Y Y) / d f R f ( Rf ) /( N m ) / m ffull (completo) rristretto [R 0]

29 Se il modello globale è significativo, si può fare: un test per ciascuna var. indip. (X) Anche se il modello globale è significativo, questo non significa che tutte le X siano significativamente associate a Y La maggior parte dei programmi utilizza un semplice t-test. Se il test è significativo, la X n può stare nel modello, altrimenti si dovrebbe togliere.

30 CONTROLLO D IPOTESI SUL MODELLO: esiste un legame lineare tra la variabile dipendente e il singolo regressore Xi? Si tratta di saggiare l ipotesi nulla H : β 0 i,..., m 0 i le ipotesi si controlla con il test t di Student. La statistica test si ottiene: t B i var( B ) i B i MSE c ii Errore Standard dell i-esimo coefficiente di regressione Dove c ii rappresenta l i-esimo elemento sulla diagonale della matrice ( X X) L ipotesi nulla viene rigettata se, a un prefissato livello di significatività α, la t così calcolata sui dati campionari è maggiore del valore della t di Student tabulato in corrispondenza di (n-m-) gradi di libertà: t α, n m

31

32 ANALISI DEI RESIDUI L analisi grafica dei residui consente di valutare, a posteriori, se il modello ipotizzato è corretto. In tal caso, infatti, gli errori dovrebbero distribuirsi in modo normale. Ancora, la rappresentazione grafica dei residui rispetto ai valori stimati della variabile dipendente consente di valutare la sussistenza delle ipotesi del modello: E () ε 0 e VAR( ε) σ I n Nel caso in cui si disponga di dati temporali, si può valutare l esistenza di autocorrelazione tra i residui con il test di Durbin-Watson, che saggia l ipotesi nulla di ASSENZA DI AUTOCORRELAZIONE tra i residui. La statistica test è: Un valore tra,3 e,4 indica autocorrelazione tra i residui d n ( ei ei ) i n ( ei ) i

33 Residui e si I residui (ey-y ) dovrebbero essere dispersi casualmente attorno a Y 0 e 0 NO e 0 Y Se non sono dispersi casualmente, esiste un altra variabile X che può spiegarne una parte, oppure la relazione non è lineare Y Y

34 MULTICOLLINEARITA on il termine multicollinearità ci si riferisce alla correlazione fra le variabili dipendenti di un modello di regressione. l suo effetto consiste nel ridurre la capacità previsiva di ogni singola variabile dipendente in modo proporzionale alla forza della sua associazione con le altre ariabili indipendenti. effetto della multicollinearità può interessare sia la capacità di spiegazione del odello (capacità della procedura di regressione e del ricercatore di rappresentare e apire l influenza di ciascuna variabile indipendente) sia la sua stima (la sua presenza ende problematica la determinazione dei contributi individuali delle variabili dipendenti, perché i loro effetti vengono mescolati o confusi). a pertanto valutata e individuata. Due strumenti a disposizione sono la Tolleranza Tolerance) e il Fattori di Accrescimento della Varianza (Variance Inflaction Factor). Tolerance R i0 VIF i R i 0 dove R i0 rappresenta il quadrato del coefficiente che misura la correlazione fra la i-esima variabile esplicativa e tutte le altre. In generale un VIF>5 è indice di alta multicollinearità.

35 Multicollinearità La situazione ideale per una regressione multipla dovrebbe essere: ogni X è altamente correlata con Y, ma le X non sono correlate fra loro Y X X.60 X.50.0 X X.0 Idealmente, le correlazioni tra le X, dovrebbero essere 0; in questo modo beta dovrebbe coincidere con r e non con r parzializzato

36 Multicollinearità Spesso però, due o più X sono correlate fra loro Y X.60 X.50 X 3.70 X X.0 Quando due variabili X o più, sono tra loro correlate (moderatamente o più), parliamo di multicollinearità.

37 Problemi della multicollinearità fa diminuire la R multipla l effetto dei predittori si confonde aumenta la varianza e l instabilità dell equazione

38 Diminuire la multicollinearità combinare fra loro i predittori altamente correlati (ad esempio sommandoli) se ci sono molti predittori altamente correlati, usare un analisi delle componenti principali per ridurre il numero delle X

39 Scegliere i predittori Usare la teoria (ricerca bibliografica) metodi semi-automatici sequenziali forward stepwise backward

40 Regressione standard Tutte le variabili X vengono considerate assieme e tutti i coefficienti di regressione (B o beta) stimati contemporaneamente

41 Forward Le variabili X vengono inserite una alla volta (in genere la X con la correlazione XY più alta) e vengono poi calcolate le correlazioni parziali e i test di significatività di tutte le altre. Una nuova variabile viene inserita se risulta statisticamente associata al modello Ci si ferma quando non ci sono variabili signficative

42 Backword Le X vengono inserite tutte assieme e poi pian piano tolte se non risultano significative al t-testt test Ci si ferma quando tutte le non significative sono state tolte

43 Stepwise Si parte con alcune variabili X e poi Le altre X vengono inserite e / o tolte a seconda della loro importanza e significatività Il modello finale identificato dovrebbe essere il migliore

44 sercizio sulla regressione Multipla: variabile indipendente (Y) e 3 variabili dipenden X). i vuole analizzare la relazione tra il numero di Carte di Credito di una famiglia in elazione a tre possibili variabili di influenza Numero Carte di Credito (Y) Ampiezza della Famiglia (X) Reddito della Famiglia (in migliaia di ) (X) Numero di auto della famiglia (X3) Fasi dell analisi: ) Stima dei parametri di regressione ) Inferenza sui parametri di Regressione Multipla (Test di Ipotesi,Intervalli di confidenza) 3) Diagnostica di Regressione: Plot dei Residui 4) Previsioni

45 Stima dei Parametri di Regressione (utilizzo di Excel o di software Statistici) Coefficienti Errore standard Stat t Valore di significatività Intercetta 0,86,606 0,78 0,867 Ampiezza della Famiglia 0,635 0,7,34 0,079 Reddito della Famiglia (in migliaia di ) 0,00 0,9,67 0,70 Numero di auto della famiglia 0,7 0,470 0,578 0,594 Y 0,86 + 0,635X + X + 0,X 0, 7 Interpretazione dei Coefficienti : Attenzione La Bontà dell adattamento del Modello Lineare 3 R al quadrato R al quadrato corretto 0,87 0,776

46 Inferenza sui Coefficienti : La significatività dei coefficienti e la Selezione delle Variabili Esplicative egression Model Selection ependent variable: Numero Carte di Credito ndependent variables: AAmpiezza della Famiglia B Numero di Auto CReddito odel Results Adjusted Included SE R-Squared R-Squared Cp Variables ,4 0,0 0,0 5,6,9 75, ,9 3,7954 A,4 4,857 0,0 3,608 B,5 68,79 63,5 5,77594 C,96 78,743 69,58 4,7994 AB,6 86,376 80,59,33369 AC,33 69, ,54 7,4895 BC,70 87,05 77,6 4,0 ABC

47 adjusted R-Squared Adjusted R-Squared Plot for Numero Carte di Credito Number of Coefficients R R m n n n m

48 R-Squared Plot for Numero Carte di Credito 00 R-Squared Number of Coefficients R Devianza di regressione Devianza totale

49 Mallows' Cp Plot for Numero Carte di Credito Cp Number of Coefficients Cp is a measure of the bias in the model based on a comparison of total Mean Squared Error to the true error variance. Unbiased models have an expected Cp value of approximately p, where p is the number of coefficients in the fitted model. Cp is based on the assumption that the model that contains all the candidate variables is unbiased; therefore, the full model will always have Cp p. Look for models that have Cp values close to p.

50 CONTROLLO D IPOTESI SUL MODELLO: esiste un legame effettivo tra la variabile dipendente e i regressori? H 0 : β β... β m 0 F Dev( Y ) regr m Dev( Y ) n m residua Var( Y ) Var( Y ) regr residua Dev (Y) Dev (Y) regressione 9,85 SSR / m MSE 9,09 Da confrontare con il valore tabulato F F 0,05 ;3;4 0,0 ;3;4 9,98 6,59 Dev (Y) residua,85

51 Stima Intervallare dei Coefficienti di Regressione Intercetta Ampiezza della Famiglia Reddito della Famiglia (in migliaia di ) Numero di auto della famiglia B i t α ( ; n m ) * Inferiore 95% -4,7-0, -0,3 -,03 var( B i ) Superiore 95% ; 4,74,39 0,53,58 B i + t Inferiore 90,0% -3,4 0,06-0,06-0,73 α ( ; n m ) * Superiore 90,0% 3,7, 0,45,7 var( B Esempio di Calcolo per il coefficiente della Variabile Ampiezza della Famiglia Coefficiente t di Student Standard Error Limite Inferiore i ) Limite Superiore 90% 0,635,3 0,7 0,057, 95% 0,635,776 0,7-0,8,387

52 Diagnostica di regressione Regression Results for Numero Carte di Credito N Oss. Y Y predetta Errore di regressione 4,0 4,609-0,609 6,0 5,9087 0, ,0 6,606-0, ,0 6, , ,0 7, , ,0 8,93 -,93 7 8,0 7,757 0, ,0 9,65 0,375 d n ( ei ei ) i n ( ei ) i DW,47 (Assenza di correlazione tra i residui) observed Plot of Numero Carte di Credito residual, 0,8 0,4 0-0,4-0,8 Residual Plot predicted -, row number

53

54

55

56

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1 Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare

Dettagli

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa

Dettagli

Regressione Lineare Semplice e Correlazione

Regressione Lineare Semplice e Correlazione Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)

Dettagli

Statistica Applicata all edilizia: il modello di regressione

Statistica Applicata all edilizia: il modello di regressione Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione

Dettagli

Fasi del modello di regressione

Fasi del modello di regressione Fasi del modello di regressione Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori

Dettagli

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.

Dettagli

Analisi di Regressione Multivariata. β matrice incognita dei coeff. di regressione (regr. lineare in β)

Analisi di Regressione Multivariata. β matrice incognita dei coeff. di regressione (regr. lineare in β) Analisi di Regressione Multivariata Regressione: metodologia per dedurre info e per anticipare risposte di una variabile dip. Modello classico di regressione lineare: Y {z} n k = {z} X β + ρ {z} {z} n

Dettagli

Esercitazione 5 Sta/s/ca Aziendale

Esercitazione 5 Sta/s/ca Aziendale Esercitazione 5 Sta/s/ca Aziendale David Aristei 12 maggio 2015 Si è interessa/ ad analizzare le determinan/ a livello aziendale della produ>vità del lavoro (PL, in migliaia di euro per dipendente) di

Dettagli

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE

Dettagli

STATISTICA A K (60 ore)

STATISTICA A K (60 ore) STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta

Dettagli

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli. Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:

Dettagli

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1 lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,

Dettagli

Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo

Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo 1 Controllo di ipotesi sui parametri In questo contesto risulta necessario avvalersi dell assunzione di normalita

Dettagli

Statistica multivariata Donata Rodi 17/10/2016

Statistica multivariata Donata Rodi 17/10/2016 Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare

Dettagli

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria

Dettagli

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,

MODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, MODELLO DI REGRESSIONE LINEARE le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, teorema di Gauss-Markov, verifica di ipotesi e test di

Dettagli

Il modello di regressione

Il modello di regressione Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti

Dettagli

Test F per la significatività del modello

Test F per la significatività del modello Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno

Dettagli

Analisi della regressione multipla

Analisi della regressione multipla Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,

Dettagli

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è

Dettagli

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141 Regressione Semplice Analisi Per avere una prima idea della struttura di dipendenza fra le variabili in esame, possiamo cominciare col costruire la matrice di correlazione delle variabili presenti nel

Dettagli

Lezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice

Lezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 45 Outline 1 2 3 4 5 () Statistica 2 / 45 Modello di In molte applicazioni il ruolo delle variabili

Dettagli

Il modello di regressione lineare multipla con regressori stocastici

Il modello di regressione lineare multipla con regressori stocastici Università di Pavia Il modello di regressione lineare multipla con regressori stocastici Eduardo Rossi Il valore atteso condizionale Modellare l esperimento casuale bivariato nel quale le variabili casuali

Dettagli

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Regressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007 Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il costo mensile Y di produzione e il corrispondente volume produttivo X per uno dei propri stabilimenti. Volume

Dettagli

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono

Dettagli

Metodi di regressione multivariata

Metodi di regressione multivariata Metodi di regressione multivariata Modellamento dei dati per risposte quantitative I metodi di regressione multivariata sono strumenti utilizzati per ricercare relazioni funzionali quantitative tra un

Dettagli

lezione 7 AA Paolo Brunori

lezione 7 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice

Dettagli

Esercitazione 9 del corso di Statistica (parte seconda)

Esercitazione 9 del corso di Statistica (parte seconda) Esercitazione 9 del corso di Statistica (parte seconda) Dott.ssa Paola Costantini 17 Marzo 9 Esercizio 1 Esercizio Un economista del Ministero degli Esteri desidera verificare se gli accordi di negoziazione

Dettagli

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova

Dettagli

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Contents 1 Inferenza sulla regressione semplice 1 1.1 Test sulla pendenza della retta................................... 1 1.2 Test sull

Dettagli

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it

Dettagli

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. Lezione 14 (a cura di Ludovica Peccia) MULTICOLLINEARITA La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. In un modello di regressione Y= X 1, X 2, X 3

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative

Dettagli

RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE

RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE 1 La verifica di ipotesi Finora abbiamo visto come si utilizza una statistica campionaria per stimare

Dettagli

Regressione lineare semplice

Regressione lineare semplice Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro

Dettagli

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice Esercitazione 16 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa

Dettagli

Esercizi di statistica

Esercizi di statistica Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..

Dettagli

Test delle Ipotesi Parte I

Test delle Ipotesi Parte I Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test

Dettagli

Esercitazione del

Esercitazione del Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36

Dettagli

Statistica 1 A.A. 2015/2016

Statistica 1 A.A. 2015/2016 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione

Dettagli

Es. la performance all esame in relazione alle ore di studio a casa e alle abilità cognitive

Es. la performance all esame in relazione alle ore di studio a casa e alle abilità cognitive Regressione Tale tecnica esamina e studia la relazione tra una o più variabili indipendenti e una variabile dipendente. L insieme dei parametri riassumono la relazione tra VD e VI, sotto le ipotesi che

Dettagli

Statistica per le ricerche di mercato. 12. Violazione delle ipotesi nel modello di regressione lineare

Statistica per le ricerche di mercato. 12. Violazione delle ipotesi nel modello di regressione lineare Statistica per le ricerche di mercato A.A. 2012/13 Dr. Luca Secondi 12. Violazione delle ipotesi nel modello di regressione lineare La violazione delle ipotesi Fino ad ora le assunzioni ipotizzate per

Dettagli

Psicometria. 9-Analisi fattoriale confermativa vers. 1.0

Psicometria. 9-Analisi fattoriale confermativa vers. 1.0 Psicometria 9-Analisi fattoriale confermativa vers. 1.0 Germano Rossi 1 germano.rossi@unimib.it Giovanni Battista Flebus 1 giovannibattista.flebus@unimib.it 1 Dipartimento di Psicologia, Università di

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri

Dettagli

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi) CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON

Dettagli

Statistica multivariata

Statistica multivariata Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire

Dettagli

ANALISI DELLE SERIE STORICHE

ANALISI DELLE SERIE STORICHE ANALISI DELLE SERIE STORICHE De Iaco S. s.deiaco@economia.unile.it UNIVERSITÀ del SALENTO DIP.TO DI SCIENZE ECONOMICHE E MATEMATICO-STATISTICHE FACOLTÀ DI ECONOMIA 24 settembre 2012 Indice 1 Funzione di

Dettagli

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)

Dettagli

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione

Dettagli

Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2016/2017. Giovanni Lafratta

Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2016/2017. Giovanni Lafratta Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2016/2017 Giovanni Lafratta ii Indice 1 Spazi, Disegni e Strategie Campionarie 1 2 Campionamento casuale

Dettagli

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

L Analisi della Varianza ANOVA (ANalysis Of VAriance) L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 Concetti generali: Confronto simultaneo tra più di due popolazioni, esempi... La analisi della varianza estende il confronto a p gruppi con p>2.

Dettagli

Università di Pavia. Test diagnostici. Eduardo Rossi

Università di Pavia. Test diagnostici. Eduardo Rossi Università di Pavia Test diagnostici Eduardo Rossi Test diagnostici Fase di controllo diagnostico: controllo della coerenza tra quanto direttamente osservato e le ipotesi statistiche adottate Ipotesi MRLM

Dettagli

Regressione multipla

Regressione multipla Regressione multipla L obiettivo è costruire un modello probabilistico per spiegare la variabile y tramite più di una variabile indipendente x 1, x 2,..., x k. Esempio: Per un efficiente progettazione

Dettagli

lezione 5 AA Paolo Brunori

lezione 5 AA Paolo Brunori AA 2016-2017 Paolo Brunori dove eravamo arrivati - le stime OLS ci consentono di approssimare linearmente la relazione fra una variabile dipendente (Y) e una indipendente (X) - i parametri stimati su un

Dettagli

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1

Dettagli

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice

Dettagli

Metodi Statistici e Probabilistici per l Ingegneria MODELLI EMPIRICI. Corso di Laurea in Ingegneria Civile

Metodi Statistici e Probabilistici per l Ingegneria MODELLI EMPIRICI. Corso di Laurea in Ingegneria Civile Metodi Statistici e Probabilistici per l Ingegneria Corso di Laurea in Ingegneria Civile Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain E-mail: livio.corain@unipd.it Home page: www.gest.unipd.it/~livio/corso_civile.html

Dettagli

Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR

Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR Materiale ad uso dei ricercatori che hanno seguito il corso di formazione interna in Statistica, edizione

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

Tema d esame del 15/02/12

Tema d esame del 15/02/12 Tema d esame del 15/0/1 Volendo aprire un nuovo locale, una catena di ristoranti chiede ad un consulente di valutare la posizione geografica ideale all interno di un centro abitato. A questo scopo, avvalendosi

Dettagli

I MODELLI LINEARI GENERALIZZATI GLM

I MODELLI LINEARI GENERALIZZATI GLM I MODELLI LINEARI GENERALIZZATI GLM Secondo la teoria dei Modelli Lineari Generalizzati (GLM), la regressione lineare, l analisi della varianza (ANOVA), la regressione logistica e i modelli log-lineari

Dettagli

Corso di Psicometria Progredito

Corso di Psicometria Progredito Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione

Dettagli

LEZIONE N. 11 ( a cura di MADDALENA BEI)

LEZIONE N. 11 ( a cura di MADDALENA BEI) LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice

Dettagli

Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a.

Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a. Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a. 2008 PARTE I 1. Si consideri il seguente modello di regressione lineare su dati cross

Dettagli

Nel modello di regressione Multivariata abbiamo più variabili risposta (tipicamente poche), in particolare avremo:

Nel modello di regressione Multivariata abbiamo più variabili risposta (tipicamente poche), in particolare avremo: Lezione 15 (a cura di Giovanni Mariani) Regressione Multivariata Consideriamo yiyr, con r = numero variabili risposta xixk, con k = numero varibili esplicative Nel modello di regressione Multivariata abbiamo

Dettagli

Contenuti: Capitolo 14 del libro di testo

Contenuti: Capitolo 14 del libro di testo Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4

Dettagli

IL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi. Statistica Economica A.A. 2011/2012. Prof.ssa Tiziana Laureti

IL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi. Statistica Economica A.A. 2011/2012. Prof.ssa Tiziana Laureti IL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi Statistica Economica A.A. 2011/2012 Prof.ssa Tiziana Laureti *Libro di testo: Stock J.H. e Watson, M.W. Introduzione all

Dettagli

PROBABILITÀ ELEMENTARE

PROBABILITÀ ELEMENTARE Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti

Dettagli

Statistica multivariata Donata Rodi 08/11/2016

Statistica multivariata Donata Rodi 08/11/2016 Statistica multivariata Donata Rodi 08/11/2016 MANOVA: Multivariate Analysis of Variance Due o più variabili dipendenti quantitative Una o più variabili indipendenti categoriali (con più livelli) Residui

Dettagli

Regressione lineare con un solo regressore

Regressione lineare con un solo regressore Regressione lineare con un solo regressore La regressione lineare è uno strumento che ci permette di stimare e di fare inferenza sui coefficienti incogniti di una retta. Lo scopo principale è di stimare

Dettagli

Variabili tutte osservabili: regressione Si parla di regressione quando si ha a disposizione un campione sperimentale di numerosità n della forma X 1

Variabili tutte osservabili: regressione Si parla di regressione quando si ha a disposizione un campione sperimentale di numerosità n della forma X 1 Modelli lineari Come motivazione di ciò che stiamo per fare, pensiamo ai dati indicatori_benessere.txt. Quando li abbiamo esaminati nella lezione 1 tramite la rappresentazione nel piano delle componenti

Dettagli

La regressione lineare multipla

La regressione lineare multipla 13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività

Dettagli

Statistica Applicata all edilizia Lezione: approccio stocastico all analisi delle serie storiche

Statistica Applicata all edilizia Lezione: approccio stocastico all analisi delle serie storiche Lezione: approccio stocastico all analisi delle serie storiche E-mail: orietta.nicolis@unibg.it 3 maggio 2011 Programma 1 Approccio stocastico all analisi delle serie storiche Programma Approccio stocastico

Dettagli

0.1 Percorrenza e Cilindrata

0.1 Percorrenza e Cilindrata 0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,

Dettagli

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

lezione 9 AA Paolo Brunori

lezione 9 AA Paolo Brunori AA 2016-2017 Paolo Brunori Dove siamo arrivati? - la regressione lineare multipla ci permette di stimare l effetto della variabile X sulla Y tenendo ferme tutte le altre variabili osservabili che hanno

Dettagli

Università di Siena. Corso di STATISTICA. Parte seconda: Teoria della stima. Andrea Garulli, Antonello Giannitrapani, Simone Paoletti

Università di Siena. Corso di STATISTICA. Parte seconda: Teoria della stima. Andrea Garulli, Antonello Giannitrapani, Simone Paoletti Università di Siena Corso di STATISTICA Parte seconda: Teoria della stima Andrea Garulli, Antonello Giannitrapani, Simone Paoletti Master E 2 C Centro per lo Studio dei Sistemi Complessi Università di

Dettagli

CAPITOLO 5 Introduzione ai piani fattoriali

CAPITOLO 5 Introduzione ai piani fattoriali Douglas C. Montgomery Progettazione e analisi degli esperimenti 2006 McGraw-Hill CAPITOLO 5 Introduzione ai piani fattoriali Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria

Dettagli

Laboratorio di Statistica Aziendale Modello di regressione lineare semplice

Laboratorio di Statistica Aziendale Modello di regressione lineare semplice Laboratorio di Statistica Aziendale Modello di regressione lineare semplice Dott.ssa Michela Pasetto michela.pasetto2@unibo.it Caricamento del dataset Il dataset SalesData si trova nella cartella condivisa

Dettagli

Multicollinearità. Strumenti quantitativi per la gestione

Multicollinearità. Strumenti quantitativi per la gestione Multicollinearità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3c_mc.html#(1) 1/13 Quando non tutto va come dovrebbe Si parla di multi-collinearità

Dettagli

Esercizio 2: voto e ore dedicate allo studio

Esercizio 2: voto e ore dedicate allo studio La seguente tabella riporta il voto riportato da 10 studenti all esame di Statistica Sociale e il numero di ore di lezione non seguite dallo studente (il corso prevede 30 ore di lezione). Ci si chiede

Dettagli

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

REGRESSIONE. Un modello di regressione può essere espresso attraverso una relazione del tipo:

REGRESSIONE. Un modello di regressione può essere espresso attraverso una relazione del tipo: REGRESSIONE Un modello di regressione può essere espresso attraverso una relazione del tipo: Y=f(X) dove Y rappresenta la variabile spiegata e X l insieme delle variabili esplicative ed f la funzione di

Dettagli

Il modello di regressione lineare classico

Il modello di regressione lineare classico Università di Pavia Il modello di regressione lineare classico Eduardo Rossi Ipotesi Il modello di regressione lineare classico y t = x tβ + ε t t = 1,...,N Y = Xβ + ε Se il modello ha un intercetta allora

Dettagli

Analisi Multivariata dei Dati. Regressione Multipla

Analisi Multivariata dei Dati. Regressione Multipla Analisi Multivariata dei Dati Regressione Multipla A M D Marcello Gallucci Milano-Bicocca Lezione: III Effetti multipli Consideriamo ora il caso in cui la variabile dipendente possa essere spiegata da

Dettagli

Modelli lineari generalizzati

Modelli lineari generalizzati Modelli lineari generalizzati Estensione del modello lineare generale Servono allo studio della dipendenza in media di una variabile risposta da una o più variabili antecedenti Vengono attenuate alcune

Dettagli

Presentazione dell edizione italiana

Presentazione dell edizione italiana 1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli

Dettagli

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii

Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4

Dettagli

Capitolo 1. Regressione. 1.1 Premessa

Capitolo 1. Regressione. 1.1 Premessa Capitolo 1 Regressione 1.1 Premessa Per elaborare delle teorie economiche occorre raggruppare le relazioni tra variabili in modo da formare un modello. Un modello statistico è una rappresentazione parsimoniosa,

Dettagli

Esercizio 4 (Regressione multipla)

Esercizio 4 (Regressione multipla) Esercizio (Regressione multipla) DATI Il data set employee.sav (o employee.xls; fonte SPSS) contiene 7 dati relativi agli impiegati di un azienda. Le variabili sono ID Employee Code BDATE Date of Birth

Dettagli

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie

Dettagli

Regressione lineare multipla

Regressione lineare multipla Regressione lineare multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2014 Rossi Regressione lineare Econometria - 2014 1 / 31 Outline 1 La distorsione da variabili omesse 2 Causalità 3 Misure

Dettagli

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

0 altimenti 1 soggetto trova lavoroentro 6 mesi} Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta

Dettagli

Analisi della varianza

Analisi della varianza Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.

Dettagli

Corso di Statistica Industriale

Corso di Statistica Industriale Corso di Statistica Industriale Corsi di Laurea Specialistica in Ingegneria Gestionale e Ingegneria Meccanica Docente: Ilia Negri Orario del corso: Martedì: dalle 14.00 alle 16.00 Venerdì: dalle 10.30

Dettagli

La regressione lineare. Rappresentazione analitica delle distribuzioni

La regressione lineare. Rappresentazione analitica delle distribuzioni La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta

Dettagli

Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:

Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: Analisi chimica strumentale Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: (31.4) dove s y è la varianza dei valori

Dettagli

Regressioni Non Lineari

Regressioni Non Lineari Regressioni Non Lineari Fino ad ora abbiamo solo considerato realazioni lineari Ma le relazioni lineari non costituiscono sempre le migliori approssimazioni La regressione multipla può anche essere formulata

Dettagli

La regressione fuzzy. Capitolo I limiti della regressione classica. a cura di Fabrizio Maturo

La regressione fuzzy. Capitolo I limiti della regressione classica. a cura di Fabrizio Maturo Capitolo 14 La regressione fuzzy a cura di Fabrizio Maturo 14.1 I limiti della regressione classica L analisi di regressione offre una possibile soluzione per studiare l effetto di una o più variabili

Dettagli

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta

Dettagli