Descrizione per la costruzione del modello di regressione
|
|
- Aloisio Orlandi
- 6 anni fa
- Visualizzazioni
Transcript
1 Descrizione per la costruzione del modello di regressione Formulazione delle Ipotesi Ricerca delle variabili esplicative Dati Modello Stima dei parametri Verifica Modello
2 IL MODELLO DI REGRESSIONE LINEARE MULTIPLA L analisi della regressione multipla è una tecnica statistica che può essere impiegata per analizzare la relazione tra una variabile dipendente e diverse variabili indipendenti (predittori). L OBIETTIVO dell analisi è prevedere i valori assunti da una variabile dipendente a partire dalla conoscenza di quelli osservati su più variabili indipendenti. Se il problema coinvolge una sola variabile indipendente, la tecnica statistica viene definita regressione semplice. Quando invece il problema coinvolge due o più variabili indipendenti, è detta, appunto, regressione multipla.
3 La relazione tra le variabili esplicative e la variabile dipendente può essere scritta come: Y f X, X,..., X ) + ε f ( ) + ε ( m X Se si esplicita una relazione di tipo lineare si ottiene l equazione: Y β + β X + β X β + ε Xβ + ε 0 m X m nella quale dovranno essere stimati i parametri β i Metodo dei minimi quadrati A tal scopo è necessario osservare le variabili esplicative e la variabile dipendente su un campione di n osservazioni
4 Regressione lineare semplice ( dip, indip) Y a + bx i i + ε i intercetta pendenza variabile indipendente errore Y i b + b X + b X 0 i i + ε i Regressione lineare multipla ( indip, dip)
5 RAPPRESENTAZIONE MATRICIALE Dato il modello ε Xβ Y + la rappresentazione dei dati campionari potrà allora essere la seguente: y n y y... y nm n n m m x x x x x x x x x X β m β β... 0 β ε n ε ε... ε
6 Y i b + b X + b X 0 i i + ε i y 3 X X 3β 0 +β +β +e 3 5 β 0 +3β +5β +e β 0 +5β +3β +e β 0 +7β +6β +e β 0 +8β +7β +e 5
7 3β 0 +β +β +e β 0 +3β +5β +e 4β 0 +5β +3β +e 3 5β 0 +7β +6β +e 4 8β 0 +8β +7β +e y Xβ e 5 β 0 3 β 6 β 7 + e e e e e 3 4 5
8 IPOTESI DEL MODELLO DI REGRESSIONE MULTIPLA Corretta specificazione del modello E ( ) 0 E( Y) VAR ε Xβ ( ε) E( ε ε) I VAR( Y) σ σ n Normalità distributiva della variabile d errore e, da cui segue la normalità distributiva della variabile dipendente Matrice di osservazioni X non stocastica, e rango(x) m+ Quando m queste ipotesi coincidono con quelle del modello di regressione semplice. OSSERVAZIONI La terza ipotesi include sia la omoschedasticità ( ) I n VAR ε i σ che l incorrelazione delle variabili casuali errori (, ) 0 COVAR ε per ogni i e j L assunzione riguardante il rango della matrice X impone in pratica che il numero di informazioni campionarie non ridondanti sia almeno pari al numero dei parametri da stimare. ε i j
9
10
11 STIMA DEI PARAMETRI: METODO DEI MINIMI QUADRATI L obiettivo è determinare, sulla base dei dati campionari, il vettore b delle stime che minimizza: Φ n ( β) ε i ε ε ( y Xβ) ( y Xβ) i y y y Xβ β X y + β X Xβ y y β X y + β X Xβ Derivando rispetto a b e uguagliando a zero di ottiene: Φ β ( β) X y + ( X X) βˆ 0 da cui si ricava il vettore b delle stime dell intercetta e dei coefficienti di regressione: b ( X X) X y
12 βˆ (X'X) X'y N x, x X X x, x x x X X 30 0
13 0,8 0,098 0,07 0,098 0,4.38 0, , X X inversa Calcolare l inversa Calcolare l inversa La diamo per scontata
14 X'y (X'X) β ˆ y y x y x X y X y
15 ,8 0,098 0,07 0,098 0,4.38 0, ,0 i i i X X Y ).5 (.50 ˆ + +
16 La correlazione fra variabili è la somma delle influenze dirette e indirette delle due variabili.50 X Z b* b*.65 Y.70 r xz.5 r xy.65 r zy.70 r xy b* +b* r zx r zy b* +b* r zx b* r xy -r xz b* b* b* r zy -r xz b* b*
17 Sviluppando poniamo XX, ZX r xy b +b r zx r zy b +b r zx r y b r +b r b r +b r r y b r +b r b r +b r r r r yx y y R r r xx b * yx r r b b * *
18 r R b* yx xx yx yxrxxb* b*r - r r y b* y.3 r +b* y.3 r +b* y3. r 3 r y b* y.3 r +b* y.3 r +b* y3. r 3 r y3 b* y.3 r 3 +b* y.3 r 3 +b* y3. r 33 con r ij r ji b * yx b b b * y.3 * y.3 * y3. R XX r r 3 r r 3 r r 3 3 r yx r r r y y y3
19 Regressione matriciale β formule alternative: β β * (X'X) C xx R c xx yx r yx X'y C xx è la matrice varianza/covarianza fra le X c yx è il vettore delle covarianze fra le x e la y R xx è la matrice di correlazione fra le X r yx è il vettore delle correlazioni fra le x e la y
20 Esempio di bc - c C XX c xy varianza e covarianza calcolate con N b 0.5 b b 0 Y ( b X i i ) 4.4 (5) (.5)
21 Beta standardizzati b b * i yx yx i i b yx b * yx i i s s s s x y x y i Con i dati dell esempio precedente: *.54 b yx.09.3 *.408 b yx (.5)
22 Esempio con b*r - r RXX r xy b 0 0
23 Propor Propor. di. di varianza varianza spiegata spiegata generico * X con *. *. ˆ ) ( ˆ) ( ) ( ) ( ) ˆ ( + i yi y y y y yy b r b r b r Y Y Y Y Y Y Y Y Y Y totale spiegata r r
24 Stimatore dei Minimi Quadrati: le proprietà B ( X ' X ) Var( B) X ' Y E( B) β Stimatore Corretto ( X ' X ) σ Cosa fare se σ è incognito? Stimare σ ˆ σ MSE SSE n m n i ( y i yˆ n m i ) Var( Bi ) MSE * cii con i,,..., m c ii Dove rappresenta l i-esimo elemento sulla diagonale della matrice ( X X)
25 MISURE DI BONTA DEL MODELLO: INDICE DI DETERMINAZIONE LINEARE Devianza di regressione R Devianza totale Nel modello di regressione multipla l indice di determinazione lineare può presentare alcuni problemi calcolatori e di interpretazione. Ad esempio, in caso di assenza di relazione lineare non è pari a zero. R tende ad aumentare al numero delle X E bene ricorrere perciò all indice R corretto: che varia sempre tra zero e uno. R mnumero di variabili indipendenti (X) m n R n n m n adjr ( R ) n m
26 CONTROLLO D IPOTESI SUL MODELLO: esiste un legame effettivo tra la variabile dipendente e i regressori? Si tratta di saggiare l ipotesi nulla H 0 : β β... β m 0 Tale ipotesi si controlla con il test F di Fisher. La statistica test si ottiene dal rapporto tra la varianza di regressione e la varianza di dispersione del modello: F Dev( Y ) regr m Dev( Y ) n m residua Var( Y ) Var( Y ) regr residua SSR / m MSE L ipotesi nulla viene rigettata se, a un prefissato livello di significatività α, la F così calcolata sui dati campionari è maggiore del valore della F di Fisher tabulato in corrispondenza di m e (n-m-) gradi di libertà: F α, m, n m
27 un test globale: che include tutte le variabili Confronto fra: Y b 0 + ε df r N- (ristretto) Y b + b X + b X 0 + ε df f N-3 (completo) H : b b 0 0 Usiamo la statistica F di Fisher Se è significativa, c è una relazione consistente fra le x e la y; la regressione ha senso. N.B.: In genere è significativa
28 F ( Rf Rr )/( dr d f ) ( Rf ) / d f ˆ ( Y Y) ( Y Y) /( dr d f ) ˆ ( Y Y) / d f R f ( Rf ) /( N m ) / m ffull (completo) rristretto [R 0]
29 Se il modello globale è significativo, si può fare: un test per ciascuna var. indip. (X) Anche se il modello globale è significativo, questo non significa che tutte le X siano significativamente associate a Y La maggior parte dei programmi utilizza un semplice t-test. Se il test è significativo, la X n può stare nel modello, altrimenti si dovrebbe togliere.
30 CONTROLLO D IPOTESI SUL MODELLO: esiste un legame lineare tra la variabile dipendente e il singolo regressore Xi? Si tratta di saggiare l ipotesi nulla H : β 0 i,..., m 0 i le ipotesi si controlla con il test t di Student. La statistica test si ottiene: t B i var( B ) i B i MSE c ii Errore Standard dell i-esimo coefficiente di regressione Dove c ii rappresenta l i-esimo elemento sulla diagonale della matrice ( X X) L ipotesi nulla viene rigettata se, a un prefissato livello di significatività α, la t così calcolata sui dati campionari è maggiore del valore della t di Student tabulato in corrispondenza di (n-m-) gradi di libertà: t α, n m
31
32 ANALISI DEI RESIDUI L analisi grafica dei residui consente di valutare, a posteriori, se il modello ipotizzato è corretto. In tal caso, infatti, gli errori dovrebbero distribuirsi in modo normale. Ancora, la rappresentazione grafica dei residui rispetto ai valori stimati della variabile dipendente consente di valutare la sussistenza delle ipotesi del modello: E () ε 0 e VAR( ε) σ I n Nel caso in cui si disponga di dati temporali, si può valutare l esistenza di autocorrelazione tra i residui con il test di Durbin-Watson, che saggia l ipotesi nulla di ASSENZA DI AUTOCORRELAZIONE tra i residui. La statistica test è: Un valore tra,3 e,4 indica autocorrelazione tra i residui d n ( ei ei ) i n ( ei ) i
33 Residui e si I residui (ey-y ) dovrebbero essere dispersi casualmente attorno a Y 0 e 0 NO e 0 Y Se non sono dispersi casualmente, esiste un altra variabile X che può spiegarne una parte, oppure la relazione non è lineare Y Y
34 MULTICOLLINEARITA on il termine multicollinearità ci si riferisce alla correlazione fra le variabili dipendenti di un modello di regressione. l suo effetto consiste nel ridurre la capacità previsiva di ogni singola variabile dipendente in modo proporzionale alla forza della sua associazione con le altre ariabili indipendenti. effetto della multicollinearità può interessare sia la capacità di spiegazione del odello (capacità della procedura di regressione e del ricercatore di rappresentare e apire l influenza di ciascuna variabile indipendente) sia la sua stima (la sua presenza ende problematica la determinazione dei contributi individuali delle variabili dipendenti, perché i loro effetti vengono mescolati o confusi). a pertanto valutata e individuata. Due strumenti a disposizione sono la Tolleranza Tolerance) e il Fattori di Accrescimento della Varianza (Variance Inflaction Factor). Tolerance R i0 VIF i R i 0 dove R i0 rappresenta il quadrato del coefficiente che misura la correlazione fra la i-esima variabile esplicativa e tutte le altre. In generale un VIF>5 è indice di alta multicollinearità.
35 Multicollinearità La situazione ideale per una regressione multipla dovrebbe essere: ogni X è altamente correlata con Y, ma le X non sono correlate fra loro Y X X.60 X.50.0 X X.0 Idealmente, le correlazioni tra le X, dovrebbero essere 0; in questo modo beta dovrebbe coincidere con r e non con r parzializzato
36 Multicollinearità Spesso però, due o più X sono correlate fra loro Y X.60 X.50 X 3.70 X X.0 Quando due variabili X o più, sono tra loro correlate (moderatamente o più), parliamo di multicollinearità.
37 Problemi della multicollinearità fa diminuire la R multipla l effetto dei predittori si confonde aumenta la varianza e l instabilità dell equazione
38 Diminuire la multicollinearità combinare fra loro i predittori altamente correlati (ad esempio sommandoli) se ci sono molti predittori altamente correlati, usare un analisi delle componenti principali per ridurre il numero delle X
39 Scegliere i predittori Usare la teoria (ricerca bibliografica) metodi semi-automatici sequenziali forward stepwise backward
40 Regressione standard Tutte le variabili X vengono considerate assieme e tutti i coefficienti di regressione (B o beta) stimati contemporaneamente
41 Forward Le variabili X vengono inserite una alla volta (in genere la X con la correlazione XY più alta) e vengono poi calcolate le correlazioni parziali e i test di significatività di tutte le altre. Una nuova variabile viene inserita se risulta statisticamente associata al modello Ci si ferma quando non ci sono variabili signficative
42 Backword Le X vengono inserite tutte assieme e poi pian piano tolte se non risultano significative al t-testt test Ci si ferma quando tutte le non significative sono state tolte
43 Stepwise Si parte con alcune variabili X e poi Le altre X vengono inserite e / o tolte a seconda della loro importanza e significatività Il modello finale identificato dovrebbe essere il migliore
44 sercizio sulla regressione Multipla: variabile indipendente (Y) e 3 variabili dipenden X). i vuole analizzare la relazione tra il numero di Carte di Credito di una famiglia in elazione a tre possibili variabili di influenza Numero Carte di Credito (Y) Ampiezza della Famiglia (X) Reddito della Famiglia (in migliaia di ) (X) Numero di auto della famiglia (X3) Fasi dell analisi: ) Stima dei parametri di regressione ) Inferenza sui parametri di Regressione Multipla (Test di Ipotesi,Intervalli di confidenza) 3) Diagnostica di Regressione: Plot dei Residui 4) Previsioni
45 Stima dei Parametri di Regressione (utilizzo di Excel o di software Statistici) Coefficienti Errore standard Stat t Valore di significatività Intercetta 0,86,606 0,78 0,867 Ampiezza della Famiglia 0,635 0,7,34 0,079 Reddito della Famiglia (in migliaia di ) 0,00 0,9,67 0,70 Numero di auto della famiglia 0,7 0,470 0,578 0,594 Y 0,86 + 0,635X + X + 0,X 0, 7 Interpretazione dei Coefficienti : Attenzione La Bontà dell adattamento del Modello Lineare 3 R al quadrato R al quadrato corretto 0,87 0,776
46 Inferenza sui Coefficienti : La significatività dei coefficienti e la Selezione delle Variabili Esplicative egression Model Selection ependent variable: Numero Carte di Credito ndependent variables: AAmpiezza della Famiglia B Numero di Auto CReddito odel Results Adjusted Included SE R-Squared R-Squared Cp Variables ,4 0,0 0,0 5,6,9 75, ,9 3,7954 A,4 4,857 0,0 3,608 B,5 68,79 63,5 5,77594 C,96 78,743 69,58 4,7994 AB,6 86,376 80,59,33369 AC,33 69, ,54 7,4895 BC,70 87,05 77,6 4,0 ABC
47 adjusted R-Squared Adjusted R-Squared Plot for Numero Carte di Credito Number of Coefficients R R m n n n m
48 R-Squared Plot for Numero Carte di Credito 00 R-Squared Number of Coefficients R Devianza di regressione Devianza totale
49 Mallows' Cp Plot for Numero Carte di Credito Cp Number of Coefficients Cp is a measure of the bias in the model based on a comparison of total Mean Squared Error to the true error variance. Unbiased models have an expected Cp value of approximately p, where p is the number of coefficients in the fitted model. Cp is based on the assumption that the model that contains all the candidate variables is unbiased; therefore, the full model will always have Cp p. Look for models that have Cp values close to p.
50 CONTROLLO D IPOTESI SUL MODELLO: esiste un legame effettivo tra la variabile dipendente e i regressori? H 0 : β β... β m 0 F Dev( Y ) regr m Dev( Y ) n m residua Var( Y ) Var( Y ) regr residua Dev (Y) Dev (Y) regressione 9,85 SSR / m MSE 9,09 Da confrontare con il valore tabulato F F 0,05 ;3;4 0,0 ;3;4 9,98 6,59 Dev (Y) residua,85
51 Stima Intervallare dei Coefficienti di Regressione Intercetta Ampiezza della Famiglia Reddito della Famiglia (in migliaia di ) Numero di auto della famiglia B i t α ( ; n m ) * Inferiore 95% -4,7-0, -0,3 -,03 var( B i ) Superiore 95% ; 4,74,39 0,53,58 B i + t Inferiore 90,0% -3,4 0,06-0,06-0,73 α ( ; n m ) * Superiore 90,0% 3,7, 0,45,7 var( B Esempio di Calcolo per il coefficiente della Variabile Ampiezza della Famiglia Coefficiente t di Student Standard Error Limite Inferiore i ) Limite Superiore 90% 0,635,3 0,7 0,057, 95% 0,635,776 0,7-0,8,387
52 Diagnostica di regressione Regression Results for Numero Carte di Credito N Oss. Y Y predetta Errore di regressione 4,0 4,609-0,609 6,0 5,9087 0, ,0 6,606-0, ,0 6, , ,0 7, , ,0 8,93 -,93 7 8,0 7,757 0, ,0 9,65 0,375 d n ( ei ei ) i n ( ei ) i DW,47 (Assenza di correlazione tra i residui) observed Plot of Numero Carte di Credito residual, 0,8 0,4 0-0,4-0,8 Residual Plot predicted -, row number
53
54
55
56
Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1
Statistica Capitolo 1 Regressione Lineare Semplice Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Spiegare il significato del coefficiente di correlazione lineare
DettagliIl modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
DettagliRegressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
DettagliStatistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: orietta.nicolis@unibg.it 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
DettagliFasi del modello di regressione
Fasi del modello di regressione Specificazione del modello: scelta del tipo di funzione da utilizzare per descrivere un fenomeno; definizione delle ipotesi di base Stima dei parametri: uso di stimatori
DettagliIl modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
DettagliAnalisi di Regressione Multivariata. β matrice incognita dei coeff. di regressione (regr. lineare in β)
Analisi di Regressione Multivariata Regressione: metodologia per dedurre info e per anticipare risposte di una variabile dip. Modello classico di regressione lineare: Y {z} n k = {z} X β + ρ {z} {z} n
DettagliEsercitazione 5 Sta/s/ca Aziendale
Esercitazione 5 Sta/s/ca Aziendale David Aristei 12 maggio 2015 Si è interessa/ ad analizzare le determinan/ a livello aziendale della produ>vità del lavoro (PL, in migliaia di euro per dipendente) di
DettagliREGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori
REGRESSIONE lineare e CORRELAZIONE Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori Y X La NATURA e la FORZA della relazione tra variabili si studiano con la REGRESSIONE
DettagliSTATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani mriani@unipr.it http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
DettagliVariabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
Dettaglilezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
DettagliRegressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo
Regressione lineare multipla CORSO DI ANALISI DEI DATI Anno Accademico 2009/2010, I ciclo 1 Controllo di ipotesi sui parametri In questo contesto risulta necessario avvalersi dell assunzione di normalita
DettagliStatistica multivariata Donata Rodi 17/10/2016
Statistica multivariata Donata Rodi 17/10/2016 Quale analisi? Variabile Dipendente Categoriale Continua Variabile Indipendente Categoriale Chi Quadro ANOVA Continua Regressione Logistica Regressione Lineare
DettagliR - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo fasulo.andrea@yahoo.it Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
DettagliMODELLO DI REGRESSIONE LINEARE. le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza,
MODELLO DI REGRESSIONE LINEARE le ipotesi del modello di regressione classico, stima con i metodi dei minimi quadrati e di massima verosimiglianza, teorema di Gauss-Markov, verifica di ipotesi e test di
DettagliIl modello di regressione
Il modello di regressione Capitolo e 3 A M D Marcello Gallucci Milano-Bicocca Lezione: II Concentti fondamentali Consideriamo ora questa ipotetica ricerca: siamo andati in un pub ed abbiamo contato quanti
DettagliTest F per la significatività del modello
Test F per la significatività del modello Per verificare la significatività dell intero modello si utilizza il test F Si vuole verificare l ipotesi H 0 : β 1 = 0,, β k = 0 contro l alternativa che almeno
DettagliAnalisi della regressione multipla
Analisi della regressione multipla y = β 0 + β 1 x 1 + β 2 x 2 +... β k x k + u 2. Inferenza Assunzione del Modello Classico di Regressione Lineare (CLM) Sappiamo che, date le assunzioni Gauss- Markov,
DettagliMetodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
DettagliRegressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141
Regressione Semplice Analisi Per avere una prima idea della struttura di dipendenza fra le variabili in esame, possiamo cominciare col costruire la matrice di correlazione delle variabili presenti nel
DettagliLezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 45 Outline 1 2 3 4 5 () Statistica 2 / 45 Modello di In molte applicazioni il ruolo delle variabili
DettagliIl modello di regressione lineare multipla con regressori stocastici
Università di Pavia Il modello di regressione lineare multipla con regressori stocastici Eduardo Rossi Il valore atteso condizionale Modellare l esperimento casuale bivariato nel quale le variabili casuali
DettagliRegressione Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007
Regressione Esempio Un azienda manifatturiera vuole analizzare il legame che intercorre tra il costo mensile Y di produzione e il corrispondente volume produttivo X per uno dei propri stabilimenti. Volume
DettagliStatistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono
DettagliMetodi di regressione multivariata
Metodi di regressione multivariata Modellamento dei dati per risposte quantitative I metodi di regressione multivariata sono strumenti utilizzati per ricercare relazioni funzionali quantitative tra un
Dettaglilezione 7 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove siamo arrivati? - se siamo interessati a studiare l andamento congiunto di due fenomeni economici - possiamo provare a misurare i due fenomeni e poi usare la lineare semplice
DettagliEsercitazione 9 del corso di Statistica (parte seconda)
Esercitazione 9 del corso di Statistica (parte seconda) Dott.ssa Paola Costantini 17 Marzo 9 Esercizio 1 Esercizio Un economista del Ministero degli Esteri desidera verificare se gli accordi di negoziazione
DettagliData Mining. Prova parziale del 20 aprile 2017: SOLUZIONE
Università degli Studi di Padova Corso di Laurea Magistrale in Informatica a.a. 2016/2017 Data Mining Docente: Annamaria Guolo Prova parziale del 20 aprile 2017: SOLUZIONE ISTRUZIONI: La durata della prova
DettagliEsercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017
Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017 Contents 1 Inferenza sulla regressione semplice 1 1.1 Test sulla pendenza della retta................................... 1 1.2 Test sull
DettagliSTATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:
esercitazione 7 p. 1/13 STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7: 20-05-2004 Luca Monno Università degli studi di Pavia luca.monno@unipv.it http://www.lucamonno.it
DettagliLa multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.
Lezione 14 (a cura di Ludovica Peccia) MULTICOLLINEARITA La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative. In un modello di regressione Y= X 1, X 2, X 3
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
DettagliRICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE
RICHIAMI DI STATISTICA DESCRITTIVA E DI INFERENZA: LA VERIFICA DI IPOTESI: TEST BASATI SU UN CAMPIONE 1 La verifica di ipotesi Finora abbiamo visto come si utilizza una statistica campionaria per stimare
DettagliRegressione lineare semplice
Regressione lineare semplice Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona Statistica con due variabili var. nominale, var. nominale: gruppo sanguigno - cancro
DettagliStatistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice
Esercitazione 16 Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () 1 / 24 Studio della relazione tra due variabili Commonly Asked Questions Qual è la relazione tra la spesa
DettagliEsercizi di statistica
Esercizi di statistica Test a scelta multipla (la risposta corretta è la prima) [1] Il seguente campione è stato estratto da una popolazione distribuita normalmente: -.4, 5.5,, -.5, 1.1, 7.4, -1.8, -..
DettagliTest delle Ipotesi Parte I
Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test
DettagliEsercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
DettagliStatistica 1 A.A. 2015/2016
Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione
DettagliEs. la performance all esame in relazione alle ore di studio a casa e alle abilità cognitive
Regressione Tale tecnica esamina e studia la relazione tra una o più variabili indipendenti e una variabile dipendente. L insieme dei parametri riassumono la relazione tra VD e VI, sotto le ipotesi che
DettagliStatistica per le ricerche di mercato. 12. Violazione delle ipotesi nel modello di regressione lineare
Statistica per le ricerche di mercato A.A. 2012/13 Dr. Luca Secondi 12. Violazione delle ipotesi nel modello di regressione lineare La violazione delle ipotesi Fino ad ora le assunzioni ipotizzate per
DettagliPsicometria. 9-Analisi fattoriale confermativa vers. 1.0
Psicometria 9-Analisi fattoriale confermativa vers. 1.0 Germano Rossi 1 germano.rossi@unimib.it Giovanni Battista Flebus 1 giovannibattista.flebus@unimib.it 1 Dipartimento di Psicologia, Università di
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@gmail.com Università degli studi di Cassino () Statistica 1 / 24 Outline 1 2 3 4 5 () Statistica 2 / 24 Dipendenza lineare Lo studio della relazione tra caratteri
DettagliCHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)
CHEMIOMETRIA Applicazione di metodi matematici e statistici per estrarre (massima) informazione chimica (affidabile) da dati chimici INCERTEZZA DI MISURA (intervallo di confidenza/fiducia) CONFRONTO CON
DettagliStatistica multivariata
Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Analisi multivariata Cercare di capire
DettagliANALISI DELLE SERIE STORICHE
ANALISI DELLE SERIE STORICHE De Iaco S. s.deiaco@economia.unile.it UNIVERSITÀ del SALENTO DIP.TO DI SCIENZE ECONOMICHE E MATEMATICO-STATISTICHE FACOLTÀ DI ECONOMIA 24 settembre 2012 Indice 1 Funzione di
DettagliSTATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
DettagliUniversità del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare
Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia Corso di Statistica Medica Correlazione Regressione Lineare Corso di laurea in medicina e chirurgia - Statistica Medica Correlazione
DettagliConcetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2016/2017. Giovanni Lafratta
Concetti di teoria dei campioni ad uso degli studenti di Statistica Economica e Finanziaria, A.A. 2016/2017 Giovanni Lafratta ii Indice 1 Spazi, Disegni e Strategie Campionarie 1 2 Campionamento casuale
DettagliL Analisi della Varianza ANOVA (ANalysis Of VAriance)
L Analisi della Varianza ANOVA (ANalysis Of VAriance) 1 Concetti generali: Confronto simultaneo tra più di due popolazioni, esempi... La analisi della varianza estende il confronto a p gruppi con p>2.
DettagliUniversità di Pavia. Test diagnostici. Eduardo Rossi
Università di Pavia Test diagnostici Eduardo Rossi Test diagnostici Fase di controllo diagnostico: controllo della coerenza tra quanto direttamente osservato e le ipotesi statistiche adottate Ipotesi MRLM
DettagliRegressione multipla
Regressione multipla L obiettivo è costruire un modello probabilistico per spiegare la variabile y tramite più di una variabile indipendente x 1, x 2,..., x k. Esempio: Per un efficiente progettazione
Dettaglilezione 5 AA Paolo Brunori
AA 2016-2017 Paolo Brunori dove eravamo arrivati - le stime OLS ci consentono di approssimare linearmente la relazione fra una variabile dipendente (Y) e una indipendente (X) - i parametri stimati su un
DettagliStatistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza iodicede@unina.it Università degli studi di Cassino () Statistica 1 / 1 Outline 1 () Statistica 2 / 1 Outline 1 2 () Statistica 2 / 1 Outline 1 2 3 () Statistica 2 / 1
DettagliESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo
Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università di Padova Docenti: Prof. L. Salmaso, Dott. L. Corain ESERCIZI Regressione lineare semplice
DettagliMetodi Statistici e Probabilistici per l Ingegneria MODELLI EMPIRICI. Corso di Laurea in Ingegneria Civile
Metodi Statistici e Probabilistici per l Ingegneria Corso di Laurea in Ingegneria Civile Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain E-mail: livio.corain@unipd.it Home page: www.gest.unipd.it/~livio/corso_civile.html
DettagliAntonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR
Antonella Bodini Istituto di Matematica Applicata e Tecnologie Informatiche E. Magenes del CNR Materiale ad uso dei ricercatori che hanno seguito il corso di formazione interna in Statistica, edizione
Dettagli3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17
C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica
DettagliTema d esame del 15/02/12
Tema d esame del 15/0/1 Volendo aprire un nuovo locale, una catena di ristoranti chiede ad un consulente di valutare la posizione geografica ideale all interno di un centro abitato. A questo scopo, avvalendosi
DettagliI MODELLI LINEARI GENERALIZZATI GLM
I MODELLI LINEARI GENERALIZZATI GLM Secondo la teoria dei Modelli Lineari Generalizzati (GLM), la regressione lineare, l analisi della varianza (ANOVA), la regressione logistica e i modelli log-lineari
DettagliCorso di Psicometria Progredito
Corso di Psicometria Progredito 5. La correlazione lineare Gianmarco Altoè Dipartimento di Pedagogia, Psicologia e Filosofia Università di Cagliari, Anno Accademico 2013-2014 Sommario 1 Tipi di relazione
DettagliLEZIONE N. 11 ( a cura di MADDALENA BEI)
LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice
DettagliFacoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a.
Facoltà di Scienze Statistiche Corso di Laurea in Statistica ed Informatica per l Azienda ESERCIZI DI ALLENAMENTO a.a. 2008 PARTE I 1. Si consideri il seguente modello di regressione lineare su dati cross
DettagliNel modello di regressione Multivariata abbiamo più variabili risposta (tipicamente poche), in particolare avremo:
Lezione 15 (a cura di Giovanni Mariani) Regressione Multivariata Consideriamo yiyr, con r = numero variabili risposta xixk, con k = numero varibili esplicative Nel modello di regressione Multivariata abbiamo
DettagliContenuti: Capitolo 14 del libro di testo
Test d Ipotesi / TIPICI PROBLEMI DI VERIFICA DI IPOTESI SONO Test per la media Test per una proporzione Test per la varianza Test per due campioni indipendenti Test di indipendenza Contenuti Capitolo 4
DettagliIL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi. Statistica Economica A.A. 2011/2012. Prof.ssa Tiziana Laureti
IL MODELLO DI REGRESSIONE LINEARE SEMPLICE E MULTIPLA* La violazione delle ipotesi Statistica Economica A.A. 2011/2012 Prof.ssa Tiziana Laureti *Libro di testo: Stock J.H. e Watson, M.W. Introduzione all
DettagliPROBABILITÀ ELEMENTARE
Prefazione alla seconda edizione XI Capitolo 1 PROBABILITÀ ELEMENTARE 1 Esperimenti casuali 1 Spazi dei campioni 1 Eventi 2 Il concetto di probabilità 3 Gli assiomi della probabilità 3 Alcuni importanti
DettagliStatistica multivariata Donata Rodi 08/11/2016
Statistica multivariata Donata Rodi 08/11/2016 MANOVA: Multivariate Analysis of Variance Due o più variabili dipendenti quantitative Una o più variabili indipendenti categoriali (con più livelli) Residui
DettagliRegressione lineare con un solo regressore
Regressione lineare con un solo regressore La regressione lineare è uno strumento che ci permette di stimare e di fare inferenza sui coefficienti incogniti di una retta. Lo scopo principale è di stimare
DettagliVariabili tutte osservabili: regressione Si parla di regressione quando si ha a disposizione un campione sperimentale di numerosità n della forma X 1
Modelli lineari Come motivazione di ciò che stiamo per fare, pensiamo ai dati indicatori_benessere.txt. Quando li abbiamo esaminati nella lezione 1 tramite la rappresentazione nel piano delle componenti
DettagliLa regressione lineare multipla
13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività
DettagliStatistica Applicata all edilizia Lezione: approccio stocastico all analisi delle serie storiche
Lezione: approccio stocastico all analisi delle serie storiche E-mail: orietta.nicolis@unibg.it 3 maggio 2011 Programma 1 Approccio stocastico all analisi delle serie storiche Programma Approccio stocastico
Dettagli0.1 Percorrenza e Cilindrata
0.1 Percorrenza e Cilindrata Iniziamo ora un analisi leggermente più complessa basata sempre sui concetti appena introdotti. Innanzi tutto possiamo osservare, dal grafico ottenuto con il comando pairs,
DettagliUniversità degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1
Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1 Lezione 1 - Mercoledì 28 Settembre 2016 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,
Dettaglilezione 9 AA Paolo Brunori
AA 2016-2017 Paolo Brunori Dove siamo arrivati? - la regressione lineare multipla ci permette di stimare l effetto della variabile X sulla Y tenendo ferme tutte le altre variabili osservabili che hanno
DettagliUniversità di Siena. Corso di STATISTICA. Parte seconda: Teoria della stima. Andrea Garulli, Antonello Giannitrapani, Simone Paoletti
Università di Siena Corso di STATISTICA Parte seconda: Teoria della stima Andrea Garulli, Antonello Giannitrapani, Simone Paoletti Master E 2 C Centro per lo Studio dei Sistemi Complessi Università di
DettagliCAPITOLO 5 Introduzione ai piani fattoriali
Douglas C. Montgomery Progettazione e analisi degli esperimenti 2006 McGraw-Hill CAPITOLO 5 Introduzione ai piani fattoriali Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria
DettagliLaboratorio di Statistica Aziendale Modello di regressione lineare semplice
Laboratorio di Statistica Aziendale Modello di regressione lineare semplice Dott.ssa Michela Pasetto michela.pasetto2@unibo.it Caricamento del dataset Il dataset SalesData si trova nella cartella condivisa
DettagliMulticollinearità. Strumenti quantitativi per la gestione
Multicollinearità Strumenti quantitativi per la gestione Emanuele Taufer file:///c:/users/emanuele.taufer/dropbox/3%20sqg/classes/3c_mc.html#(1) 1/13 Quando non tutto va come dovrebbe Si parla di multi-collinearità
DettagliEsercizio 2: voto e ore dedicate allo studio
La seguente tabella riporta il voto riportato da 10 studenti all esame di Statistica Sociale e il numero di ore di lezione non seguite dallo studente (il corso prevede 30 ore di lezione). Ci si chiede
DettagliStatistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati
ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
DettagliREGRESSIONE. Un modello di regressione può essere espresso attraverso una relazione del tipo:
REGRESSIONE Un modello di regressione può essere espresso attraverso una relazione del tipo: Y=f(X) dove Y rappresenta la variabile spiegata e X l insieme delle variabili esplicative ed f la funzione di
DettagliIl modello di regressione lineare classico
Università di Pavia Il modello di regressione lineare classico Eduardo Rossi Ipotesi Il modello di regressione lineare classico y t = x tβ + ε t t = 1,...,N Y = Xβ + ε Se il modello ha un intercetta allora
DettagliAnalisi Multivariata dei Dati. Regressione Multipla
Analisi Multivariata dei Dati Regressione Multipla A M D Marcello Gallucci Milano-Bicocca Lezione: III Effetti multipli Consideriamo ora il caso in cui la variabile dipendente possa essere spiegata da
DettagliModelli lineari generalizzati
Modelli lineari generalizzati Estensione del modello lineare generale Servono allo studio della dipendenza in media di una variabile risposta da una o più variabili antecedenti Vengono attenuate alcune
DettagliPresentazione dell edizione italiana
1 Indice generale Presentazione dell edizione italiana Prefazione xi xiii Capitolo 1 Una introduzione alla statistica 1 1.1 Raccolta dei dati e statistica descrittiva... 1 1.2 Inferenza statistica e modelli
DettagliPresentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii
Sommario Presentazione dell edizione italiana Prefazione xix Ringraziamenti xxii Glossario dei simboli xxiii xv Parte I Statistica descrittiva 1 Capitolo 1 Introduzione 3 Perché studiare statistica? 4
DettagliCapitolo 1. Regressione. 1.1 Premessa
Capitolo 1 Regressione 1.1 Premessa Per elaborare delle teorie economiche occorre raggruppare le relazioni tra variabili in modo da formare un modello. Un modello statistico è una rappresentazione parsimoniosa,
DettagliEsercizio 4 (Regressione multipla)
Esercizio (Regressione multipla) DATI Il data set employee.sav (o employee.xls; fonte SPSS) contiene 7 dati relativi agli impiegati di un azienda. Le variabili sono ID Employee Code BDATE Date of Birth
DettagliMetodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale
DIPARTIMENTO DI SCIENZE AGRARIE E AMBIENTALI PRODUZIONE, TERRITORIO, AGROENERGIA Marco Acutis marco.acutis@unimi.it www.acutis.it CdS Scienze della Produzione e Protezione delle Piante (g59) CdS Biotecnologie
DettagliRegressione lineare multipla
Regressione lineare multipla Eduardo Rossi 2 2 Università di Pavia (Italy) Aprile 2014 Rossi Regressione lineare Econometria - 2014 1 / 31 Outline 1 La distorsione da variabili omesse 2 Causalità 3 Misure
Dettagli0 altimenti 1 soggetto trova lavoroentro 6 mesi}
Lezione n. 16 (a cura di Peluso Filomena Francesca) Oltre alle normali variabili risposta che presentano una continuità almeno all'interno di un certo intervallo di valori, esistono variabili risposta
DettagliAnalisi della varianza
Analisi della varianza Prof. Giuseppe Verlato Sezione di Epidemiologia e Statistica Medica, Università di Verona ANALISI DELLA VARIANZA - 1 Abbiamo k gruppi, con un numero variabile di unità statistiche.
DettagliCorso di Statistica Industriale
Corso di Statistica Industriale Corsi di Laurea Specialistica in Ingegneria Gestionale e Ingegneria Meccanica Docente: Ilia Negri Orario del corso: Martedì: dalle 14.00 alle 16.00 Venerdì: dalle 10.30
DettagliLa regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
DettagliIntervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:
Analisi chimica strumentale Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da: (31.4) dove s y è la varianza dei valori
DettagliRegressioni Non Lineari
Regressioni Non Lineari Fino ad ora abbiamo solo considerato realazioni lineari Ma le relazioni lineari non costituiscono sempre le migliori approssimazioni La regressione multipla può anche essere formulata
DettagliLa regressione fuzzy. Capitolo I limiti della regressione classica. a cura di Fabrizio Maturo
Capitolo 14 La regressione fuzzy a cura di Fabrizio Maturo 14.1 I limiti della regressione classica L analisi di regressione offre una possibile soluzione per studiare l effetto di una o più variabili
DettagliConfronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23
Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta
Dettagli