Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello

Documenti analoghi
Metodi Quantitativi per Economia, Finanza e Management

1. variabili dicotomiche: 2 sole categorie A e B

Regressione Lineare Semplice e Correlazione

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Regressione lineare. Metodi Quantitativi per Economia, Finanza e Management. Esercitazione n 9

STATISTICA A K (60 ore)

Analisi di Regressione Multipla

s a Inferenza: singolo parametro Sistema di ipotesi: : β j = β j0 H 1 β j0 statistica test t confronto con valore t o p-value

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Relazioni tra variabili (fenomeni) aziendali

Argomenti della lezione:

Statistica multivariata Donata Rodi 17/10/2016

Analisi di regressione: approccio matriciale. Abbiamo rilevato i seguenti caratteri su n = 25

Metodi Statistici per il Management

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

Metodi Statistici per il Management

Corso in Statistica Medica

La curva di regressione è il luogo dei punti aventi come ordinate le medie condizionate

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Regressione lineare. Metodi Quantitativi per Economia, Finanza e Management. Esercitazione n 9

Test F per la significatività del modello

Metodologie Quantitative

PROBABILITÀ ELEMENTARE

Metodi statistici per la ricerca sociale Capitolo 11. Regressione Multipla e Correlazione

Facoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B

STATISTICA A D (72 ore)

Regressione. Monica Marabelli. 15 Gennaio 2016

Capitolo 12 La regressione lineare semplice

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

1.1 Obiettivi della statistica Struttura del testo 2

Metodi statistici per le ricerche di mercato

Laboratorio di Statistica Aziendale Modello di regressione lineare multipla

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

Analisi di Regressione Multivariata. β matrice incognita dei coeff. di regressione (regr. lineare in β)

Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Statistica Applicata all edilizia: il modello di regressione

ANALISI DELLE SERIE STORICHE

MISURA DELLA VARIAZIONE CONCOMITANTE (COVARIAZIONE/ CONTROVARIAZIONE) DI VARIABILI CARDINALI O QUASI- CARDINALI

Regressione & Correlazione

Correlazione e regressione

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica

Microeconometria Day # 3 L. Cembalo. Regressione con due variabili e metodo dei minimi quadrati

LEZIONE N. 11 ( a cura di MADDALENA BEI)

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

Analisi bivariata. Il caso di caratteri quantitativi

Psicometria con Laboratorio di SPSS 2

Dispensa di Statistica

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Computazione per l interazione naturale: Regressione probabilistica

COGNOME.NOME...MATR..

Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi

lezione 4 AA Paolo Brunori

Multicollinearità. Strumenti quantitativi per la gestione

Calcolo delle Probabilità e Statistica Matematica: definizioni prima parte. Cap.1: Probabilità

La regressione lineare semplice

Nota 4.1 Il modello (4.1) può essere anche utilizzato per studiare strutture più complesse. Consideriamo ad esempio il modello polinomiale:

Università di Siena. Teoria della Stima. Lucidi del corso di. Identificazione e Analisi dei Dati A.A

Il modello di regressione lineare multipla

Università di Pavia Econometria Esercizi 4 Soluzioni

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 4 Analisi Bivariata I Parte

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Stima dei parametri. La v.c. multipla (X 1, X 2,.., X n ) ha probabilità (o densità): Le f( ) sono uguali per tutte le v.c.

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

PROVA SCRITTA DI STATISTICA. CLEA/CLEFIN/CLEMIT (cod. 5047/4038/371/377) 3 Novembre 2004 MOD. A

Regressione logistica. Strumenti quantitativi per la gestione

Dall Analisi Fattoriale alla Regressione Lineare

Esercizio 2: voto e ore dedicate allo studio

Statistica. Alfonso Iodice D Enza

Fasi del modello di regressione

Indipendenza, Dipendenza e interdipendenza

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

Introduzione all Analisi della Varianza (ANOVA)

5. Per determinare il miglior grado del polinomio di una regressione polimoniale

ECONOMETRIA: Laboratorio I

INDICE PARTE METODOLOGICA

Università degli Studi Roma Tre Anno Accademico 2014/2015 ST410 Statistica 1

Destagionalizzazione, detrendizzazione delle serie storiche

Università di Siena. Corso di STATISTICA. Parte seconda: Teoria della stima. Andrea Garulli, Antonello Giannitrapani, Simone Paoletti

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

RELAZIONE TRA DUE VARIABILI QUANTITATIVE

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 5 Analisi Bivariata I Parte

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Statistica descrittiva: analisi di regressione

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

Analisi multivariata per osservazioni appaiate. Analisi multivariata per osservazioni appaiate

STATISTICA. Esercizi vari

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

Rappresentazioni grafiche di distribuzioni doppie

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

ESERCITAZIONE ANCOVA

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1

Regressione lineare. Lo studio della relazione lineare tra due variabili. X e Y caratteri entrambi quantitativi. variabile dipendente

Computazione per l interazione naturale: Regressione probabilistica

Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23

Transcript:

Metodi Quantitativi per Economia, Finanza e Management Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello

1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le ipotesi del modello 4. La stima del modello 5. La valutazione del modello 6. Commenti

L obiettivo dell analisi Prevedere la redditivita del cliente al tempo t+1

L impostazione del problema Redditività = ricavi - costi redditività var. continua classi di redditività ( < 0 ; >= 0)

I dati di input Y : tempo t Redditività consolidata al X : # ordini al tempo t-1,-2,.. pagato ordini al tempo t-1,-2,.. pagato rateale mensile sesso (dicotomica) area (dicotomiche)..

Predisposizione Banca Dati Costruzione Var. Obiettivo Analisi Preliminari Il percorso di analisi Stima del Modello Validazione Implementazione

Analisi preliminari lo studio della distribuzione di Y la struttura di correlazione tra Y e X

L impostazione del problema Redditività var. continua Regressione Lineare Redditività var. dicotomica Regressione Logistica

1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le ipotesi del modello 4. La stima del modello 5. La valutazione del modello 6. Commenti

I modelli di regressione Modelli di dipendenza per la rappresentazione di relazioni non simmetriche tra le variabili Y variabile dipendente (variabile target da spiegare) X1,,Xp variabili indipendenti (variabili esplicative o regressori)

Si vuole descrivere la relazione tra Y e X1,,Xp con una funzione lineare se p=1 osservazioni in uno spazio a due dimensioni (i=1,,n) Y f ( 1) i Xi se p>1 osservazioni in uno spazio a p+1 dimensioni (i=1,,n) Yi g( Xi1,..., Xip)

X se p=1 spazio a due dimensioni retta di regressione lineare semplice Y

Y se p>1 spazio a p+1 dimensioni retta di regressione lineare multipla X1

Obiettivi Esplicativo - Stimare l influenza dei regressori sulla variabile target. Predittivo - Stimare il valore non osservato della variabile target in corrispondenza di valori osservati dei regressori. Comparativo - Confrontare la capacità di più regressori, o di più set di regressori, di influenzare il target (= confronto tra modelli di regressione lineare diversi).

Le ipotesi del modello Y X1 X2 X3 Xp y 1 x 11 x 12 x 13 x 1p y 2 x 21 x 2 2 x 23 x 2p y 3 x 31 x 32 x 33 x 3p y n x n1 x n2 x n3 x np (nx1) (nxp) n unità statistiche vettore colonna (nx1) di n misurazioni su una variabile continua (Y) matrice (nxp) di n misurazioni su p variabili quantitative (X1,,Xp) la singola osservazione è il vettore riga (yi,xi1,xi2,xi3,,xip) i=1,,n

Le ipotesi del modello Equazione di regressione lineare multipla Y i 0 1Xi1 2Xi 2... p X ip i i-esima oss. su Y i-esima oss. su X1 errore relativo all i-esima oss. intercetta coefficiente di X1 La matrice X=[1,X1,,Xp] è detta matrice del disegno.

L errore presente nel modello si ipotizza essere di natura casuale. Può essere determinato da: variabili non considerate problemi di misurazione modello inadeguato effetti puramente casuali Le ipotesi del modello

Le ipotesi del modello 1. Errori a media nulla E( ) 0 2. Errori con varianza costante (omoschedasticità) Cov( ) 2 In 3. Errori non correlati (per ogni i j) Cov( i, j) 0 4. Errori con distribuzione Normale ~ N(0, In) * 1 3 hp deboli 1 4 hp forti

Le ipotesi del modello Da un punto di vista statistico Y è un vettore aleatorio di cui si osserva una specifica realizzazione campionaria hp sulla distribuzione X è una matrice costante con valore noto no hp sulla distribuzione beta è un vettore costante non noto l errore è un vettore aleatorio di cui si osserva una specifica realizzazione campionaria hp sulla distribuzione

Le ipotesi del modello in media Y può essere rappresentata come funzione lineare delle sole (X1,,Xp) E( Y) X ogni osservazione di Y è uguale ad una combinazione lineare dei regressori con pesi=coefficienti beta + un termine di errore Y X

1. Introduzione ai modelli di regressione 2. Obiettivi 3. Le ipotesi del modello 4. La stima del modello 5. La valutazione del modello 6. Commenti

La stima del modello Si vuole trovare la retta lineare migliore data la nuvola di punti Y X

La stima del modello Equazione teorica coefficienti non noti Y 0 1X 1 2X 2... px p Equazione stimata coefficienti stimati (una delle infinite rette possibili) Y b o b1x 1 b2x 2... bpxp ˆ stime dei coefficienti Y ˆ ˆ Y previsione errore di previsione

X La stima del modello Stimando la retta di regressione si commette un errore di previsione: Metodo dei Minimi Quadrati Y VALORE OSS. Yi ERRORE Y i VALORE STIMATO

La stima del modello Obiettivo trovare la miglior approssimazione lineare della relazione tra Y e X1,,Xp (trovare le stime dei parametri beta che identificano la migliore retta di regressione) Metodo dei minimi quadrati lo stimatore LS è la soluzione al problema min n i 1 2 min ' y i X i

La stima del modello Lo stimatore dei Minimi Quadrati: LS è funzione di Y e X ˆ 1 LS X ' X X ' Y ha media ˆ ) E( LS ha varianza Var ( ˆ ) ( X ' X ) LS 1

La stima del modello Proprietà dello stimatore LS non distorto consistente (se valgono certe hp su X X) coincide con lo stimatore di max verosimiglianza sotto hp forti BLUE (Best Linear Unbiased Estimator)

La stima del modello Equazione teorica coefficienti non noti Y 0 1X 1 2X 2... px p Equazione stimata coefficienti stimati (una delle infinite rette possibili) ˆ bo b1x 1 b2x 2... Y b p X p stime dei coefficienti

La stima del modello Interpretazione dei coefficienti impatto di Xj su Y posto che nel modello sono presenti altre variabili tasso di variazione di Y al variare di Xj come varia Y al variare di una unità di Xj se gli altri regressori non variano

La stima del modello Parameter Estimates Variable Label DF Parameter Estimate Standard Error t Value Pr > t Intercept Intercept 1-15016 2324.86370-6.46 <.0001 PAG_ORD Pagato in contrassegno 1 1.19433 0.05485 21.78 <.0001 PAG_MES Pagato con rate mensili 1 2.52341 0.10102 24.98 <.0001 TOT_ORD Totale ordini 1 14881 683.88703 21.76 <.0001 LISTA Numero di liste di appartenenza 1 603.36550 1110.84778 0.54 0.5871 SESSO Sesso 1 3453.14705 1994.83468 1.73 0.0835 CEN Residenza Centro 1-6431.88493 2597.25872-2.48 0.0133 SUD Residenza Sud 1-18390 2077.96317-8.85 <.0001

Segno del coefficiente La stima del modello indica la direzione dell impatto del regressore a cui è associato Valore del coefficiente indica l incremento marginale di Y dipende dall unità di misura di Xj

Valore del coefficiente La stima del modello per valutare l impatto relativo dei singoli regressori è necessario considerare i coefficienti standardizzati Parameter Estimates Variable Label D F Parameter Estimate Standard Error t Value Pr > t Standardized Estimate Intercept Intercept 1 30935 869.69238 35.57 <.0001 0 0 Variance Inflation Factor1 1 61162 869.81092 70.32 <.0001 0.71583 1.00000 Factor3 1 24154 869.81092 27.77 <.0001 0.28269 1.00000 Factor4 1 3446.48124 869.81092 3.96 <.0001 0.04034 1.00000 Factor6 1-13861 869.81092-15.94 <.0001-0.16223 1.00000