Il metodo della regressione
|
|
|
- Assunta Massa
- 9 anni fa
- Visualizzazioni
Transcript
1 Il metodo della regressione Consideriamo il coefficiente beta di una semplice regressione lineare, cosa significa? È una differenza tra valori attesi Anche nel caso classico di variabile esplicativa continua
2 Reddito i = + (Anni di istruzione i ) + i = Reddito atteso con X anni di istruzione - Reddito atteso con X-1 anni di istruzione Reddito atteso con 1 anno di istruzione in più= E(Reddito istruzione = X) = + (X) - E(Reddito istruzione = X-1) = + (X-1) E(Reddito X) - E(Reddito X-1) =
3 Il fatto che un coefficiente di regressione sia sempre una differenza tra medie lo si vede ancora meglio nel caso di una variabile esplicativa dicotomica Dicotomizziamo la variabile Istruzione in due soli livelli 1: Ha il diploma della media superiore 0: Non ha il diploma della media superiore
4 Reddito i = + Diploma + i Diploma = 1 con diploma, = 0 senza diploma = Reddito atteso con il Diploma ( + ) - Reddito atteso senza il Diploma ( )
5 Ovvero: = E(R i D i = 1) - E(R i D i = 0) Oppure, se introduciamo il trattamento: E(Y i T i = 1) - E(Y i T i = 0)
6 Nel caso di una sola variabile esplicativa dicotomica, non serve neppure applicare il metodo della regressione lineare per stimare e : basta calcolare la semplice differenza tra le medie del reddito dei due campioni di diplomati e non diplomati + = reddito medio dei diplomati = reddito medio dei non diplomati = differenza tra i redditi medi dei due gruppi
7
8 Cosa rappresenta un altra variabile esplicativa? Reddito i = + Diploma i + Anni di lavoro i + i è l effetto degli anni di lavoro sul reddito (probabilmente positivo) Quindi ora rappresenta l effetto del diploma A PARITA di anni di lavoro Ma si può ancora interpretare come differenza tra medie?
9 Sì, se riscriviamo l equazione così: Reddito i - Anni di lavoro i = + Diploma i (reddito depurato dall influenza degli anni di lavoro) + i = Reddito atteso (al netto dell effetto degli anni di lavoro) con Diploma - Reddito atteso ( ) senza Diploma
10 Ora non è più possibile stimare il coefficiente con semplici operazioni = Cov(x,y)/Var(x) = Media(y) - Media(x) Non possiamo fare a meno della regressione lineare, per ottenere una stima dell effetto della variabile dicotomica al netto dell influenza delle altre variabili. La regressione serve appunto a questo, o meglio ad includere tutte le variabili esplicative disponibili, pena l errore di variabile omessa
11 IL PROGRAMMA URBAN Prendiamo in considerazione il programma europeo Urban, si offrono sussidi agli stati membri per affrontare la problematica urbana in forma integrata, con azioni che associno: promozione dell'attività economica miglioramento dell'infrastruttura e dell'ambiente formazione personalizzata azioni a favore delle pari opportunità adeguamento dei servizi sociali
12 I dati
13 (3) Y i,t = + T i + P t + T i P t + i,t i = 1,300 t = 2000 i = 1,300 t = 2004 P t rappresenta il periodo di osservazione: 1 per il per il 2000; T i indica ora l assegnazione del quartiere a U o a NU, nel 2004 come nel 2000 T i P t rappresenta la variabile trattamento: uguale a 1 nel 2004 per i quartieri Urban, altrimenti. T i P t è l interazione (prodotto) tra la variabile assegnazione T i e il periodo di osservazione P t, assume quindi valore 1 se e solo se: T i =1 e P t = 1.
14 = E (Y i,t T i = 0, P t = 0) stima la media del vandalismo nei quartieri NONUrban nel = E (Y i,t T i = 1, P t = 0) stima la media nei quartieri Urban nel 2000 (quando non sapevano di esserlo) NB: T i P t =0 cosa rappresenta ora?
15 stima le differenze di partenza (la differenza tra le medie del vandalismo osservate nel 2000 tra U e NU)
16 + = E (Y i,t T i = 0, P t = 1) stima la media nei quartieri NONUrban nel 2004 e cosa stima, cosa rappresenta ora? la dinamica spontanea la sua stima è equivalente alla differenza nel vandalismo nei quartieri NU
17 + + + = E(Y i,t T i = 1, P t = 1) stima la media nei quartieri Urban nel 2004 (il fattuale ) In pratica la regressione dice che il livello atteso di vandalismo nel 2004 (il fattuale ) è dato dal: livello base ( non Urban 2000 differenze di partenza : differenza U-NU nel 2000) + dinamica spontanea ( : differenza NU ) Che fine ha fatto il controfattuale? L effetto di Urban come lo stimiamo?
18 + + stima il controfattuale stima l effetto di Urban
19
20 Tipo di quartiere Media del tasso di vandalismo nel Differenze ( ) Urban 62,90 66,37 3,47 NonUrban 46,37 57,50 11,13 Differenze (U-NU) 16,53 8,87 7,66
21 Che valenza ha il risultato attuale rispetto a quello Diff&Diff? Identica, ma risultato è ora molto più accurato: Ora possiamo valutare se è significativo, con Diff&Diff non era ovviamente possibile, Possiamo vedere i residui e il comportamento degli outliers sulle stime, per quanto con variabili dummy questo sia meno informativo disponiamo di indicatori di adattamento globale del modello, come R 2 possiamo aggiungere altri predittori
22 3 - La regressione con variabile dipendente ΔY ΔY i = Y i, Y i,2000
23 (4) Y i = + T i + i i = = E( Y i, T i = 0 ) = E (Y i, Y i, 2000 T i = 0) stima la dinamica spontanea per i quartieri NonUrban
24 + = E( Yi, Ti = 1 ) = E(Yi, Yi, 2000 Ti = 1) stima la dinamica per i quartieri Urban, da cui si ricava per differenza che = E(Y i, Y i, 2000 T i =1)-E(Y i, Y i, 2000 T i =0) cioè nuovamente la stima diff-diff dell effetto di Urban su Y i
25 Con ΔY Con Y
Il metodo della regressione
Il metodo della regressione Consideriamo il coefficiente beta di una semplice regressione lineare, cosa significa? È una differenza tra valori attesi Anche nel caso classico di variabile esplicativa continua
Il metodo differenza-nelle-differenze
Il metodo differenza-nelle-differenze Abbiamo visto un esempio di metodo delle serie storiche (prima/dopo) un esempio di metodi sperimentali (con/senza) Consideriamo ora questo ulteriore metodo come punto
LEZIONE N. 11 ( a cura di MADDALENA BEI)
LEZIONE N. 11 ( a cura di MADDALENA BEI) F- test Assumiamo l ipotesi nulla H 0 :β 1,...,Β k =0 E diverso dal verificare che H 0 :B J =0 In realtà F - test è più generale H 0 :Aβ=0 H 1 :Aβ 0 A è una matrice
Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza. Esercitazione
Metodi statistici per la ricerca sociale Capitolo 12. Confronto fra gruppi: L analisi della varianza Esercitazione Alessandra Mattei Dipartimento di Statistica, Informatica, Applicazioni (DiSIA) Università
Il metodo della regressione
Il metodo della regressione Il matching statistico Il matching statistico si basa sull idea di abbinare a ciascun soggetto trattato un soggetto non trattato tendenzialmenre equivalente, ovvero molto simile
STATISTICA A K (60 ore)
STATISTICA A K (60 ore) Marco Riani [email protected] http://www.riani.it Richiami sulla regressione Marco Riani, Univ. di Parma 1 MODELLO DI REGRESSIONE y i = a + bx i + e i dove: i = 1,, n a + bx i rappresenta
Tavola di mobilità: esempio
Tavola di mobilità: esempio Destinazione sociale Origine sociale Classe superiore Classe media Classe inferiore Totale Classe superiore 160 30 10 200 Classe media 90 150 60 300 Classe inferiore 50 200
Il modello di regressione lineare multipla. Il modello di regressione lineare multipla
Introduzione E la generalizzazione del modello di regressione lineare semplice: per spiegare il fenomeno d interesse Y vengono introdotte p, con p > 1, variabili esplicative. Tale generalizzazione diventa
Regressione Lineare Semplice e Correlazione
Regressione Lineare Semplice e Correlazione 1 Introduzione La Regressione è una tecnica di analisi della relazione tra due variabili quantitative Questa tecnica è utilizzata per calcolare il valore (y)
Microeconometria Day # 3 L. Cembalo. Regressione con due variabili e metodo dei minimi quadrati
Microeconometria Day # 3 L. Cembalo Regressione con due variabili e metodo dei minimi quadrati SRF: sample regression function Il passaggio dalla regressione sulla popolazione a quella sul campione è cruciale
La regressione lineare multipla
13 La regressione lineare multipla Introduzione 2 13.1 Il modello di regressione multipla 2 13.2 L analisi dei residui nel modello di regressione multipla 9 13.3 Il test per la verifica della significatività
Esercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale
L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
5. Per determinare il miglior grado del polinomio di una regressione polimoniale
Principi di Econometria 55 di tempo prof. Brunori Nome e cognome 16/01/2017 Matricola versione A Potete consegnare solo le risposte multiple o sia le risposte multiple che quelle aperte. Nel secondo caso
Il Capital Asset Pricing Model e lo Arbitrage Pricing Theory
Il Capital Asset Pricing Model e lo Arbitrage Pricing Theory Pierpaolo Montana Università di Roma I Il Capital Asset Pricing Model può essere visto come una evoluzione del modello media-varianza di scelta
Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.
Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive
Tema d esame del 15/02/12
Tema d esame del 15/0/1 Volendo aprire un nuovo locale, una catena di ristoranti chiede ad un consulente di valutare la posizione geografica ideale all interno di un centro abitato. A questo scopo, avvalendosi
05. Errore campionario e numerosità campionaria
Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,
R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre
R - Esercitazione 6 Andrea Fasulo [email protected] Università Roma Tre Venerdì 22 Dicembre 2017 Il modello di regressione lineare semplice (I) Esempi tratti da: Stock, Watson Introduzione all econometria
Statistica Applicata all edilizia: il modello di regressione
Statistica Applicata all edilizia: il modello di regressione E-mail: [email protected] 27 aprile 2009 Indice Il modello di Regressione Lineare 1 Il modello di Regressione Lineare Analisi di regressione
METODI E TECNICHE DELLA RICERCA IN PSICOLOGIA CLINICA E LABORATORIO MEDIAZIONE
METODI E TECNICHE DELLA RICERCA IN PSICOLOGIA CLINICA E LABORATORIO AA 2016/2017 PROF. V.P. SENESE http://psiclab.altervista.org/mettecpsicclinica2016/2016_2017.html https://goo.gl/iuaiqx Seconda Università
Capitolo 12 La regressione lineare semplice
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 12 La regressione lineare semplice Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
Principi di analisi causale Lezione 3
Anno accademico 2007/08 Principi di analisi causale Lezione 3 Docente: prof. Maurizio Pisati Approccio causale Nella maggior parte dei casi i ricercatori sociali utilizzano la regressione per stimare l
Confronto fra gruppi: il metodo ANOVA. Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23
Confronto fra gruppi: il metodo ANOVA Nicola Tedesco (Statistica Sociale) Confronto fra gruppi: il metodo ANOVA 1 / 23 1 Nella popolazione, per ciascun gruppo la distribuzione della variabile risposta
11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici
CAPITOLO 11 L ANALISI DI REGRESSIONE SOLUZIONI 11.1 a) una relazione lineare potrebbe essere appropriata b)l equazione di regressione è y cappello=0,96+0,00006 x c)olanda: y cappello=0,96+0,00006 (53560)=4,57
REGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1
lezione n. 6 (a cura di Gaia Montanucci) METODO MASSIMA VEROSIMIGLIANZA PER STIMARE β 0 E β 1 Distribuzione sui termini di errore ε i ε i ~ N (0, σ 2 ) ne consegue : ogni y i ha ancora distribuzione normale,
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)
Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009) Quesito: Posso stimare il numero di ore passate a studiare statistica sul voto conseguito all esame? Potrei calcolare il coefficiente di correlazione.
Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:
Obiettivi: Esplicitare la correlazione esistente tra l altezza di un individuo adulto e la lunghezza del suo piede e del suo avambraccio. Idea del progetto: Il progetto nasce dall idea di acquistare scarpe
STATISTICA. Regressione-2
STATISTICA Regressione-2 Esempio Su un campione di =5unità sono state osservate due variabili, ed : x i 1 2 3 4 5 y i 1.5 2.5 3 2.5 3.5 1. Rappresentare l andamento congiunto di in funzione di mediante
Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.
Variabili indipendenti qualitative Di solito le variabili nella regressione sono variabili continue In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli Ad esempio:
Minimi quadrati ordinari Interpretazione geometrica. Eduardo Rossi
Minimi quadrati ordinari Interpretazione geometrica Eduardo Rossi Il MRLM Il modello di regressione lineare multipla è usato per studiare le relazioni tra la variabile dipendente e diverse variabili indipendenti
Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill
- metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill Es. Soluzione degli esercizi del capitolo 8 home - indice In base agli arrotondamenti effettuati nei calcoli, si
Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA 2014-2015 Paolo Brunori
AA 2014-2015 Paolo Brunori popolazione studiata e popolazione di interesse - popolazione studiata: popolazione da cui è stato estratto il campione - popolazione di interesse: popolazione per la quale ci
Proprietà della varianza
Proprietà della varianza Proprietà della varianza Proprietà della varianza Proprietà della varianza Intermezzo: ma perché dovremmo darci la pena di studiare come calcolare la varianza nel caso di somme,
Statistica economica
Statistica economica a.a. 013/14 Dr. Luca Secondi 10.a. Output tipico di un modello di regressione lineare multipla 1 Le analisi basate sul modello di regressione prevedono la stima dei coefficienti associati
Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statistica - metodologie per le scienze economiche e sociali /e S Borra, A Di Ciaccio - McGraw Hill Es 6 Soluzione degli esercizi del capitolo 6 In base agli arrotondamenti effettuati nei calcoli, si possono
Regressioni Non Lineari
Regressioni Non Lineari Fino ad ora abbiamo solo considerato realazioni lineari Ma le relazioni lineari non costituiscono sempre le migliori approssimazioni La regressione multipla può anche essere formulata
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo
Metodi statistici per l economia (Prof. Capitanio) Slide n. 10 Materiale di supporto per le lezioni. Non sostituisce il libro di testo 1 REGRESSIONE LINEARE Date due variabili quantitative, X e Y, si è
Capitolo 1 MODELLI ECONOMICI DEL TASSO DI CAMBIO 11
Indice INTRODUZIONE p. 8 Capitolo 1 MODELLI ECONOMICI DEL TASSO DI CAMBIO 11 1.1 - TASSI DI CAMBIO E MERCATI VALUTARI: APPROCCIO DI PORTAFOGLIO 11 1.1.1 TASSI DI CAMBIO E TRANSAZIONI INTERNAZIONALI Prezzi
Settimana 3. G. M. Marchetti. Marzo 2017
Settimana 3 G. M. Marchetti Marzo 2017 1 / 26 Prima parte Relazioni tra variabili e regressione lineare 2 / 26 Una legge fisica approssimata Il fisico scozzese Forbes 3 / 26 L esperimento di Forbes Sulla
La regressione lineare. Rappresentazione analitica delle distribuzioni
La regressione lineare Rappresentazione analitica delle distribuzioni Richiamiamo il concetto di dipendenza tra le distribuzioni di due caratteri X e Y. Ricordiamo che abbiamo definito dipendenza perfetta
STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo
STATISTICA (2) ESERCITAZIONE 7 11.03.2014 Dott.ssa Antonella Costanzo Esercizio 1. Test di indipendenza tra mutabili In un indagine vengono rilevate le informazioni su settore produttivo (Y) e genere (X)
Teoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
Rappresentazioni grafiche di distribuzioni doppie
Rappresentazioni grafiche di distribuzioni doppie Distribuzione doppia di frequenze Tabella di contingenza Tabella di correlazione Stereogramma Distribuzione unitaria doppia di 2 caratteri quantitativi
Introduzione all Analisi della Varianza (ANOVA)
Introduzione all Analisi della Varianza (ANOVA) AMD Marcello Gallucci [email protected] Variabili nella Regressione Nella regressione, la viariabile dipendente è sempre quantitativa e, per quello
Ulteriori applicazioni del test del Chi-quadrato (χ 2 )
Ulteriori applicazioni del test del Chi-quadrato (χ 2 ) Finora abbiamo confrontato con il χ 2 le numerosità osservate in diverse categorie in un campione con le numerosità previste da un certo modello
