Analisi avanzate basate sulla regressione (Cap. 7)

Documenti analoghi
Metodologie Quantitative

Metodologie Quantitative

Analisi Multivariata dei Dati. Regressione Multipla

Il modello di regressione

Introduzione all Analisi della Varianza (ANOVA)

Il modello lineare misto

Assunzioni (Parte I)

Statistica multivariata

Corso di Psicometria Progredito

LEZIONE N. 11 ( a cura di MADDALENA BEI)

Regressione Lineare Semplice e Correlazione

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

SCOPO DELL ANALISI DI CORRELAZIONE

Analisi della regressione multipla

Tecniche statistiche di analisi del cambiamento

Metodologie Quantitative

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Strumenti di indagine per la valutazione psicologica

ANALISI MULTIVARIATA

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017

Misure Ripetute. Analisi dei dati in disegni di ricerca con misure ripetute. Marcello Gallucci

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.

Statistica multivariata Donata Rodi 17/10/2016

Regressioni Non Lineari

0 altimenti 1 soggetto trova lavoroentro 6 mesi}

Tecniche statistiche di analisi del cambiamento

Statistica multivariata 27/09/2016. D.Rodi, 2016

SMID a.a. 2004/2005 Corso di Metodi Statistici in Biomedicina Regressione di Cox 7/3/2005

Metodologie Quantitative

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

Principi di analisi causale Lezione 4

Analisi Fattoriale Concetti introduttivi Marcello Gallucci Milano-Bicocca

Analisi della Varianza Fattoriale

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Tema d esame del 15/02/12

LIMITI E DERIVATE DI UNA FUNZIONE

Il metodo della regressione

Elementi di Psicometria con Laboratorio di SPSS 1

24 : 3 = 8 con resto 0 26 : 4 = 6 con resto 2

Regressione lineare semplice

STATISTICA ESERCITAZIONE 13

Misure Ripetute. Partizione della Varianza. Marcello Gallucci

qwertyuiopasdfghjklzxcvbnmqwerty AppuntiBicoccaAppuntiBicoccaAppu ntibicoccaappuntibicoccaappuntibic occaappuntibicoccaappuntibicoccaa

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Esercitazione del

Analisi della Varianza - II

Minimi quadrati vincolati e test F

La regressione lineare multipla

Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003

Principi di analisi causale Lezione 3

LeLing12: Ancora sui determinanti.

Analisi della Varianza - II

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

C.I. di Metodologia clinica

Introduzione al corso di Econometria

Esercitazione 9 del corso di Statistica (parte seconda)

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

I TEST STATISTICI. dott.ssa Gabriella Agrusti

Psicologia del Lavoro e dell Organizzazione. Antonio Cerasa, PhD IBFM-CNR, Germaneto (CZ)

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

Modelli a effetti misti

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Analisi della varianza a una via

Anno Scolastico 2014/15 - Classe 1D Verifica di matematica dell 11 Maggio Soluzioni degli esercizi. 2(x 2) 2(x 1) + 2 = 3x

CAPITOLO 11 ANALISI DI REGRESSIONE

Economia Politica e Istituzioni Economiche. Barbara Pancino Lezione 4

Analisi della varianza

Concetti principale della lezione precedente

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Esame di Probabilità e Statistica del 23 agosto 2010 (Corso di Laurea Triennale in Matematica, Università degli Studi di Padova).

METODO DEI MINIMI QUADRATI

Statistica ARGOMENTI. Calcolo combinatorio

George BOOLE ( ) L algebra booleana. (logica proposizionale)

GENETICA QUANTITATIVA

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Teoria e tecniche dei test LA VALIDITA 10/12/2013. a) SIGNIFICATIVITA TEORICA E OSSERVATIVA DI UN COSTRUTTO. Lezione 6 seconda parte LA VALIDITA

Indagine statistica. Indagine Totale Indagine Campionaria Fasi dell indagine

Il modello di regressione lineare multipla con regressori stocastici

Alcune nozioni preliminari di teoria elementare di insiemi e funzioni

8. ANALISI DELLA COVARIANZA (ANCOVA)

Statistica Applicata all edilizia: il modello di regressione

Transcript:

Analisi avanzate basate sulla regressione (Cap. 7) AMD Marcello Gallucci marcello.gallucci@unimib.it

Regressione Multipla A seconda dello status delle variabili indipendenti, possiamo differenziare diversi tipi di tecniche statistiche Analisi della mediazione Path analysis (satura)

Regressione Multipla A seconda dello status delle variabili indipendenti, possiamo differenziare tre tipi di tecniche statistiche Analisi della mediazione VI sono teoricamente organizzate in cause esogene e cause endogene Path analysis (satura) Analisi della covarianza

Regressione Multipla A seconda dello status delle variabili indipendenti, possiamo differenziare tre tipi di tecniche statistiche Analisi della mediazione VI sono teoricamente organizzate in cause esogene e cause endogene Path analysis (satura) VI e VD sono teoricamente organizzate un modello preciso Analisi della covarianza

Regressione Multipla A seconda dello status delle variabili indipendenti, possiamo differenziare tre tipi di tecniche statistiche Analisi della mediazione VI sono teoricamente organizzate in cause esogene e cause endogene Path analysis (satura) Analisi della covarianza VI e VD sono teoricamente organizzate un modello preciso VI sono teoricamente organizzate in predittori e variabili di disturbo

Analisi della mediazione

Mediazione Per variabile mediatrice intendiamo una variabile che è responsabile dell effetto di un altra variabile sulla variabile dipendente VI sono teoricamente organizzate in cause esogene e cause endogene Cause esogene sono quelle variabili esplicative la cui variabilità è data e non spiegata dal modello Cause endogene sono quelle variabili esplicative la cui variabilità è (parzialmente) spiegata dal modello Variabili dipendenti sono quelle variabili di cui vogliamo spiegare la variabilità

Status delle VI Causa esogena VD Causa esogena La variabilità di questa variabile è data (esterna al modello) Cause endogene VD La variabilità di questa variabile è sia predetta dal modello che usata per predire la VD La variabilità di questa variabile è ciò che vogliamo spiegare (predire) con il modello

Cause? Notiamo subito che la dicitura cause non può essere giustificata statisticamente. Assumiamo che una teoria, la logica, o specifiche metodologie ci consentano di interpretare il modello come un modello causale Ricordiamoci sempre che Sesso Modo di vestire Modo di vestire sesso...sono statisticamente equivalenti

Modello di mediazione Causa esogena VD Osserviamo un effetto di una VI sulla VD Causa esogena VD mediatore Vogliamo sapere se questo effetto sia dovuto all intervento di una terza variabile

Modello di mediazione: Esempio # birre # sorrisi Osserviamo un effetto di una VI sulla VD A cosa è dovuto questo effetto?

Modello di mediazione: Esempio # birre # sorrisi Ipotizziamo che tale effetto sia dovuto alla ridotta capacità di controllo # birre # sorrisi controllo Vogliamo sapere se la ridotta capacità di controllo è responsabile (media l effetto) dei maggiori sorrisi

Mediazione: Logica X Y Vogliamo sapere se una parte dell effetto semplice sia mediato dalla variabile mediatrice X Y mediatore

Mediazione: Logica Condizione logiche: 1 Dobbiamo osservare l effetto semplice (b 0) x Y 2 La variabile esogena deve avere un effetto sul mediatore X Mediatore 3 Il mediatore deve avere un effetto sull VD, parzializzando la V. esogena X Y Mediator

Mediazione: Logica Condizione logiche: 1 # birre deve avere un effetto su # sorrisi x Y 2 # birre deve far diminuire il controllo X Mediatore 3 La mancanza di controllo deve far aumentare # sorrisi (al netto di # birre) X Y Mediatore

Mediazione Se queste condizioni valgono, allora una parte dell effetto della variabile esogena sarà mediato dalla variabile mediatrice Causa esogena VD mediatore Una parte dell effetto passa per il mediatore Come lo calcoliamo questo effetto?

Effetti di regressione Definizione dei coefficienti parziali Effetto semplice=effetto diretto + effetto indiretto b yx byx. w byw. x b wx x b yx. w Effetto diretto b wx Effetto indiretto w b yw. x y

Effetto mediato L effetto mediato non è altro che l effetto indiretto b yx byx. w byw. x b wx birre b yx. w Effetto diretto b wx Effetto indiretto= effetto mediato controllo b yw. x sorrisi

Calcolo dell effetto mediato Per calcolarlo basterà effettuare due regressioni che ci daranno i coefficienti che ci interessano 2 Mediatore come VD e esogena come VI X b wx Mediatore 3 VD come VD e variabile esogena e mediatore come variabili indipendenti X Y Effetto Mediato indiretto b wx b yw. x Mediator b yw. x

Calcolo dell Effetto mediato (2) Data la relazione Effetto semplice=effetto diretto + effetto mediato b yx byx. w byw. x b wx avremo necessariamente: Effetto mediato = effetto semplice effetto diretto b yw. x bwx byx byx. w

Esempio: SPSS Supponiamo di voler testare se la campagna pubblicitaria abbia avuto effetto in quanto rende salienti i rischi associati al fumo. Ipotesi: una maggiore esposizione alla campagna incrementa l'avversione al fumo in quanto rende salienti i rischi del fumo, e la salienza dei rischi aumenta l'avversione al fumo.

Modello da stimare Ipotesi: una maggiore esposizione alla campagna incrementa l'avversione al fumo in quanto rende salienti i rischi del fumo, e la salienza dei rischi aumenta l'avversione al fumo. Modello 1 esposizione c avversione Modello 2 esposizione c' avversione a b per. rischi

Modello 1 In primo luogo stimiamo la relazione semplice tra la variabile esogena e quella dipendente Modello 1 esposizione C=9.933 avversione

Calcolo dell effetto mediato Poi stimiamo l effetto della variabile esogena sul mediatore 2 Mediatore come VD e esogena come VI esposizione a=5.522 per. rischi

Calcolo dell effetto mediato Poi stimiamo l effetto della variabile mediatrice sulla dipendente c'=1.975 esposizione avversione 3 Il mediatore deve avere un effetto sull VD, parzializzando la V. esogena per. rischi b=1.441

Effetto mediato Calcoliamo l effetto mediato E y.m.x =a b=b mx b y.mx 5.522 1.441=7.957 Modello 2 esposizione c' avversione a=5.522 per. rischi b=1.441

Effetto mediato Calcoliamo l effetto mediato Una parte dell effetto di esposizione sull'avversione è dovuta all'aumento della percezione del rischio Modello 2 esposizione c' avversione a=5.522 per. rischi b=1.441 E y.m.x =a b=b mx b ym.x 5.522 1.441=7.957

Effetto mediato come riduzione dell'effetto Calcoliamo l effetto mediato Modello 1 esposizione C=9.933 avversione Modello 2 esposizione c'=1.975 avversione a b per. rischi E y.m.x =c c' =b yx b yx.m 9.933 1.975=7.957

Effetto mediato come riduzione dell'effetto Calcoliamo l effetto mediato Modello 1 esposizione c=9.933 avversione L effetto di esposizione, dopo aver parzializzato la percezione del rischio risulta ridotto Modello 2 c'=1.975 esposizione avversione a b per. rischi E y.m.x =c c' =b yx b yx.m 9.933 1.975=7.957

Effetto mediato L effetto mediato è quella parte dell effetto semplice che influenza la variabile dipendente attraverso l effetto della variabile mediatrice E y.m.x =a b=b mx b ym.x L effetto mediato rappresenta la riduzione dell effetto di una variabile esogena, dopo aver parzializzato l effetto della variabile mediatrice E y.m.x =c c' =b yx b yx.m

Inferenza sull effetto mediato Possiamo dire che l effetto mediato è significativamente diverso da zero (non è casuale) L effetto mediato sarà statisticamente diverso da zero se i suoi componenti (b wx e b yw.x ) saranno statisticamente diversi da zero

Mediazione totale o parziale Quando l effetto della variabile esogena, parzializzando l effetto del mediatore, risulta non significativo, diremo che la mediazione è totale Quando l effetto della variabile esogena, parzializzando l effetto del mediatore, risulta ridotta ma ancora significativa, diremo che la mediazione è parziale

Variabili intervenenti e mediatori Notiamo che un risultato simile lo avevamo ottenuto con l esempio dello stipendio, pubblicazioni, e anzianità

Effetti totali diretti e indiretti (coeffic.) Effetto semplice Pub 12.4 Stipendio pub verso anz. pub 1.2 Effetto diretto.15 anzianità 70.7 stipendio Effetto indiretto=.15*70.7=10.6 Lezione: 12

Variabili intervenenti e mediatori Anche se statisticamente i due modelli sono uguali, nel caso dell anzianità parleremo di variabile interveniente Non abbiamo nessuna giustificazione per assumere che ci sia un nesso causale tale che il numero di pubblicazioni causano l anzianità

Effetti totali diretti e indiretti (coeffic.) Questo modello non avrebbe nessun senso pub 1.2.15 anzianità 70.7 stipendio

Variabili intervenienti Diremo dunque che anzianità è una variabile interveniente tra pubblicazioni e stipendio, ma non una variabile che media gli effetti di pubblicazioni su stipendio pub stipendio anzianità

Variabili intervenenti e mediatori Considereremo effetti di mediazione quegli effetti indiretti che possono essere strutturati secondo una logica causale (Esogena- >mediatore->dipendente) Considereremo effetti intervenenti quegli effetti indiretti che non possono essere strutturati secondo una logica causale di tale tipo La differenza tra i due tipi di effetti non è statistica, ma logica (statisticamente ci vengono le stesse stime)

Dalla mediazione alla path analysis Notiamo che il modello considerato per la mediazione, è un semplice modello di path analysis. La path analysis (tra l altro) consente stimare le relazioni tra variabili strutturate in un modello logico definito X W Y

Path analysis Per modelli semplici di path analysis (detti saturi), si possono stimare i coefficienti con l uso di alcune regressioni, seguendo semplici regole (che conosciamo): Le variabile che ricevono freccia sono dipendenti Le variabile che mandano la freccia sono indipendenti Stimeremo tante regressioni quante sono le variabili che ricevono una freccia

Path analysis a X W c d b e Q Y

Path analysis X d Q a c e f W b Y Regressione 1 Regressione 2 a b wx b yw. x e b b yx. w Regressione 3 c b qw. xy d bqx. wy f b qy. wx

Path analysis Usando differenti regressioni possiamo stimare i coefficienti di un path diagram, sotto la condizione che il modello preveda tutti i possibili path (frecce). Questi modelli sono detti saturi Modello Saturo Modello non Saturo X Q X Q W Y W Y Stimabile con regressioni Non Stimabile con regressioni

Fine Fine della Lezione IV