Metodologie Quantitative Regressione Lineare Multipla Mediazione e Path analysis I M Q Marco Perugini Milano-Bicocca 1
Regressione Multipla: utilizzo avanzato A seconda dello status delle variabili indipendenti, possiamo differenziare diversi tipi di tecniche statistiche avanzate di regressione Analisi della mediazione Path analysis Analisi della moderazione 2
Regressione Multipla avanzata A seconda dello status delle variabili indipendenti, possiamo differenziare tre tipi di tecniche statistiche Analisi della mediazione Path analysis Analisi della moderazione VI sono teoricamente organizzate in esogene ed endogene VI e VD sono organizzate secondo un modello teorico preciso Una VI modera l effetto della altra VI sulla VD 3
Mediazione Per variabile mediatrice intendiamo una variabile che è responsabile dell effetto di un altra variabile sulla variabile dipendente VI sono teoricamente organizzate in cause esogene e cause endogene Cause esogene sono quelle variabili esplicative la cui variabilità è data e non spiegata dal modello Cause endogene sono quelle variabili esplicative la cui variabilità è (parzialmente) spiegata dal modello Variabili dipendenti sono quelle variabili di cui vogliamo spiegare la variabilità 4
Status delle VI Causa esogena VD Causa esogena La variabilità di questa variabile è data (esterna al modello) La variabilità di questa variabile è ciò che vogliamo spiegare (predire) con il modello VD Cause endogene La variabilità di questa variabile è sia predetta dal modello che usata per predire la VD 5
Cause? Notiamo subito che la dicitura cause non può essere giustificata statisticamente. Assumiamo che una teoria, la logica, o specifiche metodologie ci consentano di interpretare il modello come un modello causale Ricordiamoci sempre che Sesso Modo di vestire Modo di vestire Sesso sono statisticamente equivalenti 6
Funzionale vs. Causa-effetto Quando diciamo che una variabile ne spiega un altra, intendiamo dire che stiamo cercando di stabilire una relazione funzionale Una relazione funzionale non e necessariamente una relazione di causa-effetto. La variabile spiegata varia in funzione della variabile che spiega ma non necessariamente quest ultima e anche la causa Una relazione statistica non e necessariamente una relazione causale 7
Funzionale vs. Causa-effetto Ci puo essere una terza variabile (causa) che spiega la presenza di una relazione funzionale Se vogliamo predire le abilità cognitive, una variabile che predice significativamente sarà la dimensione dei piedi Ci puo essere una terza variabile (soppressore) che spiega l assenza di di una relazione funzionale anche laddove c e una relazione causale Se vogliamo predire l essere in gravidanza, una variabile NON significativa sarà l avere avuto un rapporto sessuale In entrambi i casi, c e una terza variabile (età, contraccettivi) che agisce sulla relazione funzionale tra predittore e criterio Per stabilire un effetto casuale c e bisogno di altre condizioni (ad es., tipo di dati, modello teorico, esame di spiegazioni alternative) 8
Condizioni per la causalita A p B Concezione classica per stabilire un effetto causale (Mill, 1843): 1) Isolamento. La relazione B=p*A deve tenere anche quando si considerano k VI aggiuntive. 2) Associazione. Dato un isolamento, e necessaria una associazione stabile. 3) Direzionalita. Le cause precedono temporalmente gli effetti (Hume). Ma di quanto? Concezione moderna per stabilire un effetto causale (Mackie, 1965): 1) Condizione INUS. A cause is an insufficient but necessary part of a condition which is itself unnecessary but sufficient for the result C e bisogno di una teoria forte che ci indichi quali sono queste variabili e di dati adeguati con un intervallo temporale di misurazione adeguato al tipo di effetto causale studiato. 9
Modello di mediazione Variabile esogena VD Osserviamo un effetto di una VI sulla VD Variabile esogena VD mediatore Vogliamo sapere se questo effetto sia dovuto all intervento di una terza variabile 10
Modello di mediazione: Esempio vino sorrisi Osserviamo un effetto di una VI sulla VD A cosa è dovuto questo effetto? 11
Modello di mediazione: Esempio vino sorrisi Ipotizziamo che tale effetto sia dovuto alla ridotta capacità di controllo (o all aumento delle disinibizione) vino - + sorrisi - controllo Vogliamo sapere se la ridotta capacità di controllo è responsabile (media l effetto) dei maggiori sorrisi 12
Mediazione: Logica X Y Vogliamo sapere se una parte (o tutto) dell effetto semplice sia mediato dalla variabile mediatrice X Y mediatore 13
Mediazione: Logica Condizione logiche: 1 Dobbiamo osservare l effetto semplice (b 0) x Y 2 La variabile esogena deve avere un effetto sul mediatore X Mediatore 3 Il mediatore deve avere un effetto sulla VD, parzializzando la variabile esogena X Y Mediator 14
Mediazione: Logica Condizione logiche: 1 Il vino bevuto deve avere un effetto sui sorrisi x Y 2 Il vino bevuto deve far diminuire il controllo X Mediatore 3 La diminuzione di controllo deve far aumentare i sorrisi (al netto del vino bevuto) X Y Mediatore 15
Mediazione Se queste condizioni valgono, allora una parte dell effetto della variabile esogena sarà mediato dalla variabile mediatrice Variabile esogena VD mediatore Una parte dell effetto passa per il mediatore Come lo calcoliamo questo effetto? 16
Ricordiamo i coefficienti parziali Definizione dei coefficienti parziali Effetto semplice = effetto diretto + effetto indiretto b yx byx. w byw. x b wx x b yx. w Effetto diretto b wx Effetto indiretto w b yw. x y 17
Effetto mediato L effetto mediato non è altro che l effetto indiretto b yx byx. w byw. x b wx vino b yx. w Effetto diretto b wx Effetto indiretto= effetto mediato controllo b yw. x sorrisi 18
Calcolo dell effetto mediato Per calcolarlo basterà effettuare due regressioni che ci daranno i coefficienti che ci interessano 2 Mediatore come VD e esogena come VI X b wx Mediatore 3 VD come VD e variabile esogena e mediatore come variabili indipendenti X Y Effetto Mediato indiretto b wx b yw. x Mediator b yw. x 19
Calcolo dell Effetto mediato (2) Data la relazione Effetto semplice= effetto diretto + effetto mediato b yx byx. w byw. x b wx avremo necessariamente: Effetto mediato = effetto semplice effetto diretto b yw. x bwx byx byx. w 20
Effetti diretti e indiretti Effetto semplice Vino.70 Sorrisi Effetti parziali Vino.40 Effetto diretto -.60 Sorrisi Controllo -.50 Effetto indiretto=(-.60)*(-.50)=.30 Effetto totale=.40+.30=.70 21
Esempio: SPSS Consideriamo una ricerca fatta sull uso dei preservativi e intossicazione da alcol Il ricercatore ipotizza che la relazione tra le due variabili sia mediata dalla capacità di percepire le conseguenze a lungo termini delle azioni Indice di tasso alcolico nel sangue (da 0 a 1) Statisti che descri tti ve ialcol per_cons intenzione Validi (list wis e) Dev iazione N Minimo Mas simo Media std. 120,01,96,4778,28407 120 4, 06 14, 30 8, 9384 1, 88263 120 1, 30 14, 12 8, 5025 2, 44901 120 Test Percezione conseguenze (da 0 a 15) Intenzione di usare i preservativi in un rapporto casuale (questionario da 0 a 15) 22
Esempio: SPSS In primo luogo stimiamo la relazione semplice tra la variabile esogena e quella dipendente intossicazione b yx 2.3 intenzione Modello 1 (Costante) ialcol Coeff icienti non st andardizzati a. Variabile dipendent e: intenzione Coefficienti a Coef f icienti st andardizzati B Errore s td. Beta t Sig. 9, 601,425 22, 606,000-2,300,765 -, 267-3,007,003 23
Calcolo dell effetto mediato Poi stimiamo l effetto della variabile esogena sul mediatore 2 Mediatore come VD e esogena come VI Intossicazione b wx 1.83 Modello 1 (Costante) ialcol Coeff icienti non st andardizzati a. Variabile dipendent e: per_cons Coefficienti a Coef f icienti st andardizzati B Errore s td. Beta t Sig. 9, 817,325 30, 162,000-1,839,586 -, 277-3,137,002 Percezione conseguenze 24
Calcolo dell effetto mediato Poi stimiamo l effetto della variabile mediatrice sulla dipendente 3 Il mediatore deve avere un effetto sulla VD, parzializzando la V. esogena Intossicazione intenzione Modello 1 (Costante) ialcol per_cons Coeff icienti non st andardizzati a. Variabile dipendent e: intenzione Coefficienti a Coef f icienti st andardizzati Percezione conseguenze B Errore s td. Beta t Sig.,544,890,611,543 -, 603,565 -, 070-1,067,288,923,085,709 10, 815,000 b yw. x.923 25
Effetto mediato Calcoliamo l effetto mediato effetto mediato b yw. b.923*( 1.83) 1.697 x wx Intossicazio ne b yx. w.603 b wx 1.83 Percezione Intenzione b yw. x.923 26
Effetto mediato Dunque effetto mediato b yw. b.923*( 1.83) 1.697 effetto x wx semplice b 2.3 yx Una parte dell effetto dell intossicazione alcolica sull intenzione di usare i preservativi è dovuta alla diminuita capacità di percepire le conseguenze quando si è intossicati L effetto di intossicazione, dopo aver parzializzato la percezione delle conseguenze (effetto diretto) risulta ridotto riduzione b yx b yx. w 2.3 (.603) 1.697 27
Effetto mediato L effetto mediato è quella parte dell effetto semplice che influenza la variabile dipendente attraverso l effetto della variabile mediatrice effetto mediato b yw. x b wx L effetto mediato rappresenta la riduzione dell effetto di una variabile esogena, dopo aver parzializzato l effetto della variabile mediatrice effetto mediato b yx b yx. w b yw. x bwx byx byx. w 28
Inferenza sull effetto mediato Possiamo dire che l effetto mediato è significativamente diverso da zero (non è casuale) L effetto mediato sarà statisticamente diverso da zero se i suoi componenti (b wx e b yw.x ) saranno statisticamente diversi da zero Modello 1 (Costante) ialcol Coeff icienti non st andardizzati a. Variabile dipendent e: per_cons B Errore s td. Beta t Sig. 9, 817,325 30, Coefficienti 162 a,000-1,839,586 -, 277-3,137,002 Coeff icienti non Coef f icienti st andardizzati st andardizzati Modello 1 Coefficienti a (Costante) ialcol per_cons Coef f icienti st andardizzati a. Variabile dipendent e: intenzione B Errore s td. Beta t Sig.,544,890,611,543 -, 603,565 -, 070-1,067,288,923,085,709 10, 815,000 29
Mediazione totale o parziale Quando l effetto della variabile esogena, parzializzando l effetto del mediatore, risulta non significativo, diremo che la mediazione è totale Quando l effetto della variabile esogena, parzializzando l effetto del mediatore, risulta ridotta ma ancora significativa, diremo che la mediazione è parziale Modello 1 (Costante) ialcol per_cons Coeff icienti non st andardizzati a. Variabile dipendent e: intenzione Coefficienti a Coef f icienti st andardizzati B Errore s td. Beta t Sig.,544,890,611,543 -, 603,565 -, 070-1,067,288,923,085,709 10, 815,000 30
Mediazione significativa Per verificare se l effetto di mediazione è statisticamente significativo, si può usare il test di Sobel Z ( b 2 wx * es * b 2 yw. x * es 2 yw. x Vale a dire, si moltiplicano i due parametri divisi per la radice quadrata della somma dei due parametri al quadrato per il loro errore standard al quadrato b wx 2 wx b yw. x ) Si distribuisce come una Z e quindi si può verificare la significatività della mediazione. Ci sono test più avanzati (approccio bootstrap). 31
Mediazione in SPSS Esistono dei moduli integrabili con SPSS per testare la mediazione (ad es., PROCESS di Hayes, 2013) Utilizzano un approccio bootstrap che è statisticamente più robusto (non ha bisogno di assunzioni di normalità). A partire dal proprio campione, si creano molti campioni (ad es., 1000) di numerosità uguale estratti casualmente con rimpiazzamento (ad es., un partecipante può essere estratto più volte in un campione). Si calcolano poi i valori medi dei vari parametri (media, intervallo di confidenza) ottenuti dai campioni e si verifica la mediazione 32
Variabili intervenenti e mediatori Notiamo che un risultato simile lo avevamo ottenuto con l esempio dello stipendio, pubblicazioni, e anzianità 33
Effetti totali diretti e indiretti (coeffic.) Effetto semplice Pub 12.4 Stipendio pub verso anz. pub 1.2 Effetto diretto.15 anzianità 70.7 stipendio Effetto indiretto=.15*70.7=10.6 34
Variabili intervenenti e mediatori Anche se statisticamente i due modelli sono uguali, nel caso dell anzianità parleremo di variabile interveniente Non abbiamo nessuna giustificazione per assumere che ci sia un nesso causale o funzionale tale che il numero di pubblicazioni influenzano l anzianità 35
Effetti totali diretti e indiretti (coeffic.) Questo modello non avrebbe nessun senso pub 1.2.15 anzianità 70.7 stipendio 36
Variabili intervenienti Diremo dunque che anzianità è una variabile interveniente tra pubblicazioni e stipendio, ma non una variabile che media gli effetti di pubblicazioni su stipendio pub stipendio anzianità 37
Variabili intervenienti e mediatori Considereremo effetti di mediazione quegli effetti indiretti che possono essere strutturati secondo una logica causale (Esogena- >mediatore->dipendente) Considereremo effetti intervenienti quegli effetti indiretti che non possono essere strutturati secondo una logica causale di tale tipo La differenza tra i due tipi di effetti NON è statistica, ma teorica (statisticamente ci vengono le stesse stime) 38
Dalla mediazione alla path analysis Notiamo che il modello considerato per la mediazione, è un semplice modello di path analysis. La path analysis (tra l altro) consente stimare le relazioni tra variabili strutturate in un modello logico definito X W Y 39
Path Analysis al volo La Path Analysis rappresenta dei modelli di relazione tra le variabili secondo un flusso teorico I modelli di Path Analysis sono spesso chiamati modelli causali ma EVITATE questo termine (la causalita non e necessariamente nella analisi statistica!) Causalita ipotetica: la Path Analysis puo essere usata per testare delle relazioni ipotetico-causali e non per trovarle La Path Analysis puo essere compresa come un insieme di regressioni multiple a piu strati 40
Un modello teorico 41
Un modello teorico 42
Risultati 43