Metodologie Quantitative

Похожие документы
Metodologie Quantitative

Analisi avanzate basate sulla regressione (Cap. 7)

Analisi Multivariata dei Dati. Regressione Multipla

Il modello di regressione

Metodologie Quantitative

Introduzione all Analisi della Varianza (ANOVA)

Corso di Psicometria Progredito

Statistica multivariata Donata Rodi 17/10/2016

Regressione Lineare Semplice e Correlazione

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Analisi della regressione multipla

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

Analisi della Varianza Fattoriale

Elementi di Psicometria con Laboratorio di SPSS 1

ANALISI MULTIVARIATA

Assunzioni (Parte I)

Regressione lineare semplice

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo

Metodologie Quantitative

Il modello lineare misto

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Strumenti di indagine per la valutazione psicologica

Tecniche statistiche di analisi del cambiamento

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Analisi Fattoriale Concetti introduttivi Marcello Gallucci Milano-Bicocca

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Regressioni Non Lineari

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

24 : 3 = 8 con resto 0 26 : 4 = 6 con resto 2

Misure Ripetute. Analisi dei dati in disegni di ricerca con misure ripetute. Marcello Gallucci

Il metodo della regressione

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017

CORSO INTEGRATO DI STATISTICA E INFORMATICA MEDICA

Analisi della Varianza - II

Misure Ripetute. Partizione della Varianza. Marcello Gallucci

Argomenti della lezione:

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

STATISTICA A K (60 ore)

Contenuti: Capitolo 14 del libro di testo

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

Dispensa di Statistica

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Minimi quadrati vincolati e test F

La multicollinearità sorge quando c è un elevata correlazione tra due o più variabili esplicative.

LEZIONE N. 11 ( a cura di MADDALENA BEI)

La ricerca sociale: metodologia e tecniche

Metodo epidemiologici per la clinica _efficacia / 1. L analisi statistica

I TEST STATISTICI. dott.ssa Gabriella Agrusti

Analisi della varianza a una via

Test F per la significatività del modello

Analisi della varianza

Data Mining. Prova parziale del 20 aprile 2017: SOLUZIONE

Questi appunti costituiscono soltanto una traccia sintetica del Corso di Laboratorio di Fisica, a prescindere dalle opportune spiegazioni e dai

Psicologia del Lavoro e dell Organizzazione. Antonio Cerasa, PhD IBFM-CNR, Germaneto (CZ)

Regressione lineare con un solo regressore

X Lezione Analisi della varianza Esempi e esercizi CPS - Corso di studi in Informatica II parte: Statistica

Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA Paolo Brunori

Esercitazione 9 del corso di Statistica (parte seconda)

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Statistica multivariata

C.I. di Metodologia clinica

Esame di Statistica del 19 settembre 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

Teoria e tecniche dei test LA VALIDITA 10/12/2013. a) SIGNIFICATIVITA TEORICA E OSSERVATIVA DI UN COSTRUTTO. Lezione 6 seconda parte LA VALIDITA

TRACCIA DI STUDIO. Test di confronto per misure qualitative. Verifica di ipotesi

La regressione lineare multipla

Regressione Lineare Multipla

Tecniche statistiche di analisi del cambiamento

Esercizio 1 GRAFICO 1. X e Y sono indipendenti. X e Y non sono correlate. La correlazione tra X e Y è <1. X e Y sono perfettamente correlate

11.2. Introduzione alla statistica 2/ed. Marilyn K. Pelosi, Theresa M. Sandifer, Paola Cerchiello, Paolo Giudici

DISTRIBUZIONI DI CAMPIONAMENTO

Tema d esame del 15/02/12

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo

SCOPO DELL ANALISI DI CORRELAZIONE

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

CAPITOLO 11 ANALISI DI REGRESSIONE

Test per la correlazione lineare

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

La regressione lineare. Rappresentazione analitica delle distribuzioni

Транскрипт:

Metodologie Quantitative Regressione Lineare Multipla Mediazione e Path analysis I M Q Marco Perugini Milano-Bicocca 1

Regressione Multipla: utilizzo avanzato A seconda dello status delle variabili indipendenti, possiamo differenziare diversi tipi di tecniche statistiche avanzate di regressione Analisi della mediazione Path analysis Analisi della moderazione 2

Regressione Multipla avanzata A seconda dello status delle variabili indipendenti, possiamo differenziare tre tipi di tecniche statistiche Analisi della mediazione Path analysis Analisi della moderazione VI sono teoricamente organizzate in esogene ed endogene VI e VD sono organizzate secondo un modello teorico preciso Una VI modera l effetto della altra VI sulla VD 3

Mediazione Per variabile mediatrice intendiamo una variabile che è responsabile dell effetto di un altra variabile sulla variabile dipendente VI sono teoricamente organizzate in cause esogene e cause endogene Cause esogene sono quelle variabili esplicative la cui variabilità è data e non spiegata dal modello Cause endogene sono quelle variabili esplicative la cui variabilità è (parzialmente) spiegata dal modello Variabili dipendenti sono quelle variabili di cui vogliamo spiegare la variabilità 4

Status delle VI Causa esogena VD Causa esogena La variabilità di questa variabile è data (esterna al modello) La variabilità di questa variabile è ciò che vogliamo spiegare (predire) con il modello VD Cause endogene La variabilità di questa variabile è sia predetta dal modello che usata per predire la VD 5

Cause? Notiamo subito che la dicitura cause non può essere giustificata statisticamente. Assumiamo che una teoria, la logica, o specifiche metodologie ci consentano di interpretare il modello come un modello causale Ricordiamoci sempre che Sesso Modo di vestire Modo di vestire Sesso sono statisticamente equivalenti 6

Funzionale vs. Causa-effetto Quando diciamo che una variabile ne spiega un altra, intendiamo dire che stiamo cercando di stabilire una relazione funzionale Una relazione funzionale non e necessariamente una relazione di causa-effetto. La variabile spiegata varia in funzione della variabile che spiega ma non necessariamente quest ultima e anche la causa Una relazione statistica non e necessariamente una relazione causale 7

Funzionale vs. Causa-effetto Ci puo essere una terza variabile (causa) che spiega la presenza di una relazione funzionale Se vogliamo predire le abilità cognitive, una variabile che predice significativamente sarà la dimensione dei piedi Ci puo essere una terza variabile (soppressore) che spiega l assenza di di una relazione funzionale anche laddove c e una relazione causale Se vogliamo predire l essere in gravidanza, una variabile NON significativa sarà l avere avuto un rapporto sessuale In entrambi i casi, c e una terza variabile (età, contraccettivi) che agisce sulla relazione funzionale tra predittore e criterio Per stabilire un effetto casuale c e bisogno di altre condizioni (ad es., tipo di dati, modello teorico, esame di spiegazioni alternative) 8

Condizioni per la causalita A p B Concezione classica per stabilire un effetto causale (Mill, 1843): 1) Isolamento. La relazione B=p*A deve tenere anche quando si considerano k VI aggiuntive. 2) Associazione. Dato un isolamento, e necessaria una associazione stabile. 3) Direzionalita. Le cause precedono temporalmente gli effetti (Hume). Ma di quanto? Concezione moderna per stabilire un effetto causale (Mackie, 1965): 1) Condizione INUS. A cause is an insufficient but necessary part of a condition which is itself unnecessary but sufficient for the result C e bisogno di una teoria forte che ci indichi quali sono queste variabili e di dati adeguati con un intervallo temporale di misurazione adeguato al tipo di effetto causale studiato. 9

Modello di mediazione Variabile esogena VD Osserviamo un effetto di una VI sulla VD Variabile esogena VD mediatore Vogliamo sapere se questo effetto sia dovuto all intervento di una terza variabile 10

Modello di mediazione: Esempio vino sorrisi Osserviamo un effetto di una VI sulla VD A cosa è dovuto questo effetto? 11

Modello di mediazione: Esempio vino sorrisi Ipotizziamo che tale effetto sia dovuto alla ridotta capacità di controllo (o all aumento delle disinibizione) vino - + sorrisi - controllo Vogliamo sapere se la ridotta capacità di controllo è responsabile (media l effetto) dei maggiori sorrisi 12

Mediazione: Logica X Y Vogliamo sapere se una parte (o tutto) dell effetto semplice sia mediato dalla variabile mediatrice X Y mediatore 13

Mediazione: Logica Condizione logiche: 1 Dobbiamo osservare l effetto semplice (b 0) x Y 2 La variabile esogena deve avere un effetto sul mediatore X Mediatore 3 Il mediatore deve avere un effetto sulla VD, parzializzando la variabile esogena X Y Mediator 14

Mediazione: Logica Condizione logiche: 1 Il vino bevuto deve avere un effetto sui sorrisi x Y 2 Il vino bevuto deve far diminuire il controllo X Mediatore 3 La diminuzione di controllo deve far aumentare i sorrisi (al netto del vino bevuto) X Y Mediatore 15

Mediazione Se queste condizioni valgono, allora una parte dell effetto della variabile esogena sarà mediato dalla variabile mediatrice Variabile esogena VD mediatore Una parte dell effetto passa per il mediatore Come lo calcoliamo questo effetto? 16

Ricordiamo i coefficienti parziali Definizione dei coefficienti parziali Effetto semplice = effetto diretto + effetto indiretto b yx byx. w byw. x b wx x b yx. w Effetto diretto b wx Effetto indiretto w b yw. x y 17

Effetto mediato L effetto mediato non è altro che l effetto indiretto b yx byx. w byw. x b wx vino b yx. w Effetto diretto b wx Effetto indiretto= effetto mediato controllo b yw. x sorrisi 18

Calcolo dell effetto mediato Per calcolarlo basterà effettuare due regressioni che ci daranno i coefficienti che ci interessano 2 Mediatore come VD e esogena come VI X b wx Mediatore 3 VD come VD e variabile esogena e mediatore come variabili indipendenti X Y Effetto Mediato indiretto b wx b yw. x Mediator b yw. x 19

Calcolo dell Effetto mediato (2) Data la relazione Effetto semplice= effetto diretto + effetto mediato b yx byx. w byw. x b wx avremo necessariamente: Effetto mediato = effetto semplice effetto diretto b yw. x bwx byx byx. w 20

Effetti diretti e indiretti Effetto semplice Vino.70 Sorrisi Effetti parziali Vino.40 Effetto diretto -.60 Sorrisi Controllo -.50 Effetto indiretto=(-.60)*(-.50)=.30 Effetto totale=.40+.30=.70 21

Esempio: SPSS Consideriamo una ricerca fatta sull uso dei preservativi e intossicazione da alcol Il ricercatore ipotizza che la relazione tra le due variabili sia mediata dalla capacità di percepire le conseguenze a lungo termini delle azioni Indice di tasso alcolico nel sangue (da 0 a 1) Statisti che descri tti ve ialcol per_cons intenzione Validi (list wis e) Dev iazione N Minimo Mas simo Media std. 120,01,96,4778,28407 120 4, 06 14, 30 8, 9384 1, 88263 120 1, 30 14, 12 8, 5025 2, 44901 120 Test Percezione conseguenze (da 0 a 15) Intenzione di usare i preservativi in un rapporto casuale (questionario da 0 a 15) 22

Esempio: SPSS In primo luogo stimiamo la relazione semplice tra la variabile esogena e quella dipendente intossicazione b yx 2.3 intenzione Modello 1 (Costante) ialcol Coeff icienti non st andardizzati a. Variabile dipendent e: intenzione Coefficienti a Coef f icienti st andardizzati B Errore s td. Beta t Sig. 9, 601,425 22, 606,000-2,300,765 -, 267-3,007,003 23

Calcolo dell effetto mediato Poi stimiamo l effetto della variabile esogena sul mediatore 2 Mediatore come VD e esogena come VI Intossicazione b wx 1.83 Modello 1 (Costante) ialcol Coeff icienti non st andardizzati a. Variabile dipendent e: per_cons Coefficienti a Coef f icienti st andardizzati B Errore s td. Beta t Sig. 9, 817,325 30, 162,000-1,839,586 -, 277-3,137,002 Percezione conseguenze 24

Calcolo dell effetto mediato Poi stimiamo l effetto della variabile mediatrice sulla dipendente 3 Il mediatore deve avere un effetto sulla VD, parzializzando la V. esogena Intossicazione intenzione Modello 1 (Costante) ialcol per_cons Coeff icienti non st andardizzati a. Variabile dipendent e: intenzione Coefficienti a Coef f icienti st andardizzati Percezione conseguenze B Errore s td. Beta t Sig.,544,890,611,543 -, 603,565 -, 070-1,067,288,923,085,709 10, 815,000 b yw. x.923 25

Effetto mediato Calcoliamo l effetto mediato effetto mediato b yw. b.923*( 1.83) 1.697 x wx Intossicazio ne b yx. w.603 b wx 1.83 Percezione Intenzione b yw. x.923 26

Effetto mediato Dunque effetto mediato b yw. b.923*( 1.83) 1.697 effetto x wx semplice b 2.3 yx Una parte dell effetto dell intossicazione alcolica sull intenzione di usare i preservativi è dovuta alla diminuita capacità di percepire le conseguenze quando si è intossicati L effetto di intossicazione, dopo aver parzializzato la percezione delle conseguenze (effetto diretto) risulta ridotto riduzione b yx b yx. w 2.3 (.603) 1.697 27

Effetto mediato L effetto mediato è quella parte dell effetto semplice che influenza la variabile dipendente attraverso l effetto della variabile mediatrice effetto mediato b yw. x b wx L effetto mediato rappresenta la riduzione dell effetto di una variabile esogena, dopo aver parzializzato l effetto della variabile mediatrice effetto mediato b yx b yx. w b yw. x bwx byx byx. w 28

Inferenza sull effetto mediato Possiamo dire che l effetto mediato è significativamente diverso da zero (non è casuale) L effetto mediato sarà statisticamente diverso da zero se i suoi componenti (b wx e b yw.x ) saranno statisticamente diversi da zero Modello 1 (Costante) ialcol Coeff icienti non st andardizzati a. Variabile dipendent e: per_cons B Errore s td. Beta t Sig. 9, 817,325 30, Coefficienti 162 a,000-1,839,586 -, 277-3,137,002 Coeff icienti non Coef f icienti st andardizzati st andardizzati Modello 1 Coefficienti a (Costante) ialcol per_cons Coef f icienti st andardizzati a. Variabile dipendent e: intenzione B Errore s td. Beta t Sig.,544,890,611,543 -, 603,565 -, 070-1,067,288,923,085,709 10, 815,000 29

Mediazione totale o parziale Quando l effetto della variabile esogena, parzializzando l effetto del mediatore, risulta non significativo, diremo che la mediazione è totale Quando l effetto della variabile esogena, parzializzando l effetto del mediatore, risulta ridotta ma ancora significativa, diremo che la mediazione è parziale Modello 1 (Costante) ialcol per_cons Coeff icienti non st andardizzati a. Variabile dipendent e: intenzione Coefficienti a Coef f icienti st andardizzati B Errore s td. Beta t Sig.,544,890,611,543 -, 603,565 -, 070-1,067,288,923,085,709 10, 815,000 30

Mediazione significativa Per verificare se l effetto di mediazione è statisticamente significativo, si può usare il test di Sobel Z ( b 2 wx * es * b 2 yw. x * es 2 yw. x Vale a dire, si moltiplicano i due parametri divisi per la radice quadrata della somma dei due parametri al quadrato per il loro errore standard al quadrato b wx 2 wx b yw. x ) Si distribuisce come una Z e quindi si può verificare la significatività della mediazione. Ci sono test più avanzati (approccio bootstrap). 31

Mediazione in SPSS Esistono dei moduli integrabili con SPSS per testare la mediazione (ad es., PROCESS di Hayes, 2013) Utilizzano un approccio bootstrap che è statisticamente più robusto (non ha bisogno di assunzioni di normalità). A partire dal proprio campione, si creano molti campioni (ad es., 1000) di numerosità uguale estratti casualmente con rimpiazzamento (ad es., un partecipante può essere estratto più volte in un campione). Si calcolano poi i valori medi dei vari parametri (media, intervallo di confidenza) ottenuti dai campioni e si verifica la mediazione 32

Variabili intervenenti e mediatori Notiamo che un risultato simile lo avevamo ottenuto con l esempio dello stipendio, pubblicazioni, e anzianità 33

Effetti totali diretti e indiretti (coeffic.) Effetto semplice Pub 12.4 Stipendio pub verso anz. pub 1.2 Effetto diretto.15 anzianità 70.7 stipendio Effetto indiretto=.15*70.7=10.6 34

Variabili intervenenti e mediatori Anche se statisticamente i due modelli sono uguali, nel caso dell anzianità parleremo di variabile interveniente Non abbiamo nessuna giustificazione per assumere che ci sia un nesso causale o funzionale tale che il numero di pubblicazioni influenzano l anzianità 35

Effetti totali diretti e indiretti (coeffic.) Questo modello non avrebbe nessun senso pub 1.2.15 anzianità 70.7 stipendio 36

Variabili intervenienti Diremo dunque che anzianità è una variabile interveniente tra pubblicazioni e stipendio, ma non una variabile che media gli effetti di pubblicazioni su stipendio pub stipendio anzianità 37

Variabili intervenienti e mediatori Considereremo effetti di mediazione quegli effetti indiretti che possono essere strutturati secondo una logica causale (Esogena- >mediatore->dipendente) Considereremo effetti intervenienti quegli effetti indiretti che non possono essere strutturati secondo una logica causale di tale tipo La differenza tra i due tipi di effetti NON è statistica, ma teorica (statisticamente ci vengono le stesse stime) 38

Dalla mediazione alla path analysis Notiamo che il modello considerato per la mediazione, è un semplice modello di path analysis. La path analysis (tra l altro) consente stimare le relazioni tra variabili strutturate in un modello logico definito X W Y 39

Path Analysis al volo La Path Analysis rappresenta dei modelli di relazione tra le variabili secondo un flusso teorico I modelli di Path Analysis sono spesso chiamati modelli causali ma EVITATE questo termine (la causalita non e necessariamente nella analisi statistica!) Causalita ipotetica: la Path Analysis puo essere usata per testare delle relazioni ipotetico-causali e non per trovarle La Path Analysis puo essere compresa come un insieme di regressioni multiple a piu strati 40

Un modello teorico 41

Un modello teorico 42

Risultati 43