Analisi Multivariata dei Dati. Regressione Multipla

Documenti analoghi
Il modello di regressione

Analisi Multivariata dei Dati

Introduzione all Analisi della Varianza (ANOVA)

Metodologie Quantitative

Analisi avanzate basate sulla regressione (Cap. 7)

Metodologie Quantitative

Regressione Lineare Semplice e Correlazione

Assunzioni (Parte I)

Il modello lineare misto

Statistica multivariata Donata Rodi 17/10/2016

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Esercitazione del

ANALISI MULTIVARIATA

Analisi della Varianza Fattoriale

P S I C O M T R I A Marcello Gallucci. Analisi Fattoriale. Esempi. Milano-Bicocca. Lezione: 20

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

Analisi Fattoriale Concetti introduttivi Marcello Gallucci Milano-Bicocca

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Strumenti informatici Calcolare il coefficiente di correlazione di Pearson con Excel e SPSS

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

Misure Ripetute. Partizione della Varianza. Marcello Gallucci

PROBABILITÀ ELEMENTARE

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Misure Ripetute. Analisi dei dati in disegni di ricerca con misure ripetute. Marcello Gallucci

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Statistica 1 A.A. 2015/2016

REGRESSIONE lineare e CORRELAZIONE. Con variabili quantitative che si possono esprimere in un ampio ampio intervallo di valori

Tecniche statistiche di analisi del cambiamento

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

Statistica di base per l analisi socio-economica

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Regressione Semplice. Correlazioni. sconto leverage. sconto Correlazione di Pearson 1,275. Sign. (a due code),141

Dispensa di Statistica

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

Esercitazione 5 - Statistica (parte II) Davide Passaretti 9/3/2017

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

viii Indice generale

ESERCITAZIONE IV - Soluzioni

STATISTICA. Esercizi vari

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

L A B C di R. Stefano Leonardi c Dipartimento di Scienze Ambientali Università di Parma Parma, 9 febbraio 2010

Metodologia Sperimentale Agronomica / Metodi Statistici per la Ricerca Ambientale

Statistica. Alfonso Iodice D Enza

La regressione lineare multipla

8. ANALISI DELLA COVARIANZA (ANCOVA)

Quanti soggetti devono essere selezionati?

Test F per la significatività del modello

Correlazione e regressione

Metodologie Quantitative

Istituzioni di Statistica

STATISTICA A K (60 ore)

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

La regressione lineare. Rappresentazione analitica delle distribuzioni

Regressione e Correlazione (cap. 11) Importazione dati da file di testo

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

ESERCIZI. Regressione lineare semplice CAPITOLO 12 Levine, Krehbiel, Berenson, Statistica II ed., 2006 Apogeo

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

Statistica. Alfonso Iodice D Enza

STATISTICA 1, metodi matematici e statistici Introduzione al linguaggio R Esercitazione 7:

LABORATORIO DI PROBABILITA E STATISTICA

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

REGRESSIONE E CORRELAZIONE

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

METODO DEI MINIMI QUADRATI

UNIVERSITA DI PARMA FACOLTA DI ECONOMIA. Corso di pianificazione finanziaria A.a. 2003/2004. La stima del costo del capitale proprio

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

Università del Piemonte Orientale. Corso di Laurea in Biotecnologie. Corso di Statistica Medica. Statistica Descrittiva: Variabili numeriche

Es. la performance all esame in relazione alle ore di studio a casa e alle abilità cognitive

Cluster Analysis Distanze ed estrazioni Marco Perugini Milano-Bicocca

Statistica. Alfonso Iodice D Enza

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

Metodologie Quantitative

VALIDAZIONE DEI METODI RADIOCHIMICI. Analisi di alcuni aspetti: 1. Taratura. 2. Ripetibilità. Dott. Maurizio Bettinelli.

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

CAPITOLO 11 ANALISI DI REGRESSIONE

Statistica. Esercitazione 16. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice

Transcript:

Analisi Multivariata dei Dati Regressione Multipla A M D Marcello Gallucci Milano-Bicocca Lezione: III

Effetti multipli Consideriamo ora il caso in cui la variabile dipendente possa essere spiegata da più di una variabile Parleremo di Regressione Multipla x byx.w y w byw. x

Esempio Effetti multipli Vogliamo predire il numero di sorrisi sia con il numero di birre che con il tratto estroversione del soggetto Regressione Multipla Birre byx.w Sorrisi Estrovers. byw. x

Effetti multipli La regressione multipla aggiunge termini lineari (altre VI) alla retta di regressione Legge di relazione della Regressione Multipla x y w Standardizzata yˆ z yx.w x z yw. x wz Non Standardizzata yˆ a byx.w x byw. x w

Interpretazione Il coefficiente di regressione esprime l effetto diretto di x su y, togliendo l effetto che passa indirettamente per w Effetto diretto byx.w byx byw. x bwx Effetto indiretto x bwx w byx.w byw. x y

Effetti Parziali Togliere l effetto indiretto è equivalente a bloccare la possibilità che x vada su y mediante w: Il coefficiente viene dunque detto coefficiente parziale, cioè l effetto di x parzializzando l effetto di w Effetto diretto Effetto indiretto x bwx w byx.w byw. x y

Rappresentazione geometrica yˆ a B y1 x1 B y x

Interpretazione geometrica Effetto Unico of X for X1=-10 Effetto unico di X per X1=0 Effetto unico di X per X1=10

Intercetta (o costante) L'intercetta indica il valore atteso della VD per tutte le VI uguali a 0 Y =a B y1. 0 B y.1 0 Yˆ a

Esempio Un ricercatore ha misurato la capacita di lettura e la produzione linguistica con due test in bimbi da 5 e 8 anni Si propone di studiare se la capacità di lettura è influenzata dalla produzione linguistica eta Validi 5.00 6.00 7.00 8.00 Totale Frequenza 36 7 5 3 10 Percentuale 30.0.5 0.8 6.7 100.0 Percentuale valida 30.0.5 0.8 6.7 100.0 Percentuale cumulata 30.0 5.5 73.3 100.0 Statistiche descrittive N lettura lingua Validi (listwise) 10 10 10 Minimo 1.8.0 Massimo 5.68 13.41 Media 1.869 6.3781 Deviazione std. 3.98934.9360

Esempio Incominciamo con una regressione semplice lettura byxlingua Riepilogo del modello Modello 1 R R-quadrato a.178.03 R-quadrato corretto.03 Errore std. della stima 3.9446 a. Stimatori: (Costante), lingua ANOVAb Modello 1 Varianza spiegata Coefficientia Modello 1 (Costante) lingua Coefficienti non standardizzati B Errore std. 11.316.867.4.14 a. Variabile dipendente: lettura Regressione Residuo Totale Somma dei quadrati 59.794 1834.070 1893.864 df 1 118 119 Media dei quadrati 59.794 15.543 F 3.847 a. Stimatori: (Costante), lingua b. Variabile dipendente: lettura Coefficienti standardizzati Beta.178 t 13.057 1.961 Coefficienti di regressione Sig..000.05 Sig..05a

Esempio Aggiungiamo l età lettura=b yx. w lingua b yw. x eta Riepilogo del modello Modello 1 R R-quadrato a.641.411 R-quadrato corretto.401 Errore std. della stima 3.08750 a. Stimatori: (Costante), eta, lingua ANOVAb Modello 1 Varianza spiegata Regressione Residuo Totale Somma dei quadrati 778.541 1115.33 1893.864 df 117 119 Media dei quadrati 389.71 9.533 F 40.835 a. Stimatori: (Costante), eta, lingua b. Variabile dipendente: lettura Coefficientia Modello 1 (Costante) lingua eta Coefficienti non standardizzati B Errore std. -1.003 1.573 -.077.104.9.57 Coefficienti standardizzati Beta -.056.659 t -.638 -.74 8.683 Sig..55.460.000 a. Variabile dipendente: lettura Notiamo come è cambiato l effetto della lettura Coefficienti di regressione Sig..000a

Esempio Concluderemo che la produzione linguistica è debolmente associata alla capacità di lettura Coefficientia Regressione semplice Modello 1 (Costante) lingua Coefficienti non standardizzati B Errore std. 11.316.867.4.14 Coefficienti standardizzati Beta.178 t 13.057 1.961 Sig..000.05 t -.638 -.74 8.683 Sig..55.460.000 a. Variabile dipendente: lettura Coefficientia Regressione multipla Modello 1 (Costante) lingua eta Coefficienti non standardizzati B Errore std. -1.003 1.573 -.077.104.9.57 Coefficienti standardizzati Beta -.056.659 a. Variabile dipendente: lettura Ma questa associazione dipende dalle differenze dovute all età A parità di età, non vi è una relazione tra produzione linguistica e capacità di lettura

Varianza spiegata La sostanza e la stessa che nella regressione semplice se Y Yzz Xz s reg Wz s reg s y s e = = R y. xw sy sy

Varianza non spiegata Percentuale di varianza di errore, non spiegabile mediante la regressione e e =1 R y. xw a b c X Coefficiente di alienazione W Lezione III

Calcolo di R Il calcolo pratico della varianza spiegata puo essere effettuato partendo dalle correlazioni semplici R y. xw = yx e yw r r r yx r yw r wx 1 r wx a b c X W Lezione III

Decomposizione della varianza spiegata A questo punto ci possiamo chiedere quale sia l effetto unico o il contributo unico di ogni variabile alla varianza spiegata Y Quanto ogni VI contribuisce a spiegare varianza di Y? a b c X Quanto è l effetto unico di ogni variabile sulla variabilità della Y? W Lezione III

Effetti come informazione Immaginiamo l effetto di una VI sulla VD come informazione trasferita dalla VI alla VD Informa.. Adamo Eva Informazione condivisa Eva Eva Adamo Cose che solo Eva conosce Cose che solo Adamo conosce Lezione III

Effetti come informazione Inseriamo un secondo informatore Informa Adamo Eva Serpente Informa Intendiamo sapere chi ha informato Eva e quanta parte della informazione proviene dai due informatori Lezione III

Decomposizione della informazione Come si ripartisce l informazione di Eva Cose che solo Eva conosce Cose che conoscono tutti Eva Cose che Adamo ha detto a EVA Adamo Serpente Cose che Serpente a detto a Eva Cose che Adamo e Serpente conoscono ma non Eva

Effetti unici o parziali Quale e il contributo unico di Serpente alla conoscenza ottenuta da Eva? Cose che Serpente ha detto a Eva - Cose che tutti e tre conoscono e [ a c ] c=a L effetto unico di Serpente su Eva e dato dall effetto totale di Serpente rimuovendo l effetto condiviso con Adamo a b c Adamo Serpente

Effetti unici o parziali Quale e il contributo unico di Serpente alla conoscenza ottenuta da Eva? Cose che Serpente ha detto a Eva - Cose che tutti e tre conoscono e [ a c ] c=a L effetto unico di Serpente su Eva e dato dall effetto totale di Serpente parzializzando l effetto condiviso con Adamo a b c Adamo Serpente

Parzializzazione Parzializzare significa rimuovere l effetto di una (o piu ) VI, cioe calcolare gli effetti come se quella variabile abbia nessuna variabilita e Adamo Serpente Effetto parziale (unico, diretto) di Serpente Adamo parzializzato

Parzializzazione Parzializzare significa rimuovere l effetto di una (o piu ) VI, cioe calcolare gli effetti come se quella variabile abbia nessuna variabilita e Serpente Serpente parzializzato Adamo Effetto parziale (unico, diretto) di Adamo

Effetto Congiunto Qual e l effetto totale che i due informatori hanno su Eva? Quale % della conoscenza di Eva e dovuta agli informatori? Conoscenza di Eva - Conoscenza unica di Eva e 1 e=a b c a b c Adamo Serpente

Effetto Congiunto Qual e l effetto totale che i due informatori hanno su Eva? Quale % della conoscenza di Eva e dovuta agli informatori? Cose solo Serpente ha detto a Eva + Cose solo Adamo ha detto a Eva + Cose che tutti sanno a b c L effetto combinato di A e S e dato dai loro effetti unici (parziali) e dal loro contributo comune e a b c Adamo Serpente

Entra Statistica Siamo interessati agli effetti di due (o piu ) variabili indipendenti su una variabile dipendente Siamo in grado di stimare la regressione che li lega Y =a b yx.w x b yw.x w e Vogliamo quantificare il loro contributo unico e combinato mediante degli indici che rappresentino la grandezza dei vari effetti

Varianza Decomposta Decomponiamo la varianza della varibile dipendente Varianza completamente condivisa Varianza di errore e Contributo unico di X a b c X W Contributo unico di W Varianza condivisa tra X e W

Correlazione semplice (quadrata) Ricordiamo che nella regressione semplice, la correlazione quadrata semplice e la varianza condivisa (spiegata dalla VI) Varianza di errore e r yw W Contributo W

Correlazione semplice (quadrata) La correlazione semplice Varianza completamente condivisa Varianza di errore e r yw =a c Contributo unico di X a r yx =b c b c X W Contributo unico di W Varianza condivisa tra X e W

Contributo unico di VI Il contributo unico di una VI può essere stimato grazie al quadrato della correlazione parziale Correlazione parziale Varianza spiegata pr yw.x - Varianza spiegata da x e a = a+ e a b c X w

Correlazione parziale Il quadrato della correlazione parziale indica l effetto di una VI dopo aver rimosso tutta la variabilita delle altre Correlazione parziale pr yw.x a = a e e Varianza dovuta a w calcolata sul totale dopo aver tolto la varianza di x a b c X w Varianza di x e completamente rimossa Lezione III

Calcolo di pr Pr può essere calcolato partendo dalle correlazioni semplici pr yw.x = r yw r yx r wx 1 r 1 r yx e xw a c Oppure dai coefficienti standardizzati pr yw. x = β yw. x 1 r yx b X W pr yw.x = pr yw.x pr yw.x

Contributo unico di VI () Il contributo unico di una VI può essere anche stimato grazie al quadrato della correlazione semi-parziale Correlazione semi-parziale Varianza spiegata sr yw.x - Varianza spiegata da x e a = a+ b+ c + e a b c X w

Correlazione semi-parziale Il quadrato della correlazione parziale indica l effetto di una VI dopo aver rimosso tutta la variabilita delle altre Correlazione parziale sr yw.x a = a+ b+ c + e e Varianza unica dovuta a w come proporzione di tutta la varianza di Y a b c X w Varianza di x non rimossa nel calcolo della varianza totale

Correlazione semi-parziale In altri termini.. R yxw ryw sryx.w R=.5 R=.10 e e s r=.15 r a b c x w w.5.10.15 Grazie a X, si spiega un 15% in piu

Esempio In ricerca sull anoressia sono state misurate su un campione di 85 donne la propria figura reale, la figura ideale e l autostima. Pictorial Body Image Scale

Output Coefficientia Modello 1 (Costante) Autostima Coefficienti non standardizzati B Errore std..683.06.117.048 Coefficienti standardizzati Beta.58 t 13.048.437 Sig..000.017 a. Variabile dipendente: figura_ideale Lezione: II

Regressione con SPSS Inseriamo le variabili al posto giusto Variabile Dipendente Tutte le variabili Finestra Regressione Variabili Indipendenti Lezione III

Regressione con SPSS Inseriamo le variabili al posto giusto Opzioni ulteriori Marchiamo qui per ottenere le correlazioni semplici e parziali Lezione III

OUTPUT SPSS Bontà della regressione R Significatività Lezione III

OUTPUT SPSS Coefficienti e indici Significatività (notiamo che c è un test solo per ogni VI) r pr

Fine Fine della Lezione III