Psicometria con Laboratorio di SPSS 2

Documenti analoghi
Metodologie Quantitative

Psicometria con Laboratorio di SPSS 1

Argomenti della lezione:

Regressione Lineare Semplice e Correlazione

Tecniche statistiche di analisi del cambiamento

Il modello di regressione

Facoltà di Psicologia Università di Padova Anno Accademico Corso di Psicometria - Modulo B

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

Corso in Statistica Medica

Elementi di Psicometria (con laboratorio software 1)

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Correlazione e regressione

Il modello di regressione

STATISTICA. Regressione-3 L inferenza per il modello lineare semplice

Statistica multivariata Donata Rodi 17/10/2016

La regressione lineare semplice

Statistica descrittiva: analisi di regressione

Elementi di Psicometria con Laboratorio di SPSS 1

Esercitazioni di Statistica Dott.ssa Cristina Mollica

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

Esercitazione del

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

Psicometria con Laboratorio di SPSS 2

lezione 4 AA Paolo Brunori

Elementi di Psicometria

Elementi di Psicometria

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Elementi di Psicometria con Laboratorio di SPSS 1

Regressione lineare semplice

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Analisi Multivariata dei Dati. Regressione Multipla

Correlazione tra due variabili

Psicometria con Laboratorio di SPSS 2

Elementi di Psicometria con Laboratorio di SPSS 1

Correlazione lineare e regressione

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Tecniche statistiche di analisi del cambiamento

Elementi di Psicometria con Laboratorio di SPSS 1

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Elementi di Psicometria con Laboratorio di SPSS 1

CAPITOLO 11 ANALISI DI REGRESSIONE

EsercitazioneII. In questa esercitazione faremi un ripasso generale: rappresentazioni grafiche, medie e varianze;

Lezione 6 Corso di Statistica. Domenico Cucina

Tecniche statistiche di analisi del cambiamento

Regressione & Correlazione

Settimana 3. G. M. Marchetti. Marzo 2017

Comprendere i fenomeni vuol dire studiare le relazioni tra 2 o più variabili. Esiste un legame tra le variabili?

STATISTICA A K (60 ore)

Old Faithful, Yellowstone Park. Statistica e biometria. D. Bertacchi. Dati congiunti. Tabella. Scatterplot. Covarianza. Correlazione.

Tecniche statistiche di analisi del cambiamento

LEZIONE N. 11 ( a cura di MADDALENA BEI)

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

Test delle Ipotesi Parte I

Statistica di base per l analisi socio-economica

Elementi di Psicometria (con laboratorio software 1)

Lezione 6 Corso di Statistica. Francesco Lagona

1. variabili dicotomiche: 2 sole categorie A e B

Tecniche statistiche di analisi del cambiamento

Tecniche statistiche di analisi del cambiamento

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

Psicometria con Laboratorio di SPSS 2

Dispensa di Statistica

Psicometria con Laboratorio di SPSS 2

Introduzione all Analisi della Varianza (ANOVA)

Tecniche statistiche di analisi del cambiamento

Rappresentazioni grafiche di distribuzioni doppie

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

ESERCITAZIONI N. 3 corso di statistica

Introduzione all Analisi della Varianza (ANOVA)

Capitolo 12 La regressione lineare semplice

Metodi statistici per la ricerca sociale Capitolo 9. Regressione Lineare e Correlazione Esercitazione

STATISTICA. Regressione-2

Tecniche statistiche di analisi del cambiamento

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

Analisi Multivariata dei Dati

Esercizi su Regressione e Connessione

Indipendenza, Dipendenza e interdipendenza

Tecniche statistiche di analisi del cambiamento

Tecniche statistiche di analisi del cambiamento

ESERCITAZIONI N. 3 corso di statistica

Università del Piemonte Orientale Corso di Laurea specialistica in Biotecnologie mediche. Corso di Statistica Medica. Correlazione

Relazione tra variabili (cont.) Due variabili continue. Una variabile continua e un altra qualitativa o discreta.

Matematica Lezione 22

Metodi Quantitativi per Economia, Finanza e Management. Lezione n 8 Regressione lineare multipla: le ipotesi del modello, la stima del modello

Statistica 1 A.A. 2015/2016

Vogliamo determinare una funzione lineare che meglio approssima i nostri dati sperimentali e poter decidere sulla bontà di questa approssimazione.

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

LM 88 SOCIOLOGIA E RICERCA SOCIALE. Metodi Statistici per la Ricerca Sociale. Regressione lineare e correlazione

ANALISI MULTIVARIATA

Analisi di Regressione Multipla

Elementi di Psicometria con Laboratorio di SPSS 1

Il metodo dei minimi quadrati. Molto spesso due grandezze fisiche x e y, misurabili direttamente, sono legate tra loro da una legge del tipo:

Cognome e Nome:... Corso di laurea:...

Transcript:

Psicometria con Laboratorio di SPSS 2 Regressione lineare semplice (vers. 1.2, 20 marzo 2018) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2017-18 G. Rossi (Dip. Psicologia) Psico 2017-18 1 / 22

Correlazione e causalità La correlazione fra due variabili (X e Y) non implica causalità Vi sono diverse possibili spiegazioni X causa Y [regr. semplice] Y causa X [regr. semplice] X e Y sono causati da Z (analisi fatt.) X e Y sono causati da Z 1, Z 2, Z 3... Z n (equaz. strutturale) X Y X Z Y X Y G. Rossi (Dip. Psicologia) Psico 2017-18 2 / 22

Cos è la regressione semplice Con la regressione lineare semplice cerchiamo di vedere se la (cor)relazione fra due variabili (ad es. Test di metà anno e Voto finale) può essere spiegata tramite l equazione di una retta Quale variabile sia la dipendente e quale l indipendente, è una scelta teorica (ipotizzo che il test di metà anno spieghi il voto finale) Test Voto A 12 8 B 10 7 C 14 8 D 9 5 E 9 6 F 13 9 G 11 7 H 8 5 G. Rossi (Dip. Psicologia) Psico 2017-18 3 / 22

Scatterplot test-voto Cercando una funzione che approssimi i punti, posso usare una retta ci sono però diverse rette che posso usare ciascuna è più vicina a certi punti rispetto alle altre qual è la migliore? G. Rossi (Dip. Psicologia) Psico 2017-18 4 / 22

Scatterplot test-voto Cercando una funzione che approssimi i punti, posso usare una retta ci sono però diverse rette che posso usare ciascuna è più vicina a certi punti rispetto alle altre qual è la migliore? quella che, contemporaneamente, è alla minor distanza possibile da tutti i punti osservati G. Rossi (Dip. Psicologia) Psico 2017-18 4 / 22

Grafico retta La formula della retta è Y i = a + bx i oppure Y i = b 0 + b 1 X i dove X e Y sono le variabili misurate b o b 1 è la pendenza della retta a o b 0 è l intercetta sull asse delle ordinate G. Rossi (Dip. Psicologia) Psico 2017-18 5 / 22

Equazione In teoria, la formula della retta che interpola meglio è: Y i = a + bx i ma sarebbe vero se i dati fossero perfettamente posizionati sulla retta, mentre invece non lo sono affatto per cui consideriamo i risultati della retta come una stima di dove cadrebbero i punti reali se fosse vera l equazione della retta Y i = a + bx i Per ottenere i veri valori osservati, bisogna aggiungere una variabile che corregga la retta questa è l equazione esatta, perché considera anche l errore che permette di aggiustare i dati: Y i = a + bx i + e i G. Rossi (Dip. Psicologia) Psico 2017-18 6 / 22

Riepilogo G. Rossi (Dip. Psicologia) Psico 2017-18 7 / 22

Grafico fra x e y (stime basate sulla retta migliore) Se stimo i valori y usando la retta i punti cadono esattamente sulla retta Fra tutte le possibili rette, selezioniamo la migliore, ovvero quella che è alla minor distanza possibile da tutti i punti osservati ovvero, in cui la somma degli errori è la minima possibile Obiettivo: minimizzare e i e i = Y i Y i = Y i bx i + a Bisogna che questi errori siano i più piccoli possibili e quindi usiamo il metodo dei minimi quadrati G. Rossi (Dip. Psicologia) Psico 2017-18 8 / 22

Formule algebriche b = (Xi X)(Y i Ȳ ) (Xi X) 2 = cov(x,y) var(x) = s xy s 2 x = r s y s x = N X i Y i X i Yi N X 2 i ( X i ) 2 a = Ȳ b X = Y N X b N G. Rossi (Dip. Psicologia) Psico 2017-18 9 / 22

Confronto delle pendenze Il coefficiente angolare dipende dal modo in cui è espressa la variabile X non si può dire se sia piccolo o grande se non conoscendo la gamma (differenza fra massimo e minimo) di X oppure facendo una rappresentazione grafica grande piccola G. Rossi (Dip. Psicologia) Psico 2017-18 10 / 22

Con dati standardizzati Se usiamo X e Y trasformati in punti z, la formula della retta cambia in z^y = rz x perché tutti dati sono espressi con media 0 e dev.st 1, quindi b = r s y s x b * è la pendenza standardizzata l intercetta è 0 perché a = Ȳ b X e le medie sono 0 Ne consegue che: In una regressione lineare semplice la pendenza standardizzata coincide con la correlazione fra le due variabili diventa b * = r G. Rossi (Dip. Psicologia) Psico 2017-18 11 / 22

I residui e le loro sommatorie Y ^Y non abbiamo idea di cosa lo produca Senza interferenze esterne, Y i = E(Y ) = Ȳ Y Ȳ può essere diviso in due parti L introduzione di X, giustifica la parte ^Y Ȳ Possiamo dire che Y Ȳ è divisibile in una parte spiegata da X ^Y Ȳ e in una parte non spiegata (il residuo) Y ^Y G. Rossi (Dip. Psicologia) Psico 2017-18 12 / 22

Residui e varianze Dal momento che la somma al quadrato degli scarti dalla media corrisponde alla varianza... possiamo trasformare la relazione in Y Ȳ = ( Y ^Y ) + ( ^Y Ȳ ) ( Y Ȳ ) 2 = ( Y ^Y ) 2 + ( ^Y Ȳ )2 totale non spiegata spiegata facendo il rapporto fra la varianza spiegata e quella totale, la possiamo esprimere come proporzione di varianza spiegata r 2 = (r) 2 = ( ^Y Ȳ ) 2 (Y Ȳ ) 2 = (Y Ȳ ) 2 (Y ^Y ) 2 (Y Ȳ ) 2 G. Rossi (Dip. Psicologia) Psico 2017-18 13 / 22

Proporzione di varianza spiegata La proporzione di varianza spiegata è anche chiamata Coefficiente di determinazione, r quadro oppure varianza comune La parte complementare è chiamata Coefficiente di indeterminazione o di alienazione (1 r 2 ) Proporzione di varianza comune a due variabili L R 2 ci dice quanta parte della varianza di Y è spiegata da X. G. Rossi (Dip. Psicologia) Psico 2017-18 14 / 22

Errore standard delle stime Varianza degli errori previsti ( Y ^Y ) 2 N 2 e la relativa deviazione standard (Y ^Y ) 2 s y.x = N 2 = s y 1 r 2 Ne consegue che se r = 1, va a 0 (nessun errore) se r = 0, va a s y (massimo errore) G. Rossi (Dip. Psicologia) Psico 2017-18 15 / 22

Errore standard delle stime A cosa serve l errore standard delle stime? Essendo una deviazione standard, e presumendo che X e Y siano distribuite normalmente, possiamo stimare che il 95% dei valori Y stimati a partire da un certo valore X sarà compreso fra: ^Y 1.96s y.x e ^Y + 1.96sy.x dove 1.96 è il punto z corrispondente all area 95% attorno alla media G. Rossi (Dip. Psicologia) Psico 2017-18 16 / 22

Test di significatività Sui parametri della regressione semplice vengono calcolati dei test di significatività. Un test globale (l intero modello) Anova globale (quasi sempre significativa) Un test per ogni parametro (intercetta, pendenza) viene calcolato un t-test se il t è significativo il parametro è statisticamente necessario per spiegare la dipendente Viene calcolata anche la percentuale spiegata. Maggiore la %, migliore è il modello (ovvero l ipotesi che X spieghi Y). G. Rossi (Dip. Psicologia) Psico 2017-18 17 / 22

In SPSS Analizza Regressione Lineare... Trasferite in Dipendente la variabile che volete spiegare (la Y) Trasferite in Indipendenti la variabile che volete usare per spiegare (la X) Date l OK G. Rossi (Dip. Psicologia) Psico 2017-18 18 / 22

In SPSS Nell esempio, Y è Fundament, X è Politica la pendenza e l intercetta (chiamata (Costante)) sono presentati come non standardizzati ( B ) e standardizzati ( Beta ) Fundament = 78.531 + 1.801 * politica (non standardizzata) z(fundament) =.360 * z(politica) (standardizzata).360 è anche la correlazione fra Fundament e Politica G. Rossi (Dip. Psicologia) Psico 2017-18 19 / 22

In SPSS test statistici: il parametro non standardizzato diviso l errore standard produce t (1.801/0.210=8.591) sia la costante sia Politica sono significativamente importanti per spiegare Y tramite X G. Rossi (Dip. Psicologia) Psico 2017-18 20 / 22

In SPSS Un altro risultato riportato è l R 2 (R-quadrato) che è il quadrato della correlazione L R 2 è considerato anche un indice di adeguamento (o di fitting) perché indica quanto bene funziona il nostro modello e le statistiche sui residui G. Rossi (Dip. Psicologia) Psico 2017-18 21 / 22

Riassunto terminologico Regressione lineare semplice = regressione bivariata = predizione bivariata X = variabile indipendente, v. predittiva Y = variabile dipendente, v. predetta, v. criterio Y, ^Y = valore stimato, v. previsto a, b 0 = intercetta, costante b, b 1 = coeff. angolare, coeff. di regressione, pendenza, parametro di regressione β, b * = coeff. angolare standardizzato, coeff. standardizzato G. Rossi (Dip. Psicologia) Psico 2017-18 22 / 22