Applicazioni statistiche e utilizzo del package statistico Spss - 7 CISI 27 gennaio 2005 ricercapsicologica@tiscali.it
Illustrare le principali statistiche mono e bivariate. Valutare quando è opportuno applicare tali statistiche. In Spss: leggere l output delle procedure Tavole di contingenza e Correlazione. Per i corsisti avanzati: introduzione all analisi della varianza. 2
Livello di scala Misure di tendenza centrale Misure di dispersione Categoriale Moda Ordinale Moda, Mediana RIQ Cardinale Moda, Mediana, Media Varianza, Deviazione standard 3
Le misure di dispersione riassumono quanto sia estesa una distribuzione. Il RIQ, campo di variazione interquantile, è la distanza tra il quartile inferiore e quello superiore. Il suo significato è di porzione della distribuzione contenente il 50% delle osservazioni mediane. La deviazione standard è molto informativa, soprattutto in caso di distribuzioni simmetriche. In caso di distribuzioni approssimabili alla normale, possiamo affermare, ad esempio, che entro il valore medio più o meno una dev. st. si trova circa il 68% dei casi (ved. figura nella diap. successiva). 4
Area tra la curva normale e la retta sottesa 5
variabile 2 livello di scala categ. ordin. cardin. variabile 1 (le tecniche in corsivo prevedono che la variabile 1 sia indipendente e la variabile 2 dipendente) categ. ordin. cardin. chi quadrato chi quadrato regr. logistica, an. discriminante chi quadrato r di spearman, tau-b di Kendall regr. logistica, an. discriminante ANOVA ANOVA correlaz., regress. 6
Lettura output Tavole di contingenza 1 La prima tabella riporta il numero di casi validi e mancanti della distribuzione congiunta tra la variabile di riga e quella di colonna 7
Tavole di contingenza 2 La seconda tabella riporta la tavola di contingenza richiesta. In questo caso, nelle celle, abbiamo i conteggi e le frequenze di colonna 8
Tavole di contingenza 3 La terza tabella visualizza la statistica Chi quadrato (che deve essere richiesta nella finestra Statistiche. Il valore, i gradi di libertà (df) e la significatività sono nella prima riga. La nota b ci informa che nessuna cella ha conteggio atteso inferiore a 5 (è accettabile averne fino al 20% del totale) e che il conteggio atteso minimo è superiore a 1: il test è applicabile. 9
Tavole di contingenza 4 La quarta tabella visualizza la statistica Phi (da richiedere sempre nella finestra Statistiche). Si tratta di una misura descrittiva che varia tra 0 e 1 e quindi ci fornisce informazioni più chiare sulla forza della relazione tra le due variabili prese in considerazione. Un valore vicino a 1 indica relazione molto stretta; vicino allo 0 assenza di relazione. 10
Se vogliamo descrivere l associazione tra due variabili misurate a livello di scala cardinale, il coefficiente di correlazione (r di Pearson) è molto efficace. Il coefficiente di correlazione varia tra -1 e 1. Il segno sta ad indicare la direzione della relazione (diretta o inversa) il valore la forza. Solo le relazioni lineari sono descrivibili con questo coefficiente. Il valore 1 indica correlazione lineare perfetta; il valore 0 indica assenza di correlazione lineare. 11
Diagrammi di dispersione e coefficienti di correlazione lineare 60 50 r = 0,023 60 50 r = 0,841 40 40 30 30 20 20 10 10 0 0 10 20 30 40 50 60 0 0 10 20 30 40 50 60 70 60 r = - 0,778 60 50 r = 0,087 50 40 40 30 30 20 20 10 10 0 0 10 20 30 40 50 60 0 0 10 20 30 40 50 60 12
Correlazione In Spss le correlazioni bivariate si ottengono attraverso il comando Correlazione del menu Analizza. Scegliere poi Bivariata. 13
La finestra che appare ha il solito schema: dall elenco di sinistra scegliere le variabili che costituiranno la matrice di correlazione. Tale matrice è quadrata e simmetrica; le celle della diagonale principale contengono tutte valori 1. Le altre celle contengono il coeff, di correlaz. tra le variabili alle rispettive righe e colonne. 14
Lasciare le selezioni di default e premere OK. La tabella che viene prodotta riporta r di Pearson, significatività e numero di casi validi della distribuzione congiunta. 15
Un diagramma di dispersione può aiutare a capire le caratteristiche della relazione tra due variabili, prima ancora di calcolare il coeff. di correlazione. Scegliere A dispersione del menu Grafici. Comparirà una piccola finestra su cui selezionare tra i tipi di grafici a dispersione proposti. Scegliere Semplice e premere su Definisci. 16
Vanno spostate le variabili dall elenco di sinistra agli spazi Asse Y (per la variabile che sarà posizionata sull asse verticale) e Asse X (per l asse orizzontale). Se si desidera impostare i titoli del grafico, scegliere Titoli. Una volta terminato premere OK. 17
Il grafico di sinistra contiene tutte le osservazioni, ma risulta poco chiaro per il gran numero di osservazioni sovrapposte. Il grafico di sinistra contiene solo il 5% circa delle osservazioni e, pur essendo un approssimazione, risulta più leggibile. 18
L analisi della varianza: un esempio a partire dai dati di E. Durkheim (Micheli, Manfredi, 1996) 19
20
Tassi di suicidio osservati in Baviera lungo il continuum unidimensionale della variabile e secondo la tipologia religiosa BD1 (Base-dati di Durkheim) 167 207 204 157 118 64 114 49 21
Tassi simulati di suicidio (BD2) BD2 (Base-dati modificata) 308 200 70 225 50 150 50 27 22
Scomposizione della varianza 23
24
Dati posizionati sul continuum BD4 BD3 0 50 100 150 200 250 25