LABORATORI DI STATISTICA SOCIALE

Università degli Studi di Bergamo Dipartimento di Scienze Umane e Sociali Corso di Laurea in Scienze Psicologiche LABORATORI DI STATISTICA SOCIALE Lezione III Dott.ssa Roberta Adorni Dott.ssa Giulia Fusi Dott. Nicola Palena Dott. Agostino Brugnera Dott. Andrea Greco

Test T di Student Il t-test serve a verificare se le medie di due distribuzioni sono differenti tra loro o se sono da considerarsi uguali Si basa sulla distribuzione t di Student, cioè su una distribuzione di probabilità che riflette il rapporto tra due variabili aleatorie Come qualsiasi test usato per la verifica di ipotesi, il t-test si basa sulla verifica di un ipotesi alternativa (H1) contro un ipotesi nulla (H0) o o H0 = le due medie sono uguali e qualsiasi differenza minima che possiamo riscontrare è dovuta al caso H1 = le due medie sono significativamente differenti tra loro e ciò non è dovuto ad una variabilità casuale Il valore t è la differenza tra le medie pesata per deviazione standard e numerosità campionaria delle due distribuzioni La probabilità p associata alla t rappresenta quanto è probabile (da 0 a 1) che il risultato ottenuto sia casuale. Per convenzione: o o p > 0.05 risultato abbastanza probabile da poter essere stato ottenuto casualmente, quindi considerato non significativo p < 0.05 risultato poco probabile, assunto come non casuale e considerato significativo

T-test per campione singolo OBIETTIVO: verificare che la media di una certa variabile sia differente da un determinato valore ESEMPIO: vogliamo sapere se il punteggio medio alla scala Ottimismo sia uguale (H0) o differente (H1) dal punteggio medio nazionale alla scala stessa (pari a 3.75)

T-test per campione singolo Selezioniamo anche delle statistiche addizionali: La differenza tra medie (M1-M2) Gli effect size (Cohen s D) Gli intervalli di confidenza Le descrittive I grafici delle Descrittive Queste opzioni sono disponibili in tutti i tipi di T-Test. Le descrittive sono fondamentali per interpretare i risultati.

T-test per campione singolo Dalla finestra di dialogo che compare: Portare la variabile di interesse «ottimismo» nel riquadro «Dependent Variables» Inserire il valore «3.75» (USATE IL PUNTO COME SEPARATORE DECIMALE) nel riquadro «Hypothesis, Test Value» per confrontare la media del nostro campione con la media nazionale Le analisi verranno svolte automaticamente (compaiono a destra).

T-test per campione singolo L output mostra che: La differenza tra la media del nostro campione e quella nazionale non è significativa perché la probabilità associata al valore t=-0.374 per gradi di libertà uguali a n - 1 (387-1=386) è maggiore di 0.05 (p=0.708) Abbiamo 387 partecipanti, con media 3.74 al questionario DUNQUE il punteggio di ottimismo del nostro campione è uguale alla media nazionale

T-test per campioni indipendenti OBIETTIVO: verificare che la media di una certa variabile sia differente tra due campioni differenti ESEMPIO: vogliamo sapere se il punteggio medio alla scala Ottimismo di chi lavora sia uguale (H0) o differente (H1) rispetto al punteggio medio di chi non lavora.

T-test per campioni indipendenti Dalla finestra di dialogo che compare: Portare la variabile di interesse «ottimismo» nel riquadro «Dependent Variables» Inseriamo la variabile di raggruppamento (LAVORO, categorizzato come si\no) nel riquadro «Grouping Variable» Le analisi verranno svolte automaticamente (compaiono a destra)

T-test per campioni indipendenti Tra le varie opzioni disponibili, selezioniamo anche quella per testare la «Equality of Variances» (Assumption Checks) Questo test valuta l omogeneità delle varianze dei due campioni: se il test è SIGNIFICATIVO, allora dobbiamo selezionare anche l opzione «Welch s test», ed interpretare esclusivamente quella riga (cfr. slide successiva)

T-test per campioni indipendenti Valore t, gradi di libertà e probabilità della statistica. Qui sono riportati sia i valori della t di Student, che della t di Welch Il test per l uguaglianza delle varianze è significativo. Pertanto, l assunto è violato e quindi siamo autorizzati ad interpretare i risultati forniti dal test t di Welch s (Welch s t) Numerosità, medie e deviazioni standard per il gruppo di soggetti che lavora (si) e che non lavora (no) DUNQUE i livelli di Ottimismo sono più alti tra chi lavora

T-test per campioni appaiati OBIETTIVO: entro un solo campione, verificare che la media di una certa variabile sia differente dalla media di un altra variabile ESEMPIO: vogliamo sapere se il punteggio medio alla scala Ottimismo sia uguale (H0) o differente (H1) dal punteggio medio alla stessa scala ottenuto 6 mesi prima

T-test per campioni appaiati Dalla finestra di dialogo che compare: Portare le variabili appaiate «ottimismo» e «ottimismo_6m» nel riquadro «Paired Variables» Le analisi verranno svolte automaticamente (compaiono a destra)

T-test per campioni appaiati Valore t, gradi di libertà e probabilità della statistica che risulta significativa (p<.05) Differenza tra il punteggio alla scala ottimismo ottenuta prima e dopo sei mesi. Essendo positiva significa che l ottimismo è diminuito dopo 6 mesi. Numerosità, medie e deviazioni standard per la variabile ottimismo misurata prima e dopo 6 mesi. DUNQUE l ottimismo è diminuito significativamente dopo 6 mesi

ANOVA Univariata La ANOVA (analisi della varianza) serve a verificare se le medie di 3 o più distribuzioni sono differenti tra loro o se sono da considerarsi uguali Si basa sulla distribuzione F di Fisher, cioè su una distribuzione di probabilità che riflette il rapporto tra variabili aleatorie Come qualsiasi test usato per la verifica di ipotesi, la ANOVA si basa sulla verifica di un ipotesi alternativa (H1) contro un ipotesi nulla (H0) H0 = le medie sono uguali e qualsiasi differenza minima che possiamo riscontrare è dovuta al caso H1 = le medie sono significativamente differenti tra loro e ciò non è dovuto ad una variabilità casuale La probabilità p associata alla F rappresenta quanto è probabile (da 0 a 1) che il risultato ottenuto sia casuale. Per convenzione: p > 0.05 risultato abbastanza probabile da poter essere stato ottenuto casualmente, quindi considerato non significativo p < 0.05 risultato poco probabile, assunto come non casuale e considerato significativo

ANOVA Univariata OBIETTIVO: verificare che la media di una certa variabile sia differente tra tre o più campioni differenti ESEMPIO: vogliamo sapere se il punteggio medio alla scala «Soddisfazione di Vita» sia uguale (H0) o differente (H1) tra persone con differente stato civile (es. sposati, single ecc.).

ANOVA Univariata Dalla finestra di dialogo che compare: Portare la variabile di interesse «sodvita» nel riquadro «Dependent Variables» Inseriamo la variabile di raggruppamento (STCIV) nel riquadro «Grouping Variable» Le analisi verranno svolte automaticamente (compaiono a destra)

ANOVA Univariata Selezioniamo anche varie opzioni aggiuntive: Testiamo l assunto dell equaglianza delle varianze («Assumption Checks, Equality of variances»), clicchiamo su Variances e selezioniamo entrambe le opzioni (Welch s e Fisher s), ed infine selezioniamo la tabella Descrittive («Descriptives table»)

ANOVA Univariata Infine, clicchiamo sulla sezione Post-Hoc test, e selezioniamo «Tukey». Infine aggiungiamo nelle statistiche relative la «mean difference» e «report significance»

ANOVA Univariata Valore F, gradi di libertà e probabilità della statistica che risulta significativa (p <.05). Se l assunto dell eguaglianza delle varianze è rispettato, guardiamo la riga del Fisher s F; in caso contrario, la riga del Welch s F. Dato che l ANOVA è significativa, siamo autorizzati a guardare i post-hoc. Descrittive (numerosità, media e deviazione standard) per i 5 livelli della variabile «Stato Civile» Significatività per il test dell assunto dell eguaglianza delle varianze. Il test NON è significativo, pertanto l assunto è rispettato (di conseguenza, dobbiamo guardare la riga del Welch s F) DUNQUE il livello di ottimismo cambia in base allo stato civile. Ma come faccio a sapere quale gruppo si differenzia dagli altri? Necessità di condurre test post-hoc

ANOVA Univariata P value dei confronti post-hoc della categoria Celibe\Nubile, con quelle presenti in colonna La differenza tra medie alla scala Ottimismo tra chi è celibe\nubile e coniugato è di -0.503 (è più basso nei celibi\nubili). Il confronto è significativo (p = 0.012, ovvero inferiore a 0.05), suggerendo che chi è coniugato ha un maggior livello di benessere rispetto a chi è single. L Unico confronto significativo è quello tra chi è Coniugato e chi è Single. Pertanto, i livelli di Ottimismo si differenziano solo tra questi 2 gruppi.