Strumenti informatici 4.1 - Realizzare il test dei segni con Excel e SPSS Le analisti statistiche che vengono presentate da questo punto in avanti possono essere eseguite con Excel impostando le formule adeguate che tengano conto di quanto esposto per il calcolo manuale, oppure utilizzando il pacchetto aggiuntivo per l analisi dei dati. Nel caso del test dei segni l impiego di Excel è relativamente semplice, anche se non del tutto immediato, in quanto occorre sfruttare la funzione =1 DISTRIB.BINOM(Num_successi; Prove;Probabilità_s; Cumulativo), come visto nella scheda Strumenti informatici 3.4. Nel caso illustrato nel testo della proporzione di studenti di psicologia che si dedicano al volontariato, dobbiamo quindi inserire nella formula il numero di studenti che rappresentano il successo nel campione (150,56 = 84), e correggerlo per continuità sottraendo 0,5, da cui 83,5: =1 DISTRIB.BINOM(83,5; 150;0,48;VERO) Excel restituisce il risultato,0301, che è inferiore al valore fissato di α che era,04, e dunque ci porta a rifiutare H 0. Si noti che il valore di probabilità così calcolato è quello per H 1 monodirezionale. Nel caso di SPSS la procedura è leggermente diversa, in quanto potremmo avere a disposizione i dati relativi ad ogni soggetto uno per uno. Nella Figura 4.1.1 la codifica è 0 = Non svolge attività di volontariato e 1 = svolge attività di volontariato. Figura 4.1.1 Inserimento dati in SPSS per il test della binomiale (o dei segni) A questo punto per realizzare il test seguiamo il percorso Analyze Nonparametric Tests Binomial (Figura 4.1.2) Figura 4.1.2 Il percorso di SPSS per realizzare il test della binomiale (o dei segni) Inseriamo la variabile Volontariato nel campo Test Variable List e modifichiamo il valore di Test Proportion a,48, che è quello in ipotesi nulla nel caso che stiamo trattando (il valore di default è,50) (Figura 4.1.3)
Figura 4.1.3 Finestra di SPSS per l impostazione del test della binomiale (o dei segni) Nel riquadro Define Dichotomy è possibile indicare se la variabile in esame è una vera dicotomia (Get from data) oppure indicare come generarla nel caso di un dicotomia artificale (Cut point), per cui va indicato il valore della variabile che funge da spartiacque fra una categoria e l altra. In questo caso, quindi, potremmo aver inserito come variabile da analizzare il punteggio ad un test di psicologico, che di per sé non è dicotomico, ma indicare un punto di taglio per cui si crea la dicotomia. Clickando su Exact si apre una finestra che permette di indicare se si desidera la significatività asintotica (impostazione di default) quella esatta (Exact) oppure una stima mediante simulazione Monte Carlo. Se il campione è ampio (maggiore di 30) i tre metodi forniscono risultati analoghi, mentre per campioni piccoli la significatività asintotica può essere fuorviante. In questi casi sarebbe meglio selezionale l opzione Exact, che però in alcuni casi può impiegare molto tempo prima di restituire il risultato (da cui la possibilità di impostare un limite temporale allo scadere del quale verrà visualizzato il risultato), oppure la Monte Carlo, che genera in base ai dati un numero di campioni simulati uguale a quello che viene indicato dall utente, e restituisce un intervallo di fiducia del valore di probabilità al livello scelto. Nelle Options è possibile ottenere statistiche descrittive e indici di posizione. Se manteniamo le impostazioni di default, il risultato è quello in Figura 4.1.4 Volontariato Group 1 Group 2 Total a. Based on Z Approximation. Binomial Test Observed Asymp. Sig. Category N Prop. Test Prop. (1-tailed) Svolge 84,56,48,030 a Non svolge 66,44 150 1,00 Figura 4.1.4 Output di SPSS per il test della binomiale (o test dei segni) Anche in questo caso il valore di significatività è ad una coda (Asymp. Sig. (1-tailed), che significa significatività asintotica a una coda ), e, come dice la nota, basato sull approssimazione a z. Si noti che il valore di z calcolato nel testo era di 1,97, che lascia al di là di sé un valore di area di,0244. La discrepanza è dovuta come al solito alla necessità di approssimare le formule e i risultati al secondo decimale. Se però invece dei dati soggetto per soggetto abbiamo a disposizione le frequenze per ogni categoria della variabile, per cui sappiamo già che 84 soggetti su 150 svolgono attività di volontariato, possiamo inserire direttamente le frequenze (Figura 4.1.5)
Figura 4.1.5 Inserimento diretto delle frequenze per il test della binomiale in SPSS Il problema però è che SPSS non sa che sono frequenze, per cui se seguissimo la procedura appena illustrata considererebbe i dati come le informazioni relative a due soli soggetti. Per comunicare che i dati inseriti sono frequenze, seguiamo il percorso Data Weight Cases (Figura 4.1.6) Figura 4.1.6 Percorso di SPSS per comunicare al software che i dati inseriti sono frequenze Nella finestra di Weight Cases, spuntiamo l opzione Weight cases by e inseriamo nel campo Frequency Variable la variabile che contiene le frequenze, in questo caso Volontariato (Figura 4.1.7) Figura 4.1.7 Impostazione della variabile Volontariato come variabile che contiene frequenze Clickiamo su OK. A questo punto, in basso a destra della finestra di SPSS compare la scritta Weight On. Significa che l opzione per le frequenze è attiva. A questo punto basta procedere come illustrato precedentemente col percorso Analyze Nonparametric Tests Binomial (nell output potrebbe comparire un warning che segnala un potenziale problema, ma i risultati nella tabella prodotta dal software sono corretti, quindi può essere ignorato).
Per realizzare il grafico riportato in Figura 4.7, occorre organizzare i dati in Excel nel modo riportato in Figura 4.1.8, selezionando le due colonne Figura 4.1.8 Organizzazione dei dati in Excel per realizzare il grafico di Figura 4.7 A questo punto seguiamo il percorso Inserisci Grafico Linee, scegliendo l opzione delle linee con punti (Figura 4.1.9) Figura 4.1.9 Selezione del tipo di grafico per la realizzazione del grafico in Figura 4.7 Dopo aver premuto Avanti e aver completato le fasi successive di costruzione del grafico, otteniamo il grafico in Figura 4.1.10,25,20,15,10 Proporzione Popolazione (P =,20),05,00 1 2 3 4 5 A questo punto abbiamo bisogno di aggiustarlo un po, eliminando le etichette sull asse orizzontale, aggiungendo i baffi al punto che rappresenta la proporzione campionaria e togliendo i punti alla linea che rappresenta la proporzione nella popolazione rendendola tratteggiata. Per realizzare la prima operazione si procede come abbiamo visto nella scheda Strumenti informatici 3.4. Una volta calcolata l estensione dell intervallo di fiducia (nel caso che stiamo considerando, come riportato nel testo, è,059), basta scriverlo in una delle celle del foglio di Excel e utilizzarlo come riferimento per la creazione dei baffi. Per eliminare le etichette sull asse orizzontale, i punti dalla linea della
proporzione della popolazione, la griglia del grafico, e qualunque altra modifica si desideri nell apparenza degli elementi del grafico, basta fare doppio click sull oggetto interessato e utilizzare le funzioni contenute nella linguetta Motivo della finestra che compare. In questo menu è possibile aggiungere/togliere la linea e/o i punti, cambiare il tratteggio e il colore della linea, etc. Lo stesso per eliminare le etichette sull asse orizzontale: basta clickare sulle etichette o sull asse stesso. I menu sono riportati in Figura 4.1.11 Figura 4.1.11 Menu per la modifica degli attributi grafici degli elementi del grafico in Figura 4.1.10 Per eliminare un elemento basta spuntare l opzione Assente. Per quanto riguarda l area del tracciato, conviene effettivamente eliminare la griglia (basta selezionarla con un click e premere il tasto Canc o Del sulla tastiera), ma impostare il colore Bianco per lo sfondo, in quanto rende meglio in fase di stampa. Una volta operate le modifiche necessarie, il risultato è quello della Figura 4.7. Si noti che la legenda può essere spostata a piacimento in qualunque punto del grafico semplicemente trascinandola. In una tesi di laurea o in un articolo scientifico riporteremmo il grafico in Figura 4.7 e scriveremmo: E stato eseguito un test della binomiale per verificare se un campione di 150 studenti di psicologia era omogeneo con la popolazione generale rispetto alla proporzione di individui che si dedicano all attività politica. Nella popolazione questa proporzione è del 20%, mentre nel campione è stato osservato che 24 individui (16%) riferivano di partecipare all attività politica. Il test statistico ha mostrato che la differenza fra le due proporzioni non è statisticamente significativa (z = 1,34, p >,05, g =,04) [oppure, più, semplicemente: (p =,26)].