Elementi di Psicometria (con laboratorio software 1)

Documenti analoghi
PSICOMETRIA. Esercitazione n.1. C.d.L. Comunicazione e Psicologia a.a. 2012/13

PROTOCOLLO ITACA PUGLIA RESIDENZIALE Istruzioni d'uso del software Versione 1.0

L indagine statistica

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

Elementi di Psicometria con Laboratorio di SPSS 1

VBA è un linguaggio di scripting derivato da Visual Basic, da cui prende il nome. Come ogni linguaggio ha le sue regole.

Definizione unitaria delle coniche

Modulo 1 Information Communication Technology. ICT e computer... Pag. 6 Classificazione dei computer...» 8

Grafici e Pagina web

Esercitazioni di statistica

Matematica con il foglio di calcolo

Il Metodo Scientifico

INTRODUZIONE ALLE BASI DATI RELAZIONALI

Il foglio elettronico

3.5.1 PREPARAZ1ONE I documenti che si possono creare con la stampa unione sono: lettere, messaggi di posta elettronica, o etichette.

Esercitazioni di Reti Logiche. Lezione 1 Rappresentazione dell'informazione. Zeynep KIZILTAN zkiziltan@deis.unibo.it

Manuale utente. Versione 6.9

ESERCITAZIONE 4 SOCIALE. Corso di Laurea Comunicazione e A.A. 2012/2013

7. Si confronti la variabilità del carattere età nel gruppo dei maschi ed in quello delle femmine.

PROGRAMMAZIONE DIDATTICA INDIVIDUALE (Parte 2 a )

Manuale di configurazione e utilizzo Barcode card

Prof.ssa Paola Vicard

Traccia delle lezioni svolte in laboratorio Excel Excel 2003 Excel 2010

Corso di. Dott.ssa Donatella Cocca

CAPITOLO V. DATABASE: Il modello relazionale

Riconoscere e formalizzare le dipendenze funzionali

2. Variabilità mediante il confronto di valori caratteristici della

Release MOVIO SCMS. Versione Tutorial. Commenti Dichiarazione di copyright

Esercitazione # 6. a) Fissato il livello di significatività al 5% si tragga una conclusione circa l opportunità di avviare la campagna comparativa.

Centro Ausili Tecnologici TUTORIAL CREAZIONE TABELLE DI COMUNICAZIONE CON PROGRAMMI NON SPECIFICI

Strumenti informatici 13.1

Dr. Marco Vicentini Anno Accademico Rev 30/03/2011

WINDOWS Avviare Windows95. Avviare Windows95 non è un problema: parte. automaticamente all accensione del computer. 2. Barra delle applicazioni

Statistica 4038 (ver. 1.2)

Strumenti Informatici 8.1. Realizzare il test della binomiale (o test dei segni) con Excel e SPSS

CURRICOLO DI GEOGRAFIA. INDICATORI OBIETTIVI di APPRENDIMENTO STANDARD PER LA VALUTAZIONE DELLE COMPETENZE DELL ALUNNO

Studio di funzione. Tutti i diritti sono riservati. E vietata la riproduzione, anche parziale, senza il consenso dell autore. Funzioni elementari 2

Sistemi Web per il turismo - lezione 3 -

Statistica Sociale Laboratorio 2

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria. Statistica descrittiva

Elementi di Psicometria

Excel Terza parte. Excel 2003

Elementi di Psicometria con Laboratorio di SPSS 1

Note_Batch_Application 04/02/2011

1 INTRODUZIONE ALL INTERFACCIA

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

La mappatura dei geni umani. SCOPO conoscere la localizzazione dei geni per identificarne la struttura e la funzione

Esercizi sulla conversione tra unità di misura

Il Manuale di KXSLDbg. Keith Isdale Traduzione del documento: Samuele Kaplun Traduzione del documento: Simone Solinas

matematica probabilmente

Gestione risorse (Windows)

La disposizione estetica della lettera commerciale

ITCS Erasmo da Rotterdam. Anno Scolastico 2014/2015. CLASSE 4^ M Costruzioni, ambiente e territorio

Utilizzo collegamento remoto

Generazione di Numeri Casuali- Parte 2

Non lasciamoci ingannare..

Indici (Statistiche) che esprimono le caratteristiche di simmetria e

ANALISI DEI DATI PER IL MARKETING 2014

Importazione dati. e/fiscali Spesometro - Rel con gestionale e/satto. Gestionale e/satto

Corso di Psicometria Progredito

Prof.ssa Paola Vicard

Modulo 6 Strumenti di presentazione PowerPoint

Esercitazione n. 5 di Metodologia della Ricerca Psicologica

Corso di Psicometria Progredito

Le Aree di lavoro e guida

Marziana Monfardini lezioni di word

Strumenti informatici Realizzare grafici e tabelle con Excel e SPSS

Esercizio 1. Nella Tabella A sono riportati i tempi di percorrenza, in minuti, di un tratto autostradale da parte di 40 autoveicoli.

Quantificare la variabilità dei processi ecologici

Prof.ssa Paola Vicard

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

Syllabus (estratto) Foglio elettronico. Excel. Open office - Office. Principio e funzionamento 26/11/2012. A. Ferrari

7 Disegni sperimentali ad un solo fattore. Giulio Vidotto Raffaele Cioffi

Planet School Guida per l utente GENERIC (GENITORE) - GUIDA PER L UTENTE GENITORE

Lezione 3: Il problema del consumatore: Il

SOFTWARE PER DATA LOGGER VACQ

La distribuzione Gaussiana

L analisi dei dati. Capitolo Il foglio elettronico

Valutazione del personale

METODOLOGIA STATISTICA E CLASSIFICAZIONE DEI DATI

ESAME DI STATO. SIMULAZIONE PROVA NAZIONALE Scuola Secondaria di I grado Classe Terza. Prova 3. Anno Scolastico Classe:... Data:...

Istituto Professionale di Stato per l Industria e l Artigianato Giancarlo Vallauri. Classi I C I G

Manuale Istruzione compilazione C1 per operatore economico

Syllabus: argomenti di Matematica delle prove di valutazione

Raccolta dati di qualità dei servizi telefonici

SCUOLA PRIMARIA - MORI

Come costruire una distribuzione di frequenze per caratteri quantitativi continui

Grafici delle distribuzioni di frequenza

Obiettivi del corso. Creare, modificare e formattare un semplice database costituito da tabelle, query, maschere e report utilizzando Access 2000.

Infrastruttura telematica: visione d insieme Mauro Nanni

Istruzioni per la compilazione della tabella dei libri di testo

GESTIONALE PER PUNTI VENDITA.

FUNZIONI CONTINUE - ESERCIZI SVOLTI

Disconnessione Utente

Scienze e tecniche psicologiche PSICOLOGIA

Prof.ssa Paola Vicard

EPG Metodologia della ricerca e Tecniche Multivariate dei dati. Dott.ssa Antonella Macchia a.macchia@unich.it.

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011

LOCKE. Empirismo = teoria della ragione come un insieme di poteri limitati dall esperienza:

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Transcript:

Elementi di Psicometria (con laboratorio software 1) 01-Rappresentazione dei dati (v. 1.0, 15 marzo 2019) versione per stampa Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2018-19 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 1 / 73

Perché studiare statistica? 1 Per comprendere la letteratura specializzata Teorici Ci sono psicologi (i teorici ) che studiano le regole con cui funziona la psiche dell essere umano I teorici usano la statistica per avere una buona certezza della bontà delle regole La diffusione delle regole da parte dei teorici avviene tramite comunicazioni a congressi, report, articoli su riviste specializzate e libri Tecnici Altri psicologi (i tecnici ) usano queste regole negli ambiti più svariati I tecnici devono essere in grado di capire le regole, come e perché funzionano, quanto ci si può fidare I tecnici devono conoscere la statistica G. Rossi (Dip. Psicologia) ElemPsico 2018-19 2 / 73

Perché studiare statistica? 2 Per comprendere la logica sottostante la ricerca in psicologia La letteratura scientifica presenta i propri risultati seguendo degli schemi (teoria, ipotesi, ricerca, risultati, conclusioni). Sapere come funziona la ricerca, ci permette di capire la letteratura psicologica 3 Per condurre ricerche in psicologia È possibile che anche voi possiate fare ricerca un domani (ad es. con la tesi) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 3 / 73

Cos è la statistica È una branca della matematica Il termine statistica deriva da statista (uomo di stato) e originariamente indicava le misurazioni dello Stato. Oggi indica sia la scienza della statistica sia i valori che risultano dall applicazione di alcuni algoritmi di calcolo (che producono gli indici statistici) sia i metodi e le tecniche per calcolarli (ovvero l analisi dei dati) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 4 / 73

Cos è la statistica I metodi statistici si possono suddividere in Statistica descrittiva Riassume e descrive tramite numeri le caratteristiche principali di un insieme di misurazioni (che rappresentano informazioni ) raccolte sulla realtà Statistica inferenziale Permette di stimare la sicurezza di alcune statistiche calcolate su un piccolo insieme (campione) rispetto alla popolazione oppure di confrontare tra loro dei gruppi (insiemi) differenti G. Rossi (Dip. Psicologia) ElemPsico 2018-19 5 / 73

Costrutto, variabile, costante Un costrutto è un concetto mentale che viene associato a qualche elemento della realtà per un qualche motivo; in un certo senso è la stessa cosa di un significato, ma un costrutto è un significato complesso (ad es. l amicizia, l aggressività) Una variabile è una visione particolare, una parte, un aspetto di un costrutto (la variabile persone frequentate è un aspetto del costrutto amicizia); la variabile ha questo nome perché rappresenta qualcosa che può assumere valori diversi Una costante è qualcosa che non cambia La possibilità di misurare un costrutto (tramite le variabili associate a certi aspetti del costrutto) è oggetto della teoria della misurazione G. Rossi (Dip. Psicologia) ElemPsico 2018-19 6 / 73

Variabile, valore, punteggio Variabile Ciò che intendiamo misurare (età, genere, livello di benessere) Valore È la caratteristica di ciò che stiamo misurando (anni, maschio/femmina, un numero che indica il livello di benessere) Punteggio Per ogni caso statistico e per ogni variabile, è il valore che viene attribuito (31, maschio, 43) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 7 / 73

Livelli di misura Ipotizziamo di essere al supermercato, in coda alla cassa. Davanti a noi abbiamo 3 persone e notiamo che tutte e tre hanno acquistato anche un prodotto in offerta (un succo di frutta): a) una signora grassottella con un carrello zeppo di prodotti e 12 confezioni in offerta b) un signore di corporatura media con 2 confezioni c) un altra signora mingherlina con 4 confezioni Quando arrivano alla cassa, prendiamo nota di quanto spendono. G. Rossi (Dip. Psicologia) ElemPsico 2018-19 8 / 73

Livelli di misura Abbiamo raccolto delle informazioni (misurazioni) su 3 persone (unità statistiche o casi statistici) Abbiamo delle variabili (genere, corporatura, confezioni, conto) Abbiamo dei valori (maschio/femmina, mingherlina..., dei numeri) Abbiamo dei punteggi (F, grassottella, 12...) Possiamo costruire una tabella a doppia entrata Le colonne contengono variabili ; le righe, casi statistici ; le celle contengono valori e punteggi G. Rossi (Dip. Psicologia) ElemPsico 2018-19 9 / 73

Livelli di misura Id Sesso corporatura confezioni in offerta conto a F grassottella 12 180 b M media 2 50 c F mingherlina 4 40 Il sesso si limita a distinguere categorie diverse La corporatura oltre a distinguere le categorie, permette anche di metterle in ordine (da magro a grassottella), ma non è possibile quantificare la differenza fra mingherlina e normale o fra media e Sesso Le variabili confezioni e conto usano anche un unità di misura e permettono di quantificare le differenze fra i diversi valori (fra 2 e 4 confezioni c è una differenza di 2) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 10 / 73

Livelli di misura I diversi modi di misurare si chiamano livelli di misura Possono essere classificati anche con altre, diverse modalità categorie vs. punteggi qualitative vs. quantitative discrete vs. continue nominali vs. ordinali vs. intervallo/rapporto Attenzione Excel e SPSS possono lavorare con numeri e con stringhe (testo) Excel e SPSS non sanno nulla delle scale di misura Se sono numeri, li trattano come numeri; se sono testi, come testi G. Rossi (Dip. Psicologia) ElemPsico 2018-19 11 / 73

Qualitative vs. quantitative Un livello di misura è qualitativo quando tiene conto solo e soltanto di una qualche qualità di ciò che si sta misurando (ad. es. il colore dei capelli, la razza di appartenenza, il titolo di studio raggiunto) Le scale qualitative vengono anche chiamate categoriali perché i loro valori sono categorie Un livello di misura è quantitativo quando è possibile usare i numeri per indicare i diversi livelli di ciò che si sta misurando (ad. l età, l altezza di una persona, il numero di risposte giuste ad un questionario) e il numero esprime effettivamente un unità di misura Le scale quantitative utilizzano punteggi G. Rossi (Dip. Psicologia) ElemPsico 2018-19 12 / 73

Discrete vs. continue Un livello di misura è continuo quando un valore utilizzato scivola nell altro, cioè quando, fra una qualunque misurazione e l altra, vi sono infinite possibili misurazioni (ad es. l età). Il valore che viene misurato è sempre un approssimazione del valore reale (l approssimazione dipende dalla sensibilità dello strumento di misura) Un livello di misura è discreto quando un valore utilizzato è completamente separato da qualunque altro e non vi sono valori intermedi; le variabili qualitative sono sempre discrete, mentre quelle quantitative sono discrete se non è possibile effettuare una misurazione intermedia fra due valori contigui (ad es. numero di persone che entrano in un negozio) 1 2 3 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 13 / 73

Nominali vs. ordinali vs. intervallo/rapporto È il sistema di classificazione più usato ed è stato proposto da Stevens Un livello di misura è nominale quando è soltanto possibile dare un nome (o etichetta) alle categorie di ciò che si sta misurando (ad. es. il colore dei capelli) Un livello di misura è ordinale quando è possibile ordinare i diversi livelli di categorie (ad. per il titolo di studio, la maturità è superiore alla licenza media, la laurea è superiore alla maturità,... ) in un modo qualunque Un livello di misura è ad intervallo/rapporto quando i valori assunti dalla variabile possono essere espressi tramite numeri che fanno riferimento ad una specifica unità di misura (anni di studio, altezza in cm,... ) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 14 / 73

Scala nominale Sistema empirico classificatorio 2 elementi possono appartenere a categorie uguali (=) o diverse ( ) (relazione di uguaglianza o di equivalenza) ogni elemento appartiene ad una ed ad una sola categoria le categorie possono usare qualsiasi tipo di etichetta (simboli, testo o numeri); anche se si usano i numeri, questi non sono numeri, ma testo (quindi 1 significa uno ) Esempio Il genere (maschio, femmina), la professione (chirurgo, operaio,...), il partito politico (PDL, PD, IDV, M5S,...) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 15 / 73

Scala ordinale Oltre alla caratteristiche precedenti (uguaglianza, disuguaglianza) 2 elementi diversi possono essere ordinati fra di loro, così che si può dire che uno dei due è minore dell altro oppure è maggiore (relazione d ordine) le categorie possono usare etichette che permettano di esprimere la relazione d ordine (testo [a, b, c...] e numeri) Esempio Lo status socio-economico (povero, borghese, ricco), il livello scolastico (elementari, medie, superiori, laurea, dottorato), le classi di età (neonato, bambino, pre-adolescente, adolescente, giovane, giovane-adulto, adulto, adulto-anziano, anziano) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 16 / 73

Scala a intervalli Oltre alle caratteristiche precedenti (uguaglianza, disuguaglianza, ordine) Fra 2 categorie esiste teoricamente un intervallo che è esprimibile come multiplo di un intervallo unitario (o intervalli equivalenti) All intervallo unitario è possibile riferire qualunque intervallo fra 2 categorie Esiste un punto-origine relativo Le categorie possono usare solo etichette numeriche (valori numerici positivi e negativi) Esempio La temperatura (0 gradi, 15 gradi, 25 gradi), la maggior parte dei test psicologici (QI, STAI, DPI,...) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 17 / 73

Scala a rapporti Oltre alla caratteristiche precedenti (uguaglianza, disuguaglianza, ordine, intervallo unitario) Il punto origine è assoluto (0 significa totale assenza della caratteristica misurata) Le categorie possono usare solo etichette numeriche (solo valori numerici positivi) Esempio L età, l altezza, il peso, la maggior parte delle variabili fisiche G. Rossi (Dip. Psicologia) ElemPsico 2018-19 18 / 73

Riepilogo Relazione Scala di misura Qualitative Quantitative Nominale Ordinale Intervallo Rapporto Equivalenza =, =, =, =, Ordine <, > <, > <, > Intervallo +, +, Rapporto, G. Rossi (Dip. Psicologia) ElemPsico 2018-19 19 / 73

Implicazioni 1 Ogni unità statistica può avere uno e un solo valore per ogni caratteristica misurata Esempio Se ho rilevato il reddito (scala a rapporti), non posso avere una persona che (contemporaneamente) guadagni sia 500 euro sia 60.000 euro l anno Ogni livello di misurazione superiore include le caratteristiche di quelli inferiori La scala nominale ha il minimo di informazione La scala a rapporto ha il massimo di informazione G. Rossi (Dip. Psicologia) ElemPsico 2018-19 20 / 73

Implicazioni 2 È possibile abbassare il livello di una misurazione, perdendo informazioni (ad es. da una scala a intervallo ad una ordinale) Esempio Posso trasformare l età (misurata in anni dalla nascita) in una scala ordinale (fasce di età) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 21 / 73

Implicazioni 3 Non è possibile alzare il livello di una misurazione, perché non posso aggiungere un informazione che non ho raccolto in precedenza Esempio Se ho rilevato la fascia d età (scala ordinale), non posso passare all età in anni (scala a rapporti) Se l informazione aggiuntiva è compresa nella scala ordinale, allora posso alzare il livello Esempio Se ho rilevato la scolarità tramite i livelli scolastici (elementare, media inf., media superiore...), posso passare al numero di anni trascorsi a scuola (scala a rapporti, elementare=5, m.inf=8,...) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 22 / 73

Implicazioni Per stabilire il livello di misurazione di una variabile devo considerare: la natura della variabile stessa il modo in cui è stata rilevata quali sono le relazioni valide all interno della variabile Attenzione: il nome della variabile potrebbe non indicare la sua scala di misura (se non è un nome codificato) Esempio Il reddito è una variabile quantitativa che, in teoria, oscilla fra 0 e + ; se rilevo il valore esatto del reddito, sarà misurata a livello rapporto (unità di misura, origine assoluta); se rilevo delle fasce di reddito, sarà misurata a livello ordinale (non esiste un unità di misura) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 23 / 73

Varabili dicotomiche e binomiali Le variabili binomiali sono variabili che possono assumere 2 soli valori possibili (ad es. maschio/femmina, vero/falso,...) sono variabili misurate a livello nominale e possono essere associate a simboli, testo o numeri. Se codifichiamo la variabile binomiale usando i valori numerici 0 o 1, diventa dicotomica In molte situazioni una variabile dicotomica si comporta matematicamente come una variabile a intervallo. G. Rossi (Dip. Psicologia) ElemPsico 2018-19 24 / 73

Riconoscere i livelli di misura Fra i livelli di misura, la tipologia più utilizzata è l ultima. Come possiamo riconoscere a quale livello stiamo misurando? 1 I valori di ciò che stiamo misurando permettono valori diversi? No, allora è una costante. Non è una variabile! 2 Prendiamo due qualunque valori possibili di quella variabile 3 Possiamo dire che sono uguali o sono diversi? Sì, allora siamo almeno a livello nominale 4 Possiamo in qualche modo ordinare questi valori? Sì, allora siamo almeno a livello ordinale 5 Possiamo identificare un unità di misura specifica? Sì, allora siamo almeno a livello intervallo 6 L unità di misura ha un punto d origine assoluto? No, allora siamo a livello intervallo Sì, allora siamo a livello a rapporto G. Rossi (Dip. Psicologia) ElemPsico 2018-19 25 / 73

Esercizio Descrizione variabile 1 Genere (maschi, femmine) 2 Anno di nascita 3 Età 4 Titolo di studio (licenza elementare, medie...) 5 Anni di studio completati 6 Tipo di mezzo di trasporto utilizzato x raggiungere il luogo di lavoro 7 Ore passate su un mezzo di trasporto x raggiungere il luogo di lavoro 8 Quante volte alla settimana mangi fuori casa (considerando solo i due pasti principali) 9 Quoziente di Intelligenza N O I R G. Rossi (Dip. Psicologia) ElemPsico 2018-19 26 / 73

Esercizio Descrizione variabile 10 Quanto sei soddisfatto della tua vita in generale? 0) per niente; 1) poco; 2) abbastanza; 3) molto; 4) moltissimo 11 Spesso i partiti politici vengono classificati di destra o di sinistra (e considerati come opposti) o di centro. Su una scala che va da sinistra a destra, come giudichi il tuo orientamento politico (1=sinistra 10=destra) 12 Su una scala da 1 a 10, quanto sei d accordo che gli extracomunitari vadano espulsi dal paese? N O I R Scale a ranghi: i numeri indicano solo un ordine, ma... per niente probabile 1 2 3 4 5 6 7 8 9 10 molto probabile G. Rossi (Dip. Psicologia) ElemPsico 2018-19 27 / 73

Scala a ranghi Le scale a ranghi sono scale in cui i numeri rappresentano un ordine (I premio, II arrivato, III scelta...) Sono variabili misurate a livello ordinale (fra il I posto e il II posto c è lo stesso intervallo che c è fra il III e il IV?) Tuttavia, si è visto che se l intervallo è abbastanza ampio (da 7 in sù) noi abbiamo la tendenza a equispaziare Se poi usiamo anche una rappresentazione equispaziata allora la tendenza è ancora maggiore Per cui vengono trattate come intervallo In particolare le scale Likert (ps. sociale) max disaccordo 1 2 3 4 5 6 7 8 9 10 max accordo G. Rossi (Dip. Psicologia) ElemPsico 2018-19 28 / 73

Obiettivo della statistica descrittiva L obiettivo principale è quello di cercare (e trovare) un certo ordine/struttura nelle diverse informazioni rappresentate dai dati numerici Quest obiettivo si può raggiungere tramite valori numerici o forme di visualizzazione che rappresentano delle sintesi statistiche distribuzioni di frequenza indici della tendenza centrale indici di variabilità oppure tramite rappresentazioni grafiche Vedrete queste cose praticamente durante le esercitazioni (soprattutto in SPSS) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 29 / 73

Distribuzione di frequenza semplice Si tratta di contare quanti elementi appartengono ad una stessa categoria presente in una variabile. Esempio Se abbiamo la seguente distribuzione di dati, la distribuzione di frequenza sarà: M F M F F M M M F F M M F F M M F F M M M M F F M F M F M M File: Esempio2-1.xlsx f F 13 f f M 17 f m Tot 30 N Contiamo le F; il loro numero è la frequenza delle femmine (f f ) Contiamo le M; il loro numero è la frequenza dei maschi (f m ) La somma di tutte le frequenze equivale al numero dei casi statistici (indicato con N) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 30 / 73

Distribuzione di frequenza semplice La somma di tutte le frequenze, deve necessariamente equivalere a N (chiamata numerosità ovvero il numero di casi statistici). In termini matematici, equivale a scrivere: N f i = f i = N i=1 dove indica l operazione di somma, f indica frequenza e i è un indice che indica i casi, per cui (in questo caso) può valere f o m oppure 1 o 2 la distribuzione di frequenza permette di riassumere velocemente molti dati si applica sicuramente a scale Nominali, Ordinali ed è possibile anche a livello Intervallo/Rapporto (ma non sempre è utile) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 31 / 73

Proporzioni e percentuali Esprimono il rapporto fra una parte rispetto ad un tutto (o ad un valore di riferimento) Proporzione Percentuale f N la somma dev essere 1 e nessuna proporzione può superare 1 Esempio proporzione di femmine 13 30 = 0.43 f N 100 la somma dev essere 100 e nessuna percentuale può superare 100 Esempio percentuale di maschi 17 100 = 56.67 30 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 32 / 73

Percentuali Le proporzioni e le percentuali si possono calcolare a tutti i livelli (N, O, I/R), anche se è preferibile non usarli per variabili intervallo/rapporto continue e con molti valori Quando la N su cui si calcolano le percentuali è molto piccola, la percentuale perde di significato In genere non si calcolano le percentuali se la N è inferiore a 20 (ma anche se è 22!) Infatti 1 unità su 20 equivale al 5%, mentre 1 unità su 100 equivale all 1% Se per un qualunque motivo, si è verificato un errore di misurazione e una unità è stata categorizzata male, se N è basso, le percentuali cambieranno parecchio dando una visione falsata della realtà G. Rossi (Dip. Psicologia) ElemPsico 2018-19 33 / 73

Percentuali Le percentuali hanno poco senso se non si conosce la N su cui sono calcolate Marca % sodio Residuo fisso Sodio in mg/l in mg/l Sales.00004 198.5 0.45 Flavia.00007 264.1 0.70 Sant Anna <.0001 39.2 0.90 Panna 141 6,7 Vitasnella <.0002 380.0 3.00 Bagolino.0002 130.0 2.30 San Benedetto <.0007 250.0 6.80 Ferrarelle 1245.0 48.00 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 34 / 73

Tabella delle frequenze Una tabelle delle frequenze indica quanti valori abbiamo per ogni categoria della variabile. Sesso freq prop % Maschi 17.57 56.67 Femmine 13.43 43.33 Totale 30 1.00 100 Di solito si indicano frequenze e percentuali oppure frequenze e proporzioni A livello ordinale, si possono calcolare anche le percentuali cumulate G. Rossi (Dip. Psicologia) ElemPsico 2018-19 35 / 73

Distribuzione di frequenza cumulata È la somma delle frequenze che precedono una determinata categoria La frequenza cumulata della prima categoria è uguale a se stessa la frequenza cumulata delle categorie intermedie, si ottiene sommando i singoli valori di frequenza delle categorie precedenti la frequenza cumulata dell ultima categoria è uguale a N (somma di tutte le frequenze) si applica a scale Ordinali e Intervallo/Rapporto f fc Nessuna 4 4 4 1 scelta 2 6 4+2 2-4 scelte 52 58 6+52 4+2+52 5 o più scelte 18 76 58+18 4+2+52+18 Totale 76 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 36 / 73

Intervalli di classe Quando a qualcuno chiedete Quanti anni hai? potete ricevere diverse risposte: 19; quasi 23; ho appena compiuto i 20... In tutti i casi l età detta è in qualche modo approssimata ad un intero, perché chiunque avrà un certo numero di anni, qualche mese, un po di giorni, qualche ora, alcuni minuti, alcuni secondi... L età, come numero intero di anni trascorsi dalla nascita, può essere pensato come un intervallo di classe con intervallo di ampiezza 1 Il valore centrale di un intervallo diventa il punto verso cui gravitano i veri valori dell età. 19 anni e 8 mesi è più vicino ai 20, mentre 19 anni e 3 mesi è più vicino ai 19. G. Rossi (Dip. Psicologia) ElemPsico 2018-19 37 / 73

Frequenze cumulate Il 53.4% dei soggetti ha dato come risposta valori inferiori o uguali a 5 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 38 / 73

Frequenze cumulate Su variabili intervallo/rapporto non hanno molto senso le tabelle di frequenza (perché ci sono molti valori) Però possono essere utili le percentuali cumulate G. Rossi (Dip. Psicologia) ElemPsico 2018-19 39 / 73

Intervalli di classe Una qualsiasi variabile (discreta o continua, purché quantitativa), se ha molte categorie di valori, può essere raggruppata in intervalli di classe La classificazione in intervalli può essere utilizzata sia per costruire la distribuzione di frequenza e fare rappresentazioni grafiche sia per il calcolo delle principali statistiche (in questo caso si perdono informazioni ed è altamente sconsigliato) Se faccio gli intervalli di classe di uguale ampiezza, qualunque variabile intervallo/a rapporto (anche se discreta) viene considerata come se fosse continua Se faccio intervalli di classe di diversa ampiezza, abbasso la scala a livello ordinale (es, l età in fasce: adolescenti, giovani, giovani adulti, adulti...) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 40 / 73

Intervalli di classe Per fare classi di ampiezza uguale, alcune regole sono: individuare il valore massimo e quello minimo calcolare la gamma di variazione (massimo - minimo) dividere la gamma per il numero degli intervalli che si desiderano (fra 8 e 15) ottenendo l ampiezza dell intervallo arrotondare l ampiezza dell intervallo all intero (generalmente 3, 5 o 10) usando il valore minimo si sceglie un valore iniziale dell intervallo che contenga il valore minimo si attribuiscono i valori a ciascun intervallo si considerano i valori di ciascun intervallo come uniformemente distribuiti all interno dell intervallo stesso G. Rossi (Dip. Psicologia) ElemPsico 2018-19 41 / 73

Intervalli di classe per ogni intervallo si definisce: un limite inferiore (il valore corrispondente si include) un limite superiore (il valore corrispondente si esclude da questo intervallo e si include nel successivo) un valore centrale dei limiti reali limiti indicati valore centrale limiti reali ( ) 85-89 87 84,5-89,5 90-94 92 89,5-94,5 95-99 97 94,5-99,5 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 42 / 73

Intervalli di classe Esempio Consideriamo l età di 25 studenti (Esempio2-2.xlsx): 22, 18, 20, 21, 26, 37, 23, 17, 30, 42, 37, 21, 19, 20, 18, 24, 29, 20, 27, 20, 31, 20, 33, 19, 22. Minimo: 17; Massimo: 42 gamma: 42-17=25, 25/10=2.5 3; 25/5=5 Scegliamo l ampiezza di 5 e costruiamo gli intervalli f lim inf ( ) lim sup vc valori inclusi 16-20 10 15,5 20,5 18 17, 18x2, 19x2, 20x5 21-25 6 20,5 25,5 23 21x2, 22x2, 23, 24 26-30 4 25,5 30,5 28 26, 27, 29, 30 31-35 2 30,5 35,5 33 31, 33 36-40 2 35,5 40,5 38 37x2 41-45 1 40,5 45,5 43 42 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 43 / 73

Intervalli di classe Esempio Usiamo ora un ampiezza di 3 e costruiamo gli intervalli f li ls vc 16-18 3 15,5 18,5 17 19-21 9 18,5 21,5 20 22-24 4 21,5 24,5 23 25-27 2 24,5 27,5 26 28-30 2 27,5 30,5 29 31-33 2 30,5 33,5 32 34-36. 33,5 36,5 35 37-39 2 36,5 39,5 38 40-42 1 39,5 42,5 41 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 44 / 73

Intervalli di classe Esempio f fc % vc=x fx 16-20 10 10 40 18 180 21-25 6 16 24 23 138 26-30 4 20 16 28 112 31-35 2 22 8 33 66 36-40 2 24 8 38 76 41-45 1 25 4 43 43 Somme 25 100 615 Media 24,6 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 45 / 73

Tipi di rappresentazioni grafiche Con le attuali conoscenze, le rappresentazioni grafiche disponibili sono: Grafico a barre (verticali/orizzontali) Grafico a torta Istogramma a barre (verticali/orizzontali) Poligoni di frequenza (semplice e cumulata) Diagrammi ramo-foglia Alcuni di questi grafici si possono ottenere sia in Excel sia in R sia in SPSS Alcuni non si possono ottenere se non in R G. Rossi (Dip. Psicologia) ElemPsico 2018-19 46 / 73

Grafici/Istogrammi a barre Grafici e istogrammi a barre sono molti simili I grafici a barre sono indicati per variabili nominali e ordinali: le barre sono separate l una dall altra Gli istogrammi a barre sono indicati per variabili intervallo/rapporto: le barre sono contigue fra loro Ogni frequenza è rappresentata da una barra La lunghezza di ogni barra è proporzionale alla frequenza: barre più lunghe indicano frequenze più elevate Negli istogrammi anche l area di una barra è proporzionale alla frequenza G. Rossi (Dip. Psicologia) ElemPsico 2018-19 47 / 73

Grafico a barre (Nominale/Ordinale) la variabile è misurata su una scala a 10 punti che vanno da 1=sinistra a 10=destra è quindi una variabile ordinale (*) (*) ma viene spesso considerata a intervalli G. Rossi (Dip. Psicologia) ElemPsico 2018-19 48 / 73

Grafico a barre (Nominale/Ordinale) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 49 / 73

Grafico a torta (N/O) Distribuzione vendite Distribuzione vendite Giacomo Susanna Giovanni 0 10 20 30 40 50 60 Giovanni Giacomo Susanna Le informazioni fornite sono analoghe; le torte fanno più scena, ma diventano complicate da interpretare se ci sono molte categorie con frequenze molto vicine fra loro G. Rossi (Dip. Psicologia) ElemPsico 2018-19 50 / 73

Istogramma (I/R) Frequenze 0 10 20 30 40 50 Istogramma le variabili quantitative (in particolare quelle continue) vengono rappresentate tramite intervalli di classe (SPSS lo fa automaticamente) 0 5000 10000 15000 20000 25000 30000 Reddito G. Rossi (Dip. Psicologia) ElemPsico 2018-19 51 / 73

Istogramma con classi più piccole (I/R) Frequenze 0 5 10 15 20 25 Istogramma con classi più piccole se la variabile non è molto simmetrica, l ampiezza degli intervalli può cambiare moltissimo la distribuzione raffigurata 0 5000 10000 15000 20000 25000 Reddito G. Rossi (Dip. Psicologia) ElemPsico 2018-19 52 / 73

Forme di distribuzione una distribuzione è simmetrica se è speculare rispetto alla metà asimmetrica se non lo è (negativa=sinistra; positiva=destra) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 53 / 73

Forme di distribuzione la forma grafica della distribuzione permette di identificare alcune sue caratteristiche i picchi rappresentano i valori più frequenti si classificano in unimodali, bimodali e multimodali si identificano facilmente le distribuzioni simmetriche o vicino alle simmetriche Una particolare curva simmetrica con forma a campana è chiamata normale o gaussiana Gaussiana perché studiata da Gauss Normale perché moltissime misurazioni di eventi fisici e/o naturali si distribuiscono con questa forma, che diventa un punto di riferimento in tutta la statistica G. Rossi (Dip. Psicologia) ElemPsico 2018-19 54 / 73

Istogramma con curva normale (I/R) Istogramma con classi più piccole Frequenze 0.00000 0.00004 0.00008 0.00012 0 5000 10000 15000 20000 25000 Reddito G. Rossi (Dip. Psicologia) ElemPsico 2018-19 55 / 73

Riepilogo della teoria Variabili, Valori Scale di misura Nominale Ordinale Intervalli equivalenti A rapporto Tabella delle frequenze Tabella delle percentuali Frequenze e percentuali cumulate Grafici a barre Istogrammi G. Rossi (Dip. Psicologia) ElemPsico 2018-19 56 / 73

Cos è un foglio elettronico Un foglio elettronico è una tabella in cui si possono fare calcoli in tempo reale: cambiando un valore in una cella, cambia il contenuto di eventuali celle collegate (ad es. una somma) Le righe sono generalmente identificate da numeri progressivi, mentre le colonne da lettere alfabetiche progressive. Le celle vengono quindi identificate tramite gli identificatori di colonna e di riga (A1, BC75) In una cella di un foglio elettronico, oltre a inserire del testo o un numero, si possono inserire istruzioni che indicano come usare il contenuto di altre celle per fare calcoli o altre manipolazioni (ad es. =A1+B1; =SOMMA(A1:A5)) Excel, OpenCalc, LibreCalc sono alcuni fogli elettronici che fanno parte di suite come Microsoft Office, OpenOffice, LibreOffice OpenOffice e LibreOffice sono software open (quindi gratuiti). G. Rossi (Dip. Psicologia) ElemPsico 2018-19 57 / 73

Cos è R R è un software statistico open source, molto potente e sofisticato, interamente programmabile È come avere a disposizione una mega calcolatrice che permette di svolgere sia calcoli semplici e banali (2+3) sia analisi molto complesse Si può scaricare dal sito The Comprehensive R Archive Network (abbreviato in CRAN, http://cran.r-project.org/ o da un suo mirror, uno è a Milano) Oltre alle guide disponibili in CRAN, potete utilizzare la mia dispensa L uso di R in psicologia (versione provvisoria) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 58 / 73

Alternative a R: Jasp Jasp è un interfaccia per R che mostra i risultati nello stesso formato di SPSS Non è completo (è alla versione 0.9.2.0) ma è completamente gratuito (e si preoccupa di installare anche R) Si può scaricare dal sito JASP A Fresh Way to Do Statistics Per ora non esistono guide, ma ci sono degli help (in inglese) all interno del software stesso e dei video (in inglese) su Youtube G. Rossi (Dip. Psicologia) ElemPsico 2018-19 59 / 73

Jamovi Jamovi è un interfaccia per R che mostra i risultati nello stesso formato di SPSS Non è completo (è alla versione 0.9.5.12) ma è completamente gratuito (e si preoccupa di installare anche R) Si può scaricare dal sito Jamovi. Stats. Open. Now. Esiste una guida (learning statistics with jamovi: a tutorial for psychology students and other beginners), degli help all interno del software stesso e dei video su Youtube (tutto materiale in inglese) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 60 / 73

Cos è SPSS SPSS significa Statistical Package for Social Sciences (Pacchetto statistico per le scienze sociali) ed è un programma a pagamento per gestire dati e calcolare statistiche. Adesso si chiama IBM SPSS Permette di inserire, nominare e gestire le misurazioni statistiche Permette di manipolare le variabili (in modo analogo ai fogli elettronici Permette di calcolare le statistiche descrittive, di fare grafici Permette di fare l analisi dei dati Esiste un clone open source chiamato PSPP (attualmente alla vers. 1.2.0), gratuito ma non ancora completo G. Rossi (Dip. Psicologia) ElemPsico 2018-19 61 / 73

Primo avvio 1 Per eseguire SPSS (Win 10) Start poi scorrere fino alle I e IBM SPSS Statistics quindi IBM SPSS Statistics 25 Alla prima esecuzione compare una finestra di dialogo che permette di effettuare alcune scelte. Selezionare Nuovo dataset per aprire una finestra senza dati Per disattivare l apertura automatica, click-ate qui G. Rossi (Dip. Psicologia) ElemPsico 2018-19 62 / 73

Primo avvio 2 Potete selezionare Introduzione con esercitazioni Oppure Chiudi G. Rossi (Dip. Psicologia) ElemPsico 2018-19 63 / 73

Finestra di base La finestra principale è formata da due pannelli uno per la visualizzazione dei dati (Vista dati) uno per la descrizione delle variabili (Vista variabili) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 64 / 73

Finestra di base Le principali voci di menù sono: Dati: permette di agire sul file dei dati (ordinare, selezionare, filtrare...) Trasforma: permette di manipolare le variabili (calcolare nuove variabili, ricodificare, contare valori...) Analizza: È il menù più utilizzato perché contiene tutte le procedure statistiche disponibili La prima volta che usate SPSS vi conviene fare l esercitazione disponibile nell Help. Per indicare un percorso di menù, userò questa convenzione voce principale sottomenù sotto-sottomenù: ad es. Analizza Statistiche descrittive Frequenze G. Rossi (Dip. Psicologia) ElemPsico 2018-19 65 / 73

Distribuzione e grafici in SPSS La maggior parte delle statistiche che abbiamo visto e che vedremo e i relativi grafici, si ottengono in SPSS tramite due comandi Analizza Statistiche descrittive Frequenze... Analizza Statistiche descrittive Esplora... In Spss si può fare solo quello che è previsto dal software; i grafici non sono bellissimi In Excel si possono fare molti più grafici (anche più belli ) In R (usato in questi lucidi) si può fare praticamente tutto, ma è molto più complicato G. Rossi (Dip. Psicologia) ElemPsico 2018-19 66 / 73

Spss: frequenze Calcoliamo le frequenze con il comando Analizza Statistiche descrittive Frequenze... Poi spostiamo una variabile nominale/ordinale fra le Variabili E premiamo OK File: esempio1.sav G. Rossi (Dip. Psicologia) ElemPsico 2018-19 67 / 73

Spss: frequenze G. Rossi (Dip. Psicologia) ElemPsico 2018-19 68 / 73

Spss: istogramma (Frequenze) Analizza Statistiche descrittive Frequenze... Pulsante Grafici... Selezioniamo Istogramma eventualmente anche Con curva normale Pulsante e OK Continua G. Rossi (Dip. Psicologia) ElemPsico 2018-19 69 / 73

Spss: istogramma (Esplora) Analizza Statistiche descrittive Esplora... Pulsante Grafici... Selezioniamo Istogramma (non è possibile avere la curva normale) Pulsante e OK Continua G. Rossi (Dip. Psicologia) ElemPsico 2018-19 70 / 73

Spss: istogramma (Frequenze/Esplora) Spss usa automaticamente gli intervalli di classe non è possibile modificare l ampiezza di classe La curva normale non c è con Esplora G. Rossi (Dip. Psicologia) ElemPsico 2018-19 71 / 73

Spss: torta Analizza Statistiche descrittive Frequenze... Pulsante Grafici... Selezioniamo Grafici a torta Pulsante e OK Continua G. Rossi (Dip. Psicologia) ElemPsico 2018-19 72 / 73

Riepilogo SPSS Analizza Statistiche descrittive Frequenze... Per le tabelle delle frequenze, percentuali e percentuali cumulate Per i Grafici a barre Per gli Istogrammi (anche con curva normale) Analizza Statistiche descrittive Esplora... Per gli Istogrammi (ma senza curva normale) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 73 / 73