Elementi di Psicometria (con laboratorio software 1)

Documenti analoghi
Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria (con laboratorio software 1)

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1

Tecniche statistiche di analisi del cambiamento

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria (con laboratorio software 1)

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1

Distribuzioni e rappresentazioni grafiche

Elementi di Psicometria con Laboratorio di SPSS 1

Psicometria (8CFU) SCALE DI MISURA

Data set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio

Elementi di Psicometria

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria (con laboratorio software 1)

Principi di Statistica Descrittiva (2)

Scale di Misurazione Lezione 2

INTRODUZIONE ALLA STATISTICA

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Psicometria con Laboratorio di SPSS 1

Rappresentazioni Tabellari e Grafiche. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Elementi di Psicometria con Laboratorio di SPSS 1

ESERCIZI DI STATISTICA SOCIALE

Tecniche statistiche di analisi del cambiamento

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

LA STATISTICA

Elementi di Psicometria con Laboratorio di SPSS 1

Foglio Elettronico Lezione 1

ESERCITAZIONI N. 1 Corso di Statistica

Dipartimento di Fisica a.a. 2003/2004 Fisica Medica 2 Indici statistici 22/4/2005

Elementi di Psicometria con Laboratorio di SPSS 1

Teoria e tecniche dei test. Concetti di base

Statistica. Lezione 1

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Tecniche statistiche di analisi del cambiamento

ESERCIZI DI PSICOMETRIA/2011-1

Tipi di variabili. Indici di tendenza centrale e di dispersione

Elaborazione statistica di dati

Distribuzione di frequenza e rappresentazioni grafiche

CAPITOLO 2 RAPPRESENTAZIONI GRAFICHE DEI DATI

PSICOMETRIA. Esercitazione n.1. C.d.L. Comunicazione e Psicologia a.a. 2012/13

Elementi di Psicometria con Laboratorio di SPSS 1

Esercitazioni di Statistica: ES.1.1

Questionario 1. Sono assegnati i seguenti dati

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri;

Statistica Descrittiva Soluzioni 4. Medie lasche

Fogli Elettronici. Idoneità Informatica Prof. Mauro Gaspari

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 4: Rappresentazioni grafiche

Elementi di Psicometria con Laboratorio di SPSS 1

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. La distribuzione Normale (o di Gauss)

Corso Integrato di Statistica Informatica e Analisi dei Dati Sperimentali. Esercitazione E

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

La statistica descrittiva prima parte. a cura della prof.ssa Anna Rita Valente

Università del Piemonte Orientale. Corso di Laurea Triennale di Infermieristica Pediatrica ed Ostetricia. Corso di Statistica Medica

Statistica (parte II) Esercitazione 4

Soggetto Genere Costo del soggiorno Titolo di studio

TECNICHE DI ANALISI DEI DATI

Concetti fondamentali Introduzione ai concetti fondamentali in psicometria

LIBREOFFICE: componenti

TECNICHE DI ANALISI DEI DATI

Statistica. (Dr. Elvira Di Nardo)

Esercitazioni di statistica

ESPLORAZIONE DEI DATI CON SINTESI NUMERICHE 1 / 22

Mini dispensa di Microsoft Excel 2007 ad uso esclusivo degli studenti del corso di Programmazione e Controllo Matricole Pari

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

-Validità di un test diagnostico: Sensibilità e Specificità

Statistica Sociale - modulo A

Dott.ssa Marta Di Nicola

La statistica descrittiva per le variabili quantitative

Il proprietario di una catena di negozi vuole confrontare il reddito (in euro) dei suoi 5 negozi, riportato nella seguente tabella

Laboratorio di matematica: processamento, interpretazione ed elaborazione dei dati

LABORATORIO EXCEL XLSTAT 2008 SCHEDA 1 VARIABILI QUALITATIVE

Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI

MISURE DI SINTESI 54

Distribuzioni statistiche

Grafici. 1 Generazione di grafici a partire da un foglio elettronico

Statistica Descrittiva - Lezione 1

7. STATISTICA DESCRITTIVA

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Elementi di Statistica

A proposito di valutazione scolastica

Metodi e tecniche di analisi dei dati nella ricerca psico-educativa Parte III

L analisi dei dati. L analisi dei dati. Le basi di dati. Le basi dati 10/04/2010. Claudio Locci - Vincenzo Rundeddu Le basi dati.

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016

ESPLORAZIONE DEI DATI (parte 1) 1 / 21

Analisi dei dati qualitativi: omogeneità/eterogeneità, test del chi quadrato, analisi delle corrispondenze semplici e multiple

Prof.ssa M. Di Nicola

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Esercizi. Esercizio 1. Date le funzioni f(x) = x 2 3x + 2 e g(x) = 2x 1,

materiale didattico II incontro

Strumenti di indagine per la valutazione psicologica

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Cosa sono i Fogli Elettronici?

Transcript:

Elementi di Psicometria (con laboratorio software 1) 01-Rappresentazione dei dati (v. 1.0, 15 marzo 2019) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2018-19 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 1 / 74

Perché studiare statistica? 1 Per comprendere la letteratura specializzata Teorici Ci sono psicologi (i teorici ) che studiano le regole con cui funziona la psiche dell essere umano I teorici usano la statistica per avere una buona certezza della bontà delle regole La diffusione delle regole da parte dei teorici avviene tramite comunicazioni a congressi, report, articoli su riviste specializzate e libri Tecnici Altri psicologi (i tecnici ) usano queste regole negli ambiti più svariati I tecnici devono essere in grado di capire le regole, come e perché funzionano, quanto ci si può fidare I tecnici devono conoscere la statistica G. Rossi (Dip. Psicologia) ElemPsico 2018-19 2 / 74

Perché studiare statistica? 2 Per comprendere la logica sottostante la ricerca in psicologia La letteratura scientifica presenta i propri risultati seguendo degli schemi (teoria, ipotesi, ricerca, risultati, conclusioni). Sapere come funziona la ricerca, ci permette di capire la letteratura psicologica 3 Per condurre ricerche in psicologia È possibile che anche voi possiate fare ricerca un domani (ad es. con la tesi) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 3 / 74

Cos è la statistica È una branca della matematica Il termine statistica deriva da statista (uomo di stato) e originariamente indicava le misurazioni dello Stato. Oggi indica sia la scienza della statistica sia i valori che risultano dall applicazione di alcuni algoritmi di calcolo (che producono gli indici statistici) sia i metodi e le tecniche per calcolarli (ovvero l analisi dei dati) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 4 / 74

Cos è la statistica I metodi statistici si possono suddividere in Statistica descrittiva Riassume e descrive tramite numeri le caratteristiche principali di un insieme di misurazioni (che rappresentano informazioni ) raccolte sulla realtà Statistica inferenziale Permette di stimare la sicurezza di alcune statistiche calcolate su un piccolo insieme (campione) rispetto alla popolazione oppure di confrontare tra loro dei gruppi (insiemi) differenti G. Rossi (Dip. Psicologia) ElemPsico 2018-19 5 / 74

Costrutto, variabile, costante Un costrutto è un concetto mentale che viene associato a qualche elemento della realtà per un qualche motivo; in un certo senso è la stessa cosa di un significato, ma un costrutto è un significato complesso (ad es. l amicizia, l aggressività) Una variabile è una visione particolare, una parte, un aspetto di un costrutto (la variabile persone frequentate è un aspetto del costrutto amicizia); la variabile ha questo nome perché rappresenta qualcosa che può assumere valori diversi Una costante è qualcosa che non cambia La possibilità di misurare un costrutto (tramite le variabili associate a certi aspetti del costrutto) è oggetto della teoria della misurazione G. Rossi (Dip. Psicologia) ElemPsico 2018-19 6 / 74

Variabile, valore, punteggio Variabile Ciò che intendiamo misurare (età, genere, livello di benessere) Valore È la caratteristica di ciò che stiamo misurando (anni, maschio/femmina, un numero che indica il livello di benessere) Punteggio Per ogni caso statistico e per ogni variabile, è il valore che viene attribuito (31, maschio, 43) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 7 / 74

Livelli di misura Ipotizziamo di essere al supermercato, in coda alla cassa. Davanti a noi abbiamo 3 persone e notiamo che tutte e tre hanno acquistato anche un prodotto in offerta (un succo di frutta): a) una signora grassottella con un carrello zeppo di prodotti e 12 confezioni in offerta b) un signore di corporatura media con 2 confezioni c) un altra signora mingherlina con 4 confezioni Quando arrivano alla cassa, prendiamo nota di quanto spendono. G. Rossi (Dip. Psicologia) ElemPsico 2018-19 8 / 74

Livelli di misura Abbiamo raccolto delle informazioni (misurazioni) su 3 persone (unità statistiche o casi statistici) Abbiamo delle variabili (genere, corporatura, confezioni, conto) Abbiamo dei valori (maschio/femmina, mingherlina..., dei numeri) Abbiamo dei punteggi (F, grassottella, 12...) Possiamo costruire una tabella a doppia entrata Le colonne contengono variabili ; le righe, casi statistici ; le celle contengono valori e punteggi G. Rossi (Dip. Psicologia) ElemPsico 2018-19 9 / 74

Livelli di misura Id Sesso corporatura confezioni in offerta conto a F grassottella 12 180 b M media 2 50 c F mingherlina 4 40 Il sesso si limita a distinguere categorie diverse La corporatura oltre a distinguere le categorie, permette anche di metterle in ordine (da magro a grassottella), ma non è possibile quantificare la differenza fra mingherlina e normale o fra media e Sesso Le variabili confezioni e conto usano anche un unità di misura e permettono di quantificare le differenze fra i diversi valori (fra 2 e 4 confezioni c è una differenza di 2) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 10 / 74

Livelli di misura I diversi modi di misurare si chiamano livelli di misura Possono essere classificati anche con altre, diverse modalità categorie vs. punteggi qualitative vs. quantitative discrete vs. continue nominali vs. ordinali vs. intervallo/rapporto Attenzione Excel e SPSS possono lavorare con numeri e con stringhe (testo) Excel e SPSS non sanno nulla delle scale di misura Se sono numeri, li trattano come numeri; se sono testi, come testi G. Rossi (Dip. Psicologia) ElemPsico 2018-19 11 / 74

Qualitative vs. quantitative Un livello di misura è qualitativo quando tiene conto solo e soltanto di una qualche qualità di ciò che si sta misurando (ad. es. il colore dei capelli, la razza di appartenenza, il titolo di studio raggiunto) Le scale qualitative vengono anche chiamate categoriali perché i loro valori sono categorie Un livello di misura è quantitativo quando è possibile usare i numeri per indicare i diversi livelli di ciò che si sta misurando (ad. l età, l altezza di una persona, il numero di risposte giuste ad un questionario) e il numero esprime effettivamente un unità di misura Le scale quantitative utilizzano punteggi G. Rossi (Dip. Psicologia) ElemPsico 2018-19 12 / 74

Discrete vs. continue Un livello di misura è continuo quando un valore utilizzato scivola nell altro, cioè quando, fra una qualunque misurazione e l altra, vi sono infinite possibili misurazioni (ad es. l età). Il valore che viene misurato è sempre un approssimazione del valore reale (l approssimazione dipende dalla sensibilità dello strumento di misura) Un livello di misura è discreto quando un valore utilizzato è completamente separato da qualunque altro e non vi sono valori intermedi; le variabili qualitative sono sempre discrete, mentre quelle quantitative sono discrete se non è possibile effettuare una misurazione intermedia fra due valori contigui (ad es. numero di persone che entrano in un negozio) 1 2 3 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 13 / 74

Nominali vs. ordinali vs. intervallo/rapporto È il sistema di classificazione più usato ed è stato proposto da Stevens Un livello di misura è nominale quando è soltanto possibile dare un nome (o etichetta) alle categorie di ciò che si sta misurando (ad. es. il colore dei capelli) Un livello di misura è ordinale quando è possibile ordinare i diversi livelli di categorie (ad. per il titolo di studio, la maturità è superiore alla licenza media, la laurea è superiore alla maturità,... ) in un modo qualunque Un livello di misura è ad intervallo/rapporto quando i valori assunti dalla variabile possono essere espressi tramite numeri che fanno riferimento ad una specifica unità di misura (anni di studio, altezza in cm,... ) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 14 / 74

Scala nominale Sistema empirico classificatorio 2 elementi possono appartenere a categorie uguali (=) o diverse ( ) (relazione di uguaglianza o di equivalenza) ogni elemento appartiene ad una ed ad una sola categoria le categorie possono usare qualsiasi tipo di etichetta (simboli, testo o numeri); anche se si usano i numeri, questi non sono numeri, ma testo (quindi 1 significa uno ) Esempio Il genere (maschio, femmina), la professione (chirurgo, operaio,...), il partito politico (PDL, PD, IDV, M5S,...) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 15 / 74

Scala ordinale Oltre alla caratteristiche precedenti (uguaglianza, disuguaglianza) 2 elementi diversi possono essere ordinati fra di loro, così che si può dire che uno dei due è minore dell altro oppure è maggiore (relazione d ordine) le categorie possono usare etichette che permettano di esprimere la relazione d ordine (testo [a, b, c...] e numeri) Esempio Lo status socio-economico (povero, borghese, ricco), il livello scolastico (elementari, medie, superiori, laurea, dottorato), le classi di età (neonato, bambino, pre-adolescente, adolescente, giovane, giovane-adulto, adulto, adulto-anziano, anziano) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 16 / 74

Scala a intervalli Oltre alle caratteristiche precedenti (uguaglianza, disuguaglianza, ordine) Fra 2 categorie esiste teoricamente un intervallo che è esprimibile come multiplo di un intervallo unitario (o intervalli equivalenti) All intervallo unitario è possibile riferire qualunque intervallo fra 2 categorie Esiste un punto-origine relativo Le categorie possono usare solo etichette numeriche (valori numerici positivi e negativi) Esempio La temperatura (0 gradi, 15 gradi, 25 gradi), la maggior parte dei test psicologici (QI, STAI, DPI,...) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 17 / 74

Scala a rapporti Oltre alla caratteristiche precedenti (uguaglianza, disuguaglianza, ordine, intervallo unitario) Il punto origine è assoluto (0 significa totale assenza della caratteristica misurata) Le categorie possono usare solo etichette numeriche (solo valori numerici positivi) Esempio L età, l altezza, il peso, la maggior parte delle variabili fisiche G. Rossi (Dip. Psicologia) ElemPsico 2018-19 18 / 74

Riepilogo Relazione Scala di misura Qualitative Quantitative Nominale Ordinale Intervallo Rapporto Equivalenza =, =, =, =, Ordine <, > <, > <, > Intervallo +, +, Rapporto, G. Rossi (Dip. Psicologia) ElemPsico 2018-19 19 / 74

Implicazioni 1 Ogni unità statistica può avere uno e un solo valore per ogni caratteristica misurata Esempio Se ho rilevato il reddito (scala a rapporti), non posso avere una persona che (contemporaneamente) guadagni sia 500 euro sia 60.000 euro l anno Ogni livello di misurazione superiore include le caratteristiche di quelli inferiori La scala nominale ha il minimo di informazione La scala a rapporto ha il massimo di informazione G. Rossi (Dip. Psicologia) ElemPsico 2018-19 20 / 74

Implicazioni 2 È possibile abbassare il livello di una misurazione, perdendo informazioni (ad es. da una scala a intervallo ad una ordinale) Esempio Posso trasformare l età (misurata in anni dalla nascita) in una scala ordinale (fasce di età) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 21 / 74

Implicazioni 3 Non è possibile alzare il livello di una misurazione, perché non posso aggiungere un informazione che non ho raccolto in precedenza Esempio Se ho rilevato la fascia d età (scala ordinale), non posso passare all età in anni (scala a rapporti) Se l informazione aggiuntiva è compresa nella scala ordinale, allora posso alzare il livello Esempio Se ho rilevato la scolarità tramite i livelli scolastici (elementare, media inf., media superiore...), posso passare al numero di anni trascorsi a scuola (scala a rapporti, elementare=5, m.inf=8,...) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 22 / 74

Implicazioni Per stabilire il livello di misurazione di una variabile devo considerare: la natura della variabile stessa il modo in cui è stata rilevata quali sono le relazioni valide all interno della variabile Attenzione: il nome della variabile potrebbe non indicare la sua scala di misura (se non è un nome codificato) Esempio Il reddito è una variabile quantitativa che, in teoria, oscilla fra 0 e + ; se rilevo il valore esatto del reddito, sarà misurata a livello rapporto (unità di misura, origine assoluta); se rilevo delle fasce di reddito, sarà misurata a livello ordinale (non esiste un unità di misura) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 23 / 74

Varabili dicotomiche e binomiali Le variabili binomiali sono variabili che possono assumere 2 soli valori possibili (ad es. maschio/femmina, vero/falso,...) sono variabili misurate a livello nominale e possono essere associate a simboli, testo o numeri. Se codifichiamo la variabile binomiale usando i valori numerici 0 o 1, diventa dicotomica In molte situazioni una variabile dicotomica si comporta matematicamente come una variabile a intervallo. G. Rossi (Dip. Psicologia) ElemPsico 2018-19 24 / 74

Riconoscere i livelli di misura Fra i livelli di misura, la tipologia più utilizzata è l ultima. Come possiamo riconoscere a quale livello stiamo misurando? 1 I valori di ciò che stiamo misurando permettono valori diversi? No, allora è una costante. Non è una variabile! 2 Prendiamo due qualunque valori possibili di quella variabile 3 Possiamo dire che sono uguali o sono diversi? Sì, allora siamo almeno a livello nominale 4 Possiamo in qualche modo ordinare questi valori? Sì, allora siamo almeno a livello ordinale 5 Possiamo identificare un unità di misura specifica? Sì, allora siamo almeno a livello intervallo 6 L unità di misura ha un punto d origine assoluto? No, allora siamo a livello intervallo Sì, allora siamo a livello a rapporto G. Rossi (Dip. Psicologia) ElemPsico 2018-19 25 / 74

Esercizio Descrizione variabile 1 Genere (maschi, femmine) 2 Anno di nascita 3 Età 4 Titolo di studio (licenza elementare, medie...) 5 Anni di studio completati 6 Tipo di mezzo di trasporto utilizzato x raggiungere il luogo di lavoro 7 Ore passate su un mezzo di trasporto x raggiungere il luogo di lavoro 8 Quante volte alla settimana mangi fuori casa (considerando solo i due pasti principali) 9 Quoziente di Intelligenza N O I R G. Rossi (Dip. Psicologia) ElemPsico 2018-19 26 / 74

Esercizio Descrizione variabile 10 Quanto sei soddisfatto della tua vita in generale? 0) per niente; 1) poco; 2) abbastanza; 3) molto; 4) moltissimo 11 Spesso i partiti politici vengono classificati di destra o di sinistra (e considerati come opposti) o di centro. Su una scala che va da sinistra a destra, come giudichi il tuo orientamento politico (1=sinistra 10=destra) 12 Su una scala da 1 a 10, quanto sei d accordo che gli extracomunitari vadano espulsi dal paese? N O I R G. Rossi (Dip. Psicologia) ElemPsico 2018-19 27 / 74

Esercizio Descrizione variabile 10 Quanto sei soddisfatto della tua vita in generale? 0) per niente; 1) poco; 2) abbastanza; 3) molto; 4) moltissimo 11 Spesso i partiti politici vengono classificati di destra o di sinistra (e considerati come opposti) o di centro. Su una scala che va da sinistra a destra, come giudichi il tuo orientamento politico (1=sinistra 10=destra) 12 Su una scala da 1 a 10, quanto sei d accordo che gli extracomunitari vadano espulsi dal paese? N O I R Scale a ranghi: i numeri indicano solo un ordine, ma... per niente probabile 1 2 3 4 5 6 7 8 9 10 molto probabile G. Rossi (Dip. Psicologia) ElemPsico 2018-19 27 / 74

Scala a ranghi Le scale a ranghi sono scale in cui i numeri rappresentano un ordine (I premio, II arrivato, III scelta...) Sono variabili misurate a livello ordinale (fra il I posto e il II posto c è lo stesso intervallo che c è fra il III e il IV?) Tuttavia, si è visto che se l intervallo è abbastanza ampio (da 7 in sù) noi abbiamo la tendenza a equispaziare Se poi usiamo anche una rappresentazione equispaziata allora la tendenza è ancora maggiore Per cui vengono trattate come intervallo In particolare le scale Likert (ps. sociale) max disaccordo 1 2 3 4 5 6 7 8 9 10 max accordo G. Rossi (Dip. Psicologia) ElemPsico 2018-19 28 / 74

Domande? G. Rossi (Dip. Psicologia) ElemPsico 2018-19 29 / 74

Obiettivo della statistica descrittiva L obiettivo principale è quello di cercare (e trovare) un certo ordine/struttura nelle diverse informazioni rappresentate dai dati numerici Quest obiettivo si può raggiungere tramite valori numerici o forme di visualizzazione che rappresentano delle sintesi statistiche distribuzioni di frequenza indici della tendenza centrale indici di variabilità oppure tramite rappresentazioni grafiche Vedrete queste cose praticamente durante le esercitazioni (soprattutto in SPSS) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 30 / 74

Distribuzione di frequenza semplice Si tratta di contare quanti elementi appartengono ad una stessa categoria presente in una variabile. Esempio Se abbiamo la seguente distribuzione di dati, la distribuzione di frequenza sarà: M F M F F M M M F F M M F F M M F F M M M M F F M F M F M M File: Esempio2-1.xlsx f F 13 f f M 17 f m Tot 30 N G. Rossi (Dip. Psicologia) ElemPsico 2018-19 31 / 74

Distribuzione di frequenza semplice Si tratta di contare quanti elementi appartengono ad una stessa categoria presente in una variabile. Esempio Se abbiamo la seguente distribuzione di dati, la distribuzione di frequenza sarà: M F M F F M M M F F M M F F M M F F M M M M F F M F M F M M File: Esempio2-1.xlsx f F 13 f f M 17 f m Tot 30 N Contiamo le F; il loro numero è la frequenza delle femmine (f f ) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 31 / 74

Distribuzione di frequenza semplice Si tratta di contare quanti elementi appartengono ad una stessa categoria presente in una variabile. Esempio Se abbiamo la seguente distribuzione di dati, la distribuzione di frequenza sarà: M F M F F M M M F F M M F F M M F F M M M M F F M F M F M M File: Esempio2-1.xlsx f F 13 f f M 17 f m Tot 30 N Contiamo le F; il loro numero è la frequenza delle femmine (f f ) Contiamo le M; il loro numero è la frequenza dei maschi (f m ) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 31 / 74

Distribuzione di frequenza semplice Si tratta di contare quanti elementi appartengono ad una stessa categoria presente in una variabile. Esempio Se abbiamo la seguente distribuzione di dati, la distribuzione di frequenza sarà: M F M F F M M M F F M M F F M M F F M M M M F F M F M F M M File: Esempio2-1.xlsx f F 13 f f M 17 f m Tot 30 N Contiamo le F; il loro numero è la frequenza delle femmine (f f ) Contiamo le M; il loro numero è la frequenza dei maschi (f m ) La somma di tutte le frequenze equivale al numero dei casi statistici (indicato con N) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 31 / 74

Distribuzione di frequenza semplice La somma di tutte le frequenze, deve necessariamente equivalere a N (chiamata numerosità ovvero il numero di casi statistici). In termini matematici, equivale a scrivere: N f i = f i = N i=1 dove indica l operazione di somma, f indica frequenza e i è un indice che indica i casi, per cui (in questo caso) può valere f o m oppure 1 o 2 la distribuzione di frequenza permette di riassumere velocemente molti dati si applica sicuramente a scale Nominali, Ordinali ed è possibile anche a livello Intervallo/Rapporto (ma non sempre è utile) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 32 / 74

Proporzioni e percentuali Esprimono il rapporto fra una parte rispetto ad un tutto (o ad un valore di riferimento) Proporzione Percentuale f N la somma dev essere 1 e nessuna proporzione può superare 1 Esempio proporzione di femmine 13 30 = 0.43 f N 100 la somma dev essere 100 e nessuna percentuale può superare 100 Esempio percentuale di maschi 17 100 = 56.67 30 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 33 / 74

Percentuali Le proporzioni e le percentuali si possono calcolare a tutti i livelli (N, O, I/R), anche se è preferibile non usarli per variabili intervallo/rapporto continue e con molti valori Quando la N su cui si calcolano le percentuali è molto piccola, la percentuale perde di significato In genere non si calcolano le percentuali se la N è inferiore a 20 (ma anche se è 22!) Infatti 1 unità su 20 equivale al 5%, mentre 1 unità su 100 equivale all 1% Se per un qualunque motivo, si è verificato un errore di misurazione e una unità è stata categorizzata male, se N è basso, le percentuali cambieranno parecchio dando una visione falsata della realtà G. Rossi (Dip. Psicologia) ElemPsico 2018-19 34 / 74

Percentuali Le percentuali hanno poco senso se non si conosce la N su cui sono calcolate G. Rossi (Dip. Psicologia) ElemPsico 2018-19 35 / 74

Percentuali Le percentuali hanno poco senso se non si conosce la N su cui sono calcolate Marca % sodio Residuo fisso Sodio in mg/l in mg/l Sales.00004 198.5 0.45 Flavia.00007 264.1 0.70 Sant Anna <.0001 39.2 0.90 Panna 141 6,7 Vitasnella <.0002 380.0 3.00 Bagolino.0002 130.0 2.30 San Benedetto <.0007 250.0 6.80 Ferrarelle 1245.0 48.00 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 35 / 74

Tabella delle frequenze Una tabelle delle frequenze indica quanti valori abbiamo per ogni categoria della variabile. Sesso freq prop % Maschi 17.57 56.67 Femmine 13.43 43.33 Totale 30 1.00 100 Di solito si indicano frequenze e percentuali oppure frequenze e proporzioni A livello ordinale, si possono calcolare anche le percentuali cumulate G. Rossi (Dip. Psicologia) ElemPsico 2018-19 36 / 74

Distribuzione di frequenza cumulata È la somma delle frequenze che precedono una determinata categoria La frequenza cumulata della prima categoria è uguale a se stessa la frequenza cumulata delle categorie intermedie, si ottiene sommando i singoli valori di frequenza delle categorie precedenti la frequenza cumulata dell ultima categoria è uguale a N (somma di tutte le frequenze) si applica a scale Ordinali e Intervallo/Rapporto f fc Nessuna 4 4 4 1 scelta 2 6 4+2 2-4 scelte 52 58 6+52 4+2+52 5 o più scelte 18 76 58+18 4+2+52+18 Totale 76 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 37 / 74

Distribuzione di frequenza cumulata È la somma delle frequenze che precedono una determinata categoria La frequenza cumulata della prima categoria è uguale a se stessa la frequenza cumulata delle categorie intermedie, si ottiene sommando i singoli valori di frequenza delle categorie precedenti la frequenza cumulata dell ultima categoria è uguale a N (somma di tutte le frequenze) si applica a scale Ordinali e Intervallo/Rapporto f fc Nessuna 4 4 4 1 scelta 2 6 4+2 2-4 scelte 52 58 6+52 4+2+52 5 o più scelte 18 76 58+18 4+2+52+18 Totale 76 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 37 / 74

Distribuzione di frequenza cumulata È la somma delle frequenze che precedono una determinata categoria La frequenza cumulata della prima categoria è uguale a se stessa la frequenza cumulata delle categorie intermedie, si ottiene sommando i singoli valori di frequenza delle categorie precedenti la frequenza cumulata dell ultima categoria è uguale a N (somma di tutte le frequenze) si applica a scale Ordinali e Intervallo/Rapporto f fc Nessuna 4 4 4 1 scelta 2 6 4+2 2-4 scelte 52 58 6+52 4+2+52 5 o più scelte 18 76 58+18 4+2+52+18 Totale 76 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 37 / 74

Distribuzione di frequenza cumulata È la somma delle frequenze che precedono una determinata categoria La frequenza cumulata della prima categoria è uguale a se stessa la frequenza cumulata delle categorie intermedie, si ottiene sommando i singoli valori di frequenza delle categorie precedenti la frequenza cumulata dell ultima categoria è uguale a N (somma di tutte le frequenze) si applica a scale Ordinali e Intervallo/Rapporto f fc Nessuna 4 4 4 1 scelta 2 6 4+2 2-4 scelte 52 58 6+52 4+2+52 5 o più scelte 18 76 58+18 4+2+52+18 Totale 76 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 37 / 74

Distribuzione di frequenza cumulata È la somma delle frequenze che precedono una determinata categoria La frequenza cumulata della prima categoria è uguale a se stessa la frequenza cumulata delle categorie intermedie, si ottiene sommando i singoli valori di frequenza delle categorie precedenti la frequenza cumulata dell ultima categoria è uguale a N (somma di tutte le frequenze) si applica a scale Ordinali e Intervallo/Rapporto f fc Nessuna 4 4 4 1 scelta 2 6 4+2 2-4 scelte 52 58 6+52 4+2+52 5 o più scelte 18 76 58+18 4+2+52+18 Totale 76 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 37 / 74

Intervalli di classe Quando a qualcuno chiedete Quanti anni hai? potete ricevere diverse risposte: 19; quasi 23; ho appena compiuto i 20... In tutti i casi l età detta è in qualche modo approssimata ad un intero, perché chiunque avrà un certo numero di anni, qualche mese, un po di giorni, qualche ora, alcuni minuti, alcuni secondi... L età, come numero intero di anni trascorsi dalla nascita, può essere pensato come un intervallo di classe con intervallo di ampiezza 1 Il valore centrale di un intervallo diventa il punto verso cui gravitano i veri valori dell età. 19 anni e 8 mesi è più vicino ai 20, mentre 19 anni e 3 mesi è più vicino ai 19. G. Rossi (Dip. Psicologia) ElemPsico 2018-19 38 / 74

Frequenze cumulate Il 53.4% dei soggetti ha dato come risposta valori inferiori o uguali a 5 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 39 / 74

Frequenze cumulate Su variabili intervallo/rapporto non hanno molto senso le tabelle di frequenza (perché ci sono molti valori) Però possono essere utili le percentuali cumulate G. Rossi (Dip. Psicologia) ElemPsico 2018-19 40 / 74

Intervalli di classe Una qualsiasi variabile (discreta o continua, purché quantitativa), se ha molte categorie di valori, può essere raggruppata in intervalli di classe La classificazione in intervalli può essere utilizzata sia per costruire la distribuzione di frequenza e fare rappresentazioni grafiche sia per il calcolo delle principali statistiche (in questo caso si perdono informazioni ed è altamente sconsigliato) Se faccio gli intervalli di classe di uguale ampiezza, qualunque variabile intervallo/a rapporto (anche se discreta) viene considerata come se fosse continua Se faccio intervalli di classe di diversa ampiezza, abbasso la scala a livello ordinale (es, l età in fasce: adolescenti, giovani, giovani adulti, adulti...) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 41 / 74

Intervalli di classe Per fare classi di ampiezza uguale, alcune regole sono: individuare il valore massimo e quello minimo calcolare la gamma di variazione (massimo - minimo) dividere la gamma per il numero degli intervalli che si desiderano (fra 8 e 15) ottenendo l ampiezza dell intervallo arrotondare l ampiezza dell intervallo all intero (generalmente 3, 5 o 10) usando il valore minimo si sceglie un valore iniziale dell intervallo che contenga il valore minimo si attribuiscono i valori a ciascun intervallo si considerano i valori di ciascun intervallo come uniformemente distribuiti all interno dell intervallo stesso G. Rossi (Dip. Psicologia) ElemPsico 2018-19 42 / 74

Intervalli di classe per ogni intervallo si definisce: un limite inferiore (il valore corrispondente si include) un limite superiore (il valore corrispondente si esclude da questo intervallo e si include nel successivo) un valore centrale dei limiti reali limiti indicati valore centrale limiti reali ( ) 85-89 87 84,5-89,5 90-94 92 89,5-94,5 95-99 97 94,5-99,5 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 43 / 74

Intervalli di classe Esempio Consideriamo l età di 25 studenti (Esempio2-2.xlsx): 22, 18, 20, 21, 26, 37, 23, 17, 30, 42, 37, 21, 19, 20, 18, 24, 29, 20, 27, 20, 31, 20, 33, 19, 22. Minimo: 17; Massimo: 42 gamma: 42-17=25, 25/10=2.5 3; 25/5=5 Scegliamo l ampiezza di 5 e costruiamo gli intervalli f lim inf ( ) lim sup vc valori inclusi 16-20 10 15,5 20,5 18 17, 18x2, 19x2, 20x5 21-25 6 20,5 25,5 23 21x2, 22x2, 23, 24 26-30 4 25,5 30,5 28 26, 27, 29, 30 31-35 2 30,5 35,5 33 31, 33 36-40 2 35,5 40,5 38 37x2 41-45 1 40,5 45,5 43 42 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 44 / 74

Intervalli di classe Esempio Usiamo ora un ampiezza di 3 e costruiamo gli intervalli f li ls vc 16-18 3 15,5 18,5 17 19-21 9 18,5 21,5 20 22-24 4 21,5 24,5 23 25-27 2 24,5 27,5 26 28-30 2 27,5 30,5 29 31-33 2 30,5 33,5 32 34-36. 33,5 36,5 35 37-39 2 36,5 39,5 38 40-42 1 39,5 42,5 41 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 45 / 74

Intervalli di classe Esempio f fc % vc=x fx 16-20 10 10 40 18 180 21-25 6 16 24 23 138 26-30 4 20 16 28 112 31-35 2 22 8 33 66 36-40 2 24 8 38 76 41-45 1 25 4 43 43 Somme 25 100 615 Media 24,6 G. Rossi (Dip. Psicologia) ElemPsico 2018-19 46 / 74

Tipi di rappresentazioni grafiche Con le attuali conoscenze, le rappresentazioni grafiche disponibili sono: Grafico a barre (verticali/orizzontali) Grafico a torta Istogramma a barre (verticali/orizzontali) Poligoni di frequenza (semplice e cumulata) Diagrammi ramo-foglia Alcuni di questi grafici si possono ottenere sia in Excel sia in R sia in SPSS Alcuni non si possono ottenere se non in R G. Rossi (Dip. Psicologia) ElemPsico 2018-19 47 / 74

Grafici/Istogrammi a barre Grafici e istogrammi a barre sono molti simili I grafici a barre sono indicati per variabili nominali e ordinali: le barre sono separate l una dall altra Gli istogrammi a barre sono indicati per variabili intervallo/rapporto: le barre sono contigue fra loro Ogni frequenza è rappresentata da una barra La lunghezza di ogni barra è proporzionale alla frequenza: barre più lunghe indicano frequenze più elevate Negli istogrammi anche l area di una barra è proporzionale alla frequenza G. Rossi (Dip. Psicologia) ElemPsico 2018-19 48 / 74

Grafico a barre (Nominale/Ordinale) la variabile è misurata su una scala a 10 punti che vanno da 1=sinistra a 10=destra è quindi una variabile ordinale (*) (*) ma viene spesso considerata a intervalli G. Rossi (Dip. Psicologia) ElemPsico 2018-19 49 / 74

Grafico a barre (Nominale/Ordinale) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 50 / 74

Grafico a torta (N/O) Distribuzione vendite Distribuzione vendite Giacomo Susanna Giovanni 0 10 20 30 40 50 60 Giovanni Giacomo Susanna Le informazioni fornite sono analoghe; le torte fanno più scena, ma diventano complicate da interpretare se ci sono molte categorie con frequenze molto vicine fra loro G. Rossi (Dip. Psicologia) ElemPsico 2018-19 51 / 74

Istogramma (I/R) Frequenze 0 10 20 30 40 50 Istogramma le variabili quantitative (in particolare quelle continue) vengono rappresentate tramite intervalli di classe (SPSS lo fa automaticamente) 0 5000 10000 15000 20000 25000 30000 Reddito G. Rossi (Dip. Psicologia) ElemPsico 2018-19 52 / 74

Istogramma con classi più piccole (I/R) Frequenze 0 5 10 15 20 25 Istogramma con classi più piccole se la variabile non è molto simmetrica, l ampiezza degli intervalli può cambiare moltissimo la distribuzione raffigurata 0 5000 10000 15000 20000 25000 Reddito G. Rossi (Dip. Psicologia) ElemPsico 2018-19 53 / 74

Forme di distribuzione una distribuzione è simmetrica se è speculare rispetto alla metà asimmetrica se non lo è (negativa=sinistra; positiva=destra) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 54 / 74

Forme di distribuzione la forma grafica della distribuzione permette di identificare alcune sue caratteristiche i picchi rappresentano i valori più frequenti si classificano in unimodali, bimodali e multimodali si identificano facilmente le distribuzioni simmetriche o vicino alle simmetriche Una particolare curva simmetrica con forma a campana è chiamata normale o gaussiana Gaussiana perché studiata da Gauss Normale perché moltissime misurazioni di eventi fisici e/o naturali si distribuiscono con questa forma, che diventa un punto di riferimento in tutta la statistica G. Rossi (Dip. Psicologia) ElemPsico 2018-19 55 / 74

Istogramma con curva normale (I/R) Istogramma con classi più piccole Frequenze 0.00000 0.00004 0.00008 0.00012 0 5000 10000 15000 20000 25000 Reddito G. Rossi (Dip. Psicologia) ElemPsico 2018-19 56 / 74

Riepilogo della teoria Variabili, Valori Scale di misura Nominale Ordinale Intervalli equivalenti A rapporto Tabella delle frequenze Tabella delle percentuali Frequenze e percentuali cumulate Grafici a barre Istogrammi G. Rossi (Dip. Psicologia) ElemPsico 2018-19 57 / 74

Cos è un foglio elettronico Un foglio elettronico è una tabella in cui si possono fare calcoli in tempo reale: cambiando un valore in una cella, cambia il contenuto di eventuali celle collegate (ad es. una somma) Le righe sono generalmente identificate da numeri progressivi, mentre le colonne da lettere alfabetiche progressive. Le celle vengono quindi identificate tramite gli identificatori di colonna e di riga (A1, BC75) In una cella di un foglio elettronico, oltre a inserire del testo o un numero, si possono inserire istruzioni che indicano come usare il contenuto di altre celle per fare calcoli o altre manipolazioni (ad es. =A1+B1; =SOMMA(A1:A5)) Excel, OpenCalc, LibreCalc sono alcuni fogli elettronici che fanno parte di suite come Microsoft Office, OpenOffice, LibreOffice OpenOffice e LibreOffice sono software open (quindi gratuiti). G. Rossi (Dip. Psicologia) ElemPsico 2018-19 58 / 74

Cos è R R è un software statistico open source, molto potente e sofisticato, interamente programmabile È come avere a disposizione una mega calcolatrice che permette di svolgere sia calcoli semplici e banali (2+3) sia analisi molto complesse Si può scaricare dal sito The Comprehensive R Archive Network (abbreviato in CRAN, http://cran.r-project.org/ o da un suo mirror, uno è a Milano) Oltre alle guide disponibili in CRAN, potete utilizzare la mia dispensa L uso di R in psicologia (versione provvisoria) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 59 / 74

Alternative a R: Jasp Jasp è un interfaccia per R che mostra i risultati nello stesso formato di SPSS Non è completo (è alla versione 0.9.2.0) ma è completamente gratuito (e si preoccupa di installare anche R) Si può scaricare dal sito JASP A Fresh Way to Do Statistics Per ora non esistono guide, ma ci sono degli help (in inglese) all interno del software stesso e dei video (in inglese) su Youtube G. Rossi (Dip. Psicologia) ElemPsico 2018-19 60 / 74

Jamovi Jamovi è un interfaccia per R che mostra i risultati nello stesso formato di SPSS Non è completo (è alla versione 0.9.5.12) ma è completamente gratuito (e si preoccupa di installare anche R) Si può scaricare dal sito Jamovi. Stats. Open. Now. Esiste una guida (learning statistics with jamovi: a tutorial for psychology students and other beginners), degli help all interno del software stesso e dei video su Youtube (tutto materiale in inglese) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 61 / 74

Cos è SPSS SPSS significa Statistical Package for Social Sciences (Pacchetto statistico per le scienze sociali) ed è un programma a pagamento per gestire dati e calcolare statistiche. Adesso si chiama IBM SPSS Permette di inserire, nominare e gestire le misurazioni statistiche Permette di manipolare le variabili (in modo analogo ai fogli elettronici Permette di calcolare le statistiche descrittive, di fare grafici Permette di fare l analisi dei dati Esiste un clone open source chiamato PSPP (attualmente alla vers. 1.2.0), gratuito ma non ancora completo G. Rossi (Dip. Psicologia) ElemPsico 2018-19 62 / 74

Primo avvio 1 Per eseguire SPSS (Win 10) Start poi scorrere fino alle I e IBM SPSS Statistics quindi IBM SPSS Statistics 25 Alla prima esecuzione compare una finestra di dialogo che permette di effettuare alcune scelte. Selezionare Nuovo dataset per aprire una finestra senza dati Per disattivare l apertura automatica, click-ate qui G. Rossi (Dip. Psicologia) ElemPsico 2018-19 63 / 74

Primo avvio 2 Potete selezionare Introduzione con esercitazioni Oppure Chiudi G. Rossi (Dip. Psicologia) ElemPsico 2018-19 64 / 74

Finestra di base La finestra principale è formata da due pannelli uno per la visualizzazione dei dati (Vista dati) uno per la descrizione delle variabili (Vista variabili) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 65 / 74

Finestra di base Le principali voci di menù sono: Dati: permette di agire sul file dei dati (ordinare, selezionare, filtrare...) Trasforma: permette di manipolare le variabili (calcolare nuove variabili, ricodificare, contare valori...) Analizza: È il menù più utilizzato perché contiene tutte le procedure statistiche disponibili La prima volta che usate SPSS vi conviene fare l esercitazione disponibile nell Help. Per indicare un percorso di menù, userò questa convenzione voce principale sottomenù sotto-sottomenù: ad es. Analizza Statistiche descrittive Frequenze G. Rossi (Dip. Psicologia) ElemPsico 2018-19 66 / 74

Distribuzione e grafici in SPSS La maggior parte delle statistiche che abbiamo visto e che vedremo e i relativi grafici, si ottengono in SPSS tramite due comandi Analizza Statistiche descrittive Frequenze... Analizza Statistiche descrittive Esplora... In Spss si può fare solo quello che è previsto dal software; i grafici non sono bellissimi In Excel si possono fare molti più grafici (anche più belli ) In R (usato in questi lucidi) si può fare praticamente tutto, ma è molto più complicato G. Rossi (Dip. Psicologia) ElemPsico 2018-19 67 / 74

Spss: frequenze Calcoliamo le frequenze con il comando Analizza Statistiche descrittive Frequenze... Poi spostiamo una variabile nominale/ordinale fra le Variabili E premiamo OK File: esempio1.sav G. Rossi (Dip. Psicologia) ElemPsico 2018-19 68 / 74

Spss: frequenze G. Rossi (Dip. Psicologia) ElemPsico 2018-19 69 / 74

Spss: istogramma (Frequenze) Analizza Statistiche descrittive Frequenze... Pulsante Grafici... Selezioniamo Istogramma eventualmente anche Con curva normale Pulsante e OK Continua G. Rossi (Dip. Psicologia) ElemPsico 2018-19 70 / 74

Spss: istogramma (Esplora) Analizza Statistiche descrittive Esplora... Pulsante Grafici... Selezioniamo Istogramma (non è possibile avere la curva normale) Pulsante e OK Continua G. Rossi (Dip. Psicologia) ElemPsico 2018-19 71 / 74

Spss: istogramma (Frequenze/Esplora) Spss usa automaticamente gli intervalli di classe non è possibile modificare l ampiezza di classe La curva normale non c è con Esplora G. Rossi (Dip. Psicologia) ElemPsico 2018-19 72 / 74

Spss: torta Analizza Statistiche descrittive Frequenze... Pulsante Grafici... Selezioniamo Grafici a torta Pulsante e OK Continua G. Rossi (Dip. Psicologia) ElemPsico 2018-19 73 / 74

Riepilogo SPSS Analizza Statistiche descrittive Frequenze... Per le tabelle delle frequenze, percentuali e percentuali cumulate Per i Grafici a barre Per gli Istogrammi (anche con curva normale) Analizza Statistiche descrittive Esplora... Per gli Istogrammi (ma senza curva normale) G. Rossi (Dip. Psicologia) ElemPsico 2018-19 74 / 74