Elementi di Psicometria con Laboratorio di SPSS 1

Documenti analoghi
Distribuzioni campionarie. Antonello Maruotti

Distribuzioni di probabilità

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Elementi di Psicometria con Laboratorio di SPSS 1

Campionamento La statistica media campionaria e la sua distribuzione

CAMPIONAMENTO - ALCUNI TERMINI CHIAVE

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

Capitolo 7. Distribuzioni campionarie. Statistica. Levine, Krehbiel, Berenson

Teorema del limite centrale TCL

Carta di credito standard. Carta di credito business. Esercitazione 12 maggio 2016

Il test (o i test) del Chi-quadrato ( 2 )

Il confronto fra medie

Tecniche statistiche di analisi del cambiamento

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

INFORMATICA 11-Foglio di calcolo-grafici

Capitolo 6. La distribuzione normale

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 15: Metodi non parametrici

Capitolo 11 Test chi-quadro

Risultati esperienza sul lancio di dadi Ho ottenuto ad esempio:

La Distribuzione Normale (Curva di Gauss)

LA LUNGHEZZA DEI GENI UMANI (Es4.1)

Esame di Statistica A-Di Prof. M. Romanazzi

STATISTICHE DESCRITTIVE Parte II

MISURE DI SINTESI 54

Lezione 4 a - Misure di dispersione o di variabilità

Concetti principale della lezione precedente

Analisi della varianza

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

informatica di base per le discipline umanistiche

Vedremo i concetti di:

Esercitazioni di statistica

informatica di base per le discipline umanistiche

Incertezza di Misura: Concetti di Base

Modelli descrittivi, statistica e simulazione

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

12) Metodo dei minimi quadrati e linea di tendenza

Econometria. lezione 13. validità interna ed esterna. Econometria. lezione 13. AA Paolo Brunori

ˆp(1 ˆp) n 1 +n 2 totale di successi considerando i due gruppi come fossero uno solo e si costruisce z come segue ˆp 1 ˆp 2. n 1

Corso di Psicometria Progredito

Esercitazioni di statistica

Metodi statistici per le ricerche di mercato

7 Disegni sperimentali ad un solo fattore. Giulio Vidotto Raffaele Cioffi

STATISTICA INFERENZIALE PER VARIABILI QUALITATIVE

Elementi di Psicometria con Laboratorio di SPSS 1

Dispensa sulla funzione gaussiana

Indagine conoscitiva DONNE E OMEOPATIA

Teoremi limite. Enrico Ferrero. 27 febbraio 2007

La probabilità matematica

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Esercitazioni di Metodologia

ESPONENZIALI E LOGARITMI. chiameremo logaritmica (e si legge il logaritmo in base a di c è uguale a b ).

Il campionamento statistico. prof. C.Guida

INDICI DI POSIZIONE - I QUANTILI

Esercitazione # 3. Trovate la probabilita che in 5 lanci di un dado non truccato il 3 si presenti

CAMPIONAMENTO fondamentale analisi campionamento omogenei stessa composizione variazione l abilità persona variabilità metodo analitico realtà

Università del Piemonte Orientale. Corso di Laurea in Igiene Dentale. Corso di Statistica per la ricerca sperimentale e tecnologica

Importanza delle incertezze nelle misure fisiche

Metodo dei minimi quadrati e matrice pseudoinversa

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

Il confronto tra due campioni

Esercizi sulla conversione tra unità di misura

Anno 3. Funzioni esponenziali e logaritmi: le 4 operazioni

Calcolo di una Regressione lineare semplice con Excel

p k q n k = p n (k) = n 12 = 1 = ,1208. q = 1 2 e si ha: p 12 (8) =

Il metodo della regressione

Lezione 4. Sommario. L artimetica binaria: I numeri relativi e frazionari. I numeri relativi I numeri frazionari

Graficazione qualitativa del luogo delle radici

La PROBABILITA è un numero che si associa ad un evento E ed esprime il grado di aspettativa circa il suo verificarsi.

PROBABILITÀ SCHEDA N. 7 LA VARIABILE ALEATORIA NORMALE

Elementi di Psicometria con Laboratorio di SPSS 1

INDICAZIONI PER LA RICERCA DEGLI ASINTOTI VERTICALI

ARROTONDANDO FIGURE CON TRIANGOLI EQUILATERI

Correlazione. Daniela Valenti, Treccani Scuola 1

La distribuzione normale

Università degli Studi G. d Annunzio EPG PSICOMETRIA II. Fascia A-H Anno Accademico 2015/2016. Dott. Fedele Cataldi

Probabilità. Ing. Ivano Coccorullo

Statistica. Esercitazione 10. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Statistica. A. Iodice. V.C.

12 Il mercato del lavoro dei politici

SCHEDA N 8 DEL LABORATORIO DI FISICA

La definizione e i principi dell estimo

PSICOMETRIA. Esercitazione n.1. C.d.L. Comunicazione e Psicologia a.a. 2012/13

Metodi e tecniche di analisi dei dati nella ricerca psico-educativa Parte III

Integrazioni al corso di Economia Politica (anno accademico ) Marianna Belloc

Indice Premessa Cenni storici delle misure

Elementi di Psicometria

Cercare il minimo di una funzione: Particle swam optimization

1 L estrazione di radice

CURRICOLO VERTICALE MATEMATICA RELAZIONI/ DATI E PREVISIONI/ MISURA

Le imprese nei mercati concorrenziali

DOCENTE F. S. MAIESE CARMELA

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno

Osservatorio politico. Il sentiment sull economia, sull Unione Europea e sull Euro

QUANTIZZAZIONE E CONVERSIONE IN FORMA NUMERICA

Il Metodo Cinematico lineare, comunemente anche detto Metodo della Corrivazione, si basa su alcune considerazioni:

ANOVA: ANALISI DELLA VARIANZA Prof. Antonio Lanzotti

Italiani in vacanza: priorità sicurezza

Indice Aspetti generali sul campionamento da popolazioni finite Campionamento probabilistico Disegno campionario semplice

RISPOSTA ALLA SELEZIONE

Test di Matematica di base

la struttura di una teoria

Transcript:

Elementi di Psicometria con Laboratorio di SPSS 1 09-Campione e popolazione vers. 1.0 (31 ottobre 2014) Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia, Università di Milano-Bicocca 2014-2015 G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 1 / 25

Campione e popolazione Chi si occupa di comportamento necessita di studiare il comportamento delle persone e di trarre delle conclusioni Gli psicologi, di solito, possono misurare però solo una piccola parte di queste persone Per questo motivo, la maggior parte della ricerca in psicologia si basa su un piccolo campione di dati da cui derivano affermazioni generali La statistica descrittiva si applica a dati di qualsiasi ampiezza (in termini di casi statistici) Per cui le statistiche descrittive valgono sia per un campione sia per una popolazione G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 2 / 25

Campione e popolazione Un campione (ricordiamo) è una piccola parte della popolazione Ricordiamo anche che una popolazione è l insieme di tutti i casi statistici possibili con le caratteristiche che intendiamo studiare In altre parole: il campione è costituito da tutte le misurazioni che ho fatto in questa raccolta di dati La popolazione è costituita da tutte le misurazioni che avrei potuto fare in questa raccolta dati Il campione è sempre finito La popolazione può essere finita o infinita G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 3 / 25

Campione e popolazione Il termine finito indica che esiste un numero che rappresenti il massimo dei casi statistici considerabili (Ad es. tutti gli studenti immatricolati a Psicologia nell a.a. 2014/15) Il termine infinito che non esiste un numero massimo di casi statistici (Ad es. tutti tempi di reazione a un certo stimolo) Il campionamento è l estrazione di un campione dalla popolazione (secondo determinati criteri) per poterla studiare più agevolmente Se conosciamo le caratteristiche della popolazione, sarà facile estrarre un campione che ben la rappresenti oppure riconoscere che il campione in esame rappresenta bene la popolazioni oppure no G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 4 / 25

Campione e popolazione Molto spesso nelle scienze sociali non si conoscono le caratteristiche della popolazione Se non la conosciamo dovremo cercare di estrarre un campione che sia una buona stima della popolazione Dal momento che non sempre conosciamo le caratteristiche della popolazione, le statistiche descrittive dei campioni sono usate come stima delle analoghe statistiche della popolazione Non abbiamo la certezza che queste stime siano vere ma sono le stime migliori dal momento che non conosciamo nulla! G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 5 / 25

Rappresentatività Generalizziamo il concetto di buona stima dicendo che il campione dev essere rappresentativo Il campione selezionato dovrebbe rappresentare in piccolo la popolazione che si vuol studiare... quindi il campione dovrebbe avere le stesse caratteristiche della popolazione (e nella stessa proporzione) Gruppo concreto che studio Omeomorfismo Gruppo teorico che voglio studiare G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 6 / 25

Rappresentatività Sulla base del campione rappresentativo, estendiamo i dati ottenuti all intera popolazione, tramite l inferenza statistica Campione inferenza Popolazione Una volta selezionate le variabili che ci interessa studiare (che saranno chiamate variabili dipendenti), si individuano anche delle variabili che si ritengono importanti o che possono essere/produrre influenza su (che verranno chiamate variabili indipendenti). Il campione deve distribuirsi (in queste variabili) proporzionalmente alla popolazione G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 7 / 25

Rappresentatività Un modo generalmente usato per avere la rappresentatività è quella della selezione casuale dei casi statistica dalla popolazione Questi campioni sono chiamati campioni casuali della popolazione In italiano, casuale ha più un significato di arbitrario, informale, quello che capita... Ma ha anche un significato diverso Quando metto la mano nel sacchetto con i numeri della tombola, non guardo dentro al sacchetto per poter estrarre un numero casuale... Casuale (in statistica) significa appunto che non uso strategie per selezionare un caso statistico a scapito di un altro... G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 8 / 25

Casuale o randomizzato Il vostro libro usa sia casuale sia randomizzato. È lo stesso concetto In inglese, random enfatizza il fatto che tutti gli eventi possibili hanno la stessa possibilità di essere selezionati Un campione casuale (o randomizzato) è quindi uno dei possibili campioni estraibili da quella popolazione Inoltre, tutti i casi selezionati per quel campione avevano la stessa probabilità di essere selezionati G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 9 / 25

Estrazione casuale Esistono numerosi modi per selezionare un campione casuale In molti casi si tratta di identificare ogni caso in qualche modo (ad es. con un numero) Poi è possibile (ad es.) mettere tutti gli identificatori in un contenitore, da cui si selezionano alla cieca fino a raggiungere il numero di casi stabilito per il campione usare un numero casuale (computer, calcolatrice, tavole dei numeri casuali) per selezionare si ordinano gli identificatori e si selezionano quelli che sono in una certa posizione (ad es. 1 ogni 20) G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 10 / 25

Estrazione casuale In teoria, dopo aver selezionato un caso, dovremmo ri-immetterlo nel mucchio; altrimenti gli altri non avranno la stessa probabilità dei precedenti (1/n, 1/(n-1), 1/(n-2)...) non si fa, perché (con popolazioni grandi o infinite) la diversa probabilità è piccolissima 1 su 1000000 = 0.0000010000 (1 milione) 1 su 999900 = 0.0000010001 (1 milione-100) G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 11 / 25

Stima della media Se estraiamo un campione da una popolazione e il campione è rappresentativo di quella popolazione, il campione dovrebbe avere gli stessi indici statistici Ovviamente non è sempre vero Ma possiamo vedere/calcolare/studiare quanto potrebbero differire le statistiche calcolate su un campione rispetto ai parametri della popolazione da cui sono state tratte Per questo useremo campioni estratti da una popolazione come se fossero casi statistici E ci concentreremo sulla media (ma potremmo rifare lo stesso discorso sulla mediana o su altre statistiche descrittive) G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 12 / 25

Stima della media Ipotizziamo di estrarre un campione di 100 casi da una popolazione e di calcolare la media di una certa variabile Usiamo la variabile Fondamentalismo su una popolazione di 659 persone (popolazione finita). La sua media è 90.3915 Estraiamo un campione casuale di 100 persone e calcoliamo la media di questo campione: 91.46 Estraiamo altri 19 campioni di ampiezza 100 dalla stessa popolazione e calcoliamo la media per ciascuno: 87.83, 90.63, 91.90, 91.99, 90.10, 90.80, 93.84, 90.80, 89.80, 90.12, 90.71, 88.56, 89.67, 90.76, 87.77, 90.51, 89.78, 90.68, 90.40 G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 13 / 25

Stima della media Medie Scarto 91.46 1.07 87.83-2.56 90.63 0.24 91.90 1.51 91.99 1.60 90.10-0.29 90.80 0.41 93.84 3.45 max 90.80 0.41 89.80-0.59 90.12-0.27 90.71 0.32 88.56-1.83 89.67-0.72 90.76 0.37 87.77-2.62 90.51 0.12 89.78-0.61 90.68 0.29 90.40 0.01 min Poiché vengono dalla stessa popolazione, la media di ogni campione estratto tenderà ad oscillare attorno alla media della popolazione Per ciascun campione estratto, non posso dire con sicurezza se è più o meno vicino alla media della popolazione (se non la conosco) Ma la media delle 20 medie (90.35), avrà un valore sicuramente più vicino alla media della popolazione: 90.3915 Medie Scarto 90.39 Media popolazione 90.35-0.04 Media dei campioni G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 14 / 25

Stima della media Sulle 20 medie, possiamo calcolare la deviazione standard Essendo la dev.st. delle medie dei campioni, ci informa su quanto le medie campionarie si discostano dalla media di tutti i campioni messi assieme Viene chiamata errore standard della media Un piccolo errore standard indica che le medie campionarie sono tendenzialmente vicine alla media della popolazione Più piccolo l errore standard, migliore è la stima della media della popolazione G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 15 / 25

Stima della media Un grande errore standard indica che le medie campionarie sono tendenzialmente disperse attorno alla media della popolazione Più grande l errore standard, meno sicuri siamo della bontà della stima della media della popolazione Anche la numerosità del campione incide sull errore standard Più grande è la numerosità dei campioni minore l errore standard Più piccola la numerosità dei campioni, maggiore l errore standard G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 16 / 25

Distribuzione campionaria Anziché 20 campioni ne potremmo estrarre 10.000 avremmo 10.000 medie e potremmo costruire una distribuzione di frequenza di quelle medie L importante è che ogni campione sia casuale, ovvero ogni caso di un singolo campione abbia la stessa probabilità di essere estratto degli altri ogni possibile campione estraibile dalla popolazione abbia la stessa probabilità degli altri La distribuzione di frequenza che costruiremmo con le medie dei campioni si chiama distribuzione campionaria delle medie Se il numero di campioni estratto è sufficientemente elevato, le medie dei campioni tenderanno a distribuirsi secondo la curva della normale G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 17 / 25

Distribuzione campionaria Dal momento che le medie campionarie tendono a distribuirsi come una curva normale in statistica vengono considerate stime non affidabili le medie che stanno nell estremo 2,5% di entrambi i lati Sono campioni che vengono estratti abbastanza raramente: infatti sono nell area del 2,5% (negativa o positiva) a queste aree, la statistica associa il concetto di significatività In linea di massima, significatività significa valori la cui probabilità di comparire sono molto basse e che quindi vengono considerati anomali perché molto probabilmente differenti da quelli della popolazione G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 18 / 25

Intervallo di confidenza (o di fiducia) Il 95% attorno alla media rappresenta l intervallo di fiducia È semplicemente un aspetto complementare a quello precedente gli stessi valori che determinano il 2.5% estremo, determina anche il 95% interno (se ne parlerà in un prossimo capitolo) G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 19 / 25

Distribuzione campionaria Se effettivamente estraessimo un numero elevatissimo di campioni da una popolazione (metodo Monte Carlo), avremmo una distribuzione sperimentale, mentre quella su cui noi lavoreremo è una distribuzione teorica La distribuzione campionaria delle medie si basa sul teorema del limite centrale che afferma che, all aumentare dell ampiezza dei campioni, la distribuzione campionaria della media si avvicinerà sempre più ad una distribuzione normale, indipendentemente dalla forma delle misurazioni individuali Se una variabile si distribuisce normalmente, anche piccoli campioni produrrano una distribuzione campionaria normale Con variabili non normali, la distribuzione campionaria deve avere N 30 o 40 G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 20 / 25

Distribuzione campionaria delle medie 4 2 0 2 4 Popolazione normale 0 200 600 1000 Media= 0.03 100 campioni N=10 0.0 0.1 0.2 0.3 0.4 Popolazione normale 4 2 0 2 4 Media= 0.03 100 campioni N=30 A partire da una popolazione distribuita normalmente (1000 casi, valori -4 4) abbiamo il grafico dei valori [1] l istogramma delle frequenze [2] l istogramma con normale di 100 campioni di ampiezza 10 [3] 0.0 0.4 0.8 1.2 0.0 1.0 2.0 l istogramma con normale di 100 campioni di ampiezza 30 [4] 2 1 0 1 2 2 1 0 1 2 Media dei campioni= 0.01 Media dei campioni= 0.03 G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 21 / 25

Distribuzione campionaria delle medie 0.0 0.2 0.4 Popolazione normale 4 2 0 2 4 0.0 0.5 1.0 1.5 Campioni N=10 1.0 0.0 0.5 1.0 la curva della ditribuzione normale [1] la curva di 100 campioni di ampiezza 10 [2] la curva di 100 campioni di ampiezza 30 [3] Campioni N=30 estratti da una popolazione che si distribuiva normalmente 0.0 1.0 2.0 0.6 0.2 0.2 0.6 G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 22 / 25

Distribuzione campionaria delle medie 0 200 600 1000 0 20 60 100 Media= 50.1001 Popolazione uniforme Popolazione uniforme Media= 50.1001 Frequency 0 20 40 60 80 100 0 40 80 100 campioni N=10 Media dei campioni= 51.1035 Density 0 20 40 60 80 100 0.00 0.02 0.04 100 campioni N=30 Media dei campioni= 49.9936 Density 0 20 40 60 80 100 0.00 0.03 0.06 A partire da una popolazione uniformemente distribuita (1000 casi, valori 1-100) abbiamo il grafico dei valori [1] l istogramma delle frequenze [2] l istogramma con normale di 100 campioni di ampiezza 10 [3] l istogramma con normale di 100 campioni di ampiezza 30 [4] G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 23 / 25

Distribuzione campionaria delle medie 0.000 0.006 Popolazione uniforme 20 20 60 100 Campioni N=30 0.00 0.02 0.04 Campioni N=10 20 40 60 80 la curva della distribuzione uniforme [1] la curva di 100 campioni di ampiezza 10 [2] la curva di 100 campioni di ampiezza 30 [3] estratti da una popolazione che non si distribuiva normalmente 0.00 0.03 0.06 35 45 55 65 G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 24 / 25

Distribuzione campionaria La distribuzione campionaria è una distribuzione di probabilità e per una numerosità (N) del campione superiore o uguale a 30, tende verso una curva stabile (e normale ) con M x = µ e σ x = σ N σ x è la deviazione standard delle medie campionarie anche conosciuta come errore standard della media indica quanto affidabile è ciascuna media campionaria G. Rossi (Dip. Psicologia) ElemPsico 2014-2015 25 / 25