MISURAZIONE. Sistema empirico (SE): ciò che si vuole misurare; costituito da elementi legati tra loro da relazioni

Documenti analoghi
Perché costruire un test psicologico è difficile. Misurazione e attendibilità

1 - e 2 / x 2, si tratta di far sì che e 2 rifletta effettivamente l errore di misura

Teoria e tecniche dei test DIMENSIONALITA DI UN TEST DIMENSIONALITA DI UN TEST (2) 03/04/2012. Lezione 7 DIMENSIONALITA e ATTENDIBILITA

ANALISI AFFIDABILITÀ SCALE

Caratteristiche di un buon test

Psicometria con Laboratorio di SPSS 2

2. INDICI DI DISCRIMINAZIONE 3. STUDIO DELLA DIMENSIONALITA DI UN TEST

LA MISURA IN PSICOLOGIA

PROCEDURE DI VALIDAZIONE E DI CONTROLLO DELL ATTENDIBILITÁ VALIDITÁ

Matrici di Raven (PM47)

CONFRONTO TRA LA MEDIE DI DUE CAMPIONI INDIPENDENTI

Psicologia della personalità Il testing psicologico. A.A. 2018/19 Esercitazioni prof.ssa Lisa Di Blas

Corso di Psicometria Progredito

Teoria e tecniche dei test LA VALIDITA 10/12/2013. a) SIGNIFICATIVITA TEORICA E OSSERVATIVA DI UN COSTRUTTO. Lezione 6 seconda parte LA VALIDITA

Prof. Anna Paola Ercolani (Università di Roma) Lez. 1 - La misura del comportamento - cosa misuriamo?

3 - Esercizi: strumenti di misura, propagazione degli errori, media, deviazione standard, intervalli

Metodologia della ricerca educativa

Matematica Lezione 22

FONDAMENTI DI PSICOMETRIA - 8 CFU

perché la risposte ad un item differiscono tra di loro?

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

Metodi statistici per le ricerche di mercato

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

ATTENDIBILITA' E VALIDITA' DEI TEST PSICOLOGICI

Matematica con elementi di Informatica

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

ESAME. 9 Gennaio 2017 COMPITO B

Ulteriori Conoscenze di Informatica e Statistica

Esercizi su Regressione e Connessione

Elementi di Psicometria

SCANNER SPETTRALE: VERIFICA DELL ATTENDIBILITÀ DELLE MISURE

Corso di Psicometria Progredito

Esercizi di statistica

Tecniche di sondaggio

la struttura di una teoria

Statistica. Alfonso Iodice D Enza

Analisi degli Errori di Misura. 08/04/2009 G.Sirri

dimensionalità di un test

Test delle Ipotesi Parte I

Tipi di variabili. Indici di tendenza centrale e di dispersione

Verifica delle ipotesi

DISTRIBUZIONI DI CAMPIONAMENTO

LEZIONI DI STATISTICA MEDICA

ESPERIENZA DI LABORATORIO N 1. 1) Misura diretta mediante tester della resistenza elettrica dei resistori R1, R2, R3 e calcolo degli errori di misura.

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6

Capitolo 2 Le misure delle grandezze fisiche

Ulteriori Conoscenze di Informatica e Statistica

Disegni di Ricerca e Analisi dei Dati in Psicologia Clinica. Indici di Affidabilità

Una statistica è una quantità numerica il cui valore è determinato dai dati.

LA DISTRIBUZIONE NORMALE o DI GAUSS

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

lezione 13 AA Paolo Brunori

Argomenti della lezione:

Grandezze e Misure.

STATISTICA. Regressione-2

Metodologie Quantitative

Analisi della varianza

Introduzione alla statistica con Excel

Schema lezione 5 Intervalli di confidenza

Distribuzione Gaussiana - Facciamo un riassunto -

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Modelli e procedure per l educazione degli adulti

Incertezza di Misura: Concetti di Base

Psicometria con Laboratorio di SPSS 1

Osservazioni e Misura. Teoria degli errori

standardizzazione dei punteggi di un test

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie.

PAROLE CHIAVE Accuratezza, Accuracy, Esattezza, PRECISIONE, Precision, Ripetibilità, Affidabilità, Reliability, Scarto quadratico medio (sqm), Errore

Corso C Geomatica. Teoria degli errori. Massimiliano Cannata

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Lezione 15. L analisi della Varianza (ANOVA): i disegni entro i sogetti e misti. Argomenti della lezione: Disegni entro i soggetti

Prefazione Ringraziamenti

METODI E TECNICHE DELLA RICERCA IN PSICOLOGIA CLINICA E LABORATORIO MEDIAZIONE

05. Errore campionario e numerosità campionaria

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

1 Fit di dati sperimentali: il χ 2. Il metodo dei minimi quadrati.

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Teoria e tecniche dei test

Strumenti di indagine per la valutazione psicologica

Esercitazioni di Statistica Corsi di Laurea Infermiesristica Pediatrica e Ostetricia - I anno 1

07/01/2016. Scalisi - Tecniche Psicometriche LA VERIFICA DELLE IPOTESI. La verifica delle ipotesi. Popolazioni e campioni

LA MEDIA CAMPIONARIA 14-1

BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i

1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2

MISURE ANALITICHE MISURE ANALITICHE. η = x - θ. θ (valore vero) x (misura) ERRORE TOTALE. η 1 > 0

ANALISI DELLE SERIE STORICHE

Marketing e Direzione d Impresa Lezione 20 Raccogliere informazioni e valutare l ambiente di mercato Ing. Marco Greco

Regressione lineare semplice

Come errore prendo la semidispersione o errore massimo, cioè il valore più grande meno quello più piccolo diviso 2.

Capitolo 3. Le correlazioni fra i rendimenti dei prestiti e la diversificazione di portafoglio.

Elementi di Psicometria con Laboratorio di SPSS 1

VALIDITA DELLE MISURE

Parametri statistici

Modelli e procedure per l educazione degli adulti

Transcript:

Attendibilità

Misurazione I problemi di misurazione degli oggetti di studio sono comuni a tutte le discipline scientifiche. In psicologia il problema è solo più evidente, non più grave. I costrutti che intendiamo misurare sono infatti non direttamente osservabili.

Il peso della teoria Spesso la definizione teorica di un fenomeno o costrutto varia da teoria a teoria. È stato così anche per molti concetti propri delle scienze mature. Spesso in psicologia, il disaccordo fra teorie rende problematica la misura del fenomeno. È la teoria, descrivendo le caratteristiche del fenomeno, a determinare le sue misure.

MISURAZIONE Assegnazione di valori numerici ad oggetti o eventi secondo regole che ci consentono di rappresentare proprietà degli oggetti ed eventi tramite le proprietà del sistema numerico utilizzo di uno strumento

MISURAZIONE SE SN Sistema empirico (SE): ciò che si vuole misurare; costituito da elementi legati tra loro da relazioni Sistema numerico (SN): ciò che serve per misurare; esprime mediante i numeri le relazioni esistenti nel sistema empirico

MISURAZIONE Occorre tenere presente che ad ogni misura è associato sempre un errore Il punteggio osservato si deve a: Il livello del soggetto nella caratteristica (V) Circostanze casuali, o errore casuale di misura (E) X V + E X misura rilevata V parte vera E errore: fluttuazioni casuali (sempre) costante o sistematico (talvolta).

MISURAZIONE - 1 L errore casuale di misurazione E è responsabile dell imprecisione del punteggio X. Quando E0, XV, e la misura è perfettamente attendibile (precisa) È fondamentale sapere quanto è precisa una misurazione o un test. Dobbiamo conoscere quindi V e E X lo osserviamo, invece V ed E non li osserviamo direttamente: vanno stimati

MISURAZIONE 2 Facciamo attenzione a comprendere meglio il significato della porzione vera del punteggio. V V A + V B +... S X V A + V B +... S + E V A parte vera del costrutto A (quello che vogliamo misurare) V B parte vera del costrutto B (che non volevamo misurare) S altre fonti sistematiche, anche di errore

Attendibilità Affinché una misura sia valida, si richiede che essa misuri sistematicamente qualcosa. L attendibilità rappresenta la precisione di una misura (ciò che nella misura non è errore). L attendibilità è definibile come il rapporto fra la componente sistematica e la variabilità totale della misura. ρ V V + E

Primo accenno alla validità Una misura è valida se coglie il concetto che essa tende rilevare. La validità è il limite superiore dell attendibilità. V A V A + V + S... B + E Accertare la validità è più difficile che accertare l attendibilità.

Assunzioni sull attendibilità L errore di misurazione è una variabile aleatoria, distribuita normalmente. Ciò significa che ci si aspetta tanti piccoli errori, vicini allo zero, e pochi errori di una certa entità. La media degli errori di misurazione è uguale a 0. Gli errori casuali tendono ad annullarsi all aumentare del numero di misurazioni. Più misure facciamo, più precisa sarà la misurazione. I punteggi veri e gli errori di misurazione sono tra loro indipendenti. La varianza di errore è uguale ad ogni livello del punteggio vero: Facciamo lo stesso tipo di errore per punteggi veri bassi, e per punteggi veri alti.

Assunzioni sull attendibilità Gli errori di misurazione compiuti in due somministrazioni indipendenti sono fra loro indipendenti. Se queste assunzioni sono vere, è possibile utilizzare diversi metodi per misurare la varianza vera e la varianza d errore, e da queste calcolare l attendibilità come rapporto: ρ V V + E

Vari genere di attendibilità 1) Metodo del Test-Retest: Si somministra il test al tempo T1 ed al tempo T2 e si calcola la correlazione tra i punteggi. Questo metodo non necessità di ulteriori specificazioni. Basta saper calcolare la r di Pearson tra due serie di punteggi. 2) Metodo delle Forme Parallele: Si somministrano due versioni equivalenti del test (stessa media e stessa dev. St.) Quindi si calcola la correlazione tra i le due forme come stima dell attendibilità test-retest. 3) Metodo dello Split-Half: Si somministra il test in un unico tempo T1. Si divide il test a metà e si considerano le due metà come forme parallele (stessa media e stessa dev. St.) Quindi si calcola la correlazione tra le due metà come stima dell attendibilità test-retest. 4) Metodo della Coerenza Interna: Si somministra il test in un unico tempo T1. Ogni item viene considerato un test a se stante. Si stima (con apposite formule) la correlazione media tra tutti gli item. Questa è una stima dell attendibilità

Test-retest PG T1 PG T2 ss1 11 12 ss2 15 14 ss3 17 14 ss4 20 19 ss5 20 21 ss6 25 27 ss7 22 18 ss8 21 24 ss9 34 31 ss10 38 36 ss11 40 37 Media 23,91 23,00 Dev St. 9,03 8,39 Svolgimento: Cov (PG T1, PG T2) 73.45 Dev.St.(PG T1) 9.03 Dev.St.(PG T2) 8.39 Rtt 73.45/ 9.03 8.39 73.45 / 75.74.96 r tt Cov (PG T1, PG T2) Dev.St.(PG T1) Dev.St.(PG T2)

Interpretazione attendibilità test-retest Buoni coefficienti test-retest dovrebbero superare.80 (livello piuttosto esigente). Il coefficiente test-retest cala all aumentare del tempo trascorso fra le rilevazioni. Il coefficiente test-retest è interpretabile se si assume che il concetto misurato non si modifichi nel tempo

Forme parallele Il problema principale è quello di verificare che le due forme siano effettivamente parallele. Ciò significa verificare che le due forme abbiano la stessa media e la stessa varianza. Prendiamo i seguenti dati: T1 Forma A T2 Forma B ss1 11 12 ss2 15 14 ss3 17 14 ss4 20 19 ss5 20 21 ss6 25 27 ss7 22 18 ss8 21 24 ss9 34 31 ss10 38 36 ss11 40 37 Media 23,91 23,00 Dev St. 9,03 8,39 Svolgimento: t-test sulle due medie t sp 1.3; Gdl10; t cr 2,23 Le medie sono uguali. Fare Test F sulle due varianze F sp 1.15, gdl 10,10 F cr 2.97 Le varianze sono uguali. Quindi r tt.96

Split-half Prendiamo i seguenti dati di un test di 10 item somministrato a 11 soggetti: Item 1 2 3 4 5 6 7 8 9 10 Sogg. 1 1 0 1 1 0 1 0 1 1 1 2 0 0 1 0 1 1 0 1 0 0 3 1 1 0 1 1 1 1 0 1 1 4 0 0 1 0 0 1 0 1 0 0 5 1 0 1 1 0 1 0 0 1 1 6 1 1 0 0 1 0 1 1 0 0 7 0 0 1 0 0 0 1 0 0 0 8 1 1 1 1 0 1 0 0 0 0 9 0 1 0 0 1 1 1 0 0 1 10 1 0 0 1 0 0 1 0 0 1 11 1 1 1 0 1 0 0 1 1 0 Sommiamo gli item pari e dispari Sogg. Item Dispari Item Pari 1 3 4 2 2 2 3 4 4 4 1 2 5 3 3 6 3 2 7 2 0 8 2 3 9 2 3 10 2 2 11 4 2 Media 2,55 2,45 Dev.St. 0,89 1,08 Svolgimento: Verificare che le due metà abbiano la stessa media e la stessa varianza. t-testns, F- testns: OK Calcolare la correlazione tra le due metà.40

Interpretazione coefficiente split-half L attendibilità dipende molto dalla lunghezza del test la correlazione split-half è una sottostima dell attendibilità Infatti la divisione del test a metà ne dimezza la lunghezza Ci sono delle formule che permettono di correggere tale sottostima.

Formula di Spearman-Brown Rn xx nrtt 1+ ( n 1) r tt Si chiama formula profetica Rn xx attendibilità del test allungato. Nn il numero delle volte che il test viene allungato o abbreviato. Si ottiene come rapporto tra numero degli item finale su numero degli item iniziali. r tt attendibilità iniziale. Applicazione al problema precedente: Rn xx,40; n 10/5 2 Rn xx 1+ 2.40 (2 1).40.80 1.40.58

Split-half La formula di RULON σ σ 2 differenza Rxx 1 2 totale R xx 1.17 1 1.43 2.73 Sogg. Item Dispari Item Pari Differenza Totale Pari+Dispari 1 3 4-1 7 2 2 2 0 4 3 4 4 0 8 4 1 2-1 3 5 3 3 0 6 6 3 2 1 5 7 2 0 2 2 8 2 3-1 5 9 2 3-1 5 10 2 2 0 4 11 4 2 2 6 Media 2,55 2,45 0,09 5,00 Dev.St. 0,89 1,08 1,08 1,65 Varianza 0,79 1,16 1,17 2,73.57

Split-half La formula di GUTTMAN 2 2 σ A + σ B 2 1 0.79 + 1.16 R 2 1 2(1.71). 58 σ xx totale 2.73 Rxx 2 Sogg. Item Dispari (A) Item Pari (B) Differenza Totale Pari+Dispari 1 3 4-1 7 2 2 2 0 4 3 4 4 0 8 4 1 2-1 3 5 3 3 0 6 6 3 2 1 5 7 2 0 2 2 8 2 3-1 5 9 2 3-1 5 10 2 2 0 4 11 4 2 2 6 Media 2,55 2,45 0,09 5,00 Dev.St. 0,89 1,08 1,08 1,65 Varianza 0,79 1,16 1,17 2,73

Coerenza interna Si utilizza per item dicotomici o politomici Si utilizza solo per item dicotomici Il coefficiente α di Cronbach K σ α 1 K 2 1 σ 2 i totale Il coefficiente KR-20 K p q i i KR20 1 2 K 1 totale σ

Item 1 2 3 4 5 6 7 8 9 10 Totale Sogg. 1 1 0 1 1 0 1 0 1 1 1 7 2 0 0 1 0 1 1 0 1 0 0 4 3 1 1 0 1 1 1 1 0 1 1 8 4 0 0 1 0 0 1 0 1 0 0 3 5 1 0 1 1 0 1 0 0 1 1 6 6 1 1 0 0 1 0 1 1 0 0 5 7 0 0 1 0 0 0 1 0 0 0 2 8 1 1 1 1 0 1 0 0 0 0 5 9 0 1 0 0 1 1 1 0 0 1 5 10 1 0 0 1 0 0 1 0 0 1 4 11 1 1 1 0 1 0 0 1 1 0 6 Media 0,64 0,45 0,64 0,45 0,45 0,64 0,45 0,45 0,36 0,45 5,00 Dev.St. 0,48 0,50 0,48 0,50 0,50 0,48 0,50 0,50 0,48 0,50 1,65 Varianza 0,23 0,25 0,23 0,25 0,25 0,23 0,25 0,25 0,23 0,25 2,73 Item 1 2 3 4 5 6 7 8 9 10 Totale Sogg. 1 1 0 1 1 0 1 0 1 1 1 7 2 0 0 1 0 1 1 0 1 0 0 4 3 1 1 0 1 1 1 1 0 1 1 8 4 0 0 1 0 0 1 0 1 0 0 3 5 1 0 1 1 0 1 0 0 1 1 6 6 1 1 0 0 1 0 1 1 0 0 5 7 0 0 1 0 0 0 1 0 0 0 2 8 1 1 1 1 0 1 0 0 0 0 5 9 0 1 0 0 1 1 1 0 0 1 5 10 1 0 0 1 0 0 1 0 0 1 4 11 1 1 1 0 1 0 0 1 1 0 6 p(1) 0,64 0,45 0,64 0,45 0,45 0,64 0,45 0,45 0,36 0,45 5,00 q(0) 0,36 0,55 0,36 0,55 0,55 0,36 0,55 0,55 0,64 0,55 1,65 pxq 0,23 0,25 0,23 0,25 0,25 0,23 0,25 0,25 0,23 0,25 2,73

Utilizzando i dati precedenti 10 9 10 9 Il coefficiente α di Cronbach K σ α 1 2 K 1 σ.23 4 +.25 6 1 2.73 1 2.42 2.73 2 i totale.1261 Il coefficiente KR-20 KR 20 10 9 10 9 K 1 p q 2 1 i i K σ totale.23 4 +.25 6 1 2.73 1 2.42 2.73.1261

Per item politomici Item 1 2 3 4 5 6 7 8 9 10 Totale Sogg. 1 4 6 2 5 7 6 4 2 4 1 41 2 1 7 6 4 7 4 6 1 1 1 38 3 2 7 6 5 8 5 5 3 2 4 47 4 4 8 8 8 9 6 6 7 9 4 69 5 1 9 8 6 8 5 5 1 1 1 45 6 3 3 2 3 6 4 5 2 2 1 31 7 4 7 5 7 9 9 8 6 6 6 67 8 1 8 6 6 9 6 7 1 1 1 46 9 6 8 8 8 10 7 10 8 8 6 79 10 1 5 2 3 6 3 3 3 1 1 28 11 1 8 5 6 9 4 8 1 2 1 45 Media 2,55 6,91 5,27 5,55 8,00 5,36 6,09 3,18 3,36 2,45 48,73 Dev.St. 1,75 1,70 2,37 1,75 1,34 1,69 2,02 2,60 2,98 2,11 16,18 Varianza 3,07 2,89 5,62 3,07 1,80 2,85 4,09 6,76 8,85 4,47 261,82 K σ α 1 2 K 1 σ 11 10 1 43,49 261,82 2 i totale 11 10 ( 1,17). 91

Interpretazione α Valore minimo accettabile:.70 (se abbiamo pochissimi item, può andar bene.60) È corretto calcolare α quando gli item della scala misurano tutti una caratteristica omogenea Allo stesso tempo, se gli item sono fra loro troppo simili, α sarà molto elevata, ma la validità della misura può risultare bassa In questi casi rischiamo di avere una misura iperspecifica