ANALISI AFFIDABILITÀ SCALE

Documenti analoghi
MISURAZIONE. Sistema empirico (SE): ciò che si vuole misurare; costituito da elementi legati tra loro da relazioni

Matrici di Raven (PM47)

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

Teoria e tecniche dei test

Caratteristiche di un buon test

Distribuzioni e inferenza statistica

Statistica. Alfonso Iodice D Enza

DOCIMOLOGIA 2. Gabriella Agrusti Università degli Studi Roma Tre Settima lezione

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Statistica. Alfonso Iodice D Enza

ESPERIENZA DI LABORATORIO N 1. 1) Misura diretta mediante tester della resistenza elettrica dei resistori R1, R2, R3 e calcolo degli errori di misura.

Capitolo 2 Le misure delle grandezze fisiche

FISICA. Elaborazione dei dati sperimentali. Autore: prof. Pappalardo Vincenzo docente di Matematica e Fisica

Relazione di fisica ESPERIMENTO N 1

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

Grandezze fisiche e loro misura

Esercitazioni di Statistica

FONDAMENTI DI PSICOMETRIA - 8 CFU

la struttura di una teoria

Grandezze fisiche e loro misura

Grandezze fisiche e loro misura

Elementi di Psicometria con Laboratorio di SPSS 1

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Statistica multivariata Donata Rodi 17/10/2016

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

Corso di Matematica per la Chimica. Dott.ssa Maria Carmela De Bonis a.a

Indice. Prefazione all edizione italiana. Gli Autori e i Curatori dell edizione italiana PARTE PRIMA ASPETTI GENERALI

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

I TEST STATISTICI. dott.ssa Gabriella Agrusti

Dati sperimentali Nella serie di 10 misurazioni di tempo effettuate, si sono ottenuti i seguenti valori espressi in secondi:

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Corso di Psicometria Progredito

standardizzazione dei punteggi di un test

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

La scala di ansia e depressione di Goldberg (1988) è un semplicissimo strumento diagnostico, elaborato specificamente per indagare la probabilità

Note sulla probabilità

Caso 1: Estroversione: Il mio tratto di estroversione fa si che io risponda in un certo modo alle domande del test => Analisi fattoriale

Metodi e tecniche di analisi dei dati nella ricerca psico-educativa Parte III

Aspettative e soddisfazione degli studenti universitari. Un indagine empirica esplorativa Bruno Busacca, Giuseppe Bertoli e Ottavia Pelloni

Elementi di Statistica

Strumenti di indagine per la valutazione psicologica

DA GIOVE E GIUNONE A BARBIE E KEN (LE CHIAVI DELLA CITTÀ): VALUTAZIONE DAVIDE DÈTTORE

Incertezza di Misura: Concetti di Base

Elementi di Psicometria con Laboratorio di SPSS 1

Metodo dei minimi quadrati e matrice pseudoinversa

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Teorema del limite centrale TCL

Distribuzione Gaussiana - Facciamo un riassunto -

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Come attribuire i punteggi M I S U R A R E

Lezione 10: Interpolazione lineare Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

Lezione n. 1 _Complementi di matematica

Schema lezione 5 Intervalli di confidenza

Il modello di regressione lineare multipla. Il modello di regressione lineare multipla

Esempio di calcolo di rischio relativo

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

Teoria e tecniche dei test

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Analisi degli Errori di Misura. 08/04/2009 G.Sirri

Elementi di Psicometria

Elementi di Psicometria con Laboratorio di SPSS 1

Lezione 4 a - Misure di dispersione o di variabilità

Sistemi lineari. Lorenzo Pareschi. Dipartimento di Matematica & Facoltá di Architettura Universitá di Ferrara

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Statistica di base per l analisi socio-economica

Indice: Strategie generali Strategie specifiche Ripetizione Metodi per aumentare la validità

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

Benché apparentemente distanti fra loro i due approcci hanno aspetti comuni, i metodi di costruzione dei test sono simili e, soprattutto, entrambi

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4

Seconda Parte Specifica per la tipologia di scuola - Statistica sanitaria e Biometria - 22/07/2016

Le Derivate. Appunti delle lezioni di matematica di A. Pisani Liceo Classico Dante Alighieri

INDICE. Problemi presenti sul sito

Analisi della varianza

TEORIA DEGLI ERRORI DI MISURA, IL CALCOLO DELLE INCERTEZZE

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

CURRICOLO VERTICALE PER COMPETENZE DISCIPLINARI. Scuola Secondaria di Primo Grado Matematica -

METODO DEI MINIMI QUADRATI

Accuratezza, precisione, tipi di errori e cifre significative dei dati analitici.

La matrice delle correlazioni è la seguente:

STATISTICHE DESCRITTIVE Parte II

Statistica. Alfonso Iodice D Enza

AMOS Abilità e motivazione allo studio

Incertezza di misura concetti di base. Roberto Olmi IFAC-CNR

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente:

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Transcript:

RICERCA CONGIUNTA NEL SETTORE DELLA MISURA DELLA SODDISFAZIONE DEGLI UTENTI DEI SITI E DEI SERVIZI ON LINE DELLE AMMINISTRAZIONI E PER LA PREDISPOSIZIONE DI UNO STRUMENTO DI RILEVAZIONE DELLA CUSTOMER SATISFACTION ANALISI AFFIDABILITÀ SCALE ACCORDO DI COLLABORAZIONE TRA IL CNIPA E IL DIPARTIMENTO DI SCIENZE AZIENDALI E ECONOMICO-GIURIDICHE DELL UNIVERSITÀ DEGLI STUDI ROMA TRE Data consegna 23.04.08

ANALISI AFFIDABILITA SCALE Introduzione La fase di costruzione di un questionario si avvale dei seguenti momenti: formulazione degli item; somministrazione pilota; valutazione dell affidabilità della misurazione; validità del questionario. Il concetto di affidabilità di un questionario è relativo alla credibilità dei punteggi, ossia alla loro stabilità nel tempo e alla loro coerenza. Misurare l affidabilità di un questionario è diverso dal misurarne la validità. Questa, infatti, individua l idoneità del questionario a misurare l oggetto della rilevazione. Un questionario affidabile (o attendibile) può anche non essere valido, ma un test non affidabile è anche non valido. Per valutare l affidabilità si lavora con i punteggi ottenuti dalla somministrazione pilota del questionario. Secondo la teoria dei punteggi veri, i punteggi X ottenuti da un individuo in un item sono la somma di due componenti: il vero punteggio V e un certo errore E dovuto a fattori casuali. X=V+E Statisticamente con punteggio vero si intende il punteggio che si otterrebbe se si facesse la media di infinite misurazioni di punteggi osservati sulla stessa persona. La misura dell affidabilità è il coefficiente di affidabilità che indica il livello di fiducia (in termini di coerenza e stabilità) che è possibile riporre in un test. In termini analitici esprime il rapporto tra la varianza del punteggio reale e quella del punteggio del questionario: r xx = V v /V x e ancora r xx =V v /(V v +V E ) Segue che valutare l attendibilità di un questionario, significa interrogarsi su quale porzione di varianza sia vera e quale sia dovuta ad errori casuali. Il coefficiente di affidabilità viene interpretato come la percentuale di varianza dei punteggi dovuta alla variabilità intrinseca dei punteggi assegnati (ossia alla naturale differenza di assegnazione di punteggio tra individuo e individuo). I metodi statistici per tale misurazione sono stati messi a punto dagli psicometrici e si dividono fondamentalmente in due categorie: 1. metodi per test somministrati due volte allo stesso gruppo di persone; 2. metodi basati su una somministrazione unica.

Con metodi per test somministrati due volte allo stesso gruppo di persone si intendono quelle procedure tese a misurare la stabilità nel tempo dei punteggi. Tali metodi sono: Test-retest Forme parallele Questi metodi usano come misura dell attendibilità il coefficiente di correlazione di Pearson. cov( X ; Y ) = var( X ) var( Y ) Dove il numeratore rappresenta la media aritmetica del prodotto degli scarti di X e Y. Il denominatore è la radice del prodotto delle varianze. Il valore del coefficiente di Pearson varia tra -1 e 1 restituisce il grado di correlazione lineare tra le variabili X e Y. Più si avvicina a 1 più le variabili sono correlate positivamente (e quindi all aumentare dei valori della prima variabile corrisponde un aumento dei valori della seconda); se tende a -1 sono correlate negativamente (all aumentare dei valori della prima variabile corrisponde una di munizione dei valori della seconda); se tende allo 0 le variabili non sono linearmente correlate. In termini di affidabilità individua la porzione di varianza nei punteggi osservati che va attribuita ai punteggi reali. Passando alla sua formulazione in termini percentuali, un buon valore di correlazione, e quindi di affidabilità del questionario, si aggira intorno all 80%. Parlando di metodi basati su una somministrazione unica si fa riferimento a procedure tese a valutare la coerenza interna tra gi item di un test. Tali metodi sono: Coefficiente di affidabilità split-half Alpha di Cronbach La formula di Kuder-Richardson Metodi che richiedono due somministrazioni Test-retest Una possibile definizione di attendibilità è la capacità di uno strumento applicato a un fenomeno di produrre sempre gli stessi risultati e quindi è la stabilità dei risultati nel tempo. Gli indici che misurano tale tipo di affidabilità sono detti coefficienti di stabilità e possono essere calcolati su questionari somministrati due volte a uno stesso gruppo di individui in un determinato intervallo di tempo. I coefficienti di stabilità non sono altro che coefficienti di correlazioni di Pearson calcolati su due insiemi di risultati ottenuti dalle due somministrazioni. Poniamo X= prima somministrazione e Y= seconda somministrazione

cov( X ; Y ) = rappresenta la correlazione lineare tra la prima e la seconda rilevazione. var( X ) var( Y ) Un buon valore di affidabilità si registra per un valore del coefficiente pari all 80%. Il metodo del test-retest è utile quando le grandezze oggetto del test non sono suscettibili nel tempo, come per esempio caratteristiche della personalità, in modo da compensare l errore dovuto al gap temporale della somministrazione che rappresenta uno dei limiti più significativi di questo strumento. Forme parallele Questo metodo consiste nell elaborare forme alternative di uno stesso test che devono essere il più possibile simili in termini di contenuto e modalità di risposta. Il primo test si somministra a un primo gruppo di individui; dopo breve tempo allo stesso gruppo si somministra la seconda forma del test. A questo punto si calcola un indice di equivalenza, sempre attraverso il coefficiente di correlazione di Pearson, tra i due gruppi di risposte. Poniamo X= somministrazione del primo test e Y= somministrazione del test alternativo cov( X ; Y ) = rappresenta la correlazione lineare tra le risposte date nella prima e nella var( X ) var( Y ) seconda versione del questionario. Il vantaggio rispetto al precedente metodo è di poter avere delle rilevazioni vicine nel tempo e quindi di poter avere una valutazione in termini brevi. Tuttavia alcuni soggetti potrebbero trovare più comprensibile una delle due forme del test e, conseguentemente, la rilevazioni potrebbe essere affetta da errori dovuta alla mancanza di omogeneità. Infine oltre ai costi di una doppia somministrazione a questo metodo si aggiungono i costi di una seconda elaborazione della forma del questionario, per cui lo strumento risulta piuttosto dispendioso. Metodi basati su una somministrazione unica Questi metodi sono utili quando per motivazioni strategiche, economiche o di tempo si decide di effettuare una singola somministrazione del test. La valutazione dell attendibilità del questionario avviene misurando dei coefficienti di coerenza interna degli item, ossia il grado di correlazione ra tutti gli item d una scala. Coefficiente di affidabilità split-half

In questo caso il questionario viene diviso in due parti comparabili somministrate una sola volta a un gruppo di individui. Anche in questo caso si procede con il calcolo del coefficiente di correlazione, ma per stimare l affidabilità dell intero test, si ricorre all uso della formula di Spearman-Brown che permette di prevedere la misura del coefficiente di fedeltà del test intero e, più in generale, di prevedere l affidabilità di un test quando ne viene aumenta la lunghezza. In generale per prevedere l affidabilità di un test quando viene modificato nella lunghezza si usa il seguente coefficiente: n SB = 1 + n 1 ( ) dove: SB è il nuovo coefficiente di affidabilità (e quindi il coefficiente del test nella sua nuova lunghezza) è il coefficiente di Pearson n è il numero delle volte che il questionario ha subito modifiche e si ottiene come rapporto tra il numero degli item nuovi e quelli originali. Poiché calcolare l affidabilità dell intero questionario è equivalente a raddoppiare l affidabilità del questionario splittato il coefficiente di affidabilità split-half sarà: 2 SB = 1 + La formula di Kuder-Richardson Alcune difficoltà operative legate al precedente coefficiente hanno spinto Kuder e Richardson a elaborare una serie di formule alternative, di cui la più nota è la KR20. Tale indice è molto utile per valutare la coerenza di item dicotomici che possono essere giusti o sbagliati e funziona molto bene per item omogenei (che misurano un solo fattore), mentre per item eterogenei (che misurano cioè più caratteristiche) produce risultati meno soddisfacenti del precedente indice. = K ( p q ) KR20 1 dove: K! V X è il coefficiente KR20 KR20 K è il numero degli item del test V x è la varianza dei punteggi dell intero test ( p q) è la somma dei prodotti tra la porzione di soggetti che hanno dato la risposta esatta e la porzione di soggetti che hanno dato la risposta errata. Tale indice è stato sottoposte a molte modifiche ma la più usata e note è l alpha di Cronbach. Alpha di Cronbach

A differenza del precedente è un coefficiente molto utile per valutare la coerenza interna di item che prevedono risposte con più alternative e che riguardano la misurazioni di atteggiamenti e opinioni. La formula è la seguente: α = dove k (1 ( k 1) s s 2 x 2 j s j 2 è la varianza di ogni item, s x 2 varianza della scala intera k è il numero degli item. ) Questo coefficiente, quindi, esprime il rapporto tra la somma delle varianze degli item e la varianza totale della scala (cioè la varianza dei punteggi sommati). Per ottenere una buona coerenza interna (e quindi un alpha elevato) è necessario che la varianza dovuta ai singoli item sia piuttosto bassa in rapporto alla varianza della scala. Questo coefficiente è molto utile quando le caratteristiche che si stanno misurando sono dinamiche ossia sono suscettibili a mutazioni nel tempo perché riguardano aspetti variabili a causa di fattori esterni (opinioni o percezioni). Solitamente si tende a interpretare in questo modo i seguenti valori del coefficiente: <0.60 il questionario è inaffidabile 0.60-0.65 non desiderabile 0.65-0.70 il questionario è appena affidabile 0.70-0.80 rispettabile 0.80-0.90 molto affidabile >0.90 considerare la lunghezza della scala e valutare come cambia l affidabilità andando a eliminare alcuni item. Il presente documento è stato elaborato da: M.F. Renzi Professore ordinario Università degli studi Roma Tre L. Cappelli Professore ordinario Università di Cassino G. Mattia Professore a contratto presso l Università degli studi di Roma Tre P. Vicard Professore associato all Università degli studi di Roma Tre R. Merli Ricercatore all l Università degli studi di Roma Tre R. Guglielmetti Dottoranda all Università Sapienza di Roma F. Musella Dottoranda all Università degli studi di Roma Tre