il cheating nel sistema italiano di valutazione

Documenti analoghi

Incontro Gruppo RAV lettura dati INVALSI. Liceo Scientifico «A. Volta», 19 maggio 2015

Stefania Pozio. Le prove INVALSI di matematica: il confronto con le indagini internazionali.

Principi e strumenti dell autovalutazione della scuola. Milano, 2013

ANALISI QUALITATIVA RISULTATI PROVE SNV INVALSI 2011/2012

Istituto Comprensivo Ivrea 1

La formazione delle classi e gli

SERVIZIO NAZIONALE DI VALUTAZIONE RILEVAZIONE APPRENDIMENTI a.s. 2009/10 classi II e V primaria e. I secondaria di primo grado

RELAZIONE PROVE INVALSI 2013 Introduzione

I risultati sono trasmessi attraverso tabelle comparative nonché grafici. La scelta è caduta su quelli qui riportati in quanto ritenuti i più

Capitolo 12 La regressione lineare semplice

SERVIZIO NAZIONALE DI VALUTAZIONE

Preprocessamento dei Dati

Gli esiti della rilevazione INVALSI del 2013 nell Istruzione e formazione professionale in Trentino e in altre Regioni italiane.

Verifica di ipotesi e intervalli di confidenza nella regressione multipla

ANALISI DELLE FREQUENZE: IL TEST CHI 2

Risultati prove invalsi a.s. 2013/2014

STATISTICA IX lezione

Le politiche attive del lavoro e il valore della formazione

L'ancoraggio nelle rilevazioni internazionali sugli apprendimenti. L indagine OCSE PISA. Laura Palmerio INVALSI

ANALISI REPORT INVALSI 2015

LA CORRELAZIONE LINEARE

Che cosa e come valutano le prove di matematica e con quali risultati. nell A.S

I quattro ordini di scuola a confronto Elisabetta Malaguti

Metodi Matematici e Informatici per la Biologia Maggio 2010

Cosa ci dicono (e non dicono) i dati sugli apprendimenti. Tommaso Agasisti

COME STA LA SCUOLA ITALIANA? ECCO I DATI DEL RAPPORTO INVALSI 2014

LA DISTRIBUZIONE DI PROBABILITÀ DEI RITORNI AZIONARI FUTURI SARÀ LA MEDESIMA DEL PASSATO?

Ricerca di outlier. Ricerca di Anomalie/Outlier

Esami di Stato II ciclo sessione d esame 2010

La gestione dell incertezza nella Supply Chain: la scorta di sicurezza. La scorta di sicurezza nella supply chain 1

LE PRIORITÀ E GLI STRUMENTI DEL SISTEMA NAZIONALE DI VALUTAZIONE LA STRUTTURA DEL RAV Tivoli, 10 marzo 2015

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO

Indagine Ocse Pisa e altre Ricerche Internazionali

La valutazione degli apprendimenti nelle indagini nazionali ed internazionali

Relazioni statistiche: regressione e correlazione

Librerie digitali. Video. Gestione di video. Caratteristiche dei video. Video. Metadati associati ai video. Metadati associati ai video

Regressione Mario Guarracino Data Mining a.a. 2010/2011

AND NON CAP WEIGHTED PORTFOLIO

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

Da dove siamo partiti

BASE DI DATI: sicurezza. Informatica febbraio ASA

Indagine Confindustria sul Mercato del Lavoro

La prova di matematica nelle indagini IEA TIMSS e

Griglia di correzione Fascicolo di Italiano Prova Nazionale anno scolastico

Rapporto dal Questionari Insegnanti

I dottori di ricerca a Milano

Laboratorio di Usabilità per attrezzature medicali

Rapporto dal Questionario Insegnanti. Istituto Comprensivo. RMIC DON LORENZO MILANI - Via Marco Aurelio N 2 - GUIDONIA MONTECELIO RMIC897006

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)

ISTITUTO COMPRENSIVO NETTUNO I VALUTAZIONE INTERMEDIA

Il profiling dei disoccupati basato sull occupabilità: un alternativa di targeting in assenza di evidenza sull efficacia degli interventi

Verdi Cafaro ISTITUTO COMPRENSIVO STATALE Scuola dell Infanzia, Primaria e Secondaria di Primo Grado

VERIFICA DELLE IPOTESI

Dalla Diagnosi Funzionale al PEI. Valutazione delle abilità attraverso l osservazione del comportamento e i test

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

IL CONTO CORRENTE. Anno scolastico

Aprire WEKA Explorer Caricare il file circletrain.arff Selezionare random split al 66% come modalità di test Selezionare J48 come classificatore e

Abilità Informatiche A.A. 2010/2011 Lezione 9: Query Maschere Report. Facoltà di Lingue e Letterature Straniere

La dispersione dei prezzi al consumo. I risultati di un indagine empirica sui prodotti alimentari.

Come archiviare i dati per le scienze sociali

LEZIONE n. 5 (a cura di Antonio Di Marco)

P PROCEDURA PER L ACCESSO AI DATI

LA GUIDA PERICOLOSA IN ADOLESCENZA: FUNZIONI E FATTORI DI PROTEZIONE

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco

OSSERVAZIONI TEORICHE Lezione n. 4

Risultati sul Sistema Scolastico Campano

ALLEGATO 1 Analisi delle serie storiche pluviometriche delle stazioni di Torre del Lago e di Viareggio.

Nella prima parte del corso l attenzione è venuta appuntandosi sui problemi inerenti la valutazione di investimenti aziendali e di strumenti

PROGETTO L.I.R.E.S. (LETTURA INTEGRATA RISULTATI ESITI SCOLASTICI) LETTURA INTEGRATA FRA RETI DI SCUOLE SULLA VALUTAZIONE

A. TERRENI, M.L. TRETTI, P.R. CORCELLA, C. CORNOLDI, P.E. TRESSOLDI IPDA IDENTIFICAZIONE PRECOCE DELLE DIFFICOLTA DI APPRENDIMENTO (2002) Descrizione

Strutture. Strutture e Unioni. Definizione di strutture (2) Definizione di strutture (1)

Lo studio di Benchmarking sui costi operativi condotto dall ANEA

Leasing secondo lo IAS 17

Rilevazione degli apprendimenti di italiano e matematica nelle classi II e V della scuola primaria.

ALLEGATO 1. ALL. 1 NEWSLETTER N aicq sicev

Limitazioni cognitive e comportamento del consumatore (Frank, Capitolo 8)

Corso di Psicometria Progredito

Repertorio di prove personalizzate proposte dalle scuole. agli studenti con disabilità intellettiva

Controlli Automatici T. Trasformata di Laplace e Funzione di trasferimento. Parte 3 Aggiornamento: Settembre Prof. L.

Università degli Studi di Ferrara - A.A. 2014/15 Dott. Valerio Muzzioli ORDINAMENTO DEI DATI

COME COSTRUIRE UNA UDA: INDICAZIONI METODOLOGICHE

Statistica. Lezione 6

7.2 Indagine di Customer Satisfaction

REGIONE CALABRIA Assessorato Cultura e Beni Culturali

LA REVISIONE LEGALE DEI CONTI La comprensione

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Più processori uguale più velocità?

LE ANALISI DI BILANCIO COMPLESSO DI TECNICHE DI TIPO QUANTITATIVO, BASATO SU UNO O PIÙ

La compilazione del RAV sezioni 4 e 5. Tivoli 14 aprile 2015

Introduzione all Information Retrieval

7.2 Indagine di Customer Satisfaction

Safety Speed Monitoring. Considerazioni sui sensori in applicazioni per il controllo della velocità di sicurezza

Pensiero logico, lettura, Autori: Sestili, Moalli, Vianello

PROVINCIA DI VENEZIA - MONITORAGGIO TRAFFICO

87083 Amministrazione e controllo. Fondata sulle informazioni tratte dalla contabilità

Analisi della performance temporale della rete

Laboratorio di Pedagogia Sperimentale. Indice

Energia nelle reazioni chimiche. Lezioni d'autore di Giorgio Benedetti

3. Asimmetrie informative

Transcript:

il cheating nel sistema italiano di valutazione metodi di rilevamento del cheating basato sui pattern di risposta non usuali ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ ~ i determinanti dei comportamenti opportunistici degli insegnanti workshop metodi di identificazione, analisi e trattamento del cheating 8 febbraio 2013 gerard ferrer-esteban

contenuti il rilevamento del cheating il fenomeno del cheating un metodo basato sui pattern non usuali comparazione tra metodi proposte sul metodo i determinanti del cheating dati e modello empirico risultati: incentivi e deterrenti proposte per prevenire il cheating

il fenomeno del cheating the more any quantitative social indicator is used for social decision-making, the more subject it will be to corruption pressures and the more apt it will be to distort and corrupt the social processes it is intended to monitor (campbell, 1976).. fenomeno multiforme. cheating e accountability. ricerca sul cheating

rilevare il cheating rischio nell individuazione del cheating: metodi basati sui livelli e deviazione delle performance ** errore tipo i: α o falsi positivi (quando si segnala come cheater una classe che non ha barato) ** errore tipo ii: β o falsi negativi (quando non si identifica una classe che ha barato) il caso dell indice invalsi (quintano, castellano, longobardi, 2009)

metodo Indicatore per individuare il cheating (Jacob & Levitt, 2003). indicatore di sequenze di risposta sospette (3 misure combinate). pattern più generali di similarità tra le risposte degli studenti (correlazione delle risposte del test). grado di varianza della correlazione delle risposte tra gli item. casi nei quali gli studenti mancano item facili e rispondono correttamente agli item difficili

metodo misura 1 pattern più generali di similarità tra le risposte degli studenti 1) calcolo dei residui per ogni possibile risposta che lo studente potrebbe aver fornito in ogni item e jisc 0 1- J J e j 1 e j 1 e ˆ x e ˆ x j j ˆ x s ˆ x j s j s s if j k if j k 2) somma dei residui di ogni risposta j tra gli studenti dentro della classe c dove e jisc è il residuo per la risposta j nell item I per lo studente s nella classe c (4 residui per item) j è il numero di possibili risposte (2 o 4) x è il vettore che comprende caratteristiche studenti, score passati e futuri e background e jic e jisc s

metodo misura 1 3) somma dei quadrati dei residui delle 4 possibili risposte di ogni singolo item aggregato a livello classe 4) media di classe di questa varianza v ic j e ns 2 jic c M1 c v c i v ni ic dove ni è il numero di item nel test

metodo misura 2 varianza nel grado di correlazione tra gli item 1) in base alla misura di varianza tra le risposte calcolata precedentemente (m2), calcoliamo M2 c 2 v c i ( v ic ni v c ) 2

metodo misura 3. gli studenti mancano item facili e rispondono correttamente agli item difficili. misura in cui il pattern di risposta di uno studente è diverso da un altro studente con lo stesso score aggregato A 1) calcolare la frazione q i di studenti in ogni livello aggregato di performance che ha risposto agli item correttamente q A i s z: A z ns isc A A q s q isc è uguale a 1 se lo studente s della classe c ha risposto il item i correttamente A s è uguale alla performance aggregata dello studente s al test

metodo misura 3 1) misura in cui il pattern di risposta dello studente s diferisce del pattern di risposta degli altri studenti con lo stesso score aggregato Z sc q i isc q A i 2 2) sottrazione della deviazione media degli studenti con lo stesso score aggregato A Z e somma degli studenti dentro della classe M3 c Z s sc Z A

Density.2.4.6.8 0 metodo indicatore di sequenze di risposta sospette: sintesi. due indicatori compositi: ** somma dei quadrati dei rank value delle 3 misure CHEAT cbt 2 2 2 ( rank _ M1c, b, t ) ( rank _ M 2c, b, t ) ( rank _ M3c, b, t ) ** somma dei valori normalizzati delle 3 misure 0 5 10 15 Standardized values of (composite)

scuole comparazione tra metodi simulazione con un dataset di scuole N=100 estratte in modo casuale SNV 2010-11 ranking metodo basato ranking metodo invalsi sui pattern di risposta non usuali misura 1 misura 2 misura 3 potenziali errori di tipo I: falsi positivi aaaaeeeecccc 1 1 6,9745 5,3506 33,4616 bbbbffffdddd 2 2 6,4295 3,1595 27,0450 ccccaaaaeeee 3 7 1,8111 0,4029 25,3399 ddddbbbbffff 4 49 1,0263 0,0330-0,0927 eeeeccccaaaa 5 3 4,2707 7,4876 14,2406 ffffddddbbbb 6 11 1,6190 0,2620 3,2799 aaaaeeeecccc 7 28 0,8341 4,5483-1,8228 bbbbffffdddd 8 23 0,6709 2,2601 5,0230 ccccaaaaeeee 9 5 4,9993 2,4181 3,0132 ddddbbbbffff 10 33 0,8100 0,0979-2,0792 aaaaeeeecccc 11 69 0,4955 0,0190-4,2403 bbbbffffdddd 12 64 0,4987 0,0415-3,2800 ccccaaaaeeee 13 15 1,0859 0,1402 5,5015 ddddbbbbffff 14 41 0,5575 0,0652 2,0642 eeeeccccaaaa 15 29 1,4479 0,0642-3,0764 ffffddddbbbb 16 6 15,0514 0,8218 2,4843 aaaaeeeecccc 17 58 0,4832 0,0455-1,7432 bbbbffffdddd 18 31 0,9312 0,0700-0,9873 ccccaaaaeeee 19 4 5,8427 0,6242 6,3130

comparazione tra metodi simulazione con un dataset di scuole N=100 estratte in modo casuale SNV 2010-11 scuole ranking metodo basato ranking metodo invalsi sui pattern di risposta non usuali misura 1 misura 2 misura 3 potenziali errori di tipo II: aaaaeeeecccc 1 1 6,9745 5,3506 33,4616 bbbbffffdddd falsi negativi 2 2 6,4295 3,1595 27,0450 ccccaaaaeeee 5 3 4,2707 7,4876 14,2406 ddddbbbbffff 19 4 5,8427 0,6242 6,3130 eeeeccccaaaa 9 5 4,9993 2,4181 3,0132 ffffddddbbbb 16 6 15,0514 0,8218 2,4843 aaaaeeeecccc 3 7 1,8111 0,4029 25,3399 bbbbffffdddd 70 8 3,8564 0,0913 4,6904 ccccaaaaeeee 60 9 3,1581 0,0806 6,1199 ddddbbbbffff 22 10 3,1868 0,0887 2,6583 aaaaeeeecccc 6 11 1,6190 0,2620 3,2799 bbbbffffdddd 39 12 2,7988 0,0812 0,9719 ccccaaaaeeee 29 13 1,2479 0,1537 12,6992 ddddbbbbffff 69 14 2,3593 0,0475 15,2664 eeeeccccaaaa 13 15 1,0859 0,1402 5,5015 ffffddddbbbb 32 16 1,3483 0,0936 1,7697 aaaaeeeecccc 20 17 1,9746 0,0619 0,8779 bbbbffffdddd 43 18 1,3110 0,0614 9,6332 ccccaaaaeeee 72 19 1,3343 0,3014-0,1219 ddddbbbbffff 30 20 1,7717 0,0768-0,1801

comparazione tra metodi coincidenza tra metodi delle classi rilevate come cheater metodo basato sui pattern di risposta non usuali Classi N = 3361 non sospette sospette potenziali p95 metodo invalsi non sospette 3011 136 falsi positivi 84,6% sospette 181 33 falsi negativi 80,5% potenziale errore di tipo I: falsi positivi potenziale errore di tipo II: falsi negativi p90 metodo invalsi non sospette sospette potenziali non sospette 2334 199 falsi positivi 83,3% sospette 690 138 falsi negativi 59,1%

proposte sul metodo proposte per la correzione del cheating dopo lo svolgimento delle prove (prima della correzione alle scuole) sul metodo *** metodi basati sulla logica del guadagno cognitivo (fluttuazioni dei punteggi non aspettati nel tempo) necessità di controllare i fattori esogeni *** metodi basati sulla probabilità condizionata per la rilevazione dei pattern di risposta non usuali validazione del metodo *** confronto di metodi *** testare il metodo tramite simulazioni per minimizzare il rischio di errore di tipo I e II

oltre ai divari territoriali: i determinanti del cheating

dati survey servizio nazionale di valutazione (snv): prove invalsi anno scol 2010-2011 discipline matematica (43 item) e italiano (81 item) studenti 67174 classi 3361 scuole 739

modello empirico oltre ai divari territoriali: i determinanti del cheating cheat cs ( D 5 T cs A cs c 1 r ) S 6 s C 2 cs cs D 3 cs A 4 cs dove cheat cs è il livello di cheating della classe c nella scuola s T r è la variabile di ubicazione territoriale regione- della scuola C cs è un vettore della composizione della classe, relativa alle caratteristiche sociodemografiche degli studenti SES, genere, immigration background e ripetenti D cs è un vettore relativo ai fattori che possono attuare come deterrenti del cheating, e contiene dummies sul controllo durante lo svolgimento delle prove Invalsi A cs è una proxy di strategia di cheating non basata sull alterazione dei risultati delle prove, è rappresentata dallo share di assenze degli studenti nello svolgimento delle prove P s è un vettore che contiene dei fattori a livello di scuola che possono avere un ruolo nel spiegare il cheating: età media degli insegnanti e la dimensione media delle classi (controllo cheating studenti) La regressione controlla i termini di interazione D cs A cs tra le dummies dei deterrenti (controllori in classe) e il livello di assenza degli studenti nelle prove Invalsi Ɛ cs è il error term

risultati oltre ai divari territoriali: i determinanti del cheating (1) (2) (3) (4) (5) (6) CHEAT CHEAT CHEAT CHEAT CHEAT CHEAT SES agregato per classe -0.401 ** -0.404 *** -0.246 *** -0.288 *** -0.304 *** -0.296 *** % donne / classe -0.00331-0.00302-0.00287-0.00276-0.00266-0.00234 % stud immig 1 gen/ classe -0.00961 *** -0.00953 *** -0.00561 * -0.00511 * -0.00578 ** -0.00561 ** % stud immig 2 gen/ classe -0.0116 *** -0.0124 *** -0.0106 *** -0.0103 *** -0.0110 *** -0.0111 *** % stud ripetenti / classe -0.00791 * -0.00782 * -0.00904 ** -0.00925 ** -0.00823 ** -0.00819 ** Controllo in classe (ref: non controllo) -0.420 *** -0.409 *** -0.437 *** -0.424 *** -0.297 *** Controllo test high-stake (ref: non cont) -0.423 *** -0.264 *** -0.271 *** -0.298 *** -0.276 ** Assenti alla prova di matematica 0.0994 * 0.0973 * 0.0962 * 0.102 * Età media degli insegnanti 0.0180 0.0222 * 0.0224 * Class size 0.0285 ** 0.0244 * 0.0246 * Controllo in classe x strategia cheater -0.103 * Controllo in classe x strategia cheater -0.173 * Region fixed effect Yes Yes _cons 0.375 ** 0.429 ** 0.241 ** -1.277 ** -1.324 ** -1.368 ** N 3361 3361 3361 3361 3361 3361

risultati oltre ai divari territoriali: i determinanti del cheating (1) (2) (3) (4) (5) (6) CHEAT CHEAT CHEAT CHEAT CHEAT CHEAT più bassa è SES agregato per classe -0.401 ** la composizione -0.404 *** sociale -0.246 *** della classe, -0.288 *** più alta è la -0.304 *** -0.296 *** tendenza a fare cheating % donne / classe -0.00331-0.00302-0.00287-0.00276-0.00266-0.00234 % stud immig 1 gen/ classe -0.00961 *** -0.00953 *** -0.00561 * -0.00511 * -0.00578 ** -0.00561 ** l aggregazione % stud immig 2 gen/ classe -0.0116 *** di studenti -0.0124 *** immigrati -0.0106 *** e studenti ripetenti -0.0103 *** in -0.0110 *** -0.0111 *** classe è associato a fare meno cheating % stud ripetenti / classe -0.00791 * -0.00782 * -0.00904 ** -0.00925 ** -0.00823 ** -0.00819 ** il controllo in classe è un Controllo in classe (ref: non controllo) -0.420 *** efficace deterrente -0.409 *** del cheating, -0.437 *** anche -0.424 *** -0.297 *** nelle scuole in cui i test sono high-stake per gli insegnanti Controllo test high-stake (ref: non cont) -0.423 *** -0.264 *** -0.271 *** -0.298 *** -0.276 ** le classi che tendono a barare svolgono Assenti alla prova di matematica 0.0994 * anche strategie 0.0973 * 0.0962 * 0.102 * parallele di cheating non basate sull alterazione dei test Età media degli insegnanti 0.0180 0.0222 * 0.0224 * Class size 0.0285 ** 0.0244 * 0.0246 * Controllo in classe x strategia cheater la presenza di osservatori è un deterrente efficace anche per -0.103 * Controllo in classe x strategia cheater controbilanciare l effetto di altre misure di cheating -0.173 * Region fixed effect Yes Yes _cons 0.375 ** 0.429 ** 0.241 ** -1.277 ** -1.324 ** -1.368 ** N 3361 3361 3361 3361 3361 3361

proposte prevenzione del cheating durante lo svolgimento delle prove è evidente che il deterrente più efficace per contenere il cheating è la presenza di un controllore durante lo svolgimento delle prove ma è anche il più insostenibile finanziariamente approccio basato sul contrasto di interessi tra gli insegnanti di diversi gradi: *** in un sistema di valutazione basato sul valore aggiunto, gli insegnanti sarebbero i controllori ideali per i test dei livelli inferiori *** se i livelli di apprendimento misurati in uscita dalle scuole elementari fossero sovrastimati a causa del cheating, sarebbe difficile, per gli insegnanti della scuola media, creare valore aggiunto vantaggio: le risorse disponibili localmente libererebbero inoltre i fondi per i controlli al livello superiore

grazie per l attenzione