QUALITA' DEL DATO Rilevazione statistica come processo di produzione di dati (micro,macro)

Documenti analoghi
QUALITA' DEL DATO Rilevazione statistica come processo di produzione di dati (micro,macro)

Analizzare in termini quantitativi significa basarsi su dati e non su idee o ipotesi

motivi prevalentemente personali (lavoro, studio, tempo libero, ecc.).

Valori Mancanti. Valori Mancanti. Introduzione. continua

Fonti e strumenti statistici per la comunicazione

Andrea Mancini Istat Capo Dipartimento per i censimenti e gli archivi amministrativi e statistici Montecatini terme, novembre 2012

I fenomeni collettivi sono quei fenomeni il cui studio richiede una pluralità di osservazioni.

La progettazione di un indagine statistica

Sistema Informativo Statistico. GOVERNO DEL TERRITORIO, MOBILITA E INFRASTRUTTURE INIndagine sulla qualita'percepita del trasporto su ferro 2009

Le strutture della prima infanzia in Provincia di Cagliari

Dati mancanti. Breve introduzione

zio L'INDAGINE CAMPIONARIA Metodi, disegni e tecniche di campionamento

METODOLOGIA DELLA RICERCA (STATISTICA)

REGOLAMENTO (CE) N. 698/2006 DELLA COMMISSIONE

Indice dei prezzi alla produzione dei prodotti industriali venduti sul mercato interno (E)

L azienda, i dati, le informazioni e la statistica. Lo statistico che lavora nel campo aziendale dovrebbe avere le seguenti capacità:

Gestione informatica dei dati. La qualità dei dati. Roberto Foderà Dipartimento di Giurisprudenza Corso di laurea in Economia e commercio

GOVERNO DEL TERRITORIO, MOBILITA E INFRASTRUTTURE

Capitolo 3 - Popolazione e famiglie

Statistica dei consumi alimentari e delle tendenze nutrizionali Lezione 2-02/10/2015

Risultati del monitoraggio della Qualità Percepita

Obiettivi del corso. Analisi dei dati

Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI

I. Principî di marketing... 1

BREVE RICERCA SULLA METODOLOGIA UTILIZZATA DAGLI ISTITUTI DI RICERCA "IARD" E "TONIOLO" PER LO STUDIO DELLA CONDIZIONE GIOVANILE IN ITALIA

DATI PROVENIENTI DA INDAGINI STATISTICHE

GOVERNO DEL TERRITORIO, MOBILITA E INFRASTRUTTURE

GAZZETTA UFFICIALE DELLA REPUBBLICA ITALIANA

1. variabili dicotomiche: 2 sole categorie A e B

Percorso introduttivo alla statistica ufficiale L INDAGINE STATISTICA

Richiami di inferenza statistica Strumenti quantitativi per la gestione

REGIONE MARCHE P.F. VIABILITA' REGIONALE E GESTIONE DEL TRASPORTO P.F. SISTEMI INFORMATIVI STATISTICI E DI CONTROLLO DI GESTIONE CUSTOMER SATISFACTION

Ulteriori Conoscenze di Informatica e Statistica

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Università degli Studi di Cassino. Corso di Laurea in Economia Aziendale. Corso di. Statistica. Docente: Simona Balzano.

Il censimento continuo e l archivio di microdati economici demografici e sociali

REGIONE MARCHE P.F. VIABILITA' REGIONALE E GESTIONE DEL TRASPORTO P.F. SISTEMI INFORMATIVI STATISTICI E DI CONTROLLO DI GESTIONE CUSTOMER SATISFACTION

PREFAZIONE PARTE PRIMA ELEMENTI PROPEDEUTICI DI TECNICA STATISTICA 1

Indagine Forze Lavoro a livello di SEL area livornese

Teoria dei Fenomeni Aleatori AA 2012/13

Ulteriori Conoscenze di Informatica e Statistica

licensimento come investimento per il futuro delle statistiche demografiche e territoriali

Indagine statistica. Indagine Totale Indagine Campionaria Fasi dell indagine

Tipi di variabili. Indici di tendenza centrale e di dispersione

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

Studenti quindicenni partecipanti all'indagine PISA Punteggi Generali

LEZIONI DI STATISTICA MEDICA

Titolo della lezione. Introduzione

Distribuzioni campionarie

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

per togliere l influenza di un fattore es.: quoziente di mortalità = morti / popolazione

L analisi dei dati nell'indagine statistica

MONITOR PORDENONE 2010

Fonti statistiche e indicatori socio-culturali

DEFINIZIONI ED AGGREGATI

Pedagogia sperimentale

Un sistema di registri statistici basato sull integrazione di informazioni da archivi amministrativi, indagini statistici e stime di popolazione

L INDAGINE STATISTICA

Capitolo 3 - Popolazione e famiglie

Il Censimento permanente

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Questi appunti costituiscono soltanto una traccia sintetica del Corso di Laboratorio di Fisica, a prescindere dalle opportune spiegazioni e dai

Innovazione di metodo e tecniche nell'interazione tra anagrafe e censimento del 2011

Indagine Sole 24 Ore-Banca d Italia sulle aspettative di inflazione

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Imputazione dati mancanti

Il Censimento 2011 a Milano

Campionamento. Aa

Giovanna Boccuzzo Dipartimento di Scienze Statistiche Università di Padova

(Testo rilevante ai fini del SEE)

L indagine Istat sui consumi energetici delle famiglie: aspetti metodologici

I modelli di rilevazione e i contenuti informativi del 15 o Censimento generale della popolazione e delle abitazioni

Evoluzione congiunturale del settore delle Costruzioni Tavole statistiche (dati provinciali)

PROCEDURE DI VALIDAZIONE E DI CONTROLLO DELL ATTENDIBILITÁ VALIDITÁ

Prof. Roberto de Marco. Lezione n L inferenza statistica I. Sezione di Epidemiologia & Statistica Medica Università degli Studi di Verona

PRINCIPI DI EPIDEMIOLOGIA E SORVEGLIANZA Orvieto, 22 marzo Maria Miceli

LA CONGIUNTURA DEL SETTORE MANIFATTURIERO NELLE MARCHE NOTA METODOLOGICA IV TRIMESTRE 2015

L'evoluzione congiunturale dell'economia provinciale

IMPUTAZIONE MULTIPLA: UN APPLICAZIONE ALL ANALISI DI DATI DI REDDITO

Statistica descrittiva

VALUTAZIONE EPIDEMIOLOGICA DEI TUMORI INFANTILI TRA I RESIDENTI DEI NOVE COMUNI DELLA VALLE DEL SACCO

Franco Ferraris Marco Parvis Generalità sulle Misure di Grandezze Fisiche. Prof. Franco Ferraris - Politecnico di Torino

I. Il significato del marketing... 1

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

La struttura dei dati

LA CONOSCENZA DEI DATI ECONOMICI DA PARTE DEI CONSUMATORI ITALIANI

Lezione 1: Introduzione. Prof. Massimo Aria

Il processo della rilevazione censuaria

Richiami di statistica e loro applicazione al trattamento di osservazioni topografiche e geodetiche

PROGETTO RER AVR LA RILEVAZIONE DELLA QUALITA PERCEPITA NEI SERVIZI DI DEGENZA

Nota dell editore Presentazione

LEZIONI DI STATISTICA MEDICA

Le innovazioni metodologiche e le fonti per la costruzione del nuovo sistema

Segnalazioni alle prefetture

Sistemi di welfare. IL MERCATO DEL LAVORO. Strumenti di base per l analisi.

Capitolo 13 - Agricoltura

6 Censimento Generale dell Agricoltura: stato dell arte e diffusione dei dati

Transcript:

Qualità 1 QUALITA' DEL DATO Rilevazione statistica come processo di produzione di dati (micro,macro) Qualità di un prodotto: adeguatezza del prodotto all'uso per il quale è stato realizzato ovvero capacità a soddisfare le proprietà garantite dal produttore di progettazione (es. forma, potenza,...) di tolleranza (limiti entro i quali i requisiti variano: es. durata minima di accensione di una lampadina) Qualità del dato statistico: di progettazione rilevanza teorica: adeguatezza dell'informazione prodotta alle necessità informative rilevanza effettiva: quanto dell'informazione prodotta viene effettivamente utilizzato tempestività: intervallo di tempo fra l'emergere di esigenze informative e la disponibilità dei risultati trasparenza: possibilità per l'utente di accedere a tutte le informazioni relative agli strumenti di indagine (definizioni, classificazione, questionario, ecc.) di tolleranza precisione campionaria accuratezza (precis. non campionaria): viene definita in termini di distanza fra il valore vero e quello osservato (errore di misura)

Qualità 2 Fasi dell'indagine, operazioni e principali fonti di errore non campionario Fasi Operazioni Fonti errore Tipo errore Progettazione scelta unità, modello rilevanza teorica variabili concettuale redazione questionario errori di misura struttura del vocabolario, quesiti, codifica diffusione dei dati rilevanza effettiva trasparenza Rilevazione sul campo formazione elenchi di unità liste supervisori rilevatori errori di misura (selez. da mancata copertura) raccolta dati supervisori rilevatori rispondenti errori di misura (mancate risposte, incongruenze) Revisione registrazione operatori errori di misura Elaborazione dati revisione elaborazione diffusione revisori programmi automatici programmi base statistica errori di misura (possibile selezione) errori di calcolo rilevanza effettiva tempestività

Qualità 3 Il controllo di qualità (accuratezza) Obiettivi Prevenzione (fase progettazione) Monitoraggio (fasi di rilevazione e di verifica) Può essere realizzato mediante: 1) sistema di controlli affiancato all'indagine, che fornisce indicatori riferiti ad aspetti particolari dell'indagine (non dà una misura sintetica dell'errore di misura) 2) indagine sperimentale ad hoc, che consente una misura sintetica dell'errore ma non può affiancare l'indagine in modo continuativo ed esteso (comporta aggravi economici ed organizzativi). In pratica: la tecnica 2) viene applicata a un sottogruppo di unità dell'indagine principale, una tantum; gli indicatori in 1) sono calcolati con riferimento all'intera indagine, in modo continuativo.

Qualità 4 Individuazione e correzione degli errori Tipi di controllo Revisione Correzione quantitativo qualitativo manuale (esperti di settore) automatica rapidità uniformità controlli complessi sul microdato sul macrodato Il tutto è subordinato alla possibilità di individuazione dell'errore.

Qualità 5 Controlli quantitativi Verifica della coincidenza fra piano di rilevazione teorico ed effettivo Piano teorico nr. di rilevatori nr. comuni (aree) nr. modelli rilev. inviati Piano effettivo nr. di rilevatori nr. comuni (aree) nr. modelli ril. pervenuti nr. MTR (Mancanza Totale Risposta) nr. sostituzioni esempio di controllo quantitativo mediante indagine ad hoc: la stima della copertura del censimento Per l'indagine censuaria non esiste una numerosità di confronto. L'Istat svolge un'indagine di controllo mediante un campione di sezioni di censimento nelle quali si individuano tutte le unità contenute. Si stimano quindi i dati della seguente tavola unità presenti al assenti al Totale censimento censimento presenti all'indagine N 11 N 12 N 1 assenti all'indagine N 21 N 22 N 2 N 1 N 2 N il confronto fra i risultati del censimento e quelli dell'indagine di controllo dà stime di N 11, N 12 e N 21 ; ipotizzando l'indipendenza fra le due indagini si perviene alla stima di N 22 (N 22 /N 12 ) = (N 21 /N 11 ) = (N 2 /N 1 ) => N 22 = N 12 N 21 /N 11 tasso di copertura = 100 (N 21 +N 11) /N

Qualità 6 Controlli qualitativi 1) Verifica informazione raccolta * distribuzioni di frequenza * indici statistici 2) Individuazioni di errori sistematici possono avere varie cause e varie manifestazioni (es. missing, non so) non esiste una definizione operativa, valida in generale, che ne permetta l'individuazione In generale: si usano piani di compatibilità (programmi automatici)

Qualità 7 Programmi di compatibilità e correzione (MPR) ERRORI Errori non Individuabili Errori Individuabili Valori non ripristinati Regole compatibilità Errori Individuati Regole Imputazione Errori non individuati MPR Valori ripristinati Regole compatibilità devono essere formali (struttura questionario) sostanziali (informazioni a priori; es. campo di variazione plausibile per grandezze quantitative) non ridondanti non contraddittorie Errori individuati: Mancanza Parziale Risposta MPR vera e propria valori fuori campo incongruenze

Qualità 8 Trattamento della MPR Fasi per l'individuazione RISPOSTE AL QUESITO NON DOVUTE s i n g o l o Rifiuti DOVUTE Non Ammissibili Ammissibili q u e s i t o Compatibili Non compatibili altri quesiti stesso question. Altri questionari o informazioni esterne Tecniche di correzione (imputazione) criteri deterministici forzature a priori regressione determ. criteri stocastici da donatore

Qualità 9 Criteri deterministici Forzature a priori L'imputazione di valori predeterminati richiede la sequenzialità delle regole (ordinamento gerarchico) secondo l'importanza delle variabili e in modo da realizzare il minimo numero di modifiche Esempio SESSO= femmina ETA' = 67 anni CONDIZ. PROFES. = servizio di leva SESSO= femmina ETA' = 67 anni CONDIZ. PROFES. = ritirata dal lavoro (pensionata) Regressione deterministica (variabili quantit.) y = b 0 +b 1 x < modello stimato sui dati corretti y k : variabile da correggere x: variabile nota per tutte le unità Se Y MPR e X=x k ==> Y=y k = b 0 +b 1 x k Oss.: Se b 1 =0, si imputa la media dei valori di y

Qualità 10 Criteri stocastici Da donatore Il valore (modalità) errato viene corretto in base a quello di un'altra unità, scelta secondo certe regole. Individuazione dell'unità donatrice: si considera la distanza fra l'unità k da correggere e le possibili unità donatrici (insieme dei dati completi) in base ai valori di alcune variabili che devono essere noti per tutte le unità distanza vettore di codici (var. qualit.) misura sintetica (var. quantit.) es. distanza euclidea valore imputato codice del donatore (grandezze qualitative) valore del donatore "perturbato" (grandezze quantitative) NB: basarsi solo sui rispondenti equivale ad assumere che la mancata risposta è random (ad es. nel calcolo di una media, equivale ad imputare il valor medio ai non rispondenti)

Qualità 11 Controllo del piano di compatibilità e di correzione Prima di applicare un piano di revisione e di correzione è opportuno testarlo mediante simulazioni secondo il seguente schema DATI ORIGINARI Simulazione errori DATI CON ERRORI Confronti DATI CORRETTI Revisione e correzione Confronti: dati originari < > dati corretti: effetti degli errori e dei criteri di correzione dati con errori < > dati corretti: effetti dei criteri di correzione Per testare un piano di compatibilità è necessario simulare più tipi di errore