Giovanna Boccuzzo Dipartimento di Scienze Statistiche Università di Padova

Documenti analoghi
Indagine statistica. Indagine Totale Indagine Campionaria Fasi dell indagine

Statistica descrittiva e statistica inferenziale

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

Facoltà di Economia. francesco mola. I sondaggi e le inchieste. campionaria la cui realizzazione avviene secondo le

Indagine Forze Lavoro a livello di SEL area livornese

Occupati e disoccupati Aprile 2010: stime provvisorie

Teoria e tecniche dei test

Occupati e disoccupati Dicembre 2009: stime provvisorie

OCCUPATI E DISOCCUPATI

Il campionamento. Storia del campionamento nelle scienze sociali

Università del Piemonte Orientale. Corso di Laurea in Igiene Dentale. Corso di Statistica per la ricerca sperimentale e tecnologica

OCCUPATI E DISOCCUPATI

Le indagini campionarie

OCCUPATI E DISOCCUPATI

PRINCIPI DI EPIDEMIOLOGIA E SORVEGLIANZA Orvieto, 22 marzo Maria Miceli

Campionamento La statistica media campionaria e la sua distribuzione

OCCUPATI E DISOCCUPATI

Il fumo in Italia. Marzo 2016

Descrizione del campione regionale

Il fumo in Italia. S. Rossi, C. Mortali, M. Mazzola, D. Mattioli, R. Spoletini, R. Pacifici OSSFAD Istituto Superiore di Sanità

Conoscere il rischio e il Piano di Protezione Civile per vivere in sicurezza. Comuni di Forte dei Marmi, Seravezza, Stazzema e Pietrasanta

zio L'INDAGINE CAMPIONARIA Metodi, disegni e tecniche di campionamento

Il campionamento e l inferenza. Il campionamento e l inferenza

Alcuni concetti. Unità

Maggio 2015 OCCUPATI E DISOCCUPATI Dati provvisori

IL MERCATO DEL LAVORO NEL FAENTINO E NELLA PROVINCIA DI RAVENNA

Customer Satisfaction 2015

Giugno 2015 OCCUPATI E DISOCCUPATI Dati provvisori

Il Campionamento. La popolazione di riferimento

IL MERCATO DEL LAVORO IN UMBRIA NEL 2010

standardizzazione dei punteggi di un test

OCCUPATI E DISOCCUPATI

L'IMPATTO ECONOMICO DI SAGRE / FESTE PARROCCHIALI E MANIFESTAZIONI POLITICHE / DI PARTITO IN PROVINCIA DI BOLOGNA

Il lavoro delle donne NOTA dell IRES Catania

Sistemi di welfare. IL MERCATO DEL LAVORO. Strumenti di base per l analisi.

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Statistica. Lezione 1

Elezioni Amministrative 2017 Comune di Catanzaro. Milano, 15 marzo 2017

LA CONGIUNTURA DEL SETTORE MANIFATTURIERO NELLE MARCHE NOTA METODOLOGICA IV TRIMESTRE 2015

Uno studio multicentrico dello stato nutrizionale della popolazione infantile nel Veneto. Antonio Stano SIAN Azienda ULSS 3 Bassano del Grappa (VI) 1

L opinione sul progetto della centrale a carbone di Saline Joniche

Referendum Costituzionale e revisione Titolo V della parte II della Costituzione. 17 Novembre 2016 Indagine demoscopica

OCCUPATI E DISOCCUPATI

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

LA CONGIUNTURA DEL SETTORE MANIFATTURIERO NELLE MARCHE NOTA METODOLOGICA II TRIMESTRE 2015

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Il senso di appartenenza territoriale in Trentino

Statistica sociale Laurea specialistica in Progettazione e gestione del turismo culturale. Lezione 2. Metodologia della ricerca sociale

I primati di Bologna nel mercato del lavoro nel 2007

COMUNE DI BRESCIA UNITA DI STAFF STATISTICA Ufficio di Diffusione dell Informazione

DATI PROVENIENTI DA INDAGINI STATISTICHE

2004: DOSSIER ANNUALE FORZE LAVORO LIGURIA A CURA DI BRUNO SPAGNOLETTI INDICE DELLE TAVOLE RIFERITE ALLA LIGURIA E ALLE PROVINCE LIGURI

Demografia CdLS Scienze delle professioni sanitarie - della riabilitazione (SNT-SPEC/2) - tecniche-diagnostiche (SNT-SPEC/3)

Il fumo in Italia. Sintesi dei risultati

Gli italiani e l energia solare Milano, 18 giugno 2010

Il consumo di alcol tra i cittadini stranieri

FUMO A MILANO Indagine Demoscopica - Maggio 2013

QUALITA' DEL DATO Rilevazione statistica come processo di produzione di dati (micro,macro)

TAVOLA DI MORTALITÀ 2012

Indagine congiunturale sull andamento della domanda turistica in Sardegna Luglio 2006

OCCUPATI E DISOCCUPATI

LA COSTRUZIONE DELLA BASE EMPIRICA B RELATIVAMENTE ALL UNITÀ DI ANALISI LA DEFINIZIONE OPERATIVA DELL OGGETTO

Promozioni: utilizzo e gradimento. Il punto di vista del consumatore

Radio Veneto Uno. Indagine sui Dati di Ascolto

CAMPIONAMENTO - ALCUNI TERMINI CHIAVE

La ricostruzione delle serie storiche dei principali indicatori del mercato del lavoro. IV Trimestre IV Trimestre 2003

Nascita delle rilevazioni campionarie

Customer Satisfaction 2016

Lezione n. 1 _Complementi di matematica

La ricerca sociale: metodologia e tecniche

QUANDO RACCOGLIERE DATI SU BASE CAMPIONARIA??

Definizione Impiego Esempi Fonti:

STELLA DI NATALE Dicembre 2015

INDAGINE TRIMESTRALE SETTORE SERVIZI. 1 trimestre 2016 Allegato Statistico. Unioncamere Lombardia Funzione Informazione economica

Lavoro. Istituto Nazionale di Statistica

CON O SENZA REIMMISSIONE

La vendita diretta a domicilio Il commercio al dettaglio che funziona

COMUNE DI BRESCIA UNITA DI STAFF STATISTICA Ufficio di Diffusione dell Informazione COMUNE DI BRESCIA

b) E necessario formulare delle ipotesi per calcolare l intervallo di confidenza ottenuto al punto a? (motivare brevemente la risposta):

della provincia di Padova Sintesi anno 2013 A cura del Servizio Studi - Padova, marzo 2014

Febbraio 2016 OCCUPATI E DISOCCUPATI Dati provvisori

Indagine congiunturale sull andamento della domanda turistica in Sardegna 2006

SONDAGGIO Censis L autonomia professionale del giornalista DOCUMENTO INFORMATIVO COMPLETO

OPEN - Fondazione Nord Est Ottobre 2011

SCIENZE ECONOMICHE E GESTIONALI

Osservatorio per le Politiche Sociali - Terzo Rapporto

UTZ Italian sustainability event

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

Università degli studi di Modena e Reggio Emilia Progetto Lauree Scientifiche Convegno nazionale: LE PROFESSIONI DELLE SCIENZE SCIENTIFICI

I dati dell occupazione e della disoccupazione per la Provincia di Monza e della Brianza 2016

Rilevazione sulle forze di lavoro

Forze di lavoro in provincia di Brescia

Ipsos per Comune di Vicenza La nuova linea Alta Capacità-Alta Velocità

DOCUMENTO INFORMATIVO COMPLETO

Indice Aspetti generali sul campionamento da popolazioni finite Campionamento probabilistico Disegno campionario semplice

Analizzare in termini quantitativi significa basarsi su dati e non su idee o ipotesi

Perché il medico deve conoscere la STATISTICA? 1. LA MEDICINA STA DIVENTANDO

Statistica sociale CdLS Scienze delle professioni sanitarie - della riabilitazione (SNT-SPEC/2) - tecniche-diagnostiche (SNT-SPEC/3)

Il profilo di salute del Friuli Venezia Giulia

Abitudini d utilizzo dei diversi contenitori per imbustare la spesa

Transcript:

La costruzione dei dati e la rappresentazione di informazione statistica Giovanna Boccuzzo Dipartimento di Scienze Statistiche Università di Padova Da dove provengono i dati statistici? Fonti esaustive Dati statistici Censimenti Dati amministrativi Fonti campionarie Indagini campionarie 2

Ci sono i sondaggi d opinione Brexit, cresce l'onda del Sì. Juncker: "La Ue ce la farà comunque" 3 Ci sono le stime ufficiali 4

E ci sono anche i sondaggi retribuiti. 5 Il più famoso esempio di sondaggio sbagliato Literary Digest 2,3 milioni rispondenti Landon: 55% Roosevelt: 41% 1936, elezioni presidenziali USA Come andò: Landon: 37% Roosevelt: 62% Gallup 50mila rispondenti Landon: 44% Roosevelt: 56% 6

Cosa andò storto? Lista non completa e non rappresentativa: lista telefonica + iscritti club + registro automobilistico = distorsione da selezione Non risposte: Tasso di non risposta pari al 77%! La lista iniziale prevedeva 10 milioni di unità Non risposte non casuali: Distorsione da non risposta, i sostenitori di Landon votarono in più 7 La sfiducia verso la statistica È giustificata? 8

La costruzione del dato mediante campionamento La realizzazione di un indagine campionaria può essere molto onerosa in termini di tempo e risorse L indagine sulle forze di lavoro è la più rilevante in Italia; rappresenta la principale fonte di informazione statistica sul mercato del lavoro italiano Considera ogni anno un campione di 250mila famiglie (circa 600mila persone) in 1100 comuni, le stime hanno un dettaglio provinciale. Le famiglie sono intervistate 4 volte in 15 mesi, la prima faccia a faccia (CAPI), poi per telefono (CATI) 9 Fasi dell indagine statistica Rapporto preliminare Definizione delle tabulazioni e delle statistiche rilevanti Preparazione programmi statistici PROGETTAZIONE ipotesi di ricerca piano per raccolta dei dati, campionamento piano di sfruttamento delle informazioni INDAGINE PILOTA Nuova astrazione Formulazione del materiale definitivo Selezione del personale Preparazione materiale di rilevazione Addestramento del personale RACCOLTA DEI DATI ELABORAZIONE DEI DATI (STIMA) Memorizzazione Codifica ANALISI STATISTICA DELLA QUALITÀ DEI DATI Interpretazione dei risultati delle elaborazioni (INFERENZA) Riformulazione ipotesi di ricerca 10

Come si svolgono i sondaggi? dal Mattino di Padova del 29/5/2016 XXX ha realizzato questa indagine che si è svolta a livello nazionale dal 22 marzo al 4 aprile 2016 su un campione rappresentativo della popolazione residente in Italia, con età superiore ai 18 anni. I rispondenti totali sono stati 1997 (su 13.287 contatti), l analisi dei dati è stata riproporzionatasulla base del genere, del territorio, delle classi d età, della condizione professionale e del titolo di studio. Il margine di errore è pari a +-2.2%. La rilevazione è avvenuta con un indagine attraverso i principali social network e con un campione casuale raggiungibile con i metodo CAWI e CATI. 11 12

Analizziamo punto per punto. Campione casuale (o probabilistico): Ogni unità della popolazione ha probabilità non nulla di essere selezionata: 0<p i 1, p i =1. Per estrarre un campione casuale serve una LISTA ESAUSTIVA* della popolazione * a meno di campionamento a stadi 13 La lista Popolazione residente in Italia, con età superiore ai 18 anni. Possibili liste da cui trarre il campione: - Anagrafi della popolazione - Liste elettorali - Censimento Non disponibili per sondaggi elettorali, d opinione, ricerche di marketing sono acquistate e utilizzate altre liste (di numeri telefonici e indirizzi mail), non esaustive e presumibilmente non rappresentative Distorsione da selezione 14

Popolazione obiettivo e popolazione statistica (LISTA) (POPOLAZIONE OBIETTIVO) Popolazione statistica 15 Disegno campionario stratificato vs. per quote Suddivisione della popolazione per sesso età e titolo di studio Strat ti M <20 Alto M 20-45 Alto M <20 Medio M 20-45 Medio M <20 Basso M 20-45 Basso M >45 Alto M >45 Medio M >45 Basso F <20 Alto F 20-45 Alto F >45 Alto F <20 Medio F 20-45 Medio F <20 Basso F 20-45 Basso F >45 Medio F >45 Basso Stratificato: la popolazione è suddivisa in strati, da ogni strato è estratto un campione Quote: è nota la quota della popolazione negli strati, e si cercano rispondenti finché non si riempiono tutti gli strati 16

Distorsione da non risposta I rispondenti totali sono stati 1997 (su 13.287 contatti) Il tasso di non risposta è altissimo (85%), chi ha risposto (e riempito le quote) molto probabilmente non è rappresentativo di chi non ha risposto (lavoro diverso, orari diversi, rifiuto, ) 17 Tecnica di rilevazione La rilevazione è avvenuta con un indagine attraverso i principali social network e con un campione casuale raggiungibile con i metodo CAWI e CATI CATI: Computer Assisted Telephone Interview; CAWI: Computer Assisted Web Interview Rilevazione attraverso social network: pochissimi volontari, nulla di casuale 18

L errore Il margine di errore è pari a +-2.2%. Errore campionario PRECISIONE Errore globale ATTENDIBILITA' Errore non campionario ACCURATEZZA 2 2 s zα / 2 2 2 2 D zα / 2s = 2 2 2 zα / 2s 2 z / 2s + D + 2 D N N n 2 α 1 19 Ingredienti per la costruzione di un buon dato statistico: Lista/e di partenza Tempo Disponibilità economica Accuratezza di rilevazione Competenza in tutte le fasi dell indagine Le risorse impiegate dipendono in buona parte dagli obiettivi di conoscenza e dall uso che se ne fa delle statistiche prodotte. L importante è non fare di tutta l erba un fascio 20

Dal dato all informazione statistica Disporre di dati statistici non significa disporre automaticamente di informazione statistica effettivamente utile. Il dato statistico è il prodotto finale della singola indagine o rilevazione statistica Es: il numero di morti per tumore nel 1972 in Italia è pari a 105.093 unità L Informazione statistica è la contestualizzazione del dato statistico, lo sfruttamento contemporaneo di più dati/indicatori per produrre informazione Es: il numero di morti per tumore nel 1972 in Italia è pari a 105.093 unità Il n di morti per tumore nel 1992 è pari a 151.162 unità Il tasso di mortalità per i maschi è passato da 17,2 per 10mila nel 1971-73 a 19,2 nel 1989-91. Per le donne da 10,5 a 10,08 21 Costruire una tabella (banale banale ) 22 TITOLO: cosa, descritto con quale tipo di dato, secondo quali variabili. Luogo, anno. Variabile fiancata Variabile testata Corpo tabella Totali di riga Totale Totali di colonna 22

Tabella di percentuali Variabile fiancata Variabile testata xx xx xx xx xx xx xx xx xx xx xx xx xx xx xx La tabella può contenere: Percentuali di riga, o Percentuali di colonna, o Percentuali di cella 100 100 100 xx xx xx xx xx 100 Variabile fiancata Variabile testata xx xx xx xx xx xx xx xx xx xx xx xx xx xx xx 100 100 100 100 100 23 Scelta delle percentuali Fino elementari Media inferiore Media superiore Laurea o titoli superiori Totale Fumatori 13 95 31 6 145 Non Fumatori 4 40 47 14 105 Totale 17 135 78 20 250 Fino elementari Media inferiore Media superiore Laurea o titoli superiori Totale % riga 8,9 65,5 21,3 4,1 100,0 Fino elementari La scelta della % sbagliata porta a conclusioni errate! Media inferiore Media superiore Laurea o titoli superiori Qualsiasi titolo studio % colonna 76,5 70,4 39,7 30,0 58,0 Fumatori di 18 anni e più secondo il titolo di studio 24

Esempi di rappresentazioni inappropriate Si nota come le prime indicazioni sembrino supportare l ipotesi secondo la quale gli italiani usufruiscono in misura maggiore di strutture private rispetto agli stranieri. 25 Esempi di rappresentazioni inappropriate Grafico 3: Predisposizione a controlli andrologici, da parte degli studenti (maschi) dell'università di Padova, inerente al mese di Maggio 2016. Istogramma. 80% 70% 60% 50% 40% 30% 20% 10% 0% No, non mi sono mai sottoposto al controllo Si, l'ho fatto No, non mi sono mai sottoposto al controllo Si, l'ho fatto 26

Esempi di rappresentazioni inappropriate 27 Esempi di rappresentazioni inappropriate 28

Non solo percentuali Tipologie di rapporti statistici: Rapporti di composizione (Percentuali) Rapporti di coesistenza Rapporti di derivazione (Tassi) Rapporti medi (Densità) 29 Il tasso Quoziente che si ottiene dal rapporto fra l'intensità di un certo fenomeno e l'intensità di un altro che ne costituisca il presupposto necessario. Tasso di laurea regolare (triennale)= Laureati in corso/immatricolati 3 anni prima Non è sempre ovvio costruire un tasso, per via della definizione del denominatore (popolazione a rischio di generare il numeratore) 30

Un esempio: tasso o rapporto di abortività volontaria? Tasso di abortività volontaria: IVG/donne età feconda Rapporto abortività volontaria: IVG/gravidanze, spesso calcolato come IVG/Nati 1994 RAV x 1000 TAV x 1000 Veneto 157.7 5.4 Sicilia 134.7 6.9 1994 RAV x 1000 TAV x 1000 ITALIA NORD- Indicatore OCCIDENTALE poco 288.9 9.7 ITALIA MERID. E specifico INSULARE 205.6 9.8 31 Definire indicatori appropriati Finalizzati Sensibili e specifici Accurati e precisi 32