Obiettivi del corso Fornire le conoscenze e le competenze necessarie per: un uso consapevole delle informazioni quantitative, che non può prescindere dalla conoscenza della complessità dei processi di produzione dei dati ad opera delle fonti statistiche nazionali e internazionali interpretare e analizzare in senso critico tali informazioni, organizzate sempre più spesso in banche dati di grandi dimensioni disponibili on-line Alla fine del corso lo studente avrà acquisito: le conoscenze necessarie per l'individuazione delle fonti statistiche adeguate ai propri bisogni conoscitivi le competenze per l'uso e la rielaborazione dei prodotti statistici nell'ambito di un proprio progetto di indagine, in cui le statistiche diventano indicatori di fenomeni semplici e complessi Pagina 1 Perché un corso di analisi dei dati e fonti statistiche? I keep saying the sexy job in the next ten years will be statisticians. People think I m joking, but......the ABILITY TO TAKE DATA TO BE ABLE TO UNDERSTAND IT, TO PROCESS IT, TO EXTRACT VALUE FROM IT, TO VISUALIZE IT, TO COMMUNICATE IT THAT S GOING TO BE A HUGELY IMPORTANT SKILL IN THE NEXT DECADES, not only at the professional level but even at the educational level for elementary school kids, for high school kids, for college kids. BECAUSE NOW WE REALLY DO HAVE ESSENTIALLY FREE AND UBIQUITOUS DATA. SO THE COMPLIMENTARY SCARCE FACTOR IS THE ABILITY TO UNDERSTAND THAT DATA AND EXTRACT VALUE FROM IT. Hal Varian, Google s chief economist Fonte: Business Technology Office, gennaio 2009 I think statisticians are part of it, but it s just a part. YOU ALSO WANT TO BE ABLE TO VISUALIZE THE DATA, COMMUNICATE THE DATA, AND UTILIZE IT EFFECTIVELY. BUT I DO THINK THOSE SKILLS OF BEING ABLE TO ACCESS, UNDERSTAND, AND COMMUNICATE THE INSIGHTS YOU GET FROM DATA ANALYSIS ARE GOING TO BE EXTREMELY IMPORTANT. Managers need to be able to access and understand the data themselves. Pagina 2 1
Concetti chiave Pagina 3 Analisi dei dati Obiettivo: fornire concetti e strumenti utili per evidenziare gli aspetti salienti dell informazione disponibile e per quantificare la forza dei suggerimenti che da essi si possono ragionevolmente trarre Informazione espressa in forma quantitativa Dati Fornisce regole, strumenti e tecniche che consentono la raccolta e l analisi quantitativa delle caratteristiche dei fenomeni collettivi L Analisi dei Dati si avvale delle tecniche proprie della Statistica Pagina 4 2
Statistica Definizione: Metodologia che ha come scopo la conoscenza quantitativa dei fenomeni collettivi, ossia dei fenomeni il cui studio richiede l osservazione di un insieme di manifestazioni individuali Fenomeni collettivi Relativi ad una collettività di casi singoli Relativi ad una collettività di osservazioni di un solo caso o fenomeno Pagina 5 I fenomeni collettivi I fenomeni esistenti in natura sono descritti da uno o più caratteristiche. I fenomeni che si conoscono attraverso una molteplicità di manifestazioni vengono definiti fenomeni collettivi. Le caratteristiche che ci permettono di analizzare e descrivere un fenomeno vengono formalmente denominate caratteri o variabili statistiche. Esempio: il fenomeno clima può essere delineato e descritto mediante: la temperatura, le precipitazioni, il vento al suolo, il soleggiamento, Tali caratteristiche costituiscono i diversi aspetti con cui si palesa il clima, ossia gli elementi meteoritici che ci permettono di definire il clima di una regione in un certo istante, o in un intervallo di tempo, e che si manifestano in un ampia gamma di modi differenti Pagina 6 3
I fenomeni collettivi semplici o complessi Sono fenomeni collettivi semplici quelli completamente delineati attraverso un unico carattere Es. Il fenomeno statura degli individui è completamente descritto dal carattere che misura la distanza verticale tra il piano d appoggio dei piedi e il sommo del cranio quando l individuo si trova in massima estensione Sono fenomeni collettivi complessi o multivariati quelli descritti da più caratteri Es. Il fenomeno consumo non alimentare delle famiglie è collettivo multivariato dato che è caratterizzato da molte caratteristiche tra le quali (espresse in quantità di spesa in euro): vestiario, calzature, servizi sanitari, abitazioni, combustibili ed elettricità, mobili, trasporti, istruzione, spettacoli, Pagina 7 Perché l analisi statistica Approccio esplorativo Approccio confermativo Consente di esplorare i dati al fine di: descrivere in forma sintetica le informazioni evidenziare la struttura di relazioni implicite (pattern) ricavare modelli interpretativi/predittivi della realtà verificare poche ipotesi formulate prima della rilevazione dei dati Pagina 8 4
Senza Statistica Impressioni qualitative dei fenomeni Statura M > Statura F Buone condizioni sanitarie diminuiscono la mortalità Errori Osservazione di una parte del fenomeno Proporzione nei sessi degli animali Per ogni maschio indiano 10 femmine Impressione distorta Nascono + femmine che maschi Pagina 9 Metodologia Statistica La metodologia statistica viene suddivisa tradizionalmente in due branche, strettamente collegate Statistica descrittiva indicatori statistici per riassumere realtà complesse Statistica inferenziale generalizzazione di risultati a partire dal dato empirico allo scopo di fornire affermazioni valide anche per fenomeni che non sono stati osservati nel loro complesso Pagina 10 5
Il dato statistico E una informazione qualitativa o quantitativa su una caratteristica posseduta da un elemento oggetto di rilevazione e/o misurazione E il risultato di un'operazione di misurazione/rilevazione del modo con cui una caratteristica è presente su un elemento E la base di ogni ricerca ed è quindi della massima importanza che sia affidabile Pagina 11 I dati statistici Carattere Statistico: una delle possibili manifestazioni del fenomeno e quindi è una caratteristica da studiare; viene osservata (o rilevata) sulle u.s. Unità Statistica: entità, unità elementare, che presenta le caratteristiche oggetto di studio Popolazione: insieme di u.s. omogenee rispetto ad 1 o più caratteristiche Finita aziende esistenti in una certa area in un determinato periodo Infinita (collettivo reale) pezzi producibili da una fabbrica a ciclo continuo Indefinita (collettivo virtuale o teorico) potenziali malati di un certa patologia Pagina 12 6
Unità statistica E un entità reale (persona, animale, oggetto, territorio) o virtuale (evento) suscettibile di misura che presenta le caratteristiche oggetto di studio Non è necessariamente una persona fisica Es: nello studio del fenomeno «vendita di quotidiani» le unità statistiche di riferimento potrebbero essere sono le diverse Testate Es: nello studio delle Imprese che producono automobili le unità statistiche di riferimento sono le imprese Non è necessariamente rappresentata da un singolo elemento Es: nello studio del fenomeno relativo al consumo delle famiglie, l unità statistica di riferimento è la famiglia e quindi un insieme di individui Termini equivalenti per indicare una unità statistica sono elemento, soggetto, oggetto, caso o individuo Pagina 13 Caratteri statistici Osservare i caratteri sulle u.s. significa attribuire a tali u.s. una modalità secondo determinate regole e con certi contenuti u x rappresenta la modalità del carattere X associata all u.s. u x Modalità: modi in cui un carattere si può presentare Esaustive : devono rappresentare tutti i possibili modi di essere del carattere Non sovrapposte : ogni u.s. presenta una ed una sola modalità Pagina 14 7
La struttura dei dati Carattere Qualitativo 1 (mutabile statistica) Unità statistica Osservazione di uno o più caratteri Collettivo statistico Carattere Quantitativo 2 (variabile statistica) Pagina 15 L indagine statistica Obiettivo: conoscenza di una popolazione intesa come insieme di unità statistiche su cui si manifesta il fenomeno da studiare Fasi Piano di Rilevazione Raccolta dati Classificazione e spoglio dei dati Elaborazione dei dati Interpretazione dei risultati Analisi dei dati Pagina 16 8
Piano di rilevazione Obiettivo: definizione del problema da analizzare in tutti i suoi aspetti Gli aspetti specifici da affrontare riguardano sostanzialmente: il collettivo oggetto di studio le caratteristiche di interesse Scelta metodo di rilevazione Diretto Censimento Campione Tecnica: Capi, Cati, Ind. Postale Indiretto Base dati Lista Completa Esatta Aggiornata Epoca rilevazione Definizione questionario Def. strumenti e modalità diffusione risultati Tempi e costi Pagina 17 Rilevazione censuaria Per indagine censuaria o totale si intende una rilevazione di tutte le unità (universo o popolazione target) che presentano le caratteristiche che si intendono studiare Esempio: i censimenti e le indagini in cui la popolazione target è costituita da poche unità molto importanti (perché caratteristiche) Vantaggi misure esatte Svantaggi alti costi di rilevazione e trattamento dei dati possibile incompletezza dovuta all incapacità materiale di raggiungere tutte le singole unità Pagina 18 9
Indagini campionarie Alla luce di questi problemi si ricorre spesso alle indagini campionarie anche se questo implica minor precisione Notevole risparmio di mezzi, e più in generale un minor impiego di risorse materiali e umane accrescere il numero delle indagini abbreviare la cadenza di quelle periodiche maggiore tempestività Pagina 19 Metodo di rilevazione Osservazione totale del collettivo Schematizzazione Osservazione Descrizione Osservazione parziale del collettivo Schematizzazione Formulazione delle ipotesi Osservazione Descrizione Induzione Def. Fenomeno Indiv. Collettivo Scelta caratteristiche interessanti Pagina 20 10