VI LA MATRICE DEI DATI

Documenti analoghi
VII Definizione operativa: DALLE PROPRIETA ALLE VARIABILI

Prodotto interno lordo per ripartizione geografica, in Italia e in Sardegna: variazioni percentuali 2005 su 2004

Gennaio-Febbraio 2018

Anno TOT CAPACITA' RICETTIVA FLUSSI TURISTICI 05/02/2019 TOTALE ITALIANI

Atto n.974 "L'impatto sul mercato del lavoro della quarta rivoluzione industriale" Competenze digitali e E-commerce

Anno Arrivi Presenze Arrivi Presenze Arrivi Presenze

Affitti Quota Latte - Periodo 2014/2015

Gennaio-Novembre 2018

autosnodato auto-treno con rimorchio totale incidenti trattore stradale o motrice auto-articolato

Anno Regione Euro AL BE BG BM EL GA IB IG ND Totale 2017 PIEMONTE EURO

Persone che hanno subito incidenti in. Regioni

Persone che hanno subito incidenti in. Regioni

DIPARTIMENTO AMMINISTRAZIONE PENITENZIARIA UFFICIO STAMPA E RELAZIONI ESTERNE

Struttura Ex asl impegni prestazioni costo prestazioni Ticket Regione H , ,76 Basilicata H

SIT Sistema Informativo Trapianti


REGIME QUOTE LATTE AFFITTI DI QUOTA

classifica : 3 pti vittoria, 1 pto sconfitta GARE TRENTO VS FRIULI VENEZIA GIULIA TOSCANA VS BASILICATA TRENTO VS BASILICATA TRENTO VS TOSCANA

IV - Metodo dell associazione NOZIONI DI BASE

IL LAVORO E LE DONNE BIANCA BECCALLI. L Europa che vogliamo e il lavoro che progettiamo, Incontri Riformisti, sabato 5 luglio 2014 Tartano (Sondrio)

Interventi di Upgrading di Impianti di Depurazione Esistenti

Struttura Ex asl impegni prestazioni costo Ticket Regione

Grafico 1 - Enti locali Contributi erariali per ente - Anni (valori nominali in migliaia di lire)

Allegato statistico Nota sulla legge Dopo di noi

TIPI DI SPETTACOLO Rappresentazioni Biglietti venduti Presenze Spesa al botteghino (a) Spesa del pubblico (b) Volume di affari

Percentuale delle scuole che hanno avviato la rilevazione

Allegato statistico Il dettaglio dei dati per Regioni e Province Autonome

Direzione Generale del Personale e degli Affari Generali e Amministrativi SERVIZIO STATISTICO - UFFICIO SISTAN NOTIZIARIO STATISTICO

Approfondimento 1 - Rsu per comparto e per ripartizione geografica

1. Allegato statistico: dettaglio dei dati per Regioni e Province Autonome

Registro vitivinicolo dematerializzato DM 293/2015. Applicazione del DM 20 marzo 2015 n. 293 Registri dematerializzati del settore vitivinicolo

RIEPILOGO REGIONALE PER SPECIALIZZAZIONE RIEPILOGO REGIONALE PER SPECIALIZZAZIONE

O.D. a.s. 2012/13 O.D.

Tabella 1 Regioni 2004 Regioni 2005 Regioni 2006 Italia 0,21 (0,20-0,21) Italia 0,19 (0,19-0,20) Italia 0,14 (0,14-0,15) Nota

Analisi del contenzioso tributario per valore della controversia

Per Regione e posizione giuridica

TOTALE DEI RISULTATI DEL CONTO ENERGIA (PRIMO, SECONDO, TERZO, QUARTO E QUINTO CONTO ENERGIA)

Tab. 1 - Spesa sanitaria pubblica e privata, (val. in euro correnti pro capite, var.%)

Caratteri stazionali Capitolo 16 - L'esposizione. INFC - Le stime di superficie

Tavola Biblioteche per regione e ripartizione geografica - Anno 2017 (a)

Trofeo delle Regioni Cesare Rubini" - Maschile. Calendario Incontri

Basilicata - Via Anzio, Potenza

V UNA TIPOLOGIA DELLA RICERCA EMPIRICA NELLE SCIENZE SOCIALI

O.D. a.s. 2011/12. O.D. a.s. 2012/13

Tavola 1 - Persone che percepiscono indennità di accompagnamento per regione - Anno 2014

Ministero dell'istruzione, dell'università e della Ricerca Dipartimento per l'istruzione Direzione Generale per il Personale Scolastico

LA SPESA SANITARIA PUBBLICA IN ITALIA: LA SCATOLA NERA DELLE DIFFERENZE REGIONALI

Nidi e servizi integrativi in Italia: l indagine sulla spesa sociale dei Comuni

ITALIA SETTENTRIONALE

IVG NATI VIVI * DONNE RAPPORTO PER TASSO PER 1000 TASSO DI ANNI ** 1000 NATI VIVI DONNE ANNI FECONDITA' ***

IVG NATI VIVI * DONNE RAPPORTO PER TASSO PER 1000 TASSO DI ANNI ** 1000 NATI VIVI DONNE ANNI FECONDITA'

ITALIA SETTENTRIONALE

IVG NATI VIVI * DONNE RAPPORTO PER TASSO PER 1000 TASSO DI ANNI ** 1000 NATI VIVI DONNE ANNI FECONDITA'

Direzione Generale del Personale e degli Affari Generali e Amministrativi SERVIZIO STATISTICO - UFFICIO SISTAN

Prof. Roberto Bernabei Presidente Italia Longeva

IVG NATI VIVI * DONNE RAPPORTO PER TASSO PER 1000 TASSO DI ANNI ** 1000 NATI VIVI DONNE ANNI FECONDITA' ***

OSSERVATORIO FER. ELABORAZIONE ANIE RINNOVABILI DATI GAUDì - FONTE TERNA. Febbraio 2018

IL SETTORE TERMALE. Caratteristiche strutturali e performance. Federterme. Rimini, 12 maggio 2011 * * *

IVG NATI VIVI * DONNE RAPPORTO PER TASSO PER 1000 TASSO DI ANNI ** 1000 NATI VIVI DONNE ANNI FECONDITA' ***

IVG NATI VIVI * DONNE RAPPORTO PER TASSO PER 1000 TASSO DI ANNI ** 1000 NATI VIVI DONNE ANNI FECONDITA' ***

Raccolta differenziata dei rifiuti: comportamenti e soddisfazione dei cittadini e politiche nelle città

IVG NATI VIVI * DONNE RAPPORTO PER TASSO PER 1000 TASSO DI ANNI ** 1000 NATI VIVI DONNE ANNI FECONDITA'

Bologna, Quartiere fieristico, Maggio 2014: manifestazione dedicata alla sanità e all assistenza.

Calcolo a preventivo della spesa annua escluse le imposte AMBITO TARIFFARIO: CENTRALE (Toscana, Umbria e Marche) (B)

D ocumento completo relativo al sondaggio

OSSERVATORIO FER. ELABORAZIONE ANIE RINNOVABILI DATI GAUDì - FONTE TERNA. Aprile 2017

Percentuale su totale. Descrizione reato. Regione TOP 10 Numero reati ABRUZZO FURTO 0, RAPINA 0, ORDINE PUBBLICO:

Scuola dell'infanzia Regione

IVG NATI VIVI * DONNE RAPPORTO PER TASSO PER 1000 TASSO DI ANNI ** 1000 NATI VIVI DONNE ANNI FECONDITA' ***

STATISTICHE GIOCHI D AUTUNNO 2014 Centro PRISTEM Università Bocconi Elaborazione a cura di Fabio Geronimi

sdf La mappa degli Operatori dell Agricoltura Sociale

Edizione 2015/I DATI DI SCENARIO. 28 maggio 2015

22. Infortuni sul lavoro ad extracomunitari avvenuti in agricoltura nel periodo e denunciati all INAIL per provincia, regione, gestione ed

Scuola dell'infanzia. Scuola Primaria. Posti. Regione

Rapporto Annuale Regionale

OSSERVATORIO FER. ELABORAZIONE ANIE RINNOVABILI DATI GAUDì - FONTE TERNA. Agosto 2017

Fonte: ISTAT Elaborazione+Grafici Marco De Silva Responsabile Ufficio Economico CGIL Liguria

Indagine statistica su «La Mia Pensione»

APPENDICE AL RAPPORTO DI RIESAME / /14

Prof. Alberto Brambilla. Dott. Paolo Novati. 27 giugno 2017, Milano

AGGIORNAMENTO DATI RIGUARDANTI LA STAGIONE ESTIVA 2000 PER REGIONE ITALIANA

Attività fisica e pratica sportiva

OSSERVATORIO FER. ELABORAZIONE ANIE RINNOVABILI DATI GAUDì - FONTE TERNA. Giugno 2017

150 ANNI DI CRESCITA, 150 ANNI DI DIVARI: SVILUPPO, TRASFORMAZIONI, POLITICHE

PROPOSTA AL M.I.T. DI RIPARTO 2005 DEL FONDO NAZIONALE PER LA LOCAZIOONE (Art. 11 Legge 431/98)

Ministero dell Istruzione, dell Università e della Ricerca DIPARTIMENTO PER L ISTRUZIONE Direzione Generale per il Personale scolastico ALLEGATO 1

I NUMERI DEL SETTORE SECONDO LA RILEVAZIONE STATISTICA ISTAT 2008

BOLLETTINO SULLA DISOCCUPAZIONE Dati mensili - Ottobre 2018 Dati trimestrali - 2 trim NUMERO 1. Aumentiamo i traffici

OSSERVATORIO FER. ELABORAZIONE ANIE RINNOVABILI DATI GAUDì - FONTE TERNA. Settembre 2017

OSSERVATORIO FER. ELABORAZIONE ANIE RINNOVABILI DATI GAUDì - FONTE TERNA. Novembre 2017

REPORT GARANZIA GIOVANI I PRIMI NUMERI DELL INIZIATIVA

OSSERVATORIO FER. ELABORAZIONE ANIE RINNOVABILI DATI GAUDì - FONTE TERNA. Ottobre 2017

Coperture vaccinali al 31/12/2015 per HPV (Aggiornamento 13 febbraio 2017)

IL SETTORE AGRICOLTURA E I FLUSSI FINANZIARI PUBBLICI IN VENETO. I flussi finanziari pubblici in Veneto Dott. Claudio VIGNOTTO

CARATTERISTICHE ED EVOLUZIONE DELLA POPOLAZIONE

CARATTERISTICHE ED EVOLUZIONE DELLA POPOLAZIONE

BOLLETTINO SULLA DISOCCUPAZIONE Dati mensili - Novembre 2018 Dati trimestrali - 3 trim NUMERO 2

Analisi trimestrale produzione e consumo di globuli rossi Liviana Catalano Consultazione Plenaria 30/11/2018

Transcript:

Come organizzare le informazioni raccolte? VI LA MATRICE DEI DATI MRC / VI - La matrice dei dati 1 Pro-memoria Variabile Variabile = rappresenta una proprietà raccolta sistematica di informazioni sulla proprietà corrispondente; Categorie della variabile: classi in cui suddividere le informazioni raccolte. MRC / VI - La matrice dei dati 2 1

Pro-memoria Definizione operativa = trasformazione della proprietà in variabile e degli stati sulla proprietà in categorie della variabile PROPRIETA VARIABILE stati categorie MRC / VI - La matrice dei dati 3 La matrice dei dati ( o matrice casi per variabili ) si usa se si vuole registrare in maniera SISTEMATICA gli stati dei casi su le proprietà rilevate MRC / VI - La matrice dei dati 4 2

Es. FRUIZIONE DEI MEDIA IL PUBBLICO non è un soggetto unico né una massa indistinta, ma una popolazione molto differenziata. Necessità di rilevare più casi LA FRUIZIONE DEI MEDIA si differenzia al proprio interno per media diversi, per età, stili di vita, consumi, territori, etc Necessità di rilevare più proprietà MRC / VI - La matrice dei dati 5 Raccolta sistematica di informazioni mediante i VETTORI = sequenza ordinata di informazioni Si possono organizzare le informazioni in due fasci di vettori: in colonna e in riga: Ogni vettore-colonna: le informazioni su una variabile; Ogni vettore-riga: le informazioni su un caso Due fasci di vettori paralleli, intersecandosi in modo che un fascio sia perpendicolare all altro, costituiscono una MATRICE. MRC / VI - La matrice dei dati 6 3

Nell intersezione di una riga con una colonna: CELLA dato Ogni cella contiene un informazione ( dato ) su un caso e su una variabile MRC / VI - La matrice dei dati 7 variabile caso Rossi Genere sessuale maschio Informazione (dato): Rossi è un maschio MRC / VI - La matrice dei dati 8 4

MRC / VI - La matrice dei dati 9 Di solito nelle celle della matrice vi sono codici = valori che riassumono un informazione Camilla ha risposto Diploma scuola superiore 0 Nessun titolo 1 licenza elementare 2 licenza media 3 diploma scuola superiore 4 laurea triennale 5 laurea magistrale, master, dottorato 99 l intervistato non risponde, la risposta non è classificabile TITOLO DI STUDIO Camilla 3 Petronilla Domitilla ETA 3 è un codice che traduce diploma scuola superiore. PREFERENZE TG MRC / VI - La matrice dei dati 10 5

A che cosa servono i codici 1) A sintetizzare le informazioni (es. un solo numero riassume una risposta di molte lettere alfabetiche); 2) Si usano i numeri come codici per facilitare l analisi delle relazioni fra più variabili. RISCHIO: usare operazioni matematiche su numeri che sono tali solo in apparenza (v. dopo, su differenza fra variabili categoriali/ordinali e variabili cardinali) MRC / VI - La matrice dei dati 11 Il codebook (o piano di codifica ) = raccolta di tutte le variabili e dei codici Informazioni sull istanza di adozione [annopres_1] Anno di presentazione dell istanza:.<digitare l anno> Istruzioni per la codifica [tipist_1]tipo di istanza: 1 Nazionale 2 Internazionale 3 Entrambi Variabile e suo nome Categorie e codici [confer_1] Conferimento incarico all ente autorizzato: 1 No 2 Sì Qui il codice coincide con l anno Se sì: [annconfer_1] anno:.<digitare l anno> [nomente_1] nome dell ente:.. <digitare il nome proprio dell ente> MRC / VI - La matrice dei dati 12 6

I dati in matrice devono riprodurre i codici Esempio 1 = maschio = codice 1, 1, 1, 1 = dati 1, 1, 1, 2, 2 = sequenza ordinata di dati = vettore-colonna MRC / VI - La matrice dei dati 13 La matrice è un potente concentratore di informazioni MRC / VI - La matrice dei dati 14 7

COME RISOLVERE ALCUNI PROBLEMI PER L IMMISSIONE DEI DATI IN MATRICE MRC / VI - La matrice dei dati 15 1) L unità di analisi Non si può analizzare complessivamente una matrice se i suoi casi sono individui + famiglie + regioni, etc. L unità di analisi deve essere sempre la stessa (es. solo individui); Per più unità di analisi occorrono più matrici, una per unità MRC / VI - La matrice dei dati 16 8

2) L ambito temporale E possibile rilevare le stesse proprietà sugli stessi casi ma in momenti diversi p. es. nel panel; o nelle serie temporali di unità ecologiche ricostruire un processo diacronico MRC / VI - La matrice dei dati 17 - Persone di 14 anni e più che parlano di politica o che si informano di politica almeno una volta a settimana, che hanno partecipato online a consultazioni o votazioni su problemi sociali o politici o hanno letto e postato opinioni su problemi sociali o politici sul web negli ultimi 3 mesi per sesso, regione e ripartizione geografica - Anni 2011-2016 (valori percentuali) REGIONI E RIPARTIZIONI GEOGRAFICHE MASCHI Piemonte 78,0 79,8 80,4 77,2 78,2 74,0 Valle d'aosta/vallée d'aost 74,2 73,6 74,0 78,7 74,9 71,1 Liguria 80,2 78,8 78,5 79,0 75,5 71,4 Lombardia 78,3 79,9 75,2 74,9 74,3 73,1 Trentino-Alto Adige/Südtiro 78,9 77,3 78,0 78,4 74,9 70,3 Bolzano/Bozen 76,7 77,1 76,9 78,9 74,6 69,1 Trento 81,0 77,5 79,0 77,9 75,1 71,5 Veneto 80,2 80,6 83,9 81,3 78,1 77,4 Friuli-Venezia Giulia 81,5 79,0 81,6 77,9 75,9 73,3 Emilia-Romagna 79,9 79,6 80,8 80,4 78,9 74,3 Toscana 80,0 76,1 79,6 77,8 80,7 75,2 Umbria 80,2 76,4 83,2 73,7 80,1 75,3 Marche 75,4 77,3 81,5 75,6 77,1 74,9 Lazio 75,4 73,4 78,9 78,9 78,1 72,7 Abruzzo 74,1 76,1 76,2 71,5 72,9 72,4 Molise 69,8 71,7 69,1 70,5 69,0 64,8 Campania 68,9 67,4 65,9 66,9 63,9 59,9 Puglia 68,2 64,8 69,2 66,5 66,9 65,0 Basilicata 66,6 61,9 73,0 64,6 56,1 66,6 Calabria 62,6 64,8 66,0 67,3 65,6 54,9 Sicilia 63,8 67,8 65,8 64,8 66,3 60,6 Sardegna 77,6 79,3 78,7 77,3 73,2 71,0 Nord 79,1 79,7 79,1 77,8 76,5 74,0 Centro 77,2 75,0 79,8 77,7 79,0 74,0 Mezzogiorno 67,9 68,2 68,5 67,5 66,4 62,6 Italia 74,9 74,8 75,6 74,2 73,5 70,1 2011 2012 2013 Fonte: ISTAT - BES 2014 2015 2016 Unità ecologica: Regioni Ogni colonna della matrice è un anno 1 variabile in 6 anni = 6 colonne Serie temporale: come istantanee in 6 tempi diversi processo diacronico In matrice la stessa serie temporale (in 6 colonne) si ripete per altre variabili (tasso di occupazione, tasso di scolarizzazione, etc.) MRC / VI - La matrice dei dati 18 9

3) I dati mancanti (p. es. non risposte): Inserire nella cella corrispondente un codice particolare (p. es. 99) o più codici: 990 non sa rispondere; 995 non vuole rispondere; 999 la risposta non è pertinente Si può chiedere ad SPSS di calcolare le frequenze non considerando i dati mancanti MRC / VI - La matrice dei dati 19 Si possono analizzare i casi che hanno dati mancanti e rapportarli con altre variabili, p. es. socio-anagrafiche (p. es. molti casi con bassa scolarizzazione e/o avanzata età non hanno risposto la domanda era difficile). QUINDI anche i dati mancanti possono essere interessanti MRC / VI - La matrice dei dati 20 10

nelle variabili cardinali Qualora la distribuzione sia simmetrica (= molto raramente), si può sostituire il dato mancante con il valore centrale. Ma non è affatto detto che il valore centrale sia il più vicino alle reali posizioni di quel caso (Di Franco in Cannavò-Frudà 2007, 385) Valore centrale MRC / VI - La matrice dei dati 21 Se ci sono pochi dati mancanti (1% 3%) è bene non trasformarli artificiosamente. Se una variabile presenta troppi dati mancanti, conviene eliminarla piuttosto che distorcere le informazioni MRC / VI - La matrice dei dati 22 11

4) Le risposte multiple: PRIMA SOLUZIONE: trasformare ogni possibilità di scelta in una variabile: Quali sono i motivi per cui leggi Rocca? (max 3 risposte) <Similmente a quanto ho indicato per la domanda 6: [LEGGI_ 1/ LEGGI_2 / LEGGI_3] = tre colonne distinte 1 corrisponde alle mie idee religiose-ecclesiali 2 mi è utile 3 mi aiuta ad acquisire senso critico 4 è una voce libera senza padroni 5 mi interessa il confronto con idee diverse alle mie 6 ritrovo le mie idee socio-politiche 7 altro (specificare).. <non digitare il codice ma la risposta così come è scritta> MRC / VI - La matrice dei dati 23 SECONDA SOLUZIONE: trasformare ciascuna categoria in una variabile distinta, con 2 sole categorie: sì / no idee relig utilità senso critico etc Camilla 1 1 1 Priscilla 0 1 1 Domitilla 1 0 0 1 = sì 0 = no MRC / VI - La matrice dei dati 24 12