Come organizzare le informazioni raccolte? VI LA MATRICE DEI DATI MRC / VI - La matrice dei dati 1 Pro-memoria Variabile Variabile = rappresenta una proprietà raccolta sistematica di informazioni sulla proprietà corrispondente; Categorie della variabile: classi in cui suddividere le informazioni raccolte. MRC / VI - La matrice dei dati 2 1
Pro-memoria Definizione operativa = trasformazione della proprietà in variabile e degli stati sulla proprietà in categorie della variabile PROPRIETA VARIABILE stati categorie MRC / VI - La matrice dei dati 3 La matrice dei dati ( o matrice casi per variabili ) si usa se si vuole registrare in maniera SISTEMATICA gli stati dei casi su le proprietà rilevate MRC / VI - La matrice dei dati 4 2
Es. FRUIZIONE DEI MEDIA IL PUBBLICO non è un soggetto unico né una massa indistinta, ma una popolazione molto differenziata. Necessità di rilevare più casi LA FRUIZIONE DEI MEDIA si differenzia al proprio interno per media diversi, per età, stili di vita, consumi, territori, etc Necessità di rilevare più proprietà MRC / VI - La matrice dei dati 5 Raccolta sistematica di informazioni mediante i VETTORI = sequenza ordinata di informazioni Si possono organizzare le informazioni in due fasci di vettori: in colonna e in riga: Ogni vettore-colonna: le informazioni su una variabile; Ogni vettore-riga: le informazioni su un caso Due fasci di vettori paralleli, intersecandosi in modo che un fascio sia perpendicolare all altro, costituiscono una MATRICE. MRC / VI - La matrice dei dati 6 3
Nell intersezione di una riga con una colonna: CELLA dato Ogni cella contiene un informazione ( dato ) su un caso e su una variabile MRC / VI - La matrice dei dati 7 variabile caso Rossi Genere sessuale maschio Informazione (dato): Rossi è un maschio MRC / VI - La matrice dei dati 8 4
MRC / VI - La matrice dei dati 9 Di solito nelle celle della matrice vi sono codici = valori che riassumono un informazione Camilla ha risposto Diploma scuola superiore 0 Nessun titolo 1 licenza elementare 2 licenza media 3 diploma scuola superiore 4 laurea triennale 5 laurea magistrale, master, dottorato 99 l intervistato non risponde, la risposta non è classificabile TITOLO DI STUDIO Camilla 3 Petronilla Domitilla ETA 3 è un codice che traduce diploma scuola superiore. PREFERENZE TG MRC / VI - La matrice dei dati 10 5
A che cosa servono i codici 1) A sintetizzare le informazioni (es. un solo numero riassume una risposta di molte lettere alfabetiche); 2) Si usano i numeri come codici per facilitare l analisi delle relazioni fra più variabili. RISCHIO: usare operazioni matematiche su numeri che sono tali solo in apparenza (v. dopo, su differenza fra variabili categoriali/ordinali e variabili cardinali) MRC / VI - La matrice dei dati 11 Il codebook (o piano di codifica ) = raccolta di tutte le variabili e dei codici Informazioni sull istanza di adozione [annopres_1] Anno di presentazione dell istanza:.<digitare l anno> Istruzioni per la codifica [tipist_1]tipo di istanza: 1 Nazionale 2 Internazionale 3 Entrambi Variabile e suo nome Categorie e codici [confer_1] Conferimento incarico all ente autorizzato: 1 No 2 Sì Qui il codice coincide con l anno Se sì: [annconfer_1] anno:.<digitare l anno> [nomente_1] nome dell ente:.. <digitare il nome proprio dell ente> MRC / VI - La matrice dei dati 12 6
I dati in matrice devono riprodurre i codici Esempio 1 = maschio = codice 1, 1, 1, 1 = dati 1, 1, 1, 2, 2 = sequenza ordinata di dati = vettore-colonna MRC / VI - La matrice dei dati 13 La matrice è un potente concentratore di informazioni MRC / VI - La matrice dei dati 14 7
COME RISOLVERE ALCUNI PROBLEMI PER L IMMISSIONE DEI DATI IN MATRICE MRC / VI - La matrice dei dati 15 1) L unità di analisi Non si può analizzare complessivamente una matrice se i suoi casi sono individui + famiglie + regioni, etc. L unità di analisi deve essere sempre la stessa (es. solo individui); Per più unità di analisi occorrono più matrici, una per unità MRC / VI - La matrice dei dati 16 8
2) L ambito temporale E possibile rilevare le stesse proprietà sugli stessi casi ma in momenti diversi p. es. nel panel; o nelle serie temporali di unità ecologiche ricostruire un processo diacronico MRC / VI - La matrice dei dati 17 - Persone di 14 anni e più che parlano di politica o che si informano di politica almeno una volta a settimana, che hanno partecipato online a consultazioni o votazioni su problemi sociali o politici o hanno letto e postato opinioni su problemi sociali o politici sul web negli ultimi 3 mesi per sesso, regione e ripartizione geografica - Anni 2011-2016 (valori percentuali) REGIONI E RIPARTIZIONI GEOGRAFICHE MASCHI Piemonte 78,0 79,8 80,4 77,2 78,2 74,0 Valle d'aosta/vallée d'aost 74,2 73,6 74,0 78,7 74,9 71,1 Liguria 80,2 78,8 78,5 79,0 75,5 71,4 Lombardia 78,3 79,9 75,2 74,9 74,3 73,1 Trentino-Alto Adige/Südtiro 78,9 77,3 78,0 78,4 74,9 70,3 Bolzano/Bozen 76,7 77,1 76,9 78,9 74,6 69,1 Trento 81,0 77,5 79,0 77,9 75,1 71,5 Veneto 80,2 80,6 83,9 81,3 78,1 77,4 Friuli-Venezia Giulia 81,5 79,0 81,6 77,9 75,9 73,3 Emilia-Romagna 79,9 79,6 80,8 80,4 78,9 74,3 Toscana 80,0 76,1 79,6 77,8 80,7 75,2 Umbria 80,2 76,4 83,2 73,7 80,1 75,3 Marche 75,4 77,3 81,5 75,6 77,1 74,9 Lazio 75,4 73,4 78,9 78,9 78,1 72,7 Abruzzo 74,1 76,1 76,2 71,5 72,9 72,4 Molise 69,8 71,7 69,1 70,5 69,0 64,8 Campania 68,9 67,4 65,9 66,9 63,9 59,9 Puglia 68,2 64,8 69,2 66,5 66,9 65,0 Basilicata 66,6 61,9 73,0 64,6 56,1 66,6 Calabria 62,6 64,8 66,0 67,3 65,6 54,9 Sicilia 63,8 67,8 65,8 64,8 66,3 60,6 Sardegna 77,6 79,3 78,7 77,3 73,2 71,0 Nord 79,1 79,7 79,1 77,8 76,5 74,0 Centro 77,2 75,0 79,8 77,7 79,0 74,0 Mezzogiorno 67,9 68,2 68,5 67,5 66,4 62,6 Italia 74,9 74,8 75,6 74,2 73,5 70,1 2011 2012 2013 Fonte: ISTAT - BES 2014 2015 2016 Unità ecologica: Regioni Ogni colonna della matrice è un anno 1 variabile in 6 anni = 6 colonne Serie temporale: come istantanee in 6 tempi diversi processo diacronico In matrice la stessa serie temporale (in 6 colonne) si ripete per altre variabili (tasso di occupazione, tasso di scolarizzazione, etc.) MRC / VI - La matrice dei dati 18 9
3) I dati mancanti (p. es. non risposte): Inserire nella cella corrispondente un codice particolare (p. es. 99) o più codici: 990 non sa rispondere; 995 non vuole rispondere; 999 la risposta non è pertinente Si può chiedere ad SPSS di calcolare le frequenze non considerando i dati mancanti MRC / VI - La matrice dei dati 19 Si possono analizzare i casi che hanno dati mancanti e rapportarli con altre variabili, p. es. socio-anagrafiche (p. es. molti casi con bassa scolarizzazione e/o avanzata età non hanno risposto la domanda era difficile). QUINDI anche i dati mancanti possono essere interessanti MRC / VI - La matrice dei dati 20 10
nelle variabili cardinali Qualora la distribuzione sia simmetrica (= molto raramente), si può sostituire il dato mancante con il valore centrale. Ma non è affatto detto che il valore centrale sia il più vicino alle reali posizioni di quel caso (Di Franco in Cannavò-Frudà 2007, 385) Valore centrale MRC / VI - La matrice dei dati 21 Se ci sono pochi dati mancanti (1% 3%) è bene non trasformarli artificiosamente. Se una variabile presenta troppi dati mancanti, conviene eliminarla piuttosto che distorcere le informazioni MRC / VI - La matrice dei dati 22 11
4) Le risposte multiple: PRIMA SOLUZIONE: trasformare ogni possibilità di scelta in una variabile: Quali sono i motivi per cui leggi Rocca? (max 3 risposte) <Similmente a quanto ho indicato per la domanda 6: [LEGGI_ 1/ LEGGI_2 / LEGGI_3] = tre colonne distinte 1 corrisponde alle mie idee religiose-ecclesiali 2 mi è utile 3 mi aiuta ad acquisire senso critico 4 è una voce libera senza padroni 5 mi interessa il confronto con idee diverse alle mie 6 ritrovo le mie idee socio-politiche 7 altro (specificare).. <non digitare il codice ma la risposta così come è scritta> MRC / VI - La matrice dei dati 23 SECONDA SOLUZIONE: trasformare ciascuna categoria in una variabile distinta, con 2 sole categorie: sì / no idee relig utilità senso critico etc Camilla 1 1 1 Priscilla 0 1 1 Domitilla 1 0 0 1 = sì 0 = no MRC / VI - La matrice dei dati 24 12