La matrice dati Matrice casi per variabili - Stessa unità di analisi (es. individui, nazioni, etc ) - Stesse informazioni per ogni caso CODIFICA Traduzione del materiale grezzo in matrice dati Tracciato record Indica la posizione di ogni variabile nella riga della matrice Codebook Assegna ad ogni modalità un valore numerico FILE Matrice dati memorizzata su supporto informatico La matrice dati (questionario) Domanda Batteria di domande e domande a risposta multipla Variabile Più Variabili ESEMPIO Ora le leggerò un elenco di problemi urbani. Vorrei sapere di quali lei è maggiormente insoddisfatto: I II Trasporti pubblici Orari uffici pubblici Traffico Nettezza urbana Illuminazione pubblica Approvvigionamento acqua 1
La matrice dati: dal questionario alle variabili v1 v2 v3 v4 v5 v6 v7 v8 Esempio di tracciato-record: La matrice dati Esempio di codebook: 2
La matrice dati Esempio di codebook: La matrice dati Matrice casi per variabili variabili X1 X2 X3 X4.. Xp 1 casi 2 3 n 3
La matrice dati: excel La matrice dati in Spss: variable view 4
La matrice dati in Spss: data view La matrice dati in Stata 5
La matrice dati in Stata: data editor La nostra matrice dati 6
La nostra matrice dati CODICI 1) Maturità profess. 2) Maturità tecnica 3) Classico o scientifico 4) Magistrale, artistico etc.. 5) Preferisco non rispondere 7
CODICI 1) Per nulla 2) Poco 3) Abbastanza 4) Molto 5) Preferisco non rispondere Come e dove reperire i dati Icpsr: http://www.icpsr.umich.edu/icpsrweb/landing.jsp 8
Come e dove reperire i dati http://zacat.gesis.org/webview/ Come e dove reperire i dati http://www.itanes.org/dati/ 9
Come reperire i dati http://www.europeansocialsurvey.org/ Come reperire i dati http://www.istat.it/it/ 10
L analisi monovariata - è un analisi puramente descrittiva dei fenomeni - informa come ogni variabile è distribuita tra i casi rilevati - rappresenta un passaggio inevitabile e necessario ad ogni analisi bivariata e quindi multivariata. - consente di analizzare la struttura del campione e la sua rappresentatività, attraverso le distribuzioni di frequenza delle variabili socio-grafiche (genere, età, etc.). Distribuzione di frequenza Definizione Presentazione Frequenze assolute Frequenze relative Frequenza cumulata Una rappresentazione nella quale ad ogni valore della variabile viene associata la frequenza con la quale esso si presenta forma grafica o tabellare Il numero di casi che rappresenta lo stesso valore della variabile sono il risultato della relativizzazione dei valori assoluti ad una base comune (esempio: 100) la somma delle frequenze corrispondenti ad un valore e a tutti quelli precedenti 1
Distribuzione di frequenza del titolo di studio Freq relative= (freq assolute/tot)*100 Es: (30/1200)*100=2.5 Distribuzione di frequenza: partito votato Diversa numerosità : pareggiare la base a 100 consente il confronto diretto 2
Le caratteristiche delle tabelle distribuzioni di frequenza compatte: presentare solo le frequenze percentuali, accompagnate dall indicazione della base del calcolo delle percentuali, cioè del totale del valore assoluto (N); cifre decimali: le distribuzioni di frequenza percentuali vengono presentate, per convenzione, con un decimale (caso più frequente) oppure senza decimali (consigliabile se la base delle percentuali è piccola, inferiore a 100) arrotondamenti se il decimale da eliminare si colloca tra 0 e 4, si arrotonda per difetto; se si colloca tra 5 e 9 si arrotonda per eccesso; Le caratteristiche delle tabelle il decimale zero: lo 0 va esplicitato. Pertanto il ventidue per cento si scriverà 22.0% e non 22. quadratura: se il totale delle frequenze percentuali da come valore 99.9 oppure 100.1, bisogna guardare ai valori percentuali la cui alterazione è meno rilevante. 3
Risposte multiple Quali sono i principali problemi della Sua Città? (max. due risposte) I II I + II % sui risposta risposta risposta rispondenti Trasporti pubblici 213 12 225 16.1 Orari uffici 322 105 427 30.6 Traffico 557 235 792 56.8 Nettezza urbana 143 43 186 13.3 Illuminazione pubbl. 84 25 109 7.8 Approvv. di acqua 75 43 118 8.5 Totale 1394 463 Non risponde 106 Pulizia e controllo del file -Controlli di plausibilità dei valori (es: valori strani, 8 etc ) ) -Controlli di congruenza -Valori mancanti (missing values) -Ponderazione 4
Ponderazione..un esempio Misure di tendenza centrale - Caratteristiche della variabile Moda Mediana Media Variabili NOMINALI Variabili ORDINALI Variabili CARDINALI 5
Misure di tendenza centrale Variabili nominali: Moda modalità di una variabile che si presenta nella distribuzione con maggiore frequenza (modalità prevalente); MODA Misure di tendenza centrale Mediana -se la variabile è ordinale oltre alla moda si può calcolare la mediana -essa rappresenta la modalità del caso che occupa il posto centrale nella distribuzione ordinata dei casi secondo quella variabile -se i casi sono dispari c è un solo caso che occupa la posizione centrale (N+1/2), se pari ci sono due casi (N/2 e N/2+1). In altri termini, la mediana è la modalità che occupa il posto centrale nella distribuzione ordinata delle osservazioni Il calcolo della mediana è possibile solo per caratteri quantitativi o qualitativi ordinabili. Deve essere possibile ordinare in senso crescente o decrescente le modalità del carattere e le unità corrispondenti. 6
Misure di tendenza centrale Calcolo della Mediana 1. Ordinare le unità in senso crescente rispetto alle modalità del carattere 2. Individuare la posizione in graduatoria dell unità centrale: se n è dispari, la posizione è (n+1)/2 se n è pari si hanno due unità centrali con posizione n/2 e n/2 +1; 3. Se n è dispari, la mediana è la modalità presentata dall unità centrale 4. Se n è pari si hanno due mediane date dalle modalità delle due unità centrali Misure di tendenza centrale Calcolo della Mediana: un esempio 7
Calcolo della Mediana: altro esempio Misure di tendenza centrale 2.410/2=1205 1.511+1/2=756 Misure di tendenza centrale Calcolo della Mediana: ancora un esempio (1505+1)/2= 753 Isernia (2011:176) 8
Misure di tendenza centrale Calcolo della mediana su variabili cardinali (continue) Es: Voto riportato all esame UNITA (n) voto 1 30 2 28 3 26 4 24 5 22 6 22 7 21 8 20 9 19 MEDIANA 10 16 (17+1)/2=9 11 15 12 12 13 12 14 10 15 8 16 6 17 4 Ricorda come si calcola la mediana: Ordinare le unità in senso crescente rispetto alle modalità del carattere. Individuare la posizione in graduatoria dell unità centrale: se n è dispari, la posizione è (n+1)/2 se n è pari si hanno due unità centrali con posizione n/2 e n/2 +1; Se n è dispari, la mediana è la modalità presentata dall unità centrale Se n è pari si hanno due mediane date dalle modalità delle due unità centrali. (se il carattere è quantitativo, possiamo considerare come mediana la semisomma, cioè la media, dei valori delle due unità centrali) Misure di tendenza centrale Per chiudere: Isernia (2011:177) 9
Misure di tendenza centrale Media aritmetica. Variabili CARDINALI/quantitative La media aritmetica di un insieme di n valori x 1, x 2, x n di un carattere quantitativo X è pari alla somma dei valori osservati divisa per il loro numero: (X 1 +X 2 +X 3 +X 4 +.+Xn) N Nota: in alcuni casi anche per le variabili cardinali conviene usare la mediana in luogo della media (es: reddito) UNITA voto 1 30 2 28 3 26 4 24 5 22 6 22 7 21 8 20 9 19 10 16 11 15 12 12 13 12 14 10 15 8 16 6 17 4 (30+28+26+..+4)=295 295/17 =17,35 10