L analisi monovariata

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "L analisi monovariata"

Transcript

1 L analisi monovariata - è un analisi puramente descrittiva dei fenomeni - informa come ogni variabile è distribuita tra i casi rilevati - rappresenta un passaggio inevitabile e necessario ad ogni analisi bivariata e quindi multivariata. - consente di analizzare la struttura del campione e la sua rappresentatività, attraverso le distribuzioni di frequenza delle variabili socio-grafiche (genere, età, etc.).

2 Distribuzione di frequenza Definizione Presentazione Frequenze assolute Frequenze relative Frequenza cumulata Una rappresentazione nella quale ad ogni valore della variabile viene associata la frequenza con la quale esso si presenta forma grafica o tabellare Il numero di casi che rappresenta lo stesso valore della variabile sono il risultato della relativizzazione dei valori assoluti ad una base comune (esempio: 100) la somma delle frequenze corrispondenti ad un valore e a tutti quelli precedenti

3 Distribuzione di frequenza del titolo di studio Freq relative= (freq assolute/tot)*100 Es: (30/1200)*100=2.5

4 Distribuzione di frequenza: partito votato Diversa numerosità : pareggiare la base a 100 consente il confronto diretto

5 Le caratteristiche delle tabelle distribuzioni di frequenza compatte: presentare solo le frequenze percentuali, accompagnate dall indicazione della base del calcolo delle percentuali, cioè del totale del valore assoluto (N); cifre decimali: le distribuzioni di frequenza percentuali vengono presentate, per convenzione, con un decimale (caso più frequente) oppure senza decimali (consigliabile se la base delle percentuali è piccola, inferiore a 100) arrotondamenti se il decimale da eliminare si colloca tra 0 e 4, si arrotonda per difetto; se si colloca tra 5 e 9 si arrotonda per eccesso;

6 Le caratteristiche delle tabelle il decimale zero: lo 0 va esplicitato. Pertanto il ventidue per cento si scriverà 22.0% e non 22. quadratura: se il totale delle frequenze percentuali da come valore 99.9 oppure 100.1, bisogna guardare ai valori percentuali la cui alterazione è meno rilevante.

7 Risposte multiple Quali sono i principali problemi della Sua Città? (max. due risposte) I II I + II % sui risposta risposta risposta rispondenti Trasporti pubblici Orari uffici Traffico Nettezza urbana Illuminazione pubbl Approvv. di acqua Totale Non risponde 106

8 Pulizia e controllo del file -Controlli di plausibilità dei valori (es: valori strani, 8 etc ) -Controlli di congruenza -Valori mancanti (missing values) -Ponderazione

9 Ponderazione..un esempio

10 Misure di tendenza centrale - Caratteristiche della variabile Moda Mediana Media Variabili NOMINALI Variabili ORDINALI Variabili CARDINALI

11 Misure di tendenza centrale Variabili nominali: Moda modalità di una variabile che si presenta nella distribuzione con maggiore frequenza (modalità prevalente); MODA

12 Misure di tendenza centrale Mediana -se la variabile è ordinale oltre alla moda si può calcolare la mediana -essa rappresenta la modalità del caso che occupa il posto centrale nella distribuzione ordinata dei casi secondo quella variabile -se i casi sono dispari c è un solo caso che occupa la posizione centrale (N+1/2), se pari ci sono due casi (N/2 e N/2+1). In altri termini, la mediana è la modalità che occupa il posto centrale nella distribuzione ordinata delle osservazioni Il calcolo della mediana è possibile solo per caratteri quantitativi o qualitativi ordinabili. Deve essere possibile ordinare in senso crescente o decrescente le modalità del carattere e le unità corrispondenti.

13 Misure di tendenza centrale 1. Ordinare le unità in senso crescente rispetto alle modalità del carattere 2. Individuare la posizione in graduatoria dell unità centrale: Calcolo della Mediana se n è dispari, la posizione è (n+1)/2 se n è pari si hanno due unità centrali con posizione n/2 e n/2 +1; 3. Se n è dispari, la mediana è la modalità presentata dall unità centrale 4. Se n è pari si hanno due mediane date dalle modalità delle due unità centrali

14 Misure di tendenza centrale Calcolo della Mediana: un esempio

15 Calcolo della Mediana: altro esempio Misure di tendenza centrale 2.410/2= /2=756

16 Misure di tendenza centrale Calcolo della Mediana: ancora un esempio (1505+1)/2= 753 Isernia (2011:176)

17 Misure di tendenza centrale Calcolo della mediana su variabili cardinali (continue) Es: Voto riportato all esame UNITA (n) voto MEDIANA (17+1)/2=9 Ricorda come si calcola la mediana: Ordinare le unità in senso crescente rispetto alle modalità del carattere. Individuare la posizione in graduatoria dell unità centrale: se n è dispari, la posizione è (n+1)/2 se n è pari si hanno due unità centrali con posizione n/2 e n/2 +1; Se n è dispari, la mediana è la modalità presentata dall unità centrale Se n è pari si hanno due mediane date dalle modalità delle due unità centrali. (se il carattere è quantitativo, possiamo considerare come mediana la semisomma, cioè la media, dei valori delle due unità centrali)

18 Misure di tendenza centrale Per chiudere: Isernia (2011:177)

19 Misure di tendenza centrale Media aritmetica. Variabili CARDINALI/quantitative La media aritmetica di un insieme di n valori x 1, x 2, x n di un carattere quantitativo X è pari alla somma dei valori osservati divisa per il loro numero: (X 1 +X 2 +X 3 +X 4 +.+Xn) N Nota: in alcuni casi anche per le variabili cardinali conviene usare la mediana in luogo della media (es: reddito) UNITA voto ( )= /17 =17,35

20 Misure di tendenza centrale Moda - se la variabile è nominale l unica misura di tendenza centrale calcolabile è la moda - essa rappresenta la modalità di una variabile che si presenta nella distribuzione con maggiore frequenza (modalità prevalente); Mediana - se la variabile è ordinale oltre alla moda si può calcolare la mediana - essa rappresenta la modalità del caso che occupa il posto di mezzo nella distribuzione ordinata dei casi secondo quella variabile - se i casi sono dispari c è un solo caso che occupa la posizione centrale (N+1/2), se pari ci sono due casi (N/2 e N/2+1). Media aritmetica - esprime la somma dei valori assunti dalla variabile su tutti i casi divisa per il numero di casi

21 Misure di tendenza centrale Moda Mediana Media Variabili NOMINALI Variabili ORDINALI Variabili CARDINALI

22 Misure di tendenza centrale Media aritmetica. Variabili CARDINALI/quantitative La media aritmetica di un insieme di n valori x 1, x 2, x n di un carattere quantitativo X è pari alla somma dei valori osservati divisa per il loro numero: (X 1 +X 2 +X 3 +X 4 +.+Xn) N Nota: in alcuni casi anche per le variabili cardinali conviene usare la mediana in luogo della media (es: reddito) UNITA voto ( )= /17 =17,35

23 Esempio: come varia la media tra Paesi Valori medi su scala 0-10 Identità Sostegno Belgio 7,5 7,6 Danimarca 8,0 7,9 Germania 7,4 6,9 Grecia 5,3 6,5 Spagna 7,8 8,2 Finlandia 7,1 6,5 Francia 6,6 6,4 Irlanda 6,8 8,5 Italia 6,1 6,6 Lussemburgo 8,5 8,5 Olanda 7,1 8,2 Austria 6,7 5,8 Portogallo 7,0 7,3 Svezia 8,0 6,4 Gran Bretagna 4,2 4,1 Irlanda del Nord 4,4 5,8 Cipro 6,0 6,2 Rep. Ceca 6,7 6,3 Estonia 7,2 7,0 Ungheria 7,7 5,1 Lettonia 5,8 4,7 Lituania 6,4 7,9 Malta 6,0 7,6 Polonia 7,2 8,0 Slovacchia 8,0 8,4 Slovenia 7,4 6,8 Bulgaria 6,0 7,2 Romania 7,4 8,1 MEDIA UE 6,9 7,0 Fonte: Serricchio, 2011 (Elaborazioni su Eb )

24 POR ITA BEL SPA DEN HUN AUT GER EU SLO FRA GREE POL SLK EST GB BUL -1,2-1 -0,8-0,6-0,4-0,2 0 0,2 0,4 0,6 0,8 Fonte: Bellucci. Sanders Serricchio, 2012 (Elaborazioni su dati Intune 2007

25 Misure di variabilità Indici di omogeneità/eterogeneità (variabili nominali) una variabile nominale ha una distribuzione massimamente omogenea quando tutti i casi si presentano con la stessa modalità, mentre è massimamente eterogenea quando i casi si distribuiscono equamente fra le modalità Somma delle proporzioni al quadrato (assoluto) L indice relativo neutralizza l effetto del numero delle modalità Es: Indice di frazionalizzazione di Rae (sistema partitico in base ai voti)

26 Misure di variabilità Differenza interquartile (variabili ordinali) è la differenza tra il primo e il terzo quartile (Q) Se dividiamo la distribuzione in 4 parti di uguale numerosità, i quartili sono i valori che segnano i confini tra i quattro quarti. (primo Q ha sotto il 25% e sopra il 75% dei casi). Il secondo Q è la mediana e cosi via)

27 Misure di variabilità Variabili cardinali Deviazione standard (o scarto quadratico medio) Radice quadrata di: somma degli scarti dei singoli valori alla media, elevati al quadrato, divisi per il numero dei casi Varianza Quadrato della deviazione standard Coefficiente di variazione Rapporto tra deviazione standard e la media (utile per confrontare variabili con media molto differente)

28 Misure di variabilità Coefficiente di variazione: un esempio

29 Misure di variabilità Rapporto di concentrazione di Gini Se ci riferiamo a quantità possedute dalle unità di analisi (es: reddito, produzione industriale, numero di addetti, numero di iscritti ad un partito per provincia etc.) possiamo calcolare la CONCENTRAZIONE della variabile Caratteri trasferibili da una unità all altra (esempio: età non si può trasferire, reddito, popolazione si) Equidistribuzione vs. concentrazione (es. reddito. N unità detengono 1/N di reddito. Oppure 1 unità possiede l ammontare; oppure abitanti in provincia)

30 Rappresentazioni grafiche delle distribuzioni di frequenza - Diagramma a barre (o ortogramma) - Diagramma a nastri - diagramma a settori circolari (detto anche diagramma a torta), vengono utilizzati soprattutto quando la distribuzione di frequenza si riferisce a variabili nominali; - Istogramma, quando la distribuzione di frequenza è il risultato di una variabile cardinale

31 Rappresentazioni grafiche delle distribuzioni di frequenza Motivi dell'astensione al voto europeo del ITALIA 1,36 2,26 3,17 4,52 4,98 31,22 5,88 Opposizione alla UE Comportamento solito (al voto raramente) 6,33 7,69 Mancanza di dibattiti pubblici/campagna elettorale Disinteresse per le questioni europee Insoddisfazione verso il Parlamento Europeo Impegni familiari 16,29 8,14 Impegni al lavoro Problemi di salute Scarsa conoscenza della UE/delle elezioni europee Scaso interesse per la politica 14,00 12,67 9,50 In vacanza/lontananza da casa Altre cause Voto è inefficace/inutile Disaffezione per la politica in generale Eurobarometro

32 Rappresentazioni grafiche delle distribuzioni di frequenza Affluenza elezioni europee (2014) BEBelgio LULussemburgo MTMalta ELGrecia ITItalia DKDanimarca IEIrlanda SESvezia DEGermania LTLituania ATAustria CYCipro ESSpagna FRFrancia FIFinlandia NLPaesi Bassi EEEstonia BGBulgaria UKRegno Unito PTPortogallo RORomania LVLettonia HUUngheria HRCroazia SISlovenia PLPolonia CZRepubblica ceca SKSlovacchia Fonte: Parlamento Europeo

33 Rappresentazioni grafiche delle distribuzioni di frequenza Un welfare europeo Un Presidente UE eletto direttamente Una carta d'identità europea Il diritto di voto Un servizio civile per i disastri L'educazione civica per ragazzi Le ambasciate europee 8 10 EU-27 ITA Una squadra olimpica europea 5 6 Nessuno di questi 5 8 Non voglio essere cittadino UE 1 4 Eurobarometro

34 Belgio Danimarca Germania Grecia Spagna Finlandia Francia Irlanda Italia Lussemburgo Olanda Austria Portogallo Svezia Gran Bretagna Irlanda del Nord Cipro Rep. Ceca Estonia Ungheria Lettonia Lituania Malta Polonia Slovacchia Slovenia Bulgaria Romania MEDIA UE Rappresentazioni grafiche Identità europea e sostegno europeo tra i Paesi UE 9,00 8,00 Identità Sostegno 7,00 6,00 5,00 4,00 3,00 2,00 1,00 0,00 Elaborazioni su Eb

35 Raggruppamento in classi Manipolare le variabili: perché? -Dicotomizzazione variabili (si/no) -Invertire polarità semantica -Raggruppare modalità. Es. classi di età; ideologia (sinistradestra); reddito; titolo di studio Classificazione -è il processo secondo il quale i casi studiati vengono raggruppati in sottoinsiemi (classi) sulla base della loro similarità (indicatori politici, indicatori sociali, indicatori economici, etc.)

36 Tassonomie e tipologie Tassonomia Tipologia Classificazione nella quale le variabili che definiscono la classificazione sono considerate in successione, in una struttura gerarchica che procede per variabili di generalità decrescente (tassonomia dei mammiferi: monotremi, marsupiali, insettivori, roditori, cetacei, etc.) > Dendrogramma (vedi Corbetta) Vedi anche tassonomia dei regimi Classificazione nella quale le variabili che la definiscono sono considerate simultaneamente (ad es. la classificazione congiunta di professione, reddito e genere è una tipologia). Esempio: tipologie della partecipazione politica (Almond e Verba ) o degli elettori italiani (Sani, Itanes) Altro esempio: Identità sociali (locale vs. nazionale; nazionale vs. europea) Oppure: orientamenti verso la crisi economica (Eurobarometro)

37 Esempi di tipologie/1 Cultura politica e tipologie della partecipazione politica (Almond e Verba, 1963 ) Parrocchiali (parochial) Sottomessi (subject) Partecipanti (participant) Tipologia degli elettori italiani (Sani, 2007; Sani in Bellucci e Segatti, Itanes, 2010) Civis nobilis (cittadino modello): 21,3% Civis communis (partecipa con un certo distacco): 39,9% Civis marginalis (cittadino apatico): 38,8%

38 Esempi di tipologie/2 Italia paese tradizionalista: religiosità e fiducia interpersonale (Maraffi, 2007) RELIGIOSI DIFFIDENTI 58,4% SECOLARI DIFFIDENTI 17,5% RELIGIOSI FIDUCIOSI 17,4% SECOLARI FIDUCIOSI 6,7% Il dataset utilizzato da Maraffi è l European Social Survey (ESS) del 2002 Nota: Il livello di religiosità degli italiani, misurato con la domanda sull importanza della religione nella propria vita, è tra i più alti in Europa (media 6,47 su scala 0-10, terzo dopo Grecia (8,34) e Polonia (7,26). Il livello di fiducia interpersonale degli italiani è invece tra i più bassi: 4,52 (media su scala 0-10) contro 6,99 dei danesi, primi.

39 (Eurobarometro 75.3, 2011 in Serricchio, 2012) Esempi di tipologie Tipologia: orientamenti verso la crisi economica 1) Che cosa pensa della situazione attuale in ognuno dei seguenti settori? La situazione dell economia in Italia. (Opzioni di risposta: ottima, abbastanza buona, abbastanza negativa, negativa molto negativa, non sa) 2) Quali sono le sue aspettative per i prossimi dodici mesi: i prossimi dodici mesi saranno migliori, peggiori o senza cambiamenti, riguardo a...? La situazione economica in Italia. (risposte possibili: migliori, peggiori, senza cambiamenti, non so). Italia Soddisfatti e fiduciosi 12,7% TIPI Insoddisfatti e fiduciosi 29,2% Soddisfatti e preoccupati 9,7% Insoddisfatti e preoccupati 48,4% tot 100 N 559

40 Esempi di tipologie Identità nazionale e europea Attaccamento alla nazione: Molto, Abbastanza, Poco, Per nulla Attaccamento all Europa: Molto, Abbastanza, Poco, Per nulla Ricodifica Dicotomica: SI/NO Dicotomica: SI/NO TIPOLOGIA: (quattro tipi) 1) Attaccato a nazione e Europa (SI/SI) 2) Attaccato a nazione ma non a Europa (SI/NO) 3) Attaccamento a Europa ma non a nazione (NO/SI) 4) Non attaccato a nazione né a Europa (NO/NO) Elaborazione su dati Intune, ) Italiani e Europei 71,1% 3) Solo Europei 7,7% 2) Solo Italiani 17,9% 4) No identità 3,3%

41 Esempi di tipologie Identità nazionale e europea: esempio di sintassi spss freq q11_3 q11_4. recode q11_3 q11_4 (1,2= 2) (3,4=1) (else=sysmis) into natid euid. freq natid euid. if (natid=1) and (euid=1) tipo1=1. if (natid=1) and (euid=2) tipo1=2. if (natid=2) and (euid=1) tipo1=3. if (natid=2) and (euid=2) tipo1=4. freq tipo1.

42 Capano, Piattoni, Raniolo, Verzichelli (2014:130) Ancora esem Ancora esempi

43 La costruzione di indici INDICE: Nota: il termine indice è utilizzato con elasticità Variabile funzione di altre variabili che sintetizza le informazioni contenute nelle singole variabili operativizzando un concetto complesso del quale le singole variabili sono espressioni parziali ESEMPI DI INDICI: RELIGIOSITÀ FAMILIARE (Corbetta) PARTECIPAZIONE POLITICA IDENTITÀ EUROPEA VALORI POST-MATERIALISTI Etc.

44 ESEMPIO DI INDICE Livello concettuale IDENTITÀ NAZIONALE Dimensioni concettuali Identità culturale/etnica (ascritta) Identità civica (acquisita) Definizioni concettuali Importanza di essere nato in Italia, orgoglio per patrimonio culturale etc Importanza di rispettare le leggi, orgoglio per sistema di protezione sociale etc. Definizioni operative Dati empirici set di items (vedi questionario Intune*) risposte al questionario set di items (vedi questionario Intune *) risposte al questionario

45 Dalle variabili agli indici Le persone hanno idee diverse su ciò che significa essere italiano. Secondo lei, quanto è importante ciascuno dei seguenti aspetti per essere italiano? V1 Essere cristiano V2 Condividere le tradizioni culturali italiane V3 Essere nato in Italia V4 Avere genitori italiani V5 Rispettare le leggi e le istituzioni italiane V6 Sentirsi italiano V7 Avere la padronanza dell'italiano V8 Esercitare i diritti dei cittadini, ad esempio essere attivi nella politica dell'italia Modalità di risposta: molto importante, abbastanza importante, poco importante, per nulla importante Analisi fattoriale (V1+V2+V3+V4+V6) IDENTITÀ NAZIONALE ASCRITTA (V5+V7+V8) IDENTITÀ NAZIONALE ACQUISITA INDICI (o scale) di IDENTITÀ NAZIONALE OMOGENEIZZAZIONE DEL CAMPO DI VARIAZIONE Var-min/max-min

46 Dalle variabili agli indici. Esempio di sintassi spss FREQUENCIES VARIABLES= q21 q22 q23 q24 q25 q26 q27 q28 /ORDER= ANALYSIS. compute nat_achieve =(q24+q26+q27). compute nat_ascrib =(q21+q22+q23+q25). freq nat_achieve nat_ascrib. compute nat_id =(nat_achieve+nat_ascrib). freq nat_id. compute nat_idn=10*(nat_id-15)/(28-15). freq nat_idn.

47 Altre operazioni di trasformazione delle variabili Standardizzazione Attribuisce a tutte le variabili sottoposte a questa operazione lo stesso scarto-tipo dalla media. Si calcola sottraendo a ciascun valore la media, dividendo poi il risultato per la deviazione standard. A cosa serve? Consente confronto tra scale diverse (es: voto di diploma espresso in 60esimi e 100esimi).

48 Altre analisi monovariate Su dati aggregati -Rapporti -Serie temporali e serie territoriali -Variazioni assolute e relative (punti% e %) -Numeri indici (es. numeri indice Istat)

49 Rapporti Di composizione (parte al tutto, es: maschi su popolazione; elettrici/totale elettori) Di coesistenza: (una parte sull altra, es: maschi su femmine, occupati in agricoltura/occupati industria; elettori/elettrici) Di derivazione: es. quoziente di natalità =nati/popolazione X 1000; laureati/iscritti all univ. Medi: es: densità della popolazione =n.abitanti/superficie del territorio

50 Serie temporali e territoriali Serie temporale (o storica): sequenza di valori assunti dalla variabile nel tempo Serie territoriale: sequenza di valori in diversi aggregati territoriali

51 Studiare la variazione Variazioni assolute.il partito A passa da un milione di voti a un milione e duecentomila voti tra le elezioni del 2008 e del 2013 ( ).e relative: il partito A cresce del 16,6% (e non in punti percentuali ) Altro esempio: voti ad un partito che passa dall 13,3% al 14,7%, aumenta di 1,4 punti percentuali o del 10%)

52 I numeri indice Servono per calcolare la variazione relativa.ma soprattutto le variazioni rispetto a una base di riferimento (es: si pone a 100 un dato anno e si osserva il fenomeno) Sono numeri puri e perciò consentono il confronto tra diverse variabili Base fissa e base mobile

53 Numeri indice un esempio Andamento dei morti per droga in Italia: Anno morti Incremento percentuale N. indice 1985= N. Indice a base mobile , , , = 292*100/242 e cosi via Corbetta (1999:547)

54 Altri esempi per confronti Itanes, Voto Amaro (2013:21)

55 L analisi bivariata Distribuzioni di frequenza e misure di tipicità (tendenza centrale) servono a descrivere e sintetizzare i dati, per poterli comparare con altre distribuzioni (gruppi differenti della popolazione o del campione esaminato). Tali comparazioni sono alla base delle ipotesi circa l esistenza di una relazione fra due variabili (RELAZIONI BIVARIATE). Le tabelle che organizzano queste comparazioni sono chiamate TABELLE A DOPPIA ENTRATA (o cross-tabulation) MA.

56 L analisi bivariata VARIABILE INDIPENDENTE VARIABILE DIPENDENTE NOMINALE NOMINALE Tavole di contingenza CARDINALE (evento raro)* CARDINALE Analisi della varianza Regressione e correlazione Nota: una variabile ordinale può essere trattata come una nominale e, in alcuni casi, anche come una cardinale (es: dicotomizzandola) * Qualora capitasse, si potrebbe sempre raggruppare in classi la cardinale e procedere con una cross-tab

57 Un esempio di tabella a doppia entrata Var. di colonna (usualmente è la indip.) Var. di riga (di solito è la dip.) Marginale di riga (distribuzione di freq. Della var. praticanti) Marginale di colonna (distribuzione di freq. della var. età) Corbetta (1999:558)

58 Età e pratica religiosa: c è relazione? DOMANDA: c è una relazione tra età e pratica religiosa? a) Valori assoluti b) Su 100 praticanti quanti sono giovani etc (profilo per età) c) Distribuzione della pratica religiosa per classi di età. Su 100 giovani int, 24,4 sono praticanti etc d) Su 100 intervistati, 9% sono praticanti e giovani, 12,6 praticanti e maturi etc ).. QUALE TABELLA SCEGLIERE?

59 Altro esempio: età e consumo di dolci DOMANDA: c è una relazione tra età e consumo di dolci? CONSUMO DI DOLCI Fino a 25 anni ETA 25 anni e oltre Regolare 80% 58% Non regolare 20% 42% TOTALE 100% (1302) 100% (1707)

60 Altro esempio: identità nazionale e europea DOMANDA: c è una relazione tra identità nazionale e identità europea? Europa Non attaccato Nazione Non attaccato Attaccato Total ,1% 16,6% 19,8% Attaccato ,9% 83,4% 80,2% Total ,0% 100,0% 100,0% La sintassi spss CROSSTABS /TABLES=euid BY natid /FORMAT= AVALUE TABLES /CELLS= COUNT COLUMN /COUNT ROUND CELL.

61 B arisione e Mannheimer, 1999 Altri esempi: l interesse per la politica

62 B arisione e Mannheimer, 1999 Altri esempi: l interesse per la politica

63 Altro esempio: interesse per la politica e soddisfazione democratica DOMANDA: c è una relazione tra interesse per la politica e soddisfazione democratica? demsat No Si Total polint Total No Si Count % within demsat 50,3% 49,7% 100,0% % within polint 70,0% 61,3% 65,4% Count % within demsat 40,6% 59,4% 100,0% % within polint 30,0% 38,7% 34,6% Count % within demsat 47,0% 53,0% 100,0% % within polint 100,0% 100,0% 100,0% Calcolare le percentuali di riga E di colonna può essere utile a scopi esplorativi, quando non è chiara la direzione causale LEGENDA: demsat= soddisfazione per il funzionamento della democrazia polint= interesse per la politica Dati: Intune 2007 (Italia)

64 Alcune regole per le cross-tab Nella lettura di una cross-tab si parte sempre dall esterno per andare verso l interno (cd. principio del carciofo ) vengono indicate le variabili che sono incrociate: - la variabile indipendente X è scritta in alto, in colonna - la variabile dipendente Y è riportata in riga per ciascuna variabile sono specificate le modalità ciascuna cella della tabella contiene le frequenze, cioè il numero dei casi che possiedono le diverse modalità considerate (le frequenze possono essere espresse in termini assoluti o relativi percentuali) REGOLE AUREE! Le percentuali si calcolano nella direzione della variabile indipendente (dobbiamo capire come varia la dipendente ENTRO le modalità della indipendente) Per cui: quando le percentuali sono calcolate - per colonna, si compara per riga; viceversa, quando le percentuali sono calcolate per riga, si compara per colonna

65 Peculiarità delle tavole di contingenza Parsimoniosità. Vanno riportate solo le percentuali che servono all analisi. Ma la tabella deve essere esaustiva! Totali. Ogni riga o colonna percentuale finisce col totale 100, consentendo così al lettore di capire in che direzione sono state calcolate le percentuali Base delle percentuali. Sotto al totale va riportata, in genere tra parentesi, la base della percentuale (N). Infatti un conto è dire che i giovani sono praticanti per il 25% su un campione di 100 individui ed un altro dirlo relativamente ad un campione di individui. Si ritiene imprudente calcolare e commentare percentuali su basi inferiori a 50 casi (Corbetta docet!)

66 Peculiarità delle tavole di contingenza Cifre decimali, decimale zero, arrotondamenti, quadratura. Si veda l analisi monovariata Intestazione. Le tabelle debbono essere sempre intestate (titolo) ed autoesplicative. Per esempio la frase Intensità della partecipazione politica secondo il partito votato è più chiara chiara rispetto a Relazione fra partecipazione politica e preferenza partitica (vedi slide precedente, alla voce parsimoniosità )

67 Leggere una tabella selezionare la modalità o le modalità più significative e centrare su di queste l analisi calcolare l indice di differenza percentuale Una differenza affinché sia degna di nota dovrebbe essere superiore ai 5 punti percentuali forma della relazione: se al crescere di una variabile cresce anche l altra si può dire che la relazione che si presenta agli occhi del ricercatore è monotonica o lineare.

68 Accertare una relazione Come accertare l esistenza di una effettiva relazione causale tra la variabile indipendente X e la variabile dipendente Y? IPOTESI NULLA e TEST DEL CHI QUADRO introduzione di una VARIABILE DI CONTROLLO

69 LOGICA DEL TEST DEL CHI QUADRO Formulazione dell ipotesi nulla, che assume l assenza di relazione fra le due variabili considerate. Individuazione delle frequenze che si dovrebbero ottenere se si verificasse l ipotesi nulla, cioè l assenza di relazione (frequenze attese ). Comparazione delle frequenze attese con quelle osservate empiricamente nel campione analizzato. Valutazione della probabilità con cui la differenza tra frequenze attese e quelle osservate possa essere dovuta al caso.

70 Il test del chi-quadro: un esempio Corbetta, 1999)

71 Il test del chi-quadro: altro esempio Isernia, 2011

72 Il test del chi-quadro: altro esempio Isernia, 2011

73 Il test del chi-quadro: altro esempio χ 2 =126,4 p < 0,001 Isernia, 2011

74 CONDIZIONI DEL TEST che il campione sia estratto casualmente, cioè che ogni individuo abbia la stessa probabilità di essere estratto di ogni altro; che le categorie o modalità di ciascuna delle due variabili siano mutuamente esclusive ed esaustive, per cui ciascun individuo o caso non può essere collocato che in una ed una sola cella; che la maggioranza (più dell 80%) delle frequenze attese abbiano una frequenza superiore a 5 casi.

75 Riepilogando.qualche riflessione - Quando non è consigliabile rigettare l ipotesi nulla? Quando la probabilità di commettere errore è superiore al 5 per cento (dunque quando il test è p<0,05) - Chi-quadro sensibile alla numerosità campionaria: cautela!!! - Test utile per orientarsi ma occorre sempre cautela, parliamo di probabilità. E sono necessarie altre prove, tra cui l introduzione di una terza variabile (di controllo)

76 Variabili nominali Φ (phi) V di Cramèr Misure di associazione r di Pearson (per nominali solo se tabella 2x2) Nota: nella tabelle 2X2 phi, V e r coincidono Variabili ordinali Tau-c di Kendall Gamma di Goodman e Krusakal d di Somers

77 Per esaminare in modo sistematico la relazione fra due variabili bisogna introdurre una terza variabile di controllo: ISTRUZIONE Relazioni trivariate ETA TOLLERANZA

78 tenere costante la relazione Scopo dell elaborazione è determinare se la relazione fra la variabile indipendente X e la variabile dipendente Y sia dovuta o meno ad un terzo fattore Z Dire che la relazione fra X ed Y dipende da Z significa che se Z non si manifestasse, allora la relazione fra X e Y non esisterebbe. ES: I giovani sono più tolleranti degli anziani perché hanno un maggiore livello di istruzione significa che Se i giovani non avessero un maggiore livello di istruzione degli anziani, non sarebbero più tolleranti. Per accertare se il livello di istruzione esercita un tale effetto sulla relazione bivariata fra età e tolleranza, bisogna tenere sotto controllo, ovvero mantenere costante, la terza variabile addizionale così da specificarne l eventuale influenza sulla relazione stessa. Un modo per farlo è la classificazione in sottogruppi: si creano tanti sottogruppi quante sono le modalità della variabile di controllo e si esamina la relazione bivariata iniziale per ciascuno di tali sottogruppi.

79 Consumo di dolci per stato civile STATO CIVILE Sposati Non sposati Regolare 63% 75% CONSUMO DI DOLCI Non regolare 37% 25% TOTALE 100% (2010) 100% (999)

80 Consumo di dolci per età ETA Fino a 25 anni 25 anni e oltre Regolare 80% 58% CONSUMO DI DOLCI Non regolare 20% 42% TOTALE 100% (1302) 100% (1707)

81 Consumo di dolci per stato civile, controllando per l età ETA Fino a 25 anni 25 anni e oltre STATO CIVILE Sposato Non sposato Sposato Non sposato Regolare 81% 79% 58% 60% CONSUMO DI DOLCI Non regolare 19% 21% 42% 40% Totale 100% (503) 100% (799) 100% (1507) 100% (200)

82 Perché dunque le persone sposate mangiano meno dolci delle persone non sposate? Perché gli sposati sono, in percentuale, più anziani dei non sposati e le persone più anziane di solito mangiano meno dolci. La relazione iniziale fra stato civile e consumo di dolci è quindi annullata, poiché dovuta alla variabile età e non allo stato civile: i non sposati consumano dolci più regolarmente degli sposati perché più giovani e non per non aver contratto matrimonio.

83 Relazione spuria Stato civile (variabile indipendente X) Consumo regolare di dolci (variabile dipendente Y) ETA (variabile di controllo Z)

84 Altri esempi di relazioni spurie Corbetta (1999:620)

85 Altri esempi di relazioni spurie Corbetta (1999:623)

86 Odds e odds ratio: definizioni Odds (in statistica) è il rapporto tra la probabilità p di un evento e la probabilità che tale evento non accada (cioè la probabilità (1-p) dell'evento complementare) Il rapporto tra due odds è detto odds ratio (OR), (molto usati nella statistica sanitaria). L estensione sistematica alle scienze sociali è più recente. In epidemiologia, l'odds ratio (OR) è uno degli indici utilizzati per definire il rapporto di causaeffetto tra due fattori, per esempio tra un fattore di rischio e una malattia. Il calcolo dell'odds ratio prevede il confronto tra le frequenze di comparsa dell'evento (ad esempio, malattia) rispettivamente nei soggetti esposti e in quelli non esposti al fattore di rischio in studio. Esso è utilizzato negli studi retrospettivi (caso-controllo), dove non è necessaria la raccolta dei dati nel tempo, infatti esso non calcola un andamento ed è, anzi, indipendente dal fattore durata. Negli studi prospettici si utilizza invece, allo stesso scopo, il calcolo del rischio relativo (Wikipedia) Nelle scienze sociali odds e odds ratio risultano molto utili per analizzare i dati categoriali (variabili nominali e ordinali), soprattutto per interpretare le tabelle a doppia entrata (e sono alla base dei modelli logistici e log-lineari che non riguardano questo corso)

87 Corbetta (1999:594) Odds e odds ratio: esempi

88 Bohrnstedt & Knoke (1994:152) Odds e odds ratio: esempi

89 Odds e odds ratio: esempi Genere Voto Donne Uomini Tot Bush Dukakis Tot GSS, 1991 Missing 579 Rapporti di probabilità condizionati (odds): p1 (288/242)=1,19; p2 (269/139)=1,93 Rapporto di associazione (odds ratio): 1,19/1,93 (oppure 288*139/242*269) =0,62 Bohrnstedt & Knoke (1994:167) Genere (val%) Voto Donne Uomini Bush 54,34 65,93 Dukakis 45,66 34,07 Tot GSS, 1991 Missing 579

90 Analisi della varianza Utile quando variabile dipendente è continua e var. indipendente nominale/categoriale Esempio: Relazione tra territorio/subculture politiche e voto a un partito (Dc) Corbetta (1999:600) -Forza della relazione tra le vars: coefficiente eta quadrato

Misure di tendenza centrale

Misure di tendenza centrale Misure di tendenza centrale Moda - se la variabile è nominale l unica misura di tendenza centrale calcolabile è la moda - essa rappresenta la modalità di una variabile che si presenta nella distribuzione

Dettagli

La matrice dati. La matrice dati

La matrice dati. La matrice dati La matrice dati Matrice casi per variabili - Stessa unità di analisi (es. individui, nazioni, etc ) - Stesse informazioni per ogni caso CODIFICA Traduzione del materiale grezzo in matrice dati Tracciato

Dettagli

Elezioni Europee 25 MAGGIO Lettura in ottica di genere degli eletti al Parlamento Europeo

Elezioni Europee 25 MAGGIO Lettura in ottica di genere degli eletti al Parlamento Europeo Elezioni Europee 25 MAGGIO 2014 Lettura in ottica di genere degli eletti al Parlamento Europeo A cura di: M. Rosaria Cagnazzo, Michela Giagnori, Chiara Valletta ELEZIONI DEL PARLAMENTO EUROPEO MAGGIO 2014

Dettagli

L'analisi monovariata

L'analisi monovariata L'analisi monovariata Prof. Stefano Nobile Corso di Metodologia della ricerca sociale Concetti introduttivi: analisi mono-, bi- e multivariata ANALISI MONOVARIATA Una tecnica di analisi di dice monovariata

Dettagli

ESERCIZI DI STATISTICA SOCIALE

ESERCIZI DI STATISTICA SOCIALE ESERCIZI DI STATISTICA SOCIALE FREQUENZA ASSOLUTA Data una distribuzione semplice di dati, ovvero una serie di microdati, si chiama frequenza assoluta di ogni modalità del carattere studiato il numero

Dettagli

L'analisi bivariata (associazione e cograduazione)

L'analisi bivariata (associazione e cograduazione) L'analisi bivariata (associazione e cograduazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi bivariata L analisi bivariata è un analisi delle relazioni tra due caratteristiche

Dettagli

Stesso valore medio per distribuzioni diverse

Stesso valore medio per distribuzioni diverse Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2018-2019 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016 Corso di Laurea in Economia Aziendale Docente: Marta Nai Ruscone Statistica a.a. 2015/2016 1 Indici di posizione GLI INDICI DI POSIZIONE sono indici sintetici che evidenziano le caratteristiche essenziali

Dettagli

Settimana 2. G. M. Marchetti. 4 Marzo 2017

Settimana 2. G. M. Marchetti. 4 Marzo 2017 Settimana 2 G. M. Marchetti 4 Marzo 2017 1 / 54 Mediana Un indice di posizione alternativo alla media e molto usato è la mediana È basato sull ordinamento dei dati La mediana è il valore Me tale che la

Dettagli

Teoria e tecniche dei test. Concetti di base

Teoria e tecniche dei test. Concetti di base Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi

Dettagli

Suggerimento a proposito di decimali

Suggerimento a proposito di decimali Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 017-018 Suggerimento a proposito di decimali Quando si calcolano le frequenze relative è opportuno mantenere almeno 4 cifre

Dettagli

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo indice che riassume o descrive i dati e dipende dalla

Dettagli

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo indice che riassume o descrive i dati e dipende dalla scala di misura dei dati in

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 015-016 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per la

Dettagli

Introduzione. Medie di posizione. Medie analitiche. non richiedono operazioni algebriche sulle modalità Mediana e moda

Introduzione. Medie di posizione. Medie analitiche. non richiedono operazioni algebriche sulle modalità Mediana e moda Introduzione Medie di posizione non richiedono operazioni algebriche sulle modalità Mediana e moda Medie analitiche calcolate con operazioni algebriche sulle modalità, richiedono dei caratteri quantitativi

Dettagli

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6

Dettagli

Compiti tematici dai capitoli 2,3,4

Compiti tematici dai capitoli 2,3,4 Compiti tematici dai capitoli 2,3,4 a cura di Giovanni M. Marchetti 2016 ver. 0.8 1. In un indagine recente, i rispondenti sono stati classificati rispetto al sesso, lo stato civile e l area geografica

Dettagli

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore rappresentativo è indice che riassume o descrive i dati e dipende

Dettagli

Istituzioni di Statistica

Istituzioni di Statistica Istituzioni di Statistica CORSO DI LAUREA IN ECONOMIA DEL COMMERCIO INTERNAZIONALE CORSO DI LAUREA IN ECONOMIA E AMMINISTRAZIONE DELLE IMPRESE A.A. 2007/2008 DOCENTE: Marco Minozzo PROGRAMMA - STATISTICA

Dettagli

STATISTICA 1 ESERCITAZIONE 6

STATISTICA 1 ESERCITAZIONE 6 STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere

Dettagli

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE Psicometria (8 CFU) Corso di laurea triennale INDICATORI DI TENDENZA CENTRALE Torna alla pri ma pagina INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore

Dettagli

Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI

Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI Informazioni sul corso - 1 Obiettivi Nell ambito delle lezioni impartite verranno introdotti i concetti e gli strumenti essenziali della

Dettagli

Esercitazioni. Es 1. Dato il seguente dataset

Esercitazioni. Es 1. Dato il seguente dataset Esercitazioni Es 1 Dato il seguente dataset N SESSO ETA' PESO ALTEZZA DIPLOMA COMPONENTI OCCHIALI FUMO 1 0 20,6 65 180 Ist.Tecnico 6 0 1 2 0 20,2 75 180 Liceo 4 0 0 3 0 20,3 60 173 Ist.Tecnico 4 1 0 4

Dettagli

La pratica sportiva in Italia

La pratica sportiva in Italia SALONE D ONORE DEL CONI, FORO ITALICO, ROMA ROMA 23 FEBBRAIO 2017 La pratica sportiva in Italia Giorgio Alleva Presidente Istituto nazionale di Statistica Outline 1 La pratica sportiva in Italia. Le tendenze

Dettagli

Statistica descrittiva

Statistica descrittiva Luigi Vajani Statistica descrittiva r,,, I o -:i f e l ~ 1 (f"i I - / I I - ETASLIBRI Indice XIII Presentazione Parte prima - Introduzione 3 Capitolo 1 - Concetti generali 1.1 - Introduzione; l.2 - La

Dettagli

Esercitazione di Statistica Indici di associazione

Esercitazione di Statistica Indici di associazione Esercitazione di Statistica Indici di associazione 28/10/2015 La relazione tra caratteri Indipendenza logica Quando si suppone che tra due caratteri non ci sia alcuna relazione di causa-effetto. Indipendenza

Dettagli

Questionario 1. Sono assegnati i seguenti dati

Questionario 1. Sono assegnati i seguenti dati Questionario 1. Sono assegnati i seguenti dati 30 30 10 30 50 30 60 60 30 20 20 20 30 20 30 30 20 10 10 40 20 30 10 10 10 30 40 30 20 20 40 40 40 dire se i dati illustrati sono unità statistiche valori

Dettagli

Introduzione alla statistica con Excel

Introduzione alla statistica con Excel Introduzione alla statistica con Excel Davide Sardina davidestefano.sardina@unikore.it Università degli studi di Enna Kore Corso di Laurea in Servizio Sociale A.A. 2017/2018 Variabili quantitative e qualitative

Dettagli

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative TRACCIA DI STUDIO Un indice di tendenza centrale non è sufficiente a descrivere completamente un fenomeno. Gli indici di dispersione assolvono il compito di rappresentare la capacità di un fenomeno a manifestarsi

Dettagli

Livello di misura Scala Nominale Scala Ordinale Scala di Rapporti. Scala Nominale

Livello di misura Scala Nominale Scala Ordinale Scala di Rapporti. Scala Nominale Esercitazione Supponiamo che il collettivo che si vuole studiare sia composto da un gruppo di turisti. La seguente tabella raccoglie l osservazione di alcuni caratteri di interesse. Costo Soggetto Titolo

Dettagli

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17 C L Autore Ringraziamenti dell Editore Elenco dei simboli e delle abbreviazioni in ordine di apparizione XI XI XIII 1 Introduzione 1 FAQ e qualcos altro, da leggere prima 1.1 Questo è un libro di Statistica

Dettagli

La situazione e le prospettive dell economia e del mercato dell auto

La situazione e le prospettive dell economia e del mercato dell auto Conferenza stampa La situazione e le prospettive dell economia e del mercato dell auto Intervento di Gian Primo Quagliano Presidente Econometrica e Centro Studi Promotor Circolo della Stampa - Milano,

Dettagli

Comprendere i fenomeni vuol dire studiare le relazioni tra 2 o più variabili. Esiste un legame tra le variabili?

Comprendere i fenomeni vuol dire studiare le relazioni tra 2 o più variabili. Esiste un legame tra le variabili? Comprendere i fenomeni vuol dire studiare le relazioni tra 2 o più variabili. Esiste un legame tra le variabili? Quale tipo di legame? Quanto forte? Siamo sicuri che non sia dovuto al caso? Tutti i modelli

Dettagli

X - CONTEGGIARE oppure MISURARE

X - CONTEGGIARE oppure MISURARE Come raccogliere informazioni per tradurle in una variabile? X - CONTEGGIARE oppure MISURARE 1 Proprietà conteggiabili Esempi: Quantità di televisori posseduti; N di corsi di formazione frequentati; N

Dettagli

Distribuzioni e rappresentazioni grafiche

Distribuzioni e rappresentazioni grafiche Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Outline 1 Distribuzioni unitarie e di frequenza 2 3 4 5 Outline 1 Distribuzioni unitarie e di frequenza 2 3 4 5 Distribuzione unitaria [1/2] Data

Dettagli

Dispense Associazione PRELIMINARY DRAFT

Dispense Associazione PRELIMINARY DRAFT Dispense Associazione PRELIMINARY DRAFT Cristina Mollica & Jan Martin Rossi January 3, 2019 1 Esercizio 3 - Prova scritta 12-01-2018 Esercizio 3. Si consideri la distribuzione doppia di un campione di

Dettagli

Daniela Tondini

Daniela Tondini Daniela Tondini dtondini@unite.it Facoltà di Medicina veterinaria CdS in Tutela e benessere animale Università degli Studi di Teramo 1 INDICI STATISTICI La moda M O di una distribuzione di frequenza X,

Dettagli

In Italia la percentuale di persone con un lavoro regolare è in media del 60%, con un evidente gradiente nord-sud [figura 1].

In Italia la percentuale di persone con un lavoro regolare è in media del 60%, con un evidente gradiente nord-sud [figura 1]. Il lavoro Il lavoro e il tempo libero dovrebbero essere una fonte di salute per le persone. Il modo in cui la società organizza il lavoro dovrebbe contribuire a creare una società sana. La promozione della

Dettagli

Statistica descrittiva con fogli di calcolo. Stoianov, Ceccato

Statistica descrittiva con fogli di calcolo. Stoianov, Ceccato Statistica descrittiva con fogli di calcolo Stoianov, Ceccato Distribuzioni di probabilità empirica 1) OSSERVAZIONI campione X: N osservazioni {x 1,x 2 x N } scala di misura Y K livelli [y 1 y K ] Esempio:

Dettagli

Copyright Esselibri S.p.A.

Copyright Esselibri S.p.A. 70 3000 500 000 1500 1000 500 A B C D (a) Capitolo Terzo A B C D 500 1000 1500 000 5003000 3500 Fig. 1 - Ortogramma a colonne (a) e ortogramma a nastri (b) 4. MISURE DI ASSOCIAZIONE E DI COGRADUAZIONE

Dettagli

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione [1/2] Gli indici di variabilità consentono di riassumere le principali caratteristiche di una distribuzione (assieme alle medie) Le

Dettagli

Soggetto Genere Costo del soggiorno Titolo di studio

Soggetto Genere Costo del soggiorno Titolo di studio Esercitazione n. 1 Corso di Statistica Università della Basilicata Prof. Roberta Siciliano La tabella seguente raccoglie i dati grezzi, relativamente ad un gruppo di 30 turisti per i quali sono state osservate

Dettagli

Elementi di Psicometria (con laboratorio software 1)

Elementi di Psicometria (con laboratorio software 1) Elementi di Psicometria (con laboratorio software 1) 02-Tendenza centrale e variabilità (v. 1.0, 22 marzo 2019) versione per stampa Germano Rossi 1 germano.rossi@unimib.it 1 Dipartimento di Psicologia,

Dettagli

La statistica descrittiva seconda parte. a cura della prof.ssa Anna Rita Valente

La statistica descrittiva seconda parte. a cura della prof.ssa Anna Rita Valente La statistica descrittiva seconda parte a cura della prof.ssa Anna Rita Valente INDICI DI POSIZIONE CENTRALE Sono dei valori che descrivono in modo sintetico una serie di dati raccolti. I più semplici

Dettagli

Analisi bivariata. Il caso di caratteri qualitativi

Analisi bivariata. Il caso di caratteri qualitativi Analisi bivariata Il caso di caratteri qualitativi Pagina 337 Che cosa è l analisi bivariata? E lo studio congiunto di due caratteri Esempio nel caso di caratteri qualitativi: I valori delle celle derivano

Dettagli

Indici di variabilità

Indici di variabilità Indici di variabilità 1. Prendendo in considerazione il numero di addetti per classi e le aziende: Addetti Aziende 0-5 195 5-10 225 10-25 360 25-40 180 40-100 40 - determinare la varianza e lo scarto quadratico

Dettagli

La gestione dei risultati della valutazione. Claudio Mantovani

La gestione dei risultati della valutazione. Claudio Mantovani La gestione dei risultati della valutazione Claudio Mantovani L obiettivo di questo intervento Descrivere alcune tecniche di analisi di dati dalle più semplici alle più complesse Dare suggerimenti pratici

Dettagli

Dalla distribuzione unitaria a quella di frequenza

Dalla distribuzione unitaria a quella di frequenza Dalla distribuzione unitaria a quella di frequenza Cognome sesso età Livello soddisfaz ione Tipo albergo (categoria) Giorni permanenza Bianchi F 8 basso 4 Alimov F 5 medio 3 6 More M 19 alto 4 Wieser F

Dettagli

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Introduzione : analisi delle relazioni tra due caratteristiche osservate sulle stesse unità statistiche studio del comportamento di due caratteri

Dettagli

Titolo della lezione. Introduzione

Titolo della lezione. Introduzione Titolo della lezione Introduzione Informazioni sul corso - 1 Obiettivi Nel corso verranno approfonditi gli argomenti relativi alla statistica descittiva di base e alla statistica inferenziale; particolare

Dettagli

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indicatori di Posizione e di Variabilità Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica Indici Sintetici Consentono il passaggio da una pluralità

Dettagli

L'analisi bivariata (associazione e cograduazione)

L'analisi bivariata (associazione e cograduazione) L'analisi bivariata (associazione e cograduazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi bivariata L analisi bivariata è un analisi delle relazioni tra due caratteristiche

Dettagli

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni

Dettagli

Introduzione alla STATISTICA DESCRITTIVA

Introduzione alla STATISTICA DESCRITTIVA Introduzione alla STATISTICA DESCRITTIVA Sai ched è la statistica? È na cosa che serve pe fa un conto in generale de la gente che nasce, che sta male, che more, che va in carcere e che sposa. Ma pe me

Dettagli

Nozioni di statistica

Nozioni di statistica Nozioni di statistica Distribuzione di Frequenza Una distribuzione di frequenza è un insieme di dati raccolti in un campione (Es. occorrenze di errori in seconda elementare). Una distribuzione può essere

Dettagli

INDICE PARTE METODOLOGICA

INDICE PARTE METODOLOGICA INDICE PARTE METODOLOGICA 1. Il processo di ricerca 1.1.Individuazione di un problema e formulazione delle ipotesi 1.2.Individuazione e definizione operativa delle variabili 1.2.1. Le variabili definite

Dettagli

NUOVO CONTINENTE: UN SUPPORTO ALL ITALIA DIGITALE. La situazione attuale: infrastrutture, alfabetizzazione digitale, e-commerce

NUOVO CONTINENTE: UN SUPPORTO ALL ITALIA DIGITALE. La situazione attuale: infrastrutture, alfabetizzazione digitale, e-commerce NUOVO CONTINENTE: UN SUPPORTO ALL ITALIA DIGITALE La situazione attuale: infrastrutture, alfabetizzazione digitale, e-commerce LE INFRASTRUTTURE DIGITALI UNA DOTAZIONE DIFFUSA, MA CON ALCUNI LIMITI TERRITORIALI

Dettagli

STATISTICA 1 ESERCITAZIONE 2

STATISTICA 1 ESERCITAZIONE 2 Frequenze STATISTICA 1 ESERCITAZIONE 2 Dott. Giuseppe Pandolfo 7 Ottobre 2013 RAPPRESENTAZIONE GRAFICA DEI DATI Le rappresentazioni grafiche dei dati consentono di cogliere la struttura e gli aspetti caratterizzanti

Dettagli

Elementi di Statistica

Elementi di Statistica Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica

Dettagli

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel: UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA Prof.ssa Donatella Siepi donatella.siepi@unipg.it tel: 075 5853525 4 LEZIONE Statistica descrittiva STATISTICA DESCRITTIVA Rilevazione dei dati Rappresentazione

Dettagli

Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche.

Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche. Misure di tendenza centrale e di variabilità: Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche. Il valore medio di una variabile in un gruppo di osservazioni

Dettagli

Esempi di confronti grafici

Esempi di confronti grafici Esempi di confronti grafici Esempi di confronti grafici 7/3 Capitolo 3 LE MEDIE La media aritmetica La media geometrica La trimmed mean La mediana La moda I percentili Statistica - Metodologie per

Dettagli

Proposte di legge C. 1, C. 457, C. 470, C. 526 e C. 587 Disciplina degli orari di apertura degli esercizi commerciali. Allegato statistico

Proposte di legge C. 1, C. 457, C. 470, C. 526 e C. 587 Disciplina degli orari di apertura degli esercizi commerciali. Allegato statistico Proposte di legge C. 1, C. 457, C. 470, C. 526 e C. 587 Disciplina degli orari di apertura degli esercizi commerciali Allegato statistico Audizione dell Istituto Nazionale di Statistica, Dott. Roberto

Dettagli

Dr. Marco Vicentini Anno Accademico Rev 02/04/2011

Dr. Marco Vicentini Anno Accademico Rev 02/04/2011 Università degli Studi di Padova Facoltà di Psicologia, L4, Psicometria, Modulo B Dr. Marco Vicentini marco.vicentini@unipd.it Anno Accademico 2010 2011 Rev 02/04/2011 Tabelle di contingenza Percentuali

Dettagli

Università degli Studi di Padova Facoltà di Scienze Statistiche, CL. in Astronomia

Università degli Studi di Padova Facoltà di Scienze Statistiche, CL. in Astronomia Università degli Studi di Padova Facoltà di Scienze Statistiche, CL. in Astronomia Esame di Statistica Descrittiva mod. B, Appello del 4/7/2007 CORREZIONE 1) Un azienda produce bulloni di diametro pari

Dettagli

STATISTICA PSICOMETRICA a.a. 2004/2005 Corsi di laurea Scienze e tecniche neuropsicologiche. Modulo 1. Modulo 1 Statistica descrittiva Monovariata

STATISTICA PSICOMETRICA a.a. 2004/2005 Corsi di laurea Scienze e tecniche neuropsicologiche. Modulo 1. Modulo 1 Statistica descrittiva Monovariata STATISTICA PSICOMETRICA a.a. 004/005 Corsi di laurea Scienze e tecniche neuropsicologiche Modulo Modulo Distribuzioni semplici di frequenza e loro rappresentazioni Operatori di tendenza centrale Operatori

Dettagli

con fogli di calcolo Docente del laboratorio: Maria Silvia Pini

con fogli di calcolo Docente del laboratorio: Maria Silvia Pini Statistica descrittiva con fogli di calcolo Docente del laboratorio: Maria Silvia Pini Frequenze Campione X: un insieme di N osservazioni {x 1,x x N } misurati con Scala di misura Y con K categorie [y

Dettagli

Analisi dell associazione tra due caratteri

Analisi dell associazione tra due caratteri Analisi dell associazione tra due caratteri Non ci accontentiamo di analizzare il singolo fenomeno, considerato indipendentemente da altri fenomeni Ci interessano le relazioni che possono esistere tra

Dettagli

Scale di Misurazione Lezione 2

Scale di Misurazione Lezione 2 Last updated April 26, 2016 Scale di Misurazione Lezione 2 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura II anno, II semestre Tipi di Variabili 1 Scale di Misurazione 1. Variabile

Dettagli

Fonti e strumenti statistici per la comunicazione

Fonti e strumenti statistici per la comunicazione Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 018-019 Indici Medi Sintesi della distribuzione: gli indici medi Le distribuzioni delle variabili possono essere sintetizzate

Dettagli

Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica

Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 20/202 Statistica Esercitazione 3 9 maggio 202 Coefficiente di variazione. Serie storiche.

Dettagli

Statistica di base per l analisi socio-economica

Statistica di base per l analisi socio-economica Laurea Magistrale in Management e comunicazione d impresa Statistica di base per l analisi socio-economica Giovanni Di Bartolomeo gdibartolomeo@unite.it Definizioni di base Una popolazione è l insieme

Dettagli

Statistiche e relazioni

Statistiche e relazioni tatistiche descrittive per frequenze e misure Frequenze e misure Per le frequenze e le misure, molte di queste statistiche perdono senso. In compenso, esistono indici appropriati, inutilizzabili per i

Dettagli

Applicazioni statistiche e utilizzo del package statistico Spss - 7

Applicazioni statistiche e utilizzo del package statistico Spss - 7 Applicazioni statistiche e utilizzo del package statistico Spss - 7 CISI 27 gennaio 2005 ricercapsicologica@tiscali.it Illustrare le principali statistiche mono e bivariate. Valutare quando è opportuno

Dettagli

Prova d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003

Prova d esame di Statistica - II canale - nuovo ordinamento Dott.ssa C. Conigliani 19/06/2003 19/06/2003 Compito A Esercizio 1. [14 punti] Data la seguente distribuzione doppia secondo i caratteri reddito familiare mensile () e spesa alimentare mensile (): 0 300 300 600 600 e più tot 0 1000 25

Dettagli

STIME STATISTICHE. Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 2/2

STIME STATISTICHE. Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 2/2 p. 1/1 INFORMAZIONI Prossime lezioni Giorno Ora Dove 10/02 14:30 P50 11/02 14:30 Laboratorio (via Loredan) 17/02 14:30 P50 23/02 14:30 P50 25/02 14:30 Aula informatica (6-7 gruppi) 02/03 14:30 P50 04/03

Dettagli

Indici di tendenza centrale Media, mediana e moda.

Indici di tendenza centrale Media, mediana e moda. Indici di tendenza centrale Media, mediana e moda. Indici di tendenza centrale Gli indici di tendenza centrale individuano gli aspetti tipici, ovvero i valori più rappresentativi della distribuzione Questi

Dettagli

Data set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio

Data set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio ESERCITAZIONE 1: VARIABILI E DISTRIBUZIONI 1.TIPOLOGIA DEI DATI 2. CALCOLO DI FREQUENZE 3. RAPPRESENTAZIONE GRAFICA DI UNA VARIABILE A Roma nel 2006 è stata effettuata un indagine, tramite questionario,

Dettagli

NOI E L UNIONE. 1. Parole per capire CPIA 1 FOGGIA. A. Conosci già queste parole? Scrivi il loro significato o fai un disegno:

NOI E L UNIONE. 1. Parole per capire CPIA 1 FOGGIA. A. Conosci già queste parole? Scrivi il loro significato o fai un disegno: CPIA 1 FOGGIA NOI E L UNIONE EUROPEA 1. Parole per capire A. Conosci già queste parole? Scrivi il loro significato o fai un disegno: paese....... stato................... governo......... Europa.......

Dettagli

Analisi dei dati per la comunicazione

Analisi dei dati per la comunicazione Analisi dei dati per la comunicazione La costruzione e l uso di misure relative semplici e complesse Prof.ssa Isabella Mingo A.A. 2014-2015 La costruzione di indici complessi: fasi In definitiva, la costruzione

Dettagli

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di

Dettagli

Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano:

Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano: 4. STATISTICA DESCRITTIVA ESERCIZI Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano: 138 164 150 132 144 125 149 157 146 158 140 147 136 148 152 144

Dettagli

Seconda Lezione. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 DISTRIBUZIONE DI FREQUENZA

Seconda Lezione. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 DISTRIBUZIONE DI FREQUENZA Seconda Lezione "Educare significa aiutare l'animo dell'uomo ad entrare nella totalità della realtà. Non si può però educare se non rivolgendosi alla libertà, la quale definisce il singolo, l'io. Quando

Dettagli

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale

L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile. Corso di Metodologia della ricerca sociale L'analisi bivariata (analisi della varianza e correlazione) Prof. Stefano Nobile Corso di Metodologia della ricerca sociale L analisi della varianza (ANOVA) La tecnica con cui si esplorano le relazioni

Dettagli

Statistica Elementare

Statistica Elementare Statistica Elementare 1. Frequenza assoluta Per popolazione si intende l insieme degli elementi che sono oggetto di una indagine statistica, ovvero l insieme delle unità, dette unità statistiche o individui

Dettagli

Metodi statistici per le ricerche di mercato Soluzione degli Esercizi 1-8

Metodi statistici per le ricerche di mercato Soluzione degli Esercizi 1-8 Esercizio 1 Metodi statistici per le ricerche di mercato Soluzione degli Esercizi 1-8 Social medium preferito: qualitativo sconnesso; indice medio: moda; indice di eterogeneità: Indice di Gini. Spesa per

Dettagli

Distribuzione di frequenza relativa e percentuale: esempio

Distribuzione di frequenza relativa e percentuale: esempio Distribuzione di frequenza relativa e percentuale: esempio Sesso Freq. assol. F 3 M Totale 5 Sesso % F 60 M 40 Totale 100 Sesso Freq. assol. F 180 M 10 Totale 300 Sesso % F 60 M 40 Totale 100 Attenzione:

Dettagli

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi ISTITUZIONI DI STATISTICA A A 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Statistica multivariata! Analisi fattoriale

Statistica multivariata! Analisi fattoriale Parte 3 : Statistica multivariata Quando il numero delle variabili rilevate sullo stesso soggetto aumentano, il problema diventa gestirle tutte e capirne le relazioni. Statistica multivariata! Analisi

Dettagli

ESERCITAZIONE I - SOLUZIONI

ESERCITAZIONE I - SOLUZIONI Esercizio 1 a) - Età: quantitativo continuo - Sesso: qualitativo sconnesso ESERCITAZIONE I - SOLUZIONI - Codice: qualitativo ordinabile (scala di gravità) - Tempo previsto di attesa: quantitativo continuo

Dettagli

Dispensa di Statistica

Dispensa di Statistica Dispensa di Statistica 1 parziale 2012/2013 Diagrammi... 2 Indici di posizione... 4 Media... 4 Moda... 5 Mediana... 5 Indici di dispersione... 7 Varianza... 7 Scarto Quadratico Medio (SQM)... 7 La disuguaglianza

Dettagli

7. STATISTICA DESCRITTIVA

7. STATISTICA DESCRITTIVA 7. STATISTICA DESCRITTIVA Quando si effettua un indagine statistica si ha a che fare con un numeroso insieme di oggetti, detto popolazione del quale si intende esaminare una o più caratteristiche (matricole

Dettagli

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51

Sommario. 2 I grafici Il sistema di coordinate cartesiane Gli istogrammi I diagrammi a torta...51 Sommario 1 I dati...15 1.1 Classificazione delle rilevazioni...17 1.1.1 Esperimenti ripetibili (controllabili)...17 1.1.2 Rilevazioni su fenomeni non ripetibili...18 1.1.3 Censimenti...19 1.1.4 Campioni...19

Dettagli

LA STATISTICA

LA STATISTICA http://www.biostatistica.unich.it LA STATISTICA E l insieme dei metodi che consentono di raccogliere, ordinare, riassumere, presentare ed analizzare dati e informazioni, trarne valide conclusioni e prendere

Dettagli

Dipartimento di Fisica a.a. 2003/2004 Fisica Medica 2 Indici statistici 22/4/2005

Dipartimento di Fisica a.a. 2003/2004 Fisica Medica 2 Indici statistici 22/4/2005 Dipartimento di Fisica a.a. 23/24 Fisica Medica 2 Indici statistici 22/4/25 Ricerca statistica La ricerca può essere deduttiva (data una legge teorica nota cerco verifica tramite più misure) ovvero induttiva

Dettagli

x i. Δ x i

x i. Δ x i ITCS "R. LUXEMBURG" BO- AS 011-01 5CL MATEMATICA- COGOME: OME: VERIFICA UD 1.A : STATISTICA DESCRITTIVA (ORE ) DATA: 1] Data la serie del numero di componenti dei nuclei familiari rilevati in un gruppo

Dettagli

Prova scritta di Statistica

Prova scritta di Statistica Prova scritta di Statistica 5 Febbraio 2016 1. Da un indagine riguardante l utilizzo del telefono cellulare si sono ottenuti i seguenti risultati: Età No.telefonini Chiamate Spesa sett. Bluetooth 20 2

Dettagli

Stefania Taralli Anno Accademico 2017/2018 1

Stefania Taralli Anno Accademico 2017/2018 1 L unità statistica Caratteri e modalità CORSO DI FONDAMENTI E METODI PER L'ANALISI EMPIRICA NELLE SCIENZE SOCIALI Introduzione al corso Lezione 2: L'analisi quantitativa dei dati per la sintesi dei fenomeni

Dettagli