Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it
Outline 1 Distribuzioni unitarie e di frequenza 2 3 4 5
Outline 1 Distribuzioni unitarie e di frequenza 2 3 4 5
Distribuzione unitaria [1/2] Data una tabella di dati: Nome Sesso Altezza Peso Caio M 178 80 Tizia F 167 58 Ogni riga (record) descrive il profilo di ogni unità del collettivo Ogni colonna riporta la distribuzione unitaria semplice dei caratteri oggetto di studio
Distribuzione unitaria [2/2] Distribuzione unitaria semplice: elenco delle modalità osservate (valori), unità per unità, nel collettivo preso in esame se si considerano più caratteri, la distribuzione viene detta unitaria multipla
Frequenza assoluta [1/2] Frequenza assoluta: data una modalità, numero di volte in cui questa è presente in un collettivo viene calcolata contando le occorrenze dei valori nelle unità Data la variabile X che può assumere k modalità distinte x 1, x 2,..., x k, sapendo che: la modalità x 1 è presente n 1 volte la modalità x 2 è presente n 2 volte... n j (j = 1,..., k) sono le frequenze assolute. n 1 + n 2 + + n k = k j=1 n j = n (con n cardinalità del collettivo)
Frequenza assoluta [2/2] Frequenza assoluta semplice: carattere discreto: frequenze come numeri naturali carattere continuo: modalità come intervalli continui di valori per calcolare le frequenze se il carattere è ordinabile, è opportuno ordinare prima di calcolare le frequenze
Frequenza relativa [1/4] La frequenza assoluta non permette di confrontare valori tra collettivi distinti Per questo è necessario calcolare le frequenze relative f j : f j = n j n = n j k j=1 n per j = 1,..., k j La somma delle frequenze relative è pari a 1: k f 1 + f 2 + + f k = f j = 1. Deriva quindi che 0 f j 1 j=1
Frequenza relativa [2/4] Dalle frequenze assolute Alle frequenze relative
Frequenza relativa [3/4] Distribuzioni di frequenza: sconnesse carattere qualitativo sconnesso carattere qualitativo nominale rettilinee carattere qualitativo ordinabile seriazioni caratteri quantitativi
Frequenza relativa [4/4] Ricapitolando: dove p j rappresentano le frequenze percentuali ottenute moltiplicando le f j 100 (Ma cosa succede in Calc o Fogli Google?)
Frequenze e raggruppamenti in classi Problema di rappresentazione di caratteri quantitativi (discreti o continui) che presentano numerose modalità: raggruppamento in classi classi esatte esaustive (tutti i valori coperti) disgiunte (intersezione nulla tra le classi) numero di classi e ampiezza scelta arbitraria classi di pari ampiezza classi di uguale numerosità
Scelta arbitraria delle classi Stabilite in base a conoscenze aggiuntive sul campione Ad esempio ISTAT ha definito le seguenti classi per le fasce d età: 11-15: al di sotto dell età legale 16-17: minorenni 18-24: giovani 25-44: giovani adulti 45-64: adulti 65-74: giovani anziani >74: anziani
Classi di pari ampiezza [1/3] Per la costruzione delle classi di pari ampiezza di un carattere si procede come segue: ordinare le modalità (ordinamento crescente) individuare gli estremi inferiore x min e superiore x max calcolare la differenza d tra estremo superiore e inferiore scegliere il numero di classi k calcolare l ampiezza della classe a: a = x max x min k = d k
Classi di pari ampiezza [2/3] Dato l esempio: Volendo suddividere in k = 3 classi: a = 3000 600 3 = 2400 3 = 800
Classi di pari ampiezza [3/3] La prima classe viene quindi identificata con i seguenti estremi: [600, x min + a = 600 + 800 = 1400] In maniera analoga si costruiscono le altre 2 classi
Classi di uguale numerosità Per la costruzione delle classi di uguale numerosità di un carattere si procede come segue: ordinare le modalità (ordinamento crescente) scegliere la numerosità n j calcolare il numero di classi k = n n j ricostruire l ampiezza delle classi
Outline 1 Distribuzioni unitarie e di frequenza 2 3 4 5
Frequenza cumulata di una distribuzione [1/3] Si applica ai caratteri qualitativi ordinabili o ai caratteri quantitativi Permette di calcolare la percentuale di unità statistiche al di sotto di una certa soglia Formalmente: Frequenza cumulata assoluta N j Rappresenta la somma consecutiva delle frequenze assolute n j con modalità del carattere X non superiore ad una certa soglia N j = n 1 + n 2 + + n j
Frequenza cumulata di una distribuzione [2/3] Detto in altri termini: per ogni j, N j rappresenta il numero delle unità del collettivo il cui carattere assume un valore non superiore a x j dato un carattere X con k modalità ordinate in senso crescente, per ogni classe j abbiamo: N j = n 1 + n 2 + + n j è la frequenza assoluta cumulata F j = f 1 + f 2 + + f j è la frequenza relativa cumulata P j = p 1 + p 2 + + p j è la frequenza percentuale cumulata
Frequenza cumulata di una distribuzione [3/3]
Outline 1 Distribuzioni unitarie e di frequenza 2 3 4 5
e territoriali Serie temporale o storica: sequenza dei valori assunti da una variabile, nello stesso aggregato territoriale, in tempi diversi seriestoriche.istat.it Serie territoriale: sequenza dei valori assunti da una variabile nello stesso momento in diversi aggregati territoriali sitis.istat.it
Outline 1 Distribuzioni unitarie e di frequenza 2 3 4 5
Grafici per distribuzioni di dati Vantaggi: visualizzazione immediata delle caratteristiche di una distribuzione confronto tra diverse distribuzioni visualizzazione di andamenti, relazioni e valori anomali semplice divulgazione delle informazioni E necessario identificare la rappresentazione grafica più adatta per una distribuzione di dati!
Criteri per la costruzione di un grafico Cosa tenere in considerazione: fenomeno oggetto di studio misura associata alla variabile in esame (nominale, ordinale o cardinale) tipologia della distribuzione di frequenza (unitaria, non unitaria o in classi) Linee guida da seguire: chiarezza accuratezza proporzionalità
Criteri per la costruzione di un grafico Il grafico deve sempre avere: una intestazione caratteri e legenda unità di misura fonte
per dati qualitativi [1/5] Grafici a barre (orizzontali o verticali)
per dati qualitativi [2/5] Diagrammi circolari (o grafici a torta)
per dati qualitativi [3/5] Diagrammi in coordinate polari
per dati qualitativi [4/5] Cartogrammi
per dati qualitativi [5/5] Pictogrammi a figure ripetute
per dati quantitativi [1/4] Istogrammi (per dati quantitativi continui) Per gli istogrammi con classi di diversa ampiezza deve essere calcolata la densità della classe j: d j = f j a j
per dati quantitativi [2/4] Diagrammi a canne d organo (per dati quantitativi discreti)
per dati quantitativi [3/4] Diagrammi cartesiani (per serie storiche)
per dati quantitativi [4/4] Poligono delle frequenze (per le frequenze cumulate)
Outline 1 Distribuzioni unitarie e di frequenza 2 3 4 5
Openoffice Calc Strumento open-source gratuito per l organizzazione, l elaborazione e la visualizzazione dei dati LibreOffice Calc (scaricalo qui) Breve guida introduttiva per Calc Sul libro sono presenti esercitazioni svolte utilizzando Excel In Calc sono presenti tutte le funzionalità descritte e utilizzate Esercitazione con Calc
Fogli Google [1/4]
Fogli Google [2/4]
Fogli Google [3/4]
Fogli Google [4/4]
Dove studio questi argomenti? Capitolo 7 del libro!