Stefania Taralli Anno Accademico 2017/2018 1

Documenti analoghi
Elementi di Statistica

Scale di Misurazione Lezione 2

STATISTICA NOZIONI DI BASE

Statistica Elementare

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche.

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016

INDICATORI DI TENDENZA CENTRALE

Matematica Lezione 22

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

La Statistica: introduzione e approfondimenti

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE

Variabilità o Dispersione Definizione Attitudine di un fenomeno ad assumere diverse modalità

Stesso valore medio per distribuzioni diverse

Dipartimento di Fisica a.a. 2003/2004 Fisica Medica 2 Indici statistici 22/4/2005

Variabilità e Concentrazione Esercitazione n 02

Introduzione alla STATISTICA DESCRITTIVA

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Distribuzione di Frequenza: Esempio

La struttura dei dati

ESERCIZI DI STATISTICA SOCIALE

Descrittiva. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

4. INDICI DI POSIZIONE

L'analisi monovariata

Livello di misura Scala Nominale Scala Ordinale Scala di Rapporti. Scala Nominale

La statistica descrittiva seconda parte. a cura della prof.ssa Anna Rita Valente

Corso di Laurea triennale Tecniche della Prevenzione PERCORSO STRAORDINARIO 2007/08. Insegnamento di STATISTICA MEDICA. Modulo II

Le medie. Antonello Maruotti

Classificazione dei caratteri

Statistica Misure di eterogeneità. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

I fenomeni collettivi sono quei fenomeni il cui studio richiede una pluralità di osservazioni.

Esercitazioni di statistica

4. VALORI CENTRALI. Statistica sociale

Unità Carattere Modalità

Elementi di statistica

REGRESSIONE E CORRELAZIONE

Concetti base - Classificazione dei caratteri. Antonello Maruotti

Elementi di Probabilità e Statistica

Misurazione dei caratteri quantitativi

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

Questionario 1. Sono assegnati i seguenti dati

Corso di laurea in Comunicazione pubblica e d'impresa. Docente: Mariangela Zenga Ricevimento: mercoledì

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

Teoria e tecniche dei test. Concetti di base

Statistica. Alfonso Iodice D Enza

Statistica Descrittiva Soluzioni 4. Medie lasche

Modelli descrittivi, statistica e simulazione

Distribuzione di frequenza relativa e percentuale: esempio

Statistica. (Dr. Elvira Di Nardo)

La statistica. Scienza che studia con metodi matematici fenomeni collettivi.

Fonti e strumenti statistici per la comunicazione

Statistica di base per l analisi socio-economica

Statistica descrittiva II

esercitazione1 12/10/2015

Classificazione dei caratteri

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

Istituzioni di Statistica e Statistica Economica

Classificazione dei caratteri

Università degli Studi di Cassino. Corso di Laurea in Economia Aziendale. Corso di. Statistica. Docente: Simona Balzano.

Nozioni di statistica

Tipi di variabili. Indici di tendenza centrale e di dispersione

Statistica. Matematica con Elementi di Statistica a.a. 2017/18

Soggetto Genere Costo del soggiorno Titolo di studio

STATISTICHE DESCRITTIVE Parte II

Misure di dispersione (o di variabilità)

Grafici e tabelle permettono di fare valutazioni qualitative, non quantitative. E necessario poter sintetizzare i dati attraverso due importanti

Lezione 4: Indici di posizione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Variabile divisa in classi: varianza

Dispense Associazione PRELIMINARY DRAFT

Corso di Statistica. Variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

Statistica descrittiva in una variabile

Dalla distribuzione unitaria a quella di frequenza

x i. Δ x i

Daniela Tondini

Titolo della lezione. Introduzione

08/04/2014. Misure di posizione. INDICI DI POSIZIONE (measures of location or central tendency) 1. MODA 2. MEDIA 3. MEDIANA

Metodi statistici per le ricerche di mercato

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI

La struttura dei dati

ESERCITAZIONI N. 1 Corso di Statistica

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Tra i non fumatori qual è la percentuale di non utilizzatori di sostanze stupefacenti? Scegli un'alternativa: a. 86% b. 10% c. 50% d. 25% e.

Indicatori compositi. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno

La gestione dei risultati della valutazione. Claudio Mantovani

Statistica. Lezioni: 7, 8. Statistica Descrittiva Univariata 3

Matematica Lezione 21

Transcript:

L unità statistica Caratteri e modalità CORSO DI FONDAMENTI E METODI PER L'ANALISI EMPIRICA NELLE SCIENZE SOCIALI Introduzione al corso Lezione 2: L'analisi quantitativa dei dati per la sintesi dei fenomeni AA 2017/2018 La classificazione dei caratteri Indici di posizione Indici di variabilità FENOMENI COLLETTIVI COME SINTESI DI MANIFESTAZIONI INDIVIDUALI L unità statistica L aspetto quantitativo dei fenomeni collettivi è l oggetto di studio della statistica. I fenomeni collettivi non possono essere studiati e conosciuti attraverso un unica osservazione complessiva sull insieme. La loro conoscenza è il risultato di un processo di sintesi degli esiti dell osservazione effettuata sulle singole unità che compongono il collettivo di interesse, relativamente al fenomeno oggetto di studio. 1

IL PROCESSO DI CONOSCENZA (QUANTITATIVA) DI UN FENOMENO COLLETTIVO La conoscenza quantitativa dell espressione di un fenomeno all interno di un collettivo di studio passa necessariamente attraverso due momenti: ESEMPIO Fenomeno di studio: ABITUDINE AL FUMO l OSSERVAZIONE del fenomeno sulle singole unità che formano il collettivo la successiva SINTESI delle osservazioni individuali La statistica è interessata agli aspetti quantitativi dei fenomeni che riguardano un collettivo nel suo complesso e non alle singole unità. Collettivo di interesse: RAGAZZI 14-17 ANNI ESEMPIO DEFINIZIONE DI "UNITÀ STATISTICA" OSSERVAZIONE delle singole unità che compongono il collettivo Unità SINTESI delle osservazioni effettuate: Collettivo Le singole unità che compongono il collettivo oggetto di indagine, sulle quali viene eseguita la misurazione di uno o più fenomeni, sono dette UNITÀ STATISTICHE In Italia nel 2011, fuma l 8,8% dei ragazzi tra 14 e 17 anni Fonte: ISTAT Indagine multiscopo sulle famiglie 2

UNITÀ STATISTICA (1/2) Unità statistiche di analisi Sono le unità elementari con riferimento alle quali andare a rilevare le modalità con cui si manifestano le variabili significative selezionate per lo studio del fenomeno indagato. Nel caso per esempio del censimento della popolazione e delle abitazioni, l unità elementare di analisi è il singolo individuo, la singola abitazione. Nel caso del censimento dell agricoltura, l unità elementare di analisi è rappresentata dalla azienda agricola. Nel caso dello studio del fenomeno della nuzialità, l unità di analisi è rappresentata dalla coppia di sposi UNITÀ STATISTICA (2/2) Unità di rilevazione È l unità più indicata ai fini della raccolta delle informazioni sulle unità di analisi. La scelta delle unità di rilevazione più adatte a reperire i dati sulle unità elementari di interesse è condizionata non soltanto dalle caratteristiche delle unità di analisi stesse, ma anche da fattori di ordine tecnico quali l esistenza o meno di elenchi di base, la distribuzione sul territorio delle unità, ecc. Le unità di rilevazione vengono ad assumere il compito di elementi strumentali il cui ruolo è funzionale alla rilevazione delle informazioni sull unità di analisi. La funzione dell unità di rilevazione si esaurisce nel momento in cui l operazione di rilevazione si è compiuta con successo. Unità di rilevazione e unità di analisi possono non coincidere; nel caso del censimento della popolazione, ad esempio, l unità di rilevazione è rappresentata dalla famiglia e dalla convivenza anagrafica; l unità di analisi invece è il singolo individuo censito. DEFINIZIONI Caratteri e modalità Ciascuna unità statistica presente nel collettivo possiede delle caratteristiche che possono manifestarsi in modo diverso nelle varie unità. Le caratteristiche di una unità statistica prendono il nome di CARATTERI (o VARIABILI) Le possibili manifestazioni di ciascun carattere vengono dette MODALITÀ Vediamo alcuni esempi 3

CARATTERI Le caratteristiche dell unità statistica prendono il nome di caratteri o variabili. La selezione delle variabili significative in una indagine statistica è la fase in cui si traducono gli obiettivi d indagine in variabili atte alla migliore descrizione del fenomeno. Si considereranno quindi le variabili descrittive (variabili specifiche) del fenomeno stesso, ovvero quelle che riflettono il modo o l intensità con cui il fenomeno si manifesta e quelle connesse (variabili interpretative) al fenomeno in quanto lo influenzano e/o sono da esso influenzate. Per la migliore raccolta delle informazioni sarà necessario individuare le classificazioni del carattere, ossia individuare l insieme delle categorie assunte dalle variabili. Per fare un esempio, si consideri un gruppo di studenti di una scuola secondaria superiore. Per ognuno di essi si può determinare la data di nascita, il sesso, il luogo di nascita, la statura, il peso, il colore dei capelli, l anno di frequenza e così via. L elenco precedente corrisponde a una possibile lista di caratteri di ciascuna unità (studente). MODALITÀ Ciascun carattere è presente in ogni unità statistica con una determinata modalità. Esempi: Se uno studente è maschio e un altro è femmina, diremo che nel primo il carattere sesso si presenta con la modalità maschio, mentre nel secondo con la modalità femmina. Misurando le altezze di un gruppo di studenti possiamo aspettarci che il carattere altezza si presenti in ciascuno con un valore differente. I "diversi valori" misurati sono le "diverse modalità" con cui il carattere altezza si presenta nelle varie unità oggetto di studio. ESEMPI Collettivo statistico Nati in Italia nel 2011 Unità statistica Bambino nato in Italia nel 2011 Carattere 1 Sesso Carattere 2 Peso alla nascita ESEMPIO Nel caso del primo esempio, per quanto riguarda le MODALITÀ, abbiamo: Carattere 3 Giorno della settimana in cui è nato Collettivo statistico Matrimoni in Italia nel 2011 Unità statistica Carattere 1 Carattere 2 Carattere 3 Carattere 4 Carattere 5 Coppia Età della sposa Età dello sposo Titolo di studio della sposa Titolo di studio dello sposo Tipo di matrimonio (civile, religioso) Descrizione Possibili modalità Carattere 1 Sesso maschio, femmina Carattere 2 Peso alla nascita 2750 gr, 3120 gr Carattere 3 Giorno della settimana in cui è nato lun, mar, dom 4

LA CLASSIFICAZIONE DEI CARATTERI La classificazione dei caratteri I caratteri statistici sono di natura diversa, per cui è utile eseguirne una classificazione per poter evidenziare gli attributi comuni. La prima grande suddivisione è rappresentata nello schema qui di seguito. QUALITATIVI CARATTERI QUANTITATIVI LA CLASSIFICAZIONE DEI CARATTERI All interno di ciascuno dei due grandi gruppi si eseguono ulteriori suddivisioni. I caratteri qualitativi (detti anche mutabili ) vengono ulteriormente classificati secondo lo schema in figura. LA CLASSIFICAZIONE DEI CARATTERI I caratteri quantitativi vengono ulteriormente classificati secondo lo schema in figura. SCONNESSI CARATTERI DISCRETI QUALITATIVI rettilinei QUANTITATIVI CARATTERI ORDINABILI CONTINUI ciclici 5

LA CLASSIFICAZIONE DEI CARATTERI Lo psicologo Stevens [1946] introdusse una classificazione dei caratteri statistici sulla base delle operazioni ammissibili su di essi. I caratteri si distinguono sulla base della SCALA DI MISURAZIONE. SCALA NOMINALE SCALA ORDINALE CARATTERI SCALA A INTERVALLO SCALA DI RAPPORTO CARATTERI E VARIABILI Tipo di variabile Nominale Ordinale Cardinale Stato della proprietà Discreto Non ordinato Discreto Ordinato Continuo Discreto Operativiz. Valori Operazioni Classificazione Nomi = Ordinamento Misurazione Conteggio Numeri con proprietà ordinali Numeri con proprietà cardinali = > < = > < + - * : 22 Indici di posizione Media Moda Mediana D. INDICI DI POSIZIONE Media Moda Mediana 6

MISURE SINTETICHE: NECESSITÀ DI SINTESI INFORMATIVE L esigenza di sintetizzare le informazioni individuali raccolte su di un collettivo deriva dalla necessità di caratterizzare, con un unico valore rappresentativo, il complesso delle manifestazioni di un determinato carattere oggetto di studio, all Interno di un collettivo di indagine. Tale sintesi permette anche di eseguire confronti con valori riferiti a fenomeni analoghi osservati in tempi e luoghi diversi. MISURE DI SINTESI: IL CENTRO DELLA DISTRIBUZIONE Ogni tipo di variabile ha la sua misura di sintesi per determinare il BARICENTRO della distribuzione MODA: modalità che si presenta con maggior frequenza; variabili nominali; MEDIANA: modalità del caso che occupa il posto di mezzo nella distribuzione ordinata dei casi secondo quella variabile; variabili ordinali; N dispari => (N+1)/2; N pari => N/2 e N/2 + 1; MEDIA: somma dei valori assunta dalla variabile su tutti i casi divisa per il numero di casi; variabili cardinali. 26 DISTRIBUZIONE DI FREQUENZA MISURE SINTETICHE: INDICI DI POSIZIONE Rappresentazione nella quale ad ogni valore della variabile viene associata la frequenza con cui esso si presenta nei casi analizzati (Marradi, 1999) 27 La metodologia statistica mette a disposizione degli indicatori sintetici, detti INDICI DI POSIZIONE che permettono di sintetizzare, in un valore significativo, i molti valori di un fenomeno raccolti durante un indagine. Tra le diverse tecniche di sintesi dei dati proposti dalla statistica descrittiva, consideriamo i tre seguenti: Assolute Relative MEDIA Frequenze Numero dei casi che presentano quel valore (assoluto) Rapporto dei casi al totale del campione (percentuale per comparazione) MODA MEDIANA 7

INDICI DI POSIZIONE: MODA La moda è la modalità prevalente di un carattere, ossia quella a cui è associato il maggior numero di osservazioni rilevate. La moda è la modalità del carattere espressa dalla maggioranza relativa del collettivo. PROPRIETÀ Può essere utilizzata anche con variabili qualitative sconnesse. È una media lasca Coincide sicuramente con una delle modalità del carattere Le medie lasche sono le medie che utilizzano per il calcolo solo alcune delle modalità del carattere e non tutte. Le medie lasche sono individuate sulla base della posizione relativa assunta da una modalità rispetto a tutte le altre. INDICI DI POSIZIONE: MEDIANA La mediana è la modalità dell unità statistica che occupa la posizione centrale nella distribuzione ordinata delle osservazioni. Metà delle unità statistiche del collettivo presentano modalità inferiori alla mediana mentre l altra metà del collettivo assume valori del carattere superiori a quello della mediana. PROPRIETÀ Può essere utilizzata con variabili qualitative ordinabili. È una media lasca almeno INDICI DI POSIZIONE: MEDIA La media aritmetica, comunemente detta media, è quel valore del carattere che, sostituito a ciascuna delle unità statistiche del collettivo, lascia invariato l ammontare totale. Rappresenta l ipotetica equidistribuzione del carattere fra le unità del collettivo. Ossia, ipotizzando di poter sostituire a ciascuna unità osservata il valore medio calcolato, al posto di quello effettivo rilevato, questa sostituzione non comporterebbe alcuna modifica del totale (somma) dei valori osservati. Indici di variabilità Campo di variazione Varianza Scarto quadratico medio PROPRIETÀ Non può essere utilizzata con variabili qualitative. 8

LA STATISTICA DI TRILUSSA Se due persone hanno ha disposizione due polli e uno li mangia tutti e due, in media ne hanno mangiato uno a testa LA VARIABILITÀ L indice di posizione media aritmetica dà sicuramente indicazioni di sintesi significative su un collettivo, ma la sua accuratezza dipende in misura inversa da quanto varia il carattere all interno del collettivo. In altri termini: se gli indici di posizione da un lato forniscono informazioni di sintesi su un collettivo, dall altro da soli non riescono a dare informazioni complete sul fenomeno allo studio. In particolare, non fanno emergere l aspetto legato alla VARIABILITÀ, cioè l attitudine del fenomeno stesso ad assumere modalità differenti. La metodologia statistica offre gli strumenti per individuare l ineguale ripartizione del carattere tra le unità statistiche nel collettivo. LA MISURA DELLA VARIABILITÀ Gli strumenti per lo studio della variabilità del carattere nel collettivo sono appunto gli INDICI DI VARIABILITÀ o DISPERSIONE CAMPO DI VARIAZIONE VARIANZA SCARTO QUADRATICO MEDIO INDICI DI VARIABILITÀ: CAMPO DI VARIAZIONE L indice di variabilità più semplice è il campo di variazione ( range ). È rappresentato dalla differenza tra il valore massimo e il valore minimo delle modalità assunte dal carattere (Y) osservato: CV (Y) = max(y) min (Y) Il campo di variazione è un indice piuttosto grossolano in quanto è influenzato dai valori estremi, che sono spesso valori eccezionali del fenomeno e poco indicativi dell insieme dei dati. 9

ESEMPIO Reddito in dei componenti della famiglia ROSSI: 1300, 1600, 2000, 3500, 4000 Campo di variazione = 4000-1300 = 2700 INDICI DI VARIABILITÀ: VARIANZA Per misurare la variabilità, occorre misurare la distanza tra il valore del carattere assunto dalla singola unità statistica e la media aritmetica. Reddito in dei componenti della famiglia BIANCHI: 1300, 1300, 1300, 1300, 4000 Campo di variazione = 4000-1300 = 2700 Come si può notare, il campo di variazione è lo stesso, ma i redditi della famiglia Rossi presentano variabilità intrinsecamente diversa da quella che manifestano i redditi della famiglia Bianchi. La varianza è un indice di variabilità che misura le distanze (o scarti ) al quadrato dalla media aritmetica di ciascun valore della distribuzione. In particolare si calcola effettuando prima il calcolo degli scarti dei valori dalla media aritmetica (vedi dati in figura); poi calcolando la media aritmetica dei quadrati di detti scarti. ESEMPIO INDICI DI VARIABILITÀ: VARIANZA La varianza è una quantità sempre positiva e cresce all aumentare della dispersione dei dati della distribuzione intorno alla media aritmetica. Osserviamo che l unità di misura della varianza è rappresentata dal quadrato dell unità di misura del fenomeno in esame, risulta quindi di non immediata interpretazione Nel caso dell esempio precedente, per i redditi della famiglia Rossi avremo varianza pari a 1.149.600, data dal risultato del calcolo: var 1180 2 880 2 480 2 1020 2 1520 5 2 1149600 ^2 =? 10

INDICI DI VARIABILITÀ: SCARTO QUADRATICO MEDIO Proprio per questo motivo, si utilizza come misura della variabilità lo scarto quadratico medio - detto anche deviazione standard - che essendo dato dalla radice quadrata della varianza, ha il vantaggio di essere espresso nella stessa unità di misura dei dati. Nel caso dell esempio precedentemente illustrato, avremo che lo scarto quadratico medio è pari a 1.072,194, ossia la radice quadrata di 1.149.600 INDICI DI VARIABILITÀ: COEFFICIENTE DI VARIAZIONE La deviazione standard misura la variabilità di una popolazione o campione La deviazione standard dipende dal valore assoluto delle media Il coefficiente di variazione ci permette di valutare la variabilità fra popolazioni con medie molto diverse s 100 CV x 42 11