Classificazione dei caratteri

Documenti analoghi
Classificazione dei caratteri

Misurazione dei caratteri quantitativi

Classificazione dei caratteri

La struttura dei dati

Conclusione del percorso di studio

La struttura dei dati

Fonti e strumenti statistici per la comunicazione

Fonti e strumenti statistici per la comunicazione

La struttura dei dati

Metodi statistici per le ricerche di mercato

ADC - Bocci - a.a. 2014/2015

La Statistica: introduzione e approfondimenti

Metodologia Statistica

Distribuzione di frequenza relativa e percentuale: esempio

Metodi statistici per le ricerche di mercato

Analisi bivariata. Il caso di caratteri qualitativi

Suggerimento a proposito di decimali

Rappresentazioni Tabellari e Grafiche. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Dalla distribuzione unitaria a quella di frequenza

STATISTICHESE. Popolazione Rilevazione totale 1. Campione Rilevazione parziale

Capitolo 1 La rilevazione dei fenomeni statistici

Concetti base - Classificazione dei caratteri. Antonello Maruotti

Stesso valore medio per distribuzioni diverse

Fonti e strumenti statistici per la comunicazione

Esercitazioni di Statistica: ES.1.1

Fonti e strumenti statistici per la comunicazione

Unità Carattere Modalità

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

Con riferimento ai dati riportati nella seguente tabella, indicare la tipologia dei caratteri rilevati.

Fonti e strumenti statistici per la Comunicazione

ESERCITAZIONI N. 1 Corso di Statistica

STATISTICA NOZIONI DI BASE

Metodi statistici per le ricerche di mercato

Analisi bivariata Il caso di caratteri qualitativi

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

Pedagogia sperimentale

Università degli Studi di Cassino. Corso di Laurea in Economia Aziendale. Corso di. Statistica. Docente: Simona Balzano.

Distribuzioni e rappresentazioni grafiche

Statistica. (Dr. Elvira Di Nardo)

Stefania Taralli Anno Accademico 2017/2018 1

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2010/2011 STATISTICA. Docente: Paolo Mazzocchi

Università degli Studi di Napoli. Corso di Laurea in Management per le Imprese Turistiche. STATISTICA per il Turismo. I Lezione

ESERCIZI DI STATISTICA SOCIALE

Metodi statistici per le ricerche di mercato

Data set relativo a 40 titolari di esercizi commerciali. Durata del percorso casa lavoro (in minuti) Numero dipendenti che lavorano nel negozio

LA STATISTICA

Dott.ssa Marta Di Nicola

Variabilità o Dispersione Definizione Attitudine di un fenomeno ad assumere diverse modalità

Hanno ordinato o comprato merci e/o servizi su internet

Lezione 1. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 1. A. Iodice.

Unità Carattere Modalità

I fenomeni collettivi sono quei fenomeni il cui studio richiede una pluralità di osservazioni.

Lezione 2 Corso di Statistica. Domenico Cucina

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno

Psicometria (8CFU) SCALE DI MISURA

Strumenti di indagine per la valutazione psicologica

Università di Cassino Corso di Statistica 1 Esercitazione del 14/01/2008 Dott. Alfonso Piscitelli

Prof.ssa M. Di Nicola

Matematica Lezione 21

CONCETTI CHIAVE DELLA STATISTICA

RILEVAZIONI STATISTICHE

CORSO DI STATISTICA MEDICA Prof. Enzo Ballone

STATISTICA 1 ESERCITAZIONE 1 CLASSIFICAZIONE DELLE VARIABILI CASUALI

-Validità di un test diagnostico: Sensibilità e Specificità

ESERCITAZIONI N. 1 Corso di Statistica

Statistica. Statistica descrittiva. GRAFICI e INDICI

Statistica e informatica

L indagine statistica

Livello di misura Scala Nominale Scala Ordinale Scala di Rapporti. Scala Nominale

Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Lezione I: Introduzione. La statistica. Nell analisi statistica si può individuare una: Prof. Enzo Ballone

Lezione 2. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 2. A. Iodice. Distribuzioni unitarie

LEZIONE 1.1. corso di statistica. Francesco Lagona Università Roma Tre. LEZIONE 1.1 p. 1/18

NOZIONE DI VARIABILE. Varie accezioni

LA STATISTICA. Dott.ssa Marta Di Nicola 1.

Modelli descrittivi, statistica e simulazione

Dott.ssa Marta Di Nicola 1

Statistica. Lezione 1

Titolo della lezione. Introduzione

Titolo della lezione Corso di Statistica Prof. Andrea CICCARELLI

Laboratorio di matematica: processamento, interpretazione ed elaborazione dei dati

Dipartimento di Fisica a.a. 2003/2004 Fisica Medica 2 Indici statistici 22/4/2005

Corso di laurea in Comunicazione pubblica e d'impresa. Docente: Mariangela Zenga Ricevimento: mercoledì

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri;

Elementi di Statistica

Corso di Statistica Canale E Bini, Cutillo A.A. 2017/2018. Esercitazione di riepilogo n.1

Statistica descrittiva univariata

Statistica. Lezioni: 3, 4. Statistica Descrittiva Univariata 2

Metodi e tecniche di analisi dei dati nella ricerca psico-educativa Parte III

Rilevazione (Raccolta) Dati: Raccolta Campionaria e Raccolta Globale

Esercitazioni di statistica

Analisi dei dati per la comunicazione

Istituzioni di Statistica e Statistica Economica

Statistica Sociale - modulo A

Statistica: la scienza dei dati. Prof. Stefano Bonnini

L acquisizione dei dati

Variabile divisa in classi: varianza

Transcript:

Classificazione dei caratteri Carattere Qualitativo (utabile Statistica): modalità espresse da attributi Genere, Stato civile, Sett. di attività econ., Titolo di studio, Grado militare Carattere Quantitativo (Variabile Statistica): modalità espresse da numeri Discreto: numero finito, o numerabile, di modalità Num. di figli, Num. di pezzi prodotti Continuo: numero infinito di modalità Peso, Altezza, Reddito Pagina 1 isurazione dei caratteri Carattere qualitativo Scala nominale o utabile Sconnessa Se date due sue modalità è possibile affermare solo se queste sono uguali o diverse Nessun ordine tra le modalità Sesso, Stato civile, Sett. attività econ. Scala Ordinale o utabile Ordinata Esiste un ordine naturale tra le modalità se date due sue modalità è possibile affermare se queste sono uguali e stabilire un ordinamento oggettivo, specificando quale precede l altra utabili rettilinee: Tit. studio, Grado militare utabili cicliche: ese di nascita, Giorno della settimana di nascita Pagina 2 1

continua Caratteri quantitativi: esiste un unità di misura delle modalità numeriche Variabile a scala di intervalli non esiste uno zero assoluto, naturale e non arbitrario Operazioni = o e > o < e distanza Temperatura, Q.I. Variabile a scala di rapporti esiste uno zero assoluto, naturale e non arbitrario Operazioni = o e > o <, distanza e rapporto Nati, orti, Pezzi prodotti, Reddito, Peso Pagina 3 In sintesi Carattere Qualitativo Quantitativo Nominale Luogo di nascita Genere Colore capelli Stato civile Nazionalità Religione Professione Tipo maturità Ordinale Anno di corso Grado militare Ceto sociale Anno di nascita Titolo studio ese di nascita Giorno settimana di nascita Discreto Numero fratelli Num. pezzi prodotti Num. macchine possedute Voto diploma Q.I. Continuo Statura Peso Età Reddito prodotto Temperatura Longitudine Latitudine Pagina 4 2

Classificazione gerarchica SCALA DI RAPPORTI odalità numeriche con unità di misura e zero naturale SCALA DI INTERVALLO odalità numeriche con unità di misura e origine arbitraria ORDINALE odalità con ordinamento NOINALE odalità senza ordinamento Potenzialmente tutti i caratteri Pagina 5 Popolazione, Unità e Caratteri Pagina 6 3

Popolazione, Unità e Caratteri Pagina 7 Trasformazioni della scala di misura DA A Nominale Ordinale Scala di intervalli Scala di rapporti Nominale Introdurre parametri Introdurre parametri Introdurre parametri Ordinale Non tenere conto dell ordine Introdurre parametri Introdurre parametri Scala di intervalli Suddividere in classi e non tenere conto dell ordine Suddividere in classi Scala di rapporti Suddividere in classi e non tenere conto dell ordine Suddividere in classi Pagina 8 4

Trasformazione di un carattere: da quantitativo a qualitativo ordinale Supponiamo di aver rilevato il reddito annuo lordo su un collettivo di occupati : il reddito minimo è 4.000 euro, il massimo 50.000 euro Si tratta di un carattere quantitativo a scala di rapporti Può essere trasformato in una mutabile ordinale raggruppando in classi le modalità numeriche ed associando a ciascuna di esse un attributo Le classi devono essere esaustive e non sovrapposte [ Estremo incluso ( Estremo escluso Classi di reddito [da 4.000 a 10.000] (da 10.000 a 20.000) [da 20.000 a 25.000) [da 25.000 a 35.000] Attributo Basso ediobasso edio edio-alto ] Estremo incluso ) Estremo escluso (da 35.000 a 50.000] Alto Pagina 9 Trasformazione di un carattere: da qualitativo a quantitativo Supponiamo di aver rilevato la mutabile ordinale titolo di studio in un collettivo di occupati, distinguendo nessun titolo, licenza elementare, media inferiore, diploma, laurea triennale, laurea magistrale La mutabile ordinale può essere trasformata in carattere quantitativo facendo corrispondere a ciascuna modalità il numero di anni scolastici necessari per conseguire il titolo corrispondente odalità attributo odalità numerica Nessun titolo 0 Licenza elementare 5 Licenza media 8 inferiore Diploma 13 Laurea triennale 16 Laurea magistrale 18 Pagina 10 5

Riepilogo sui caratteri = o > o < + o - x o / Sconnessa si no no no Ordinale si si no no Scala intervalli si si si no Scala rapporti si si si si Pagina 11 Tabelle di dati Tabella di dati: insieme di informazioni organizzate secondo diverse righe e diverse colonne Tabella unità x caratteri (o tabella unità x variabili o matrice dei dati) ciascuna riga è associata ad una u.s. ciascuna colonna è associata ad un carattere una cella è la realizzazione del carattere (in colonna) su una u.s. (in riga) atrice dei dati: può essere una tabella di microdati o di macrodati Pagina 12 6

Trasformazione delle unità statistiche La manipolazione dei dati può riguardare non soltanto i caratteri osservati, ma anche le unità statistiche che possono essere aggregate secondo criteri utili alle finalità dell indagine Si è rilevato su alcuni individui laureati alcuni caratteri, si può passare dalle unità statistiche laureati alle unità statistiche corsi di laurea Pagina 13 La tabella dei microdati Unità statistica di rilevazione Corso di laurea Conclusione del percorso di studio Voto di laurea Intervistato 1 Economia In corso 100 Intervistato 2 Economia uori corso 106 Intervistato 3 Comunicazione In corso 110 Intervistato 4 Comunicazione uori corso 104 Intervistato 5 Comunicazione uori corso 101 Intervistato 6 Ingegneria In corso 90 Intervistato 7 Ingegneria In corso 110 Pagina 14 7

Trasformazione delle unità statistiche Si vuole focalizzare l analisi non tanto sui singoli laureati quanto sui corsi di laurea, per far emergere eventuali analogie e differenze in merito ai voti e alla possibilità di licenziare laureati in corso I dati statistici che si andranno ad analizzare non saranno quelli riguardanti i singoli intervistati, ma quelli ottenuti attraverso opportune elaborazioni dei microdati Pagina 15 La tabella dei macrodati Unità statistica di analisi Numero laureati in corso Numero laureati fuori corso Voto medio di laurea Economia 1 1 103 Comunicazione 1 2 105 Ingegneria 2 0 100 Pagina 16 8

atrice unità di analisi x caratteri I laureati sono aggregati in gruppi in base alla medesima modalità del carattere corso di laurea tanti gruppi quante sono le modalità del carattere corso di laurea unità di analisi Per gli altri caratteri si sceglie una appropriata funzione di aggregazione delle modalità che tenga conto della tipologia del carattere per la mutabile dicotomica conclusione del percorso di studio si contano, per ogni unità di analisi, i laureati in corso e quelli fuori corso per la variabile a scala di rapporti voto di laurea si calcola il voto medio alla laurea per ciascuna unità di analisi Pagina 17 icrodati e macrodati Unità statistica di rilevazione: unità elementare su cui vengono rilevati i caratteri danno luogo ai microdati: insieme di dati riguardanti le unità elementari Unità statistica di analisi: unità primaria di interesse per l analisi, a cui vengono riferiti i caratteri oggetto di studio può coincidere con quella di rilevazione può riferirsi ad aggregazioni di tali unità (la famiglia, la scuola, l azienda, il corso) da luogo ai macrodati, insieme di dati riguardanti le unità aggregate Pagina 18 9

Tabelle di dati Tabella di dati: insieme di informazioni organizzate secondo diverse righe e diverse colonne Tabella unità x caratteri (o tabella unità x variabili o matrice dei dati) ciascuna riga è associata ad una u.s. ciascuna colonna è associata ad un carattere una cella è la realizzazione del carattere (in colonna) su una u.s. (in riga) atrice dei dati: può essere una tabella di microdati o di macrodati Pagina 19 La struttura dei dati Carattere Qualitativo (mutabile statistica) Unità statistica Osservazione di uno o più caratteri Carattere Quantitativo (variabile statistica) Collettivo statistico Pagina 20 10

Rilevazione dei dati statistici Da un indagine condotta ad un anno dalla laurea sui laureati nell a.a. 2003/2004 ad un corso di laurea triennale della facoltà di Scienze della Comunicazione, si sono ottenuti i seguenti dati: A B C D E G H I J K N P Q UNITA' genere LaureaNO Tesi VotoL Durata LavOggi Settore Qualifica Contratto OreLav LavAdeguato UnivOggi Solo Reddito u1 STC 4 101 3 NO, non cerco 0 0 0 0 0 3 0 0 u2 STC 4 111 3 SI 11 22 3 10 1 1 NO 0 u3 SCPO 7 110 3 SI 40 12 3 40 1 3 SI 5 u4 STC 3 108 3 NO, in cerca 0 0 0 0 0 3 0 0 u5 SCPO 12 99 3 NO, non cerco 0 0 0 0 0 1 0 0 u6 COOP 6 110 3 SI 17 22 5 18 1 3 0 1 u7 COOP 13 96 3 SI 30 12 4 40 1 3 SI 2 u8 STC 4 107 3 SI 15 7 1 12 1 1 SI 1 u9 SCPO 7 104 3 NO, non cerco 0 0 0 0 0 2 0 0 u10 STC 3 110 3 NO, non cerco 0 0 0 0 0 3 0 0 u11 SCPO 16 105 3 SI 14 2 7 16 1 1 SI 3 u12 SCPO 4 108 3 NO, non cerco 0 0 0 0 0 1 0 0 u13 SCPO 11 108 3 NO, non cerco 0 0 0 0 0 2 0 0 u14 SCPO 4 102 4 NO, non cerco 0 0 0 0 0 1 0 0 u15 STC 4 103 3 NO, non cerco 0 0 0 0 0 1 0 0 u16 SCPO 9 108 4 SI 45 7 6 20 1 1 SI 1 u17 SCPO 7 103 3 NO, in cerca 0 0 0 0 0 3 0 0 u18 SCPO 11 111 3 NO, in cerca 0 0 0 0 0 1 0 0 u19 SCPO 11 105 3 NO, in cerca 0 0 0 0 0 3 0 0 u20 STC 2 103 3 NO, non cerco 0 0 0 0 0 1 0 0 u21 SCPO 9 109 4 NO, non cerco 0 0 0 0 0 1 0 0 u22 STC 1 111 5 SI 18 23 8 36 1 1 SI 5 u23 STC 3 104 3 NO, non cerco 0 0 0 0 0 1 0 0 u24 SCPO 2 111 4 NO, non cerco 0 0 0 0 0 3 0 0 u25 SCPO 5 109 3 NO, non cerco 0 0 0 0 0 1 0 0 u26 STC 3 107 5 SI 15 1 6 x 2 1 NO 2 Pagina 21 atrice dei dati : microdati A B C D E G H I J K N P Q UNITA' genere LaureaNO Tesi VotoL Durata LavOggi Settore Qualifica Contratto OreLav LavAdeguato UnivOggi Solo Reddito u1 STC 4 101 3 NO, non cerco 0 0 0 0 0 3 0 0 u2 STC 4 111 3 SI 11 22 3 10 1 1 NO 0 u3 SCPO 7 110 3 SI 40 12 3 40 1 3 SI 5 u4 STC 3 108 3 NO, in cerca 0 0 0 0 0 3 0 0 u5 SCPO 12 99 3 NO, non cerco 0 0 0 0 0 1 0 0 u6 COOP 6 110 3 SI 17 22 5 18 1 3 0 1 u7 COOP 13 96 3 SI 30 12 4 40 1 3 SI 2 u8 STC 4 107 3 SI 15 7 1 12 1 1 SI 1 u9 SCPO 7 104 3 NO, non cerco 0 0 0 0 0 2 0 0 u10 STC 3 110 3 NO, non cerco 0 0 0 0 0 3 0 0 u11 SCPO 16 105 3 SI 14 2 7 16 1 1 SI 3 u12 SCPO 4 108 3 NO, non cerco 0 0 0 0 0 1 0 0 u13 SCPO 11 108 3 NO, non cerco 0 0 0 0 0 2 0 0 u14 SCPO 4 102 4 NO, non cerco 0 0 0 0 0 1 0 0 u15 STC 4 103 3 NO, non cerco 0 0 0 0 0 1 0 0 u16 SCPO 9 108 4 SI 45 7 6 20 1 1 SI 1 u17 SCPO 7 103 3 NO, in cerca 0 0 0 0 0 3 0 0 u18 SCPO 11 111 3 NO, in cerca 0 0 0 0 0 1 0 0 u19 SCPO 11 105 3 NO, in cerca 0 0 0 0 0 3 0 0 u20 STC 2 103 3 NO, non cerco 0 0 0 0 0 1 0 0 u21 SCPO 9 109 4 NO, non cerco 0 0 0 0 0 1 0 0 u22 STC 1 111 5 SI 18 23 8 36 1 1 SI 5 u23 STC 3 104 3 NO, non cerco 0 0 0 0 0 1 0 0 u24 SCPO 2 111 4 NO, non cerco 0 0 0 0 0 3 0 0 u25 SCPO 5 109 3 NO, non cerco 0 0 0 0 0 1 0 0 u26 STC 3 107 5 SI 15 1 6 x 2 1 NO 2 Pagina 22 11

Distribuzione unitaria Tabella unità x variabili è una distribuzione unitaria multipla unitaria perché è rappresentata ciascuna u.s. multipla perché sono osservati più caratteri su una medesima u.s. Una sola colonna della tabella distribuzione unitaria semplice Pagina 23 Esempio: Distribuzione Unitaria ultipla A B C D E UNITA' sesso LaureaNO Tesi VotoL Durata u1 STC 4 101 3 u2 STC 4 111 3 u3 SCPO 7 110 3 u4 STC 3 108 3 u5 SCPO 12 99 3 u6 COOP 6 110 3 u7 COOP 13 96 3 u8 STC 4 107 3 u9 SCPO 7 104 3 u10 STC 3 110 3 u11 SCPO 16 105 3 u12 SCPO 4 108 3 u13 SCPO 11 108 3 u14 SCPO 4 102 4 u15 STC 4 103 3 u16 SCPO 9 108 4 u17 SCPO 7 103 3 u18 SCPO 11 111 3 u19 SCPO 11 105 3 u20 STC 2 103 3 u21 SCPO 9 109 4 u22 STC 1 111 5 u23 STC 3 104 3 u24 SCPO 2 111 4 u25 SCPO 5 109 3 u26 STC 3 107 5 Unitaria Semplice A B UNITA' sesso u1 u2 u3 u4 u5 u6 u7 u8 u9 u10 u11 u12 u13 u14 u15 u16 u17 u18 u19 u20 u21 u22 u23 u24 u25 u26 Pagina 24 12

La Distribuzione Statistica di requenze Assolute Necessità di sintesi Lista delle modalità che il carattere può assumere Conteggio del numero di u.s. del collettivo considerato che presentano la singola modalità (freq. Assoluta) CARATTERE odalità uno odalità due odalità kappa REQUENZE ASSOLUTE Numero di unità statistiche del collettivo considerato che presentano la modalità uno del carattere Numero di unità statistiche del collettivo considerato che presentano la modalità due del carattere Numero di unità statistiche del collettivo considerato che presentano la modalità kappa del carattere Pagina 25 La notazione X : Carattere osservato x 1, x 2,, x i,, x K : K modalità assunte del carattere X x i modalità generica x K ultima modalità Se X quantitativo x 1 < x 2 << x i << x K n : numero di u.s. che compongono il collettivo n 1, n 2,, n i,, n K : freq. Assol. associate alle K modalità n 1 + n 2 + + n i ++ n K =n Car. X REQUENZE ASSOLUTE x 1 n 1 x 2 n 2 x i x K Totale n i n K n Pagina 26 13

la formalizzazione CARATTERE odalità uno REQUENZE ASSOLUTE Numero di u.s. del collettivo considerato che presentano la modalità uno del carattere Car. X REQUENZE ASSOLUTE x 1 n 1 odalità due Numero di u.s. del collettivo considerato che presentano la modalità due del carattere x 2 n 2 x i n i odalità i Numero di u.s. del collettivo considerato che presentano la modalità i del carattere x K n K odalità kappa Numero di u.s. del collettivo considerato che presentano la modalità kappa del carattere Totale n Pagina 27 Distribuzione dei laureati per genere Distribuzione per genere dei laureati di Scienze della Comunicazione nell a.a. 2003/2004 requenze Genere assolute 17 9 Totale 26 Pagina 28 14

Condizione occupazionale dei laureati Distribuzione per condizione occupazionale dei laureati di Scienze della Comunicazione nell a.a. 2003/2004 Condizione occupazionale requenze assolute SI 9 NO, non cerco 13 No, ma cerco 4 Totale 26 Pagina 29 La Distribuzione Statistica di requenze Relative Consente di confrontare l informazione relativa ad un medesimo carattere osservato su collettivi di numerosità diversa requenze Relative si ottengono dividendo, per ogni modalità, la requenza Assoluta corrispondente per la Numerosità Totale del collettivo In sintesi: = f 1 + f 2 ++ f i ++ f K = 1 Pagina 30 15

Distribuzione dei laureati occupati per Durata del Corso di Studi Distribuzione dei laureati di Scienze della Comunicazione nell a.a. 2003/2004 per Durata del Corso di Studi Durata Corso di Studi requenze assolute requenze relative 3 20 0.77 4 4 0.15 5 2 0.08 Totale 26 1.00 Pagina 31 La Distribuzione Statistica di requenze Percentuali Consente di confrontare collettivi di numerosità diversa ed evidenziarne la composizione requenze Percentuali si ottengono dividendo, per ogni modalità, la req. Ass. per la Num. Totale e moltiplicando per 100 In sintesi: oppure: = = p 1 + p 2 ++ p i ++ p K = 100 Pagina 32 16

Distribuzione dei laureati per genere Distribuzione per genere dei laureati di Scienze della Comunicazione nell a.a. 2003/2004 Genere requenze assolute requenze relative requenze percentuali 17 0.65 65 9 0.35 35 Totale 26 1.00 100 Pagina 33 In sintesi Carattere X requenza requenza requenza Assoluta Relativa Percentuale n i f i = n i /n p i = f i x 100 x 1 n 1 f 1 p 1 x 2 n 2 f 2 p 2............ x i n i f i p i............ x K n K f K p K Totale n 1 100 Pagina 34 17