Le misure della tendenza

Похожие документы
Gli indici di variabilità

Indici di tendenza centrale Media, mediana e moda.

INDICATORI DI TENDENZA CENTRALE

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE

Esercitazioni di statistica

Scale di Misurazione Lezione 2

ESERCIZI DI STATISTICA SOCIALE

08/04/2014. Misure di posizione. INDICI DI POSIZIONE (measures of location or central tendency) 1. MODA 2. MEDIA 3. MEDIANA

Teoria e tecniche dei test. Concetti di base

1/55. Statistica descrittiva

Esempi di confronti grafici

Le medie. Antonello Maruotti

standardizzazione dei punteggi di un test

Statistica descrittiva

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Statistica Descrittiva Soluzioni 4. Medie lasche

La sintesi delle distribuzioni

Elementi di Statistica

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

MISURE DI SINTESI 54

Elementi di Psicometria con Laboratorio di SPSS 1

L indagine statistica

Fonti e strumenti statistici per la comunicazione

Distribuzioni Statistiche e Medie Esercitazione n 01

TEST DI AUTOVALUTAZIONE STATISTICA DESCRITTIVA

TEST DI AUTOVALUTAZIONE STATISTICA DESCRITTIVA

Questionario 1. Sono assegnati i seguenti dati

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri;

La statistica descrittiva seconda parte. a cura della prof.ssa Anna Rita Valente

4. INDICI DI POSIZIONE

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

4. VALORI CENTRALI. Statistica sociale

Statistica. Matematica con Elementi di Statistica a.a. 2017/18

Corso di Statistica: ESERCITAZIONI

Obiettivi Strumenti Cosa ci faremo? Probabilità, distribuzioni campionarie. Stimatori. Indici: media, varianza,

esercitazione1 12/10/2015

STATISTICHE DESCRITTIVE

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Statistica: principi e metodi. Medie

Statistica descrittiva II

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

TEST DI AUTOVALUTAZIONE STATISTICA DESCRITTIVA

Lezione 4: Indici di posizione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

La matrice dati. La matrice dati

Elementi di Psicometria con Laboratorio di SPSS 1

Lezione 4. Statistica. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Lezione 4. A. Iodice. Indici di posizione.

STATISTICA: esercizi svolti su MODA, MEDIANA, QUARTILI, DECILI e CENTILI

LE MEDIE DI POSIZIONE

Istituzioni di Statistica e Statistica Economica


ESERCIZI STATISTICA DESCRITTIVA

Lezione 1.3 Corso di Statistica. Francesco Lagona

Rappresentazioni grafiche

Esercitazioni di Statistica

La distribuzione delle frequenze. T 10 (s)

Medie. Monia Ranalli. Ranalli M. Medie Settimana # 2 1 / 22

Транскрипт:

Statistica descrittiva: le misure della tendenza centrale 4 ottobre 2011 Statistica sociale 1 Le misure della tendenza centrale Vediamo i passi che abbiamo fatto finora: 1) Abbiamo stabilito che cosa è un dato statistico (valore di una variabile associato a una unità statistica); 2) Abbiamo visto i diversi tipi di variabili, a seconda delle scale di misura; 3) Abbiamo organizzato i dati in un archivio (la matrice caso X variabile ), per poterli analizzare; Il successivo passo: 4) Costruire una misura, un indice che SINTETIZZI l informazione presente in una popolazione (una classe, una scuola, un comune, un qualunque insieme di unità statistiche) 4 ottobre 2011 Statistica sociale 2 1

Le misure della tendenza centrale Come si può realizzare questo obiettivo? Dipende, ancora una volta, dalla scala di misura Ogni scala di misura ha il proprio indice della tendenza centrale Più è complessa la scala, più complesso sarà il relativo indice di tendenza centrale Se una scala è più complessa, ammette anche gli indici di tendenza centrale delle scale meno complesse 4 ottobre 2011 Statistica sociale 3 In termini schematici: Scala di misura Nominale Ordinale Ad intervalli A rapporti Indici di Moda (la Idem + Idem + Media Idem + Media tendenza modalità con la Mediana (la aritmetica (la geometrica centrale frequenza più modalità che somma delle ammissibili alta) divide in due modalità della parti uguali la variabile in distribuzione dei questione per i soggetti, tutti i soggetti ordinati sulla diviso il numero base della dei soggetti) proprietà in 4 ottobre 2011 questione) Statistica sociale 4 2

Torniamo alla nostra matrice CxV (n=200) VARIABILI SCUOLA PREP ANNONASC VOTO CASI Giacomo L Ottima 1988 90 Giuseppe P Sufficiente 1986 80 Maria L Buona 1988 94 Laura L Ottima 1989 96 Filippo T Insufficiente 1987 70..... Federica T Sufficiente 1987 72 4 ottobre 2011 Statistica sociale 5 Variabile 1: la scuola frequentata Dal conteggio dei dati relativi alle 200 matricole, sappiamo che la distribuzione, secondo il tipo di scuola frequentata, è la seguente: Scuola Licei Ist.tecnici Ist.professionali TOTALE n 50 70 80 200 % 25% 35% 40% 100% 4 ottobre 2011 Statistica sociale 6 3

La moda La moda (o valore modale) è l indice di tendenza centrale più semplice È il valore della variabile considerata più frequente nella popolazione Nel nostro caso abbiamo: Frequenza(istituto professionale)=80 Quindi il valore modale è: : ISTITUTO PROFESSIONALE 4 ottobre 2011 Statistica sociale 7 La moda La moda è l unico indice di tendenza centrale che si può ricavare per dati su scala NOMINALE; La moda si può ricavare in tutte le scale di misura, anche in quelle più complesse 4 ottobre 2011 Statistica sociale 8 4

Un semplice grafico Ist.profession ali; 80 Licei; 50 Ist.tecnici; 70 4 ottobre 2011 Statistica sociale 9 Variabile 2: il giudizio sulla preparazione Conosciamo la distribuzione; stavolta le modalità hanno anche un ORDINE: Freq.assoluta % Insufficiente Sufficiente Buona Ottima Totale 20 100 60 20 200 10 50 30 10 100 4 ottobre 2011 Statistica sociale 10 5

La distribuzione cumulata Si ottiene accumulando le modalità una sull altra, seguendo il loro ordine: FINO A insufficiente Freq.assoluta cumulata 0+20 % cumulata 0+10=10% FINO A sufficiente FINO A buona FINO A ottima = TOTALE 100+20=120 100+20+60=180 200 50+10=60% 50+10+30=90% 100% 4 ottobre 2011 Statistica sociale 11 La mediana La mediana (o valore mediano) è quel valore della variabile che spezza in due parti uguali (50% e 50%), almeno in modo approssimato, la distribuzione cumulata; Nel nostro caso, poiché si ha: % cumulata( sufficiente sufficiente )= 60%,, e nessun valore più basso raggiunge il 50%, la mediana è: sufficiente 4 ottobre 2011 Statistica sociale 12 6

La mediana La mediana è l indice più complesso che sia possibile utilizzare per dati su scala ordinale; La mediana si può utilizzare anche in tutte le scale più complesse di quella ordinale (ad intervalli o a rapporti) 4 ottobre 2011 Statistica sociale 13 Un semplice grafico Distribuzione cumulata 110% 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 10% FINO A insufficiente 60% FINO A sufficiente 90% 100% FINO A buona FINO A ottima = TOTALE 4 ottobre 2011 Statistica sociale 14 7

Altri indici di posizione Oltre alla mediana, può essere interessante valutare altri punti critici della distribuzione Sono importanti: Il primo quartile: : il valore in corrispondenza del quale la variabile ha accumulato il 25% delle unità statistiche; Il terzo quartile: : il valore in corrispondenza del quale la variabile ha accumulato il 75% delle unità statistiche; Il 10 percentile: : il valore in corrispondenza del quale la variabile ha accumulato il 10% delle unità statistiche; Il 90 percentile: : il valore in corrispondenza del quale la variabile ha accumulato il 90% delle unità statistiche; Gli indici di posizione sono importanti nella didattica e nella valutazione: si può, ad esempio, decidere che tutti gli allievi che NON RAGGIUNGONO il 10 percentile siano RESPINTI in una prova di ammissione 4 ottobre 2011 Statistica sociale 15 Nel nostro esempio: Distribuzione cumulata 110% 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% 10% FINO A insufficiente 60% FINO A sufficiente 90% FINO A buona 100% FINO A ottima = TOTALE 10 percentile = insufficiente 90 percentile = buona È più o meno quello che ci aspettavamo 4 ottobre 2011 Statistica sociale 16 8

Variabile 3: anno di nascita Per le nostre finalità conoscitive, conviene trasformare gli anni di nascita in età, sottraendo il 2011 all anno anno di nascita; Una trasformazione di questo tipo si chiama traslazione,, e, in una scala ad intervalli, applicare una traslazione non cambia le proprietà dei dati (su questo aspetto non ci dilunghiamo) 4 ottobre 2011 Statistica sociale 17 Le età Ricaviamo la seguente distribuzione per età delle 200 matricole: Età anni 19 (n.1992.1992) 20 (n.1991.1991) 21 (n.1990.1990) 22 (n.1989.1989) Totale Freq.assolute 18 160 18 4 200 % 9 80 9 2 100 4 ottobre 2011 Statistica sociale 18 9

La media aritmetica L età è una variabile quantitativa vera e propria; Sulla scala ad intervalli, come ricorderete, sono possibili le operazioni di differenza e di somma; La media aritmetica è quel valore della variabile che ciascuna unità statistica avrebbe se TUTTE le unità statistiche fossero uguali 4 ottobre 2011 Statistica sociale 19 Come si calcola la media aritmetica? Da questa definizione, segue che la media aritmetica si calcola in due passi: 1) sommando i valori di tutte le unità statistiche (se sono raggruppate in classi, si fa ancora prima) 2) dividendo tale somma per il numero di unità statistiche 4 ottobre 2011 Statistica sociale 20 10

Come si calcola la media aritmetica? Età anni 19 (n.1992.1992) 20 (n.1991.1991) 21 (n.1990.1990) 22 (n.1989.1989) Totale Freq.ass. 18 160 18 4 200 % 9 80 9 2 100 Somma = (19*18 + 20*160 + 21*18 + 22*4) = 4008 n = 200 Media = Somma / n = 4008 / 200 = 20,04 4 ottobre 2011 Statistica sociale 21 In simboli: La formula per il calcolo della media aritmetica, se gli n dati (nel nostro caso 200) sono organizzati in una distribuzione con k classi (che nel nostro caso sono 4), è la seguente: Dove: x k i= 1 k i = 1 = n i = n x n i n i Il simbolo Σ si legge: somma di. 4 ottobre 2011 Statistica sociale 22 11

In simboli: Nel caso i dati siano rappresentati da una semplice SERIE di dati (che va da 1 a n), e non da una distribuzione, la formula è ancora più semplice. x n j= = 1 n x j 4 ottobre 2011 Statistica sociale 23 La media aritmetica Per calcolare la media aritmetica, i dati devono essere almeno su scala ad intervalli; Se i dati sono su una scala a rapporti, si può comunque calcolare la media aritmetica; Su una scala a rapporti, si può calcolare, oltre alla media aritmetica, anche la media geometrica; di questo aspetto, però, non ci occupiamo 4 ottobre 2011 Statistica sociale 24 12

Un semplice grafico Distribuzione delle età (età media = 20,04 anni) 180 160 140 120 100 80 60 40 20 0 19 20 21 22 4 ottobre 2011 Statistica sociale 25 Riassumendo: Scala di misura Nominale Ordinale Ad intervalli A rapporti Indici di tendenza centrale ammissibili Moda (la modalità con la frequenza più alta) Idem + Mediana (la modalità che divide in due parti uguali la distribuzione dei soggetti, ordinati sulla base della proprietà in questione) Idem + Media aritmetica (la somma delle modalità della variabile in questione per i tutti i soggetti diviso il numero dei soggetti) Idem + Media geometrica 4 ottobre 2011 Statistica sociale 26 13