STATISTICHE DESCRITTIVE Parte II

Documenti analoghi
STATISTICHE DESCRITTIVE

Misure di dispersione (o di variabilità)

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

Lezione 4 a - Misure di dispersione o di variabilità

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Variabilità e Concentrazione Esercitazione n 02

Statistica. Alfonso Iodice D Enza

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Un breve riassunto. La Stilometria. Coefficiente di Variazione. Unità di misura della Dev. Std. 15/03/2012

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri;

Misure di dispersione (o di variabilità)

Indici di Dispersione

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Statistica descrittiva II

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Teoria e tecniche dei test. Concetti di base

Esercizi di statistica descrittiva. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 30

1/55. Statistica descrittiva

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Nozioni di statistica

La statistica descrittiva seconda parte. a cura della prof.ssa Anna Rita Valente

Statistica Sociale - modulo A

Statistica Un Esempio

Capitolo 3 Sintesi e descrizione dei dati quantitativi

Statistica di base per l analisi socio-economica

Statistica descrittiva

7. STATISTICA DESCRITTIVA

MISURE DI DISPERSIONE

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

Istituzioni di Statistica e Statistica Economica

La variabilità. Antonello Maruotti

Esercitazioni di statistica

Statistica. Matematica con Elementi di Statistica a.a. 2017/18

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Gli indici di variabilità

La Variabilità statistica

Fonte:

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

STATISTICA esercizi svolti sulla VARIABILITA

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Elementi di Statistica

Medie. Monia Ranalli. Ranalli M. Medie Settimana # 2 1 / 22

Indici di variabilità relativa

STATISTICA 1 ESERCITAZIONE 6

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Distribuzioni Statistiche e Medie Esercitazione n 01

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

Transcript:

STATISTICHE DESCRITTIVE Parte II

INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione

introduzione Una distribuzione di dati contiene un insieme di informazioni complesse e di per se poco maneggevole. Il ricorso ad un indice di tendenza centrale comporta una forte semplificazione, e da solo non fornisce informazioni esaurienti sulla distribuzione. Occorre anche capire quanto i dati siano dispersi intorno all indice di tendenza centrale. Esempio Consideriamo i risultati dei compiti di Psicometria di tre diverse Facoltà: Facoltà A = {18,, 4, 16, 19,, 18, 1} Facoltà B = {10, 10, 1, 10, 30, 8, 30, 30} Facoltà C = {0, 0, 0, 0, 0, 0, 0, 0} In ogni Facoltà la media dei voti è pari a 0, ma è evidente una diversa dispersione intorno a tale valore. 3

gli indici di dispersione Gli indici che vedremo servono a misurare la dispersione (o variabilità) di una data distribuzione di dati. Per questo motivo vengono definiti come indici di dispersione o indici di variabilità. Gli indici di dispersione possono assumere solo valori positivi (non ha senso parlare di dispersione negativa) o nulli (nei casi in cui tutti i dati osservati sono uguali tra loro). 4

la gamma La gamma, detta anche campo di variazione, è la differenza fra il valore massimo e quello minimo dei dati. gamma = X X max min Esempio I seguenti dati rappresentano le altezze in centimetri dei giocatori di una squadra di pallavolo. {188, 195, 198, 170, 185, 199} La gamma di tale distribuzione sarà: gamma = 199 170 = 9 5

la differenza interquartilica La differenza interquartilica, o range interquartile, è data dalla differenza tra il terzo e il primo quartile (o equivalentemente tra il 75-esimo e il 5-esimo percentile) dei dati: Q = Q Q 75 5 Nota: La differenza interquartilica, non tiene conto dei valori estremi della distribuzione dei dati, evitando così di considerare valori anomali. Per questo motivo è considerata un indice robusto. 6

la varianza La varianza σ di un insieme di dati è definita come la media degli scarti al quadrato tra i dati e la media dei dati stessi. Essa assume il valore minimo di 0 quando i dati sono tutti uguali tra loro e aumenta al crescere della variabilità dei dati. Le formule per il calcolo della varianza sono differenti a seconda che i dati siano o meno raggruppati in classi. 7

formula per il calcolo della varianza - dati non raggruppati n σ = i = 1 ( x x ) i n dove: ( x x ) i è lo scarto tra l i-esima statistica e la media dei dati. unità 8

formula ridotta per il calcolo della varianza - dati non raggruppati La varianza può essere anche calcolata attraverso la seguente formula, che consente un calcolo più agevole e veloce: σ x x i i i i = n n varianza = media dei quadrati - quadrato della media 9

Esempio [1] Un ricercatore ha valutato la capacità linguistiche di 10 bambini in età prescolare ottenendo i dati sottoriportati. La capacità di linguistica è qui indagata come numero di parole non conosciute nella lettura di un testo [da Keppel, 199]. Calcolare la varianza dei dati, sia con la formula generale che con quella ridotta. codice soggetto 1 3 4 5 6 7 8 9 10 Numero parole non note 8 6 7 7 9 6 7 9 4 7 10

Esempio [] Calcoliamo innanzi tutto la media dei dati: x 8+ 6+ + 4+ 7 70 = = = 7 10 10 Utilizziamo ora la formula generale per il calcolo della varianza: (8 7) + (6 7) + + (7 7) 0 σ = = = 10 10 11

Esempio [3] Utilizziamo ora la formula ridotta. Per prima cosa calcoliamo la media dei quadrati : ( x ) 8 + 6 + 7 510 = = = 51 10 10 Calcoliamo ora il quadrato della media : ( ) x = 7 = 49 Infine utilizzando la formula ridotta per il calcolo della varianza otteniamo: ( x ) ( x) 51 49 σ = = = 1

formula per il calcolo della varianza - dati raggruppati σ = i ( x x) f i i n dove: f i è la frequenza relativa dell i-esima modalità statistica. 13

Esempio [1] Calcolare la varianza dei dati dell esempio precedente utilizzandoli in forma raggruppata. Per prima cosa rappresentiamo i dati in forma raggruppata: x i Parole sconosciute 4 6 7 8 9 f i frequenze 1 4 1 14

Esempio [] Ricordando che la media dei dati è pari a 7, applichiamo la formula per il calcolo della varianza per dati raggruppati: + + + (4 7) 1 (6 7) (9 7) 0 σ = = = 10 10 15

formula per il calcolo della varianza - dati raggruppati in classi σ = i ( x x) f vc i i n dove: x vci è il valore centrale dell i-esima classe di frequenza. 16

Esempio [1] In un azienda veronese che produce occhiali sono stati rilevati gli stipendi mensili dei 0 dipendenti: Stipendio mensile in Euro 800-100 Frequenze 10 100-1600 5 1600-000 3 000-400 Calcolare la media e la varianza di tali dati. Nota: gli intervalli di frequenza si intendono del tipo primo valore incluso secondo valore escluso. 17

Esempio [] Calcoliamo la media dei dati: x 1000 10+ 1400 5+ 1800 3+ 00 = = 1340 0 Calcoliamo ora la varianza di tali dati: + + (1000 1340) 10 (00 1340) σ = = 164400 0 18

la deviazione standard La deviazione standard (o scarto quadratico medio) è la radice della varianza: σ = σ Essa è molto utile in chiave interpretativa perché, a differenza della varianza, è espressa nella stessa unità di misura del fenomeno studiato. Esempio In campione di 0 soggetti è stata rilevata la variabile peso. In tale campione la media è pari a 70 Kg e la deviazione standard è pari a 10.7. Si potrà affermare che i soggetti differiscono mediamente di 10.7 Kg dal peso medio di 70 Kg. 19

il coefficiente di variazione [1] Il coefficiente di variazione è dato dal rapporto tra la deviazione standard e il valore assoluto della media dei dati: CV = σ x Esso è un indice di variabilità relativa, che tiene conto oltre che della deviazione standard dei dati anche della media. Per questo motivo è molto utile per eseguire dei confronti in termini di variabilità tra fenomeni diversi tra loro. 0

il coefficiente di variazione [] Esempio Nel reparto di ginecologia e ostetricia di un ospedale è stato rilevato il peso di un campione di 80 neonati maschi e contemporaneamente il peso dei rispettivi papà. I dati ottenuti sono espressi nella seguente tabella: gruppo neonati papà media 3.4 Kg 8 Kg deviazione standard 0.8 15 Ci si chiede se, rispetto alla variabile peso, esiste più variabilità nel gruppo dei neonati o in quello dei papà. 1

il coefficiente di variazione [3] Naturalmente confrontare le deviazioni standard non è di grande aiuto. Esse dipendono fortemente dalle media dei dati su cui sono state calcolate. Per poter operare un confronto sulla variabilità dei due gruppi è opportuno calcolare i rispettivi coefficienti di variazione: 0.8 CV bambini = = 3.4 15 CV papà = = 8 0.4 0.18 Osservando i risultati si può concludere che il gruppo dei bambini presenta una maggiore variabilità rispetto a quella del gruppo dei papà.

il coefficiente di variazione[3] In conclusione, vediamo alcuni valori particolari del CV che possono essere utili nello studio di una distribuzione di dati: CV = 0, in questo caso la deviazione standard è pari a 0. Tutti i dati sono uguali tra loro e la media può essere considerata come un indice perfetto per rappresentarli. CV 0.5, in questo caso la deviazione standard è più della metà della media. La media, in questo caso, non può essere considerata un buon indice per rappresentare i dati. CV 0.5, in questo caso la deviazione standard è meno della metà della media. La media, in questo caso, può essere considerata un buon indice per rappresentare i dati. 3