Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Documenti analoghi
Statistica Descrittiva Esercitazione 3. Indici di variabilità

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

Istituzioni di Statistica e Statistica Economica

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

La variabilità. Antonello Maruotti

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

Istituzioni di Statistica

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Statistica Descrittiva Soluzioni 3. Medie potenziate

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Statistica Un Esempio

Indici di variabilità ed eterogeneità

STATISTICHE DESCRITTIVE Parte II

Teoria e tecniche dei test. Concetti di base

Statistica di base per l analisi socio-economica

Statistica descrittiva II

Statistica Sociale - modulo A

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Statistica. Alfonso Iodice D Enza

Esercitazioni di Statistica

Esercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

Descrittiva. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali

Misure di dispersione (o di variabilità)

STATISTICA 1 ESERCITAZIONE 6

Variabilità. ..senza variabilità non ci sarebbe la statistica

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

Statistica Descrittiva Soluzioni 7. Interpolazione: minimi quadrati

Corso di Statistica. Medie,Moda. Prof.ssa T. Laureti a.a Corso di Statistica a.a DEIM, Univ.TUSCIA - Prof.

A1. La curva normale (o di Gauss)

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

STATISTICA esercizi svolti sulla VARIABILITA

La Variabilità statistica

Nozioni di statistica

tabelle grafici misure di

Indici di variabilità relativa

Q1 = /4 0 4 = Me = /2 4 = 3

1) Calcolare l indice di eterogeneità di Gini per i caratteri Qualifica Funzionale e Regime di Impiego.

STATISTICHE DESCRITTIVE

Esercitazioni di Statistica

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

INDICATORI DI TENDENZA CENTRALE

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Dispensa di Statistica

Valori Medi. Docente Dott.ssa Domenica Matranga

INDICATORI DI TENDENZA CENTRALE

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

Statistica Descrittiva Soluzioni 1. Caratteri e distribuzioni statistiche

Le medie. Antonello Maruotti

INDICATORI DI TENDENZA CENTRALE

Statistica. Alfonso Iodice D Enza

Statistica economica Capitolo 4

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Sintesi numerica di distribuzioni statistiche

Scale di Misurazione Lezione 2

Esercitazioni di statistica

Statistica descrittiva

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI

Statistica economica. Prof. Alessandra Michelangeli a.a

La sintesi delle distribuzioni

La gestione dei risultati della valutazione. Claudio Mantovani

Elementi di Statistica

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

x 1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 x = 35 q 2 = Me q 3 = x (8,25) = x (8) + 0, 25 ( x (9) x (8)

Università degli Studi di Verona

LEZIONI DI STATISTICA MEDICA

Settimana 2. G. M. Marchetti. 4 Marzo 2017

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

Statistica. Alfonso Iodice D Enza

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Stesso valore medio per distribuzioni diverse

PAROLE CHIAVE Accuratezza, Accuracy, Esattezza, PRECISIONE, Precision, Ripetibilità, Affidabilità, Reliability, Scarto quadratico medio (sqm), Errore

ESERCIZI STATISTICA DESCRITTIVA

x i x f i f i + log1, 07 + log1,065 = 0, log1,05+ log1,06 + log1,055+ log( 1+ i)= 1 5

Statistica. Alfonso Iodice D Enza

2. Variabilità mediante il confronto di valori caratteristici della

UNIVERSITÀ DEGLI STUDI DI ROMA LA SAPIENZA

Esempio sulla media geometrica

INDICI DI FORMA: L ASIMMETRIA

Esempio sulla media geometrica

STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I

Esempi di confronti grafici

Corso di Statistica: ESERCITAZIONI

X ~ N (20, 16) Soluzione

Esercizi di statistica descrittiva. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 30

Statistica a.a Autovalutazione 1

Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

Lezione 4 a - Misure di dispersione o di variabilità

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

Variabilità e Concentrazione Esercitazione n 02

Prefazione Ringraziamenti

Misure di dispersione (o di variabilità)

x i. Δ x i

METODO DEI MINIMI QUADRATI

Transcript:

ISTITUZIONI DI STATISTICA A A 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona (sede di Vicenza) Statistica Descrittiva Soluzioni 6 Indici di variabilità, asimmetria e curtosi Introduzione Dato un carattere X, la sua variabilità rappresenta l attitudine ad assumere modalità diverse Prenderemo in considerazione solamente i caratteri quantitativi Per i caratteri qualitativi, la variabilità si traduce in mutabilità Esistono diversi tipi di indici di variabilità In ogni caso, un indice di variabilità deve a) annullarsi nel caso in cui tutti i termini siano uguali e b) aumentare di valore al crescere della diversità tra modalità Distinguiamo tre gruppi di indici di variabilità Intervalli di variazione Sono indici basati sul confronto di alcuni termini della successione ordinata di termini della distribuzione Campo di variazione (o range): R x max x min, dove x max e x min indicano rispettivamente il massimo ed il minimo valore osservato di X Scarto interquartilico: D Q 3 Q 1, ottenuto come differenza tra il terzo ed il primo quartile della distribuzione di X Scostamenti da un valore medio Sono indici che sintetizzano gli scarti tra i termini della distribuzione di X ed un valore centrale Scostamento semplice medio dalla media aritmetica: ms 1 i x i m f i i f i Scostamento semplice medio dalla mediana: mes 1 Si noti che me S 1 è sempre minore di m S 1 i x i me f i i f i Scarto quadratico medio È la misura di variabilità più diffusa ms 2 Tale misura si indica solitamente con σ i(x i m) 2 f i i f i 1

M Minozzo e A Guolo Statistica Descrittiva: Soluzioni 6 2 Varianza È data dal quadrato dello scarto quadratico medio: V (X) σ 2 i(x i m) 2 f i i f i La varianza si può calcolare sia applicando la formula sopra indicata (metodo diretto) sia attraverso al seguente formula (metodo indiretto): V (X) i x 2 i f i i f i m 2, vale a dire come media dei quadrati dei valori di X meno la media aritmetica di X elevata al quadrato Proprietà pitagorica della varianza: i(x i m) 2 f i i f i dove A è un valore arbitrario Varianza di una trasformazione lineare: con a e b valori reali arbitrari i(x i A) 2 f i i f i + (A m) 2 σ 2 + (A m) 2, V (a + b X) b 2 V (X), Standardizzazione Dato un carattere X di media m e varianza σ 2, il carattere U (X m)/σ ha media nulla e varianza pari a 1 Differenze medie Sono indici basati sul confronto tra tutti i termini della distribuzione Differenze medie assolute semplici Nj1 Ni1,i j x i x j e con ripetizione Nj1 Ni1 x i x j R N 2 Differenze medie quadratiche semplici Nj1 Ni1,i j (x i x j ) 2 2 e con ripetizione 2 R Nj1 Ni1 (x i x j ) 2 N 2 Indici relativi di variabilità Gli indici di variabilità esaminati sono assoluti, nel senso che mantengono la dipendenza dalle unità di misura in cui sono osservati i valori di X Si possono modificare al fine di eliminare tale dipendenza e permettere quindi il confronto tra distribuzioni di fenomeni diversi Si ottengono allora gli indici relativi seguenti Range relativo: R m x max x min m

M Minozzo e A Guolo Statistica Descrittiva: Soluzioni 6 3 Differenza interquartilica relativa: Scostamento semplice medio relativo D m Q 3 Q 1 m ms 1 m Coefficiente di variazione Cv σ m Asimmetria Dato un carattere X, si valuta il grado di lontananza della distribuzione del carattere da una situazione di simmetria tramite i seguenti indici: coefficiente di skewness di Pearson, per distribuzioni unimodali, indice β 1 di Pearson indice γ 1 di Fisher s k m m 0 ; σ β 1 ( mµ 3 ) 2 (σ 2 ) 3 { i(x i m) 3 f i / i f i } 2 (σ 2 ) 3 ; γ 1 m µ 3 σ 3 i(x i m) 3 f i / i f i σ 3 Curtosi Dato un carattere X, si valuta il grado di aderenza della sua distribuzione a quello di una distribuzione normale, con particolare attenzione alle code della distribuzione stessa, tramite i seguenti indici: indice β 2 di Pearson indice γ 2 di Fisher β 2 m µ 4 σ 4 γ 2 m µ 4 σ 4 3 i(x i m) 4 f i / i f i σ 4 ; i(x i m) 4 f i / i f i σ 4 3 Esercizio A Ponendo le nove osservazioni in ordine crescente, si ricava che la mediana ed il primo e terzo quartile sono pari, rispettivamente,a me 173, Q 1 167, Q 3 177 Inoltre, la media aritmetica delle osservazioni è pari a m 170, 8 Si ricava quindi quanto richiesto, come segue a) Range R x max x min 180 156 24 Scarto interquartilico D Q 3 Q 1 177 167 10

M Minozzo e A Guolo Statistica Descrittiva: Soluzioni 6 4 b) Scostamento medo semplice dalla media: ms 1 i1 x i m Scostamento medio semplice dalla mediana: 156 170, 8 + + 180 170, 8 6, 123 mes 1 i1 x i me 156 173 + + 180 173 5, 88 Come noto dalla teoria, lo scostamento medio semplice dalla mediana è minore della scostamento medio semplice dalla media c) Varianza: V (X) σ 2 i1 (x i m) 2 (156 170, 8)2 + + (180 170, 8) 2 51, 654 d) La varianza di 1 + 0, X è pari a 0, 2 V (X) 41, 840 Esercizio B a) La seguente tabella contiene le informazioni necessarie al calcolo dello scostamento semplice medio dalla mediana me S 1 e dello scarto quadratico medio dalla media artimetica σ si indica con x i il valore centrale della calsse di età, con d i l ampiezza della classe, con p i la frequenza relativa e con P i la frequenza relativa cumulata Senza titolo Scuola media inf Classe di età x i d i p i P i p i P i [15 20) 17,5 5 0,01 0,01 0,04 0,04 [20 25) 22,5 5 0,02 0,03 0,0 0,13 [25 30) 27,5 5 0,03 0,06 0,15 0,28 [30 40) 35 10 0,10 0,16 0,33 0,62 [40 50) 45 10 0,2 0,44 0,24 0,86 [50 60) 55 10 0,38 0,83 0,11 0,7 [60 65) 62,5 5 0,12 0,5 0,02 0, [65 70) 67,5 5 0,05 1 0,01 1 Utilizzando le informazioni contenute nella tabella, risulta che: Titolo di Studio m σ m e me S 1 Senza titolo 4,88 10,6 51,435 8,623 Scuola media inf 37,43 10, 36,440 8,70 b) Dai risultati in tabella si nota che la seconda distribuzione presenta una maggiore variabilità, sia che essa venga misurata tramite lo scostamento medio semplice dalla mediana che tramite lo scarto quadratico medio Esercizio C a) La media delle 5 osservazioni risulta essere pari a m 3574, 2 La varianza calcolata secondo il metodo diretto è pari a 5i1 σ 2 (x i 3574, 2) 2 5077683 5

M Minozzo e A Guolo Statistica Descrittiva: Soluzioni 6 5 In base al metodo indiretto si ha 5i1 x 2 i V (X) m 2 5 Essendo la media dei valori di X elevati al quadrato pari a (7214 2 + + 3185 2 )/5 17852588, si ha V (X) 17852588 3574, 2 2 5077683, che, come ci si attende, coincide col valore ottenuto tramite il calcolo diretto Esercizio D a) Per trovare la differenza semplice media del numero di abitanti calcoliamo le differenze: x i x j x 1 831714 x 2 3527303 x 3 5108067 x 4 166142 x 1 831714 0 26558 4276353 82715 x 2 3527303 26558 0 1580764 1865874 x 3 5108067 4276353 1580764 0 3446638 x 4 166142 82715 1865874 3446638 0 da cui si ricava, ponendo N 4, che 1 N N x i x j 244155, 50 i1 j1 b) I calcoli per trovare la differenza quadratica del numero di morti sono i seguenti: (x i x j ) 2 x 1 133 x 2 41286 x 3 47086 x 4 13707 x 1 133 0 103381540 144043020 2021476 x 2 41286 103381540 0 33640000 760601241 x 3 47086 144043020 33640000 0 1114157641 x 4 13707 2021476 760601241 1114157641 0 da cui si ricava che 1 N N 2 (x i x j ) 2701, 10 i1 j1 Esercizio E a) Si consideri la regione Veneto Fissando l altezza minima e massima rispettivamente pari a 150 cm e 1 cm, si ha Statura [14,5 15,5) [15,5 164,5) [164,5 16,5) [16,5 17,5) [17,5 184,5) [184,5 18,5) [18,5 1,5) p i 0,008 0,036 0,127 0,550 0,187 0,071 0,021 x i 154,5 162 167 174,5 182 187 14,5 x 2 i p i 10,62 44,784 3541,03 16747,64 614,188 2482,7 74,4353 Quindi, essendo m 175, 65, lo scarto quadratico medio dalla media aritmetica si può ottenere tramite il metodo indiretto, come segue: n σ 2 x 2 i p i m 2 3086, 71 (175, 65) 2 43, 7875, i1 e si ha σ 6, 6172 Per la regione Sicilia, avendo m 171, 81, si ottiene σ 6, 6003

M Minozzo e A Guolo Statistica Descrittiva: Soluzioni 6 6 b) Per la regione Veneto, non conoscendo le stature di ogni singolo individuo, con una leggera forzatura il campo di variazione si può calcolare come c n c 0 1, 5 14, 5 50, mentre l intervallo interquartile è pari a Q 3 Q 1 180, 2754 170, 364, 33 Esercizio F a) Una ponderazione naturale è data dalla popolazione residente (in milioni) dei singoli Paesi Indicando con w i la popolazione dei singoli Paesi, con w la loro somma e con m (1/w) 4 i1 x i w i la media ponderata del quoziente di natalità, la varianza del quoziente di natalità dei quattro Paesi è data da σ 2 1 4 x 2 i w i m 2 155, 1836 (12, 4376) 2 0, 487 w e quindi σ 0, 68 Esercizio G i1 a) Assegnando il valore di anni compiuti all estremo superiore dell ultima classe si ha x i f i p i P i x i p i (x i m) 2 p i (x i m) 3 p i (x i m) 4 p i 0,5 1141 0,0082 0,0082 0,0041 16,032-708,11 31346,185 3,0 47077 0,0325 0,0407 0,075 56,561-235,573 8435,151 7,5 62862 0,0433 0,0840 0,3248 5,76-2232,154 83074,872 12,5 65171 0,044 0,128 0,5613 46,604-1501,467 48373,287 20,0 16866 0,1171 0,2460 2,3420 71,542-1768,327 43708,361 35,0 42181 0,208 0,5368 10,1780 27,45-266,832 252,00 55,0 36483 0,2547 0,715 14,0085 26,30 276,13 2847,404 82,5 30248 0,2085 1,0000 17,2013 27,640 11245,617 42488,227 145087 1,0000 44,7174 602,745 2685,265 735267,30 da cui si ricava che ( 3 γ 1 m µ 3 /(σ) 3 2685, 265/ 602, 745) 0, 1815 Inoltre Q 1 25, 2751, m e 42, 461 e Q 3 61, 7413 da cui (Q 3 m e ) (m e Q 1 ) (Q 3 m e ) + (m e Q 1 ) 0, 0387; gli indici segnalano un livello di asimmetria molto basso b) L indice di curtosi è pari a γ 2 m µ 4 /(σ) 4 3 735267, 30/( 602, 745) 4 3 0, 762 Esercizio H a) L indice di asimmetria basato sui quartili fornisce il valore 0,44 Per il calcolo dell indice γ 1, essendo disponibile la distribuzione di quantità, si possono utilizzare le medie parziali al posto dei valori centrali di classe ottenendo γ 1 m µ 3 /(σ) 3 44, 6/(58, 87) 3 2, 42