Statistica. Alfonso Iodice D Enza

Похожие документы
Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Statistica. Alfonso Iodice D Enza

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza

Nozioni di statistica

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Statistica. Alfonso Iodice D Enza

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

Statistica. Alfonso Iodice D Enza

Teoria e tecniche dei test. Concetti di base

Esercitazioni di statistica

Statistica. Alfonso Iodice D Enza

Esercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

STATISTICA 1 ESERCITAZIONE 6

Lezione 2. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 2. A. Iodice. Distribuzioni unitarie

Statistica Sociale - modulo A

INDICATORI DI TENDENZA CENTRALE

Statistica di base per l analisi socio-economica

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

INDICATORI DI TENDENZA CENTRALE

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

ESERCIZI STATISTICA DESCRITTIVA

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Lezione 8. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 8. A. Iodice. Relazioni tra variabili

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI

Capitolo 3 Sintesi e descrizione dei dati quantitativi

INDICATORI DI TENDENZA CENTRALE

1) Calcolare l indice di eterogeneità di Gini per i caratteri Qualifica Funzionale e Regime di Impiego.

Scale di Misurazione Lezione 2

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Università del Piemonte Orientale. Corso di Laurea in Biotecnologie. Corso di Statistica Medica. Statistica Descrittiva: Variabili numeriche

STATISTICA A K (63 ore)

Statistica. Alfonso Iodice D Enza iodicede@unina.it

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Gli indici di variabilità

Istituzioni di Statistica e Statistica Economica

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

La variabilità. Antonello Maruotti

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Lezione 18. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 18. A. Iodice

Lezione 17. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 17. A. Iodice

Indici di variabilità relativa

Lezione 4 a - Misure di dispersione o di variabilità

Misure di dispersione (o di variabilità)

Elementi di Probabilità e Statistica

Esercitazioni di Statistica per Biotecnologie. Francesca Pizzorni Ferrarese

tabelle grafici misure di

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Lezione 4. Statistica. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Lezione 4. A. Iodice. Indici di posizione.

Indici di variabilità ed eterogeneità

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

STATISTICHE DESCRITTIVE Parte II

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Istituzioni di Statistica

Dispensa di Statistica

La Variabilità statistica

ESERCIZI DI RIEPILOGO 1

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva

A1. La curva normale (o di Gauss)

STATISTICA DESCRITTIVA (variabili quantitative)

Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

LA DISTRIBUZIONE NORMALE o DI GAUSS

Indici di posizione e dispersione per distribuzioni di variabili aleatorie

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Statistica. Alfonso Iodice D Enza

Valori Medi. Docente Dott.ssa Domenica Matranga

Consideriamo la distribuzione per età di tre diversi collettivi di studenti

Esercizi di statistica descrittiva. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 30

Università di Cassino Corso di Statistica 1 Esercitazione del 14/01/2008 Dott. Alfonso Piscitelli

Questionario 1. Sono assegnati i seguenti dati

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

MISURE DI SINTESI 54

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

08/04/2014. Misure di posizione. INDICI DI POSIZIONE (measures of location or central tendency) 1. MODA 2. MEDIA 3. MEDIANA

Esercitazione: La distribuzione NORMALE

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

4. INDICI DI POSIZIONE

Транскрипт:

Statistica Il e Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 21

Outline Il e 1 2 3 Il 4 e 5 () Statistica 2 / 21

Il e Due distribuzioni aventi stessa posizione e variabilità possono differire per forma. In altre parole, la forma dipende dal valore delle modalità più piccole (o più grandi) del valore centrale della. () Statistica 3 / 21

Il e Due distribuzioni aventi stessa posizione e variabilità possono differire per forma. In altre parole, la forma dipende dal valore delle modalità più piccole (o più grandi) del valore centrale della. Aspetti che caratterizzano la forma di sono curtosi () Statistica 3 / 21

Il e Due distribuzioni aventi stessa posizione e variabilità possono differire per forma. In altre parole, la forma dipende dal valore delle modalità più piccole (o più grandi) del valore centrale della. Aspetti che caratterizzano la forma di sono curtosi () Statistica 3 / 21

Asimmetria simmetrica rettangolare Il e () Statistica 4 / 21

Asimmetria simmetrica campanulare Il e () Statistica 4 / 21

Asimmetria asimmetrica positiva Il e () Statistica 4 / 21

Asimmetria asimmetrica negativa Il e () Statistica 4 / 21

Esercizio: confronto tra distribuzioni Il e Si considerino tre studenti, X, Y e Z che nei primi 9 esami hanno riportato i seguenti voti: X Y Z 18 22 21 20 23 22 21 24 23 23 24 24 25 25 25 2 27 2 27 29 27 27 29 28 30 30 29 misurare la tendenza centrale, la variabilità e la forma della dei voti di ciascun studente; utilizzare un opportuno strumento per confrontare le tre distribuzioni. () Statistica 5 / 21

Il e indice normalizzato di A Tale indice la versione normalizzata della differenza tra media e mediana, dal momento che σ risulta essere in qualunque caso tale che σ µ Me A = µ Me σ Tale indice varia nell intervallo [ 1, 1]. () Statistica / 21

Il e indice normalizzato di A Tale indice la versione normalizzata della differenza tra media e mediana, dal momento che σ risulta essere in qualunque caso tale che σ µ Me A = µ Me σ Tale indice varia nell intervallo [ 1, 1]. se A > 0 allora la asimmetrica positiva se A < 0 allora la asimmetrica negativa se A = 0 allora la simmetrica () Statistica / 21

Il e Standardizzazione di variabile L operazione di standardizzazione consiste nel sottrarre a ciasc modalita x i la media µ, dividendo poi per lo scarto quadratico medio σ. Tale operazione consente il confronto tra distribuzioni con medie e varianze diverse. z i = x i µ σ () Statistica 7 / 21

Il e indice di di Fisher γ γ = 1 n (z i ) 3 = 1 n n i=1 n ( xi µ i=1 σ ) 3 () Statistica 8 / 21

Il indice di di Fisher γ γ = 1 n (z i ) 3 = 1 n n i=1 n ( xi µ i=1 σ ) 3 e se γ > 0 allora la asimmetrica positiva se γ < 0 allora la asimmetrica negativa se γ = 0 allora la simmetrica () Statistica 8 / 21

Esercizio: confronto tra distribuzioni Il e Si considerino tre studenti, X, Y e Z che nei primi 9 esami hanno riportato i seguenti voti: misurare la tendenza centrale, la variabilità e la forma della dei voti di ciascun studente; x i y i z i sc xi = (x i µ x) 2 sc yi = (y i µ y) 2 sc zi = (z i µ z) 2 18 22 21 37.34 15.123 1 20 23 22 1.901 8.34 9 21 24 23 9.79 3.58 4 23 24 24 1.235 3.58 1 25 25 25 0.790 0.790 0 2 27 2 3.58 1.235 1 27 29 27 8.34 9.79 4 27 29 28 8.34 9.79 9 30 30 29 34.79 1.901 1 217 233 225 120.89 8.89 0 (xi ) µ x = = n 217 9 = 24.11, µy = (yi ) = n 233 9 = 25.89, µz = (zi ) = n 225 9 = 25 (xi µx) σ x = 2 = 120.89 = 13.43 = 3., n 9 (yi µy ) σ y = 2 = 8.89 = 7.5 = 2.7, n 9 (zi µz ) σ z = 2 = 0 n 9 =.7 = 2.58 () Statistica 9 / 21

calcolo dell indice normalizzato di A A = µ Me σ Il e A x = µx Mex σ x = 24.11 25 3. = 0.242 A y = µy Mey σ y = 25.89 25 2.7 = 0.321 A z = µz Mez σ z = 25 25 2.58 = 0 () Statistica 10 / 21

di Fisher γ calcolo indice γ n n ( ) xi µ 3 γ = 1 (z i ) 3 = 1 n i=1 n i=1 σ Il e S x S y S z Sx 3 Sy 3 Sz 3-1.7-1.41-1.55-4.4-2.78-3.72-1.12-1.04-1.1-1.41-1.14-1.57-0.85-0.8-0.77-0.1-0.32-0.4-0.30-0.8-0.39-0.03-0.32-0.0 0.24-0.32 0.00 0.01-0.03 0.00 0.52 0.40 0.39 0.14 0.0 0.0 0.79 1.12 0.77 0.49 1.42 0.4 0.79 1.12 1.1 0.49 1.42 1.57 1.1 1.49 1.55 4.15 3.28 3.72-1.41 1. 0 (xi µx) γ x = = 1.41 = 0.15 n 9 (yi µy ) γ y = = n 1.04 = 0.178 9 (zi µz ) γ z = = n 0 9 = 0 () Statistica 11 / 21

Il Il a scatola () è particolare rappresentazione di : gli elementi utilizzati per costruire la scatola sono i quantili e gli estremi della. Il e () Statistica 12 / 21

tra distribuzioni: confrontare graficamente le tre distribuzioni Il e min x = 18, max x = 30, Q 1 = 21, Q 2 = 25, Q 3 = 27 min y = 22, max y = 30, Q 1 = 24, Q 2 = 25, Q 3 = 27 min z = 21, max z = 29, Q 1 = 23, Q 2 = 25, Q 3 = 29 () Statistica 13 / 21

Costruzione di un box plot Si consideri la seguente di frequenze Il e () Statistica 14 / 21

Costruzione di un box plot La rappresentazione evidenzia la presenza di un valore anomalo Il e () Statistica 14 / 21

Costruzione di un box plot Il e () Statistica 14 / 21

Costruzione di un box plot Il e () Statistica 14 / 21

Costruzione di un box plot I, che quindi non parteciano alla costruzione della scatola, vengono determinati dal confronto con il campo di variazione interquartile. In particolare vengono considerate due soglie: Il e () Statistica 15 / 21

Costruzione di un box plot Il e I, che quindi non parteciano alla costruzione della scatola, vengono determinati dal confronto con il campo di variazione interquartile. In particolare vengono considerate due soglie: Q 1 1, 5 (Q 3 Q 1 ) rappresenta il valore al di sotto del quale modalità considerata outlier () Statistica 15 / 21

Costruzione di un box plot Il e I, che quindi non parteciano alla costruzione della scatola, vengono determinati dal confronto con il campo di variazione interquartile. In particolare vengono considerate due soglie: Q 1 1, 5 (Q 3 Q 1 ) rappresenta il valore al di sotto del quale modalità considerata outlier Q 3 + 1, 5 (Q 3 Q 1 ) rappresenta il valore al di sopra del quale modalità considerata outlier () Statistica 15 / 21

Box plot e istogramma Il e () Statistica 1 / 21

Box plot e istogramma Il e () Statistica 1 / 21

Box plot e istogramma Il e () Statistica 1 / 21

Box plot e istogramma Il e () Statistica 1 / 21

Box plot e istogramma Il e () Statistica 1 / 21

Il e Nel caso di variabili ordinali, è possibile misurare l attraverso un indice costruito sulla base della dispersione D. L indice D L indice D per il calcolo della dispersione in variabili ordinali si basa sulle frequenze cumulate F j e retrocumulate RF j, con j = 1,..., k, dove k è il numero di modalità della variabile. Ricordando che la frequenza relativa cumulata F j e quella retrocumulata RF j della j-esima modalità sono date rispettivamente da: L indice D è il seguente: indice di A F j = f 1 + f 2 +... + f j e RF j = f j + f j+1 +... + f K ; k [ D = Fj (1 F j ) + RF j (1 RF j ) ] k [ = 2 Fj (1 F j ) ] j=1 j=1 Tale indice si basa sul confronto tra la dispersione che caratterizza la delle modalità che si trovano alla sinistra di quella centrale e quella delle variabili alla destra di quelle centrali. A = D d D s D d + D s dove D d è la dispersione a dx e D s quella a sx () Statistica 17 / 21

Il e Esempio di calcolo dell indice A t.studio n j f j F j 1 F j a. 5 0.25 0.25 0.75 l.e. 5 0.25 0.50 0.5 l.m 3 0.15 0.5 0.35 d. 3 0.15 0.80 0.2 l. 4 0.2 1.00 0 tot 20 1.00 Per effettuare il calcolo dell indice bisogna individuare le modalità della parte destra della e quelle della parte sinistra. Poichè N è pari, N = 10. Dunque le modalità della parte sinistra sono {1, 2}, 2 quelle della parte destra sono {3, 4, 5}. () Statistica 18 / 21

Il e Parte sinistra della Esempio di calcolo dell indice A t.studio n j f j F j 1 F j a. 5 0.5 0.5 0.5 l.e. 5 0.5 1 0 l.m 0 0 1 0 d. 0 0 1 0 l. 0 0 1 0 tot 10 1.00 Per effettuare il calcolo dell indice bisogna individuare le modalità della parte destra della e quelle della parte sinistra. Poichè N è pari, N = 10. Dunque le modalità della parte sinistra sono {1, 2}, 2 quelle della parte destra sono {3, 4, 5}. 2 D s = 2 F j (1 F j ) = 2 0.5(0.5) = 0.5 j=1 () Statistica 19 / 21

Parte destra della Il e Esempio di calcolo dell indice A t.studio n j f j F j 1 F j a. 0 0 0 1 l.e. 0 0 0 1 l.m 3 0.3 0.3 0.7 d. 3 0.3 0. 0.4 l. 4 0.4 1 0 tot 10 1.00 Per effettuare il calcolo dell indice bisogna individuare le modalità della parte destra della e quelle della parte sinistra. Poichè N è pari, N = 10. Dunque le modalità della parte sinistra sono {1, 2}, 2 quelle della parte destra sono {3, 4, 5}. 2 D d = 2 F j (1 F j ) = 2 [0.3 0.7 + 0. 0.4] = 2 0.45 = 0.9 j=1 () Statistica 20 / 21

dispersione Il e Esempio di calcolo dell indice A Per effettuare il calcolo dell indice bisogna individuare le modalità della parte destra della e quelle della parte sinistra. Poichè N è pari, N = 10. Dunque le modalità della parte sinistra sono {1, 2}, 2 quelle della parte destra sono {3, 4, 5}. A = D d D s 0.9 0.5 = D d + D s 0.9 + 0.5 = 0.4 1.4 = 0.2857 () Statistica 21 / 21