Indici di dispersione



Documenti analoghi
Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Indici (Statistiche) che esprimono le caratteristiche di simmetria e

Elementi di Psicometria con Laboratorio di SPSS 1

La distribuzione Normale. La distribuzione Normale

Il concetto di valore medio in generale

Misure della dispersione o della variabilità

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA

LOGISTICA APPUNTI DI STATISTICA

Analisi Statistica per le Imprese (6 CFU) - a.a Prof. L. Neri RICHIAMI DI STATISTICA DESCRITTIVA UNIVARIATA

ESERCITAZIONE 13 : STATISTICA DESCRITTIVA E ANALISI DI REGRESSIONE

Elementi di Psicometria

STATISTICA DESCRITTIVA. Le misure di tendenza centrale

Relazioni statistiche: regressione e correlazione

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

Statistica descrittiva

ESERCIZIO N 4. Fatturato Supermercati [0;500) 340 [500;1000) 368 [1000;5000) 480 [5000;10000) 37 [10000;20000) 15 taglia = 1240

Statistica descrittiva

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

Elementi di Psicometria con Laboratorio di SPSS 1

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

LEZIONE n. 5 (a cura di Antonio Di Marco)

LEZIONE 3. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

Slide Cerbara parte1 5. Le distribuzioni teoriche

ESERCIZI DI STATISTICA DESCRITTIVA

Brugnaro Luca Boscaro Gianni (2009) 1

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale

Elementi di Statistica

Valori medi e misure della tendenza centrale

Università del Piemonte Orientale. Corsi di Laurea Triennale. Corso di Statistica e Biometria. Introduzione e Statistica descrittiva

Prova di autovalutazione Prof. Roberta Siciliano

Statistica descrittiva: prime informazioni dai dati sperimentali

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

Metodi statistici per le ricerche di mercato

LE CARTE DI CONTROLLO (4)

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).

Facciamo qualche precisazione

SPC e distribuzione normale con Access

Grafici delle distribuzioni di frequenza

CENNI DI METODI STATISTICI

Inferenza statistica. Statistica medica 1

Corso di. Dott.ssa Donatella Cocca

Cenni di geografia astronomica. Giorno solare e giorno siderale.

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Statistica. Alfonso Iodice D Enza iodicede@unina.it

2. Leggi finanziarie di capitalizzazione

Lineamenti di econometria 2

La propagazione delle onde luminose può essere studiata per mezzo delle equazioni di Maxwell. Tuttavia, nella maggior parte dei casi è possibile

STATISTICA IX lezione

Statistica. L. Freddi. L. Freddi Statistica

Dimensione di uno Spazio vettoriale

1. Distribuzioni campionarie


f(x) = 1 x. Il dominio di questa funzione è il sottoinsieme proprio di R dato da

La Distribuzione Normale (Curva di Gauss)

Lezione n. 2 (a cura di Chiara Rossi)

Metodi statistici per l economia (Prof. Capitanio) Slide n. 9. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

G3. Asintoti e continuità

Statistica (Prof. Capitanio) Slide n. 1. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

STATISTICA DESCRITTIVA UNIVARIATA

Esercitazione di riepilogo 23 Aprile 2013

LE FUNZIONI A DUE VARIABILI

La distribuzione Gaussiana

SOLUZIONI D = (-1,+ ).

Statistica inferenziale

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

Esercitazione n.1 (v.c. Binomiale, Poisson, Normale)

Dai dati al modello teorico

LA CORRELAZIONE LINEARE

ALLEGATO D ANALISI STATISTICA DEI DATI METEOROLOGICI

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Analisi di dati di frequenza

Statistica. Lezione 6

Corso di Psicometria Progredito

Elementi di Psicometria con Laboratorio di SPSS 1

Statistiche campionarie

La corrente elettrica

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media.

Punteggi. Punteggi grezzi, norme e percentili

INTEGRALI DEFINITI. Tale superficie viene detta trapezoide e la misura della sua area si ottiene utilizzando il calcolo di un integrale definito.

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Indagine campionaria sul ricorso alla rendita vitalizia Esercizi

Regressione Mario Guarracino Data Mining a.a. 2010/2011

CORSO DI MISURE ANALISI DEI SEGNALI NEL DOMINIO DEL TEMPO

Rapporto dal Questionari Insegnanti

I punteggi zeta e la distribuzione normale

Analisi e diagramma di Pareto

Aspettative, Produzione e Politica Economica

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 7

ESERCIZI SVOLTI PER LA PROVA DI STATISTICA

Capitolo 13: L offerta dell impresa e il surplus del produttore

Corso di laurea in Scienze Motorie Corso di Statistica Docente: Dott.ssa Immacolata Scancarello Lezione 14: Analisi della varianza (ANOVA)

Fondamenti e didattica di Matematica Finanziaria

ELEMENTI DI STATISTICA

SISTEMI DI NUMERAZIONE E CODICI

ALLEGATO 1 Analisi delle serie storiche pluviometriche delle stazioni di Torre del Lago e di Viareggio.

L analisi dei dati. Capitolo Il foglio elettronico

SOLUZIONE DEL PROBLEMA 1 TEMA DI MATEMATICA ESAME DI STATO 2015

Transcript:

Indici di dispersione 1

Supponiamo di disporre di un insieme di misure e di cercare un solo valore che, meglio di ciascun altro, sia in grado di catturare le caratteristiche della distribuzione nel suo complesso, ovvero rappresenti il valore più tipico della distribuzione. Moda, Mediana, Media aritmetica 2

MODA La moda di una distribuzione di frequenze è il punto centrale della classe di misure più frequente. Distribuzione zeromodale: nessun valore ha una frequenza più elevata degli altri. Distribuzione unimodale: c è un solo valore con una frequenza più elevata degli altri. Es. [2, 4, 1, 3, 7, 3, 5, 3] Distribuzione bimodale: ci sono due valori con una frequenza più elevata degli altri. Es. [7, 4, 7, 3, 7, 3, 5, 3] 3

Negli istogrammi, la moda coincide con il punto centrale della base del rettangolo con altezza maggiore. Nelle curve di frequenza, la moda coincide con il valore corrispondente ad un massimo della curva Affinché una distribuzione sia bimodale è sufficiente che vi siano due massimi. Non è necessario che entrambi abbiano lo stesso valore. Dato che la moda dipende soltanto dalla frequenza delle osservazioni, è l unica misura di tendenza centrale per dati in scala nominale. 4

LIMITI DELLA MODA Un campione può avere più di una moda. La moda è molto sensibile alla grandezza e al numero degli intervalli di classe. La moda può cambiare in maniera considerevole cambiando gli intervalli delle classi. La moda di un campione non fornisce una buona stima della moda della popolazione da cui quel campione è stato tratto. 5

MEDIANA La mediana è il valore che occupa la posizione centrale quando le osservazioni di un campione sono ordinate in base al loro valore. 6

6, 6.7, 3.8, 7, 5.8 I valori ordinati sono 3.8, 5.8, 6, 6.7, 7 7

6, 6.7, 3.8, 7, 5.8, 9.975 I valori ordinati sono: 8

MEDIA ARITMETICA 9

Proprietà 1. Se un insieme di osservazioni è costituito da due sottoinsiemi disgiunti di grandezza n 1 e n 2, e medie allora la media dell insieme totale sarà uguale a: e 10

11

DIFFERENZE TRA LA MEDIA E LA MEDIANA La media risente dei cambiamenti effettuati agli estremi di una distribuzione, mentre la mediana è insensibile a questi cambiamenti. La media è più stabile della mediana, ovvero varia di meno al passare da un campione ad un altro. 12

Esempio Nella sono rappresentate le distribuzioni delle età dei morti in Italia nel 1890, nel 1950 e nel 1990. Chiamiamole, in ordine, Età1890, Età1950 ed Età1990. Le rispettive medie sono 28, 58 e 75: un morto nel 1890 aveva mediamente 28 anni, 58 nel 1950 e 75 nel 1990. Le età mediane di morte erano invece, in ordine, 8, 66 e 78: Il fatto che, nel 1890, la media abbia un valore molto maggiore della mediana (mascherando in parte il fenomeno della mortalità infantile) è dovuto alla lunga coda destra che fa aumentare il risultato del calcolo della media. Nel 1990, invece, la media è inferiore alla mediana a causa della cosa sinistra; la differenza in questo caso è lieve in quanto si tratta di una coda molto "sottile", e quindi non incide molto sul risultato. 13

INDICI DI POSIZIONE 14

Quantili I quantili si riferiscono ad una suddivisione in parti uguali dei dati ordinati. min max Il primo quartile è l unità di osservazione che ha la proprietà di avere sotto di sé un quarto dei dati della distribuzione. Il secondo quartile è uguale alla mediana. 15

Il primo decile è l unità di osservazione che ha la proprietà di avere sotto di sé un decimo dei dati della distribuzione. Il primo centile è l unità di osservazione che ha la proprietà di avere sotto di sé un centesimo dei dati della distribuzione. 16

Per calcolare i quantili si usa lo stesso procedimento usato per il calcolo della mediana. Per calcolare il 24 percentile, per esempio, si ordinano i dati in senso crescente, e si determina se esiste un valore che abbia sotto di sé il 24% dei dati della distribuzione. Se tale valore non esiste, una procedura di interpolazione lineare viene usata per trovare il valore esatto del percentile cercato. 17

INDICI DI DISPERSIONE 18

Le misure di dispersione esprimono la tendenza delle singole osservazioni di una distribuzione di allontanarsi dalla tendenza centrale, ovvero la variabilità dei dati. La dispersione esprime la bontà o la povertà della tendenza centrale quale descrittore di una distribuzione. [7, 8, 10, 12, 13] [1, 2, 10, 18, 19] 19

20

Come si può quantificare la variabilità di una distribuzione? 21

GAMMA (CAMPO DI VARIABILITA ) Gamma = X max - X min [5, 2, 7, 11, 3, 6, 2] Gamma = 11-2 = 9 22

Sono chiamati indici di dispersione degli indicatori numerici che danno un'idea quantitativa di come i dati sono più o meno sparpagliati. Per introdurli facciamo riferimento alle distribuzioni Età1890, Età1950 ed Età1990 23

Passando dal 1890 al 1950, oltre a uno spostamento verso destra della zona in cui si concentrano le età di morte (testimoniato dall'aumento sia della media che della mediana), possiamo osservare un maggiore addensamento dei dati: l'istogramma assume una forma più tozza. Questa percezione intuitiva può essere precisata considerando l'intervallo in cui si colloca il 50% centrale dei dati, ossia i dati che vanno dal 25 al 75 percentile, che per il 1890 sono circa 3 e 58 (il 25% dei morti aveva età che non superava i 3 anni e il 75% età che non superava i 58 anni), e per il 1950 sono circa 43 e 81. 24

La ampiezza di questo intervallo, che viene chiamata distanza interquartile in quanto costituisce la distanza tra il valore che delimita il primo quarto dei dati da quello che ne delimita l'ultimo quarto, passa da 55 a 38. Per il 1990 si ha un'ulteriore riduzione della dispersione: si può calcolare che questa distanza diventa 32. La distanza interquartile, indicato in genere con IQR (IntraQuartile Range), è l'indice di dispersione d'uso più generale. 25

VARIANZA E DEVIAZIONE STANDARD 26

Lo scarto tra ciascuna osservazione di una distribuzione e la media è dato da: Problema: Soluzione: elevare gli scarti al quadrato 27

Varianza: media degli scarti dalla media elevati al quadrato. 28

Esempio di calcolo della varianza 29

[2, 3, 6, 9, 15] 30

Deviazione standard: radice quadrata della varianza. 31

32

Formula alternativa per la varianza 33

34

ESERCIZIO Per i seguenti dati, calcolate la media, la varianza e la deviazione standard. Per il calcolo della varianza usate entrambe le formule presentate in precedenza. 2 5 8 7 3 35

COEFFICIENTE DI VARIAZIONE Il coefficiente di variazione è definito come il rapporto tra la deviazione standard e la media: L indice di varianza relativa è uguale al quadrato del coefficiente di variazione: 36