MISURE DI SINTESI 54



Documenti analoghi

ESPLORAZIONE DEI DATI CON SINTESI NUMERICHE 1 / 22

Le medie. Antonello Maruotti

Statistica descrittiva II

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva

Seconda Lezione. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 DISTRIBUZIONE DI FREQUENZA

Medie. Monia Ranalli. Ranalli M. Medie Settimana # 2 1 / 22

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

La sintesi delle distribuzioni

MISURE DI DISPERSIONE

Indici di tendenza centrale Media, mediana e moda.

Statistica descrittiva

INDICATORI DI TENDENZA CENTRALE

Grafici e tabelle permettono di fare valutazioni qualitative, non quantitative. E necessario poter sintetizzare i dati attraverso due importanti

1/55. Statistica descrittiva

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

ESERCIZI DI STATISTICA SOCIALE

Statistica Descrittiva Soluzioni 4. Medie lasche

Indici di. tendenza centrale: posizione: variabilità e dispersione: -quantili -decili -percentili. -Media -Moda -Mediana

INDICATORI DI TENDENZA CENTRALE

Esercitazioni di statistica

INDICATORI DI TENDENZA CENTRALE

Valori Medi. Docente Dott.ssa Domenica Matranga

Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012

Università di Cassino. Esercitazioni di Statistica 1 del 29 Gennaio Dott. Mirko Bevilacqua

Lezione 4. Statistica. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Lezione 4. A. Iodice. Indici di posizione.

Corso di Laurea triennale Tecniche della Prevenzione PERCORSO STRAORDINARIO 2007/08. Insegnamento di STATISTICA MEDICA. Modulo II

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

La statistica descrittiva per le variabili quantitative

Esempi di confronti grafici

STIME STATISTICHE. Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 2/2

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016

Obiettivi Strumenti Cosa ci faremo? Probabilità, distribuzioni campionarie. Stimatori. Indici: media, varianza,


08/04/2014. Misure di posizione. INDICI DI POSIZIONE (measures of location or central tendency) 1. MODA 2. MEDIA 3. MEDIANA

Fonti e strumenti statistici per la comunicazione

DISTRIBUZIONE NORMALE. Distribuzione teorica di probabilità, detta anche Gaussiana. Variabili continue

Statistica Sociale - modulo A

Corso di Statistica: ESERCITAZIONI

Questionario 1. Sono assegnati i seguenti dati

p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali.

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Dalla distribuzione unitaria a quella di frequenza

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche.

Rappresentazioni grafiche

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

e) calcolate i cinque numeri di sintesi, la media e la deviazione standard per entrambi i campioni di lunghezze. 1,5 + 1,5

tabelle grafici misure di

Esercitazioni di Statistica

LEZIONI DI STATISTICA MEDICA

Introduzione. Medie di posizione. Medie analitiche. non richiedono operazioni algebriche sulle modalità Mediana e moda

Esercitazioni di Statistica

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria

ELEMENTI DI STATISTICA DESCRITTIVA

Daniela Tondini

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

La Sintesi Statistica Una serie di dati numerici è compiutamente descritta da tre proprietà principali: La tendenza centrale o posizione La

Elementi di Statistica

L indagine statistica

Suggerimento a proposito di decimali

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

La distribuzione normale

Una statistica è una quantità numerica il cui valore è determinato dai dati.

Lezione MEDIANA

Indicatori di posizione e ampiezza di variabili aleatorie

STATISTICA DESCRITTIVA (variabili quantitative)

Statistica Elementare

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA

Elementi di Psicometria con Laboratorio di SPSS 1

Tipi di variabili. Indici di tendenza centrale e di dispersione

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

7. STATISTICA DESCRITTIVA

Statistica di base per l analisi socio-economica

Nozioni di statistica

Distribuzione di frequenza relativa e percentuale: esempio

Modelli descrittivi, statistica e simulazione

Teoria e tecniche dei test. Concetti di base

CORSO DI STATISTIC CA

4. VALORI CENTRALI. Statistica sociale

Lezione 4: Indici di posizione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

4. INDICI DI POSIZIONE

Corso di Statistica. Medie,Moda. Prof.ssa T. Laureti a.a Corso di Statistica a.a DEIM, Univ.TUSCIA - Prof.

Elementi di Psicometria con Laboratorio di SPSS 1

Elementi di Psicometria con Laboratorio di SPSS 1

Statistica Medica. Sez. 1 - Analisi esplorativa dei dati. Statistica Medica p.1/39

Statistica Inferenziale

Principi di Statistica Descrittiva (3)

Elementi di Probabilità e Statistica

3/19/18. Obiettivo: Descrizione di un Istogramma

Quantili, Mediana e Quartili. Ranking dei dati. Pietro Coretto Università degli Studi di Salerno

Scale di Misurazione Lezione 2

Elementi di statistica medica

Statistica: principi e metodi. Medie

Corso di Statistica. Indici di posizione: Medie,Moda Mediana, Quartili, Percentili. Prof.ssa T. Laureti a.a

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

Statistica e informatica

Transcript:

MISURE DI SINTESI 54

MISURE DESCRITTIVE DI SINTESI 1. MISURE DI TENDENZA CENTRALE 2. MISURE DI VARIABILITÀ 30 0 µ Le due distribuzioni hanno uguale tendenza centrale, ma diversa variabilità. 30 0 Le due distribuzioni hanno diversa tendenza centrale, ma uguale variabilità. 55

MISURE DI TENDENZA CENTRALE 56

MISURE DI TENDENZA CENTRALE Un insieme di dati numerici può essere sintetizzato da alcuni valori tipici, che indicano la posizione sull asse orizzontale di punti importanti della distribuzione studiata Punti centrali MISURE di TENDENZA CENTRALE MEDIA (coordinata orizzontale del baricentro) MODA (coordinata orizzontale del punto più alto) MEDIANA 57

MEDIA CAMPIONARIA x n i= = 1 n x i SOMMA delle osservazioni di una variabile divisa per il numero totale di osservazioni. NB: x indica la media campionaria; µ indica la media della popolazione. Esempio Date le età, in anni, di 5 soggetti si calcoli l età media. 19 21 18 22 28 19 + 21 + 18 + 22 + 28 108 x = = = 21. 6anni 5 5 58

MEDIA PESATA Età (anni) = x i f i x i f i 18 2 18 2 = 36 19 25 19 25 = 475 20 30 20 30 = 600 21 22 21 22 = 462 22 20 22 20 = 440 23 12 23 12 = 276 24 10 24 10 = 240 25 8 25 8 = 200 129 2729 x n i= 1 = x n i f i x = n x n f 2729 129 i i i = 1 = = 21.155 anni 59

MEDIA PER DATI RAGGRUPPATI IN CLASSI Età (anni) x k f k x k f k [15-20) 17.5 10 17.5 10 = 175 [20-25) 22.5 15 22.5 15 = 337.5 [25-30) 27.5 30 27.5 30 = 825 [30-35) 32.5 12 32.5 12 = 390 [35-40) 37.5 11 37.5 11 = 412.5 78 2140 x K k = = 1 x k n f k x k = valore centrale della classe = = media degli estremi di classe Si assume che i soggetti appartenenti alla stessa classe abbiano tutti uguale altezza, calcolata come media degli estremi di classe. f k = frequenza di classe x K x n f 2140 78 k k k = 1 = = = 27.44 anni 60

PROPRIETÀ DELLA MEDIA Non corrisponde necessariamente ad un valore che la variabile studiata può assumere; è unica: per un dato insieme di dati vi è una sola media; è facile da calcolare; usa tutta l informazione contenuta nei dati (tutti i dati concorrono al calcolo della media); è molto sensibile agli OUTLIERS*; è impiegata in molti test statistici inferenziali. *Outlier = valore estremo, che giace molto perifericamente rispetto alla restante distribuzione dei dati. 61

MEDIANA È l osservazione che divide a metà la serie ordinata delle osservazioni. Per individuare la mediana occorre: ordinare (in senso crescente o decrescente) le osservazioni; determinare la posizione della mediana con la seguente formula: posizione della mediana = (n+1)/2 n = n o di osservazioni individuare la mediana come l osservazione che occupa la posizione precedentemente calcolata. 62

Distinguiamo 2 casi: 1. Le osservazioni sono in numero dispari Età (in anni) di 9 soggetti: 42 28 28 61 31 23 50 34 32 Posizione della mediana (n+1)/2=10/2=5 Ordino le osservazioni 23 28 28 31 32 34 42 50 61 La mediana è 32 anni perché occupa la 5 a posizione. 2. Le osservazioni sono in numero pari Età (in anni) di 10 soggetti: 42 28 28 61 31 23 50 34 32 37 Posizione della mediana (n+1)/2=11/2=5.5 Ordino le osservazioni 23 28 28 31 32 34 37 42 50 61 La mediana è 33 anni (media aritmetica dei valori che occupano la 5 a e la 6 a posizione). 63

Esempio Calcolare la mediana dei dati in tabella: Età (anni) = x i f i Frequenza cumulata 18 2 2 19 25 27 20 30 57 21 22 79 22 20 99 23 12 111 24 10 121 25 8 129 129 Posizione della mediana (129+1)/2=65 La mediana occupa la 65 a posizione. Dalla colonna delle frequenze cumulate risulta che: 18 anni 1 a -2 a osservazione 19 anni 3 a -27 a osservazione 20 anni 28 a -57 a osservazione 21 anni 58 a -79 a osservazione La mediana è 21 anni, perché quando tutti i 129 dati vengono ordinati, 21 anni occupa la posizione centrale. 64

DATI RAGGRUPPATI IN CLASSI: LA CLASSE MEDIANA Età (anni) f k Frequenza cumulata [15-20) 10 10 [20-25) 15 25 [25-30) 30 55 [30-35) 12 67 [35-40) 11 78 78 Posizione della mediana (n+1)/2=(78+1)/2 = 39,5 consideriamo la 39 a e la 40 a posizione La classe che contiene la 39 a osservazione è la classe mediana. e la 40 a Dalla colonna delle frequenze cumulate risulta che: 1 a classe: [15-20) 1 a -10 a osservazione 2 a classe: [20-25) 11 a -25 a osservazione 3 a classe: [25-30) 26 a -55 a osservazione La classe [25-30) anni contiene la 39 a e la 40 a osservazione e quindi è la classe mediana. 65

PROPRIETÀ DELLA MEDIANA È unica: per un dato insieme di dati vi è una sola mediana; è facile da calcolare; non è influenzata dai valori estremi (stima robusta di localizzazione). 66

MODA È l osservazione che si presenta con la massima frequenza. Esempio Età (in anni) di 9 soggetti: 42 28 28 61 31 23 50 34 32 La moda è 28, perché è l osservazione che si presenta più frequentemente. DATI RAGGRUPPATI IN CLASSI: LA CLASSE MODALE Età (anni) f k [15-20) 10 [20-25) 15 [25-30) 30 [30-35) 12 [35-40) 11 78 La classe modale è [25-30) anni, perché con essa si registra la massima frequenza. 67

PROPRIETÀ DELLA MODA Semplicità concettuale; 30 0 10 20 30 40 50 60 70 Può essere letta direttamente dal grafico: la moda è il valore che ha massima frequenza, cioè il valore corrispondente alla colonna più alta. In questo caso la moda è 40. a differenza di media e mediana è determinabile anche per variabili qualitative; può non esistere; ne può esistere più di una: 1 valore modale distribuzione unimodale; 2 valori modali distribuzione bimodale. 68

Distribuzione unimodale moda = 40 30 0 10 20 30 40 50 60 70 Distribuzione bimodale moda 1 = 60 moda 2 = 100 60 30 0 10 40 50 60 70 80 90 100 110 120 130 140 Esempio Distribuzione del peso in un campione casuale di 100 studenti di cui 50 femmine e 50 maschi. La distribuzione può essere bimodale: peso più frequente nelle 2 picchi peso più frequente nei 69

FORMA DI UNA DISTRIBUZIONE Come la forma di una distribuzione influenza le misure di tendenza centrale DISTRIBUZIONE UNIMODALE SIMMETRICA µ= moda=mediana Distribuzione SIMMETRICA: le code hanno uguale lunghezza. MEDIA, MODA E MEDIANA COINCIDONO La curva è definita a campana. 70

DISTRIBUZIONI ASIMMETRICHE Nelle distribuzioni ASIMMETRICHE, le cui code hanno diversa lunghezza MEDIA, MODA E MEDIANA NON COINCIDONO: in particolare, la media tende ad essere spinta verso la coda. La misura di tendenza centrale più appropriata per distribuzioni molto asimmetriche è la mediana (non influenzata dai valori estremi). Asimmetria positiva La distribuzione è tirata verso destra, verso i valori positivi. La media (M) è maggiore della mediana (Me). Esempio: distribuzione dei punteggi di un test difficile. Asimmetria negativa La distribuzione è tirata verso sinistra, verso i valori negativi. La media (M) è minore della mediana (Me) Esempio: distribuzione dei punteggi di un test facile. 71

MEDIA, MEDIANA E MODA sono definite sia misure di tendenza centrale sia MISURE DI POSIZIONE individuano la posizione della distribuzione sull asse orizzontale quando questa viene rappresentata graficamente. Altre misure di posizione sono i QUANTILI. 72

QUANTILI Sono un estensione del concetto di MEDIANA (ricordiamo che la mediana divide la serie ordinata di dati in 2 parti, ciascuna contenente il 50% delle osservazioni). QUARTILI sono 3 (Q 1, Q 2, Q 3 ). Dividono la serie ordinata di dati in 4 parti, ciascuna contenente il 25% delle osservazioni. 25% Q 1 25% Q 2 25% Q 3 25% MEDIANA DECILI sono 9 (D 1, D 2, D 3,, D 9 ). Dividono la serie ordinata di dati in 10 parti, ciascuna contenente il 10% delle osservazioni. PERCENTILI sono 99 (P 1, P 2, P 3,, P 99 ). Dividono la serie ordinata di dati in 100 parti, ciascuna contenente l 1% delle osservazioni. Il calcolo dei percentili risente della limitatezza del campione: vengono normalmente calcolati per grandi insiemi di dati. 73

QUARTILI 25% Q 1 25% Q 2 25% Q 3 25% Q 1 Primo quartile Valore che, nella serie ordinata dei dati, lascia prima di sé il 25% delle osservazioni e dopo di sé il 75%. Q 2 Secondo quartile Valore che, nella serie ordinata dei dati, lascia sia prima che dopo di sé il 50% delle osservazioni (vedi mediana). Q 3 Terzo quartile Valore che, nella serie ordinata dei dati, lascia prima di sé il 75% delle osservazioni e dopo di sé il 25%. 74

Q 1 = (n+1)/4 POSIZIONE DEI QUARTILI Q 2 = 2(n+1)/4 =(n+1)/2 Q 3 = 3(n+1)/4 n = n o di osservazioni COME INDIVIDUARE I QUARTILI Esempio Daniel pag.45 es. 2.6.2 I dati seguenti riportano i diametri (in cm) di neoplasie mammarie di 20 soggetti con sarcoma: 0,5 1,2 2,1 2,5 2,5 3,0 3,8 4,0 4,2 4,5 5,0 5,0 5,0 5,0 6,0 6,5 7,0 8,0 9,5 13,0 Individuare il primo, il secondo (mediana) e il terzo quartile. Q 1 Posizione di Q 1 = (20+1)/4 = 5.25 Q 1 = osservazione situata in 5 a posizione + 0,25 della differenza tra le osservazioni situate in 6 a e 5 a posizione 0,5 1,2 2,1 2,5 2,5 3,0 3,8 4,0 4,2 4,5 5,0 5,0 5,0 5,0 6,0 6,5 7,0 8,0 9,5 13,0 Q 1 = 2,5 + (3-2,5) 0,25 = 2,5 + 0,5 0,25 = 2,625 75

Q 2 (Mediana) Posizione di Q 2 = (20+1)/2 = 10,5 Q 2 = osservazione situata in 10 a posizione + 0,5 della differenza tra le osservazioni situate in 10 a e 11 a posizione 0,5 1,2 2,1 2,5 2,5 3,0 3,8 4,0 4,2 4,5 5,0 5,0 5,0 5,0 6,0 6,5 7,0 8,0 9,5 13,0 Q 2 = 4,5 + (5-4,5) 0,5 = 4,5 + 0,5 0,5 = 4,75 Q 3 Posizione di Q 3 =3 (20+1)/4=15.75 Q 3 = osservazione situata in 15 a posizione + 0,75 della differenza tra le osservazioni situate in 15 a e 16 a posizione 0,5 1,2 2,1 2,5 2,5 3,0 3,8 4,0 4,2 4,5 5,0 5,0 5,0 5,0 6,0 6,5 7,0 8,0 9,5 13,0 Q 3 = 6 + (6,5-6) 0,75 =6 + 0,5 0,75 = 6,375 76

PERCENTILI 77