1/55. Statistica descrittiva

Documenti analoghi
Nozioni di statistica

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016

Modelli descrittivi, statistica e simulazione

Teoria e tecniche dei test. Concetti di base

MISURE DI SINTESI 54

Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche.

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

tabelle grafici misure di

Scale di Misurazione Lezione 2

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Elementi di Psicometria con Laboratorio di SPSS 1

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Distribuzione di Frequenza: Esempio

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

Misure di dispersione (o di variabilità)

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Indici di. tendenza centrale: posizione: variabilità e dispersione: -quantili -decili -percentili. -Media -Moda -Mediana

Statistica. Matematica con Elementi di Statistica a.a. 2017/18

Statistica descrittiva

Esercizi di statistica descrittiva. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 30

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Statistica descrittiva

Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012

Seconda Lezione. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 DISTRIBUZIONE DI FREQUENZA

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

STATISTICHE DESCRITTIVE Parte II

Indici di Dispersione

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

INDICI DI FORMA: L ASIMMETRIA

ESERCIZI DI STATISTICA SOCIALE

STATISTICA PSICOMETRICA a.a. 2004/2005 Corsi di laurea Scienze e tecniche neuropsicologiche. Modulo 1. Modulo 1 Statistica descrittiva Monovariata

Grafici e tabelle permettono di fare valutazioni qualitative, non quantitative. E necessario poter sintetizzare i dati attraverso due importanti

Capitolo 3 Sintesi e descrizione dei dati quantitativi

Dispersione. si cercano indici di dispersione che:

STATISTICHE DESCRITTIVE

Statistica descrittiva

DISTRIBUZIONE NORMALE. Distribuzione teorica di probabilità, detta anche Gaussiana. Variabili continue

Elementi di Statistica

Corso di Laurea triennale Tecniche della Prevenzione PERCORSO STRAORDINARIO 2007/08. Insegnamento di STATISTICA MEDICA. Modulo II

Statistica Un Esempio

( ) ( ) ( e la probabilità che si verifichi un evento compreso tra c e b a < c < b sarà data da:

Dipartimento di Fisica a.a. 2003/2004 Fisica Medica 2 Indici statistici 22/4/2005

Misure di dispersione (o di variabilità)

ESPLORAZIONE DEI DATI CON SINTESI NUMERICHE 1 / 22

Corso in Statistica Medica

Principi di Statistica Descrittiva (3)

Statistica di base per l analisi socio-economica

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

MISURE DI DISPERSIONE

Metodi Matematici ed Informatici per la Biologia Esame Finale, II appello 2 Luglio Matricola: Codice

Esercitazioni di statistica

Esercitazioni di Statistica per Biotecnologie. Francesca Pizzorni Ferrarese

Elementi di Psicometria (con laboratorio software 1)


STIME STATISTICHE. Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 2/2

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria

Andrea Bonanomi Università Cattolica del Sacro Cuore. Principi di Statistica Descrittiva. Milano, 9 gennaio 2015 Camera di Commercio

STATISTICA DESCRITTIVA (variabili quantitative)

INTRODUZIONE AL DOE come strumento di sviluppo prodotto Francesca Campana Parte 2 Concetti di base

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche

Statistica dei consumi alimentari e delle tendenze nutrizionali Lezione 5-15/10/2015

Elementi di Psicometria con Laboratorio di SPSS 1

STATISTICA Disciplina scien tifica che fornisce strumenti per l interpretazione delle informazioni contenute in insiemi di dati relativi a

Laboratorio di Probabilità e Statistica

Indici di tendenza centrale Media, mediana e moda.

Elementi di Probabilità e Statistica

Questionario 1. Sono assegnati i seguenti dati

INDICATORI DI TENDENZA CENTRALE

La distribuzione normale

University of Messina, Italy

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

University of Messina, Italy

Fonte:

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

Statistica descrittiva II

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)

Dispensa di Statistica

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità

INDICATORI DI TENDENZA CENTRALE

Le sperimentazioni cliniche controllate: aspetti statistici I

Lezione 4 a - Misure di dispersione o di variabilità

INDICATORI DI TENDENZA CENTRALE

Coincide con la media aritmetica degli n dati nel campione

Prefazione Ringraziamenti

DISTRIBUZIONI DI PROBABILITA

Esercizi. Esercizio 1. Date le funzioni f(x) = x 2 3x + 2 e g(x) = 2x 1,

INTRODUZIONE AL DOE come strumento di sviluppo prodotto Francesca Campana Parte 2 Concetti di base

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Le misure della tendenza

ELEMENTI DI STATISTICA DESCRITTIVA

Statistica Inferenziale

Transcript:

1/55 Statistica descrittiva

Organizzare e rappresentare i dati I dati vanno raccolti, analizzati ed elaborati con le tecniche appropriate (organizzazione dei dati). I dati vanno poi interpretati e valutati con le tecniche statistiche appropriate. 2/55

Organizzare e rappresentare i dati Dati raccolti + statistica = informazioni 3/55

Organizzare e rappresentare i dati Rank order distribution (distribuzione ordinata per classifica) Quando i dati sono pochi (<=20) la semplice loro ordinazione dal più piccolo al più grande può fornire più informazioni. 4/55

Organizzare e rappresentare i dati Rank order distribution (distribuzione ordinata per classifica) N = numero di dati H = valore più alto L = valore più basso R (range) = H - L 5/55

Organizzare e rappresentare i dati x 18 17 16 15 N=15 H = 18 L = 2 Range = 18 2 = 16 14 13 12 12 10 9 9 8 8 5 2 6/55

Organizzare e rappresentare i dati Distribuzione di frequenza semplice Quando i dati sono molti può essere conveniente organizzare i dati in tabelle in cui in una colonna venga indicato il numero di volte che è stato rilevato un determinato dato (colonna della frequenza) 7/55

Organizzare e rappresentare i dati x f N=368 H = 19 L = 0 Range = 19 0 = 19 19 1 18 2 17 3 16 4 15 5 14 7 13 10 12 12 11 15 10 20 9 21 8 20 7 15 6 12 5 10 4 7 3 5 2 4 1 3 0 2 8/55

Organizzare e rappresentare i dati Distribuzione di frequenza per classi I dati vengono raggruppati in classi di frequenze 9/55

Organizzare e rappresentare i dati Classi (x) f 100-91 31 90-81 71 80-71 64 < 70 40 N = 206 10/55

Organizzare e rappresentare i dati Distribuzione di frequenza per classi Ogni classe è definita dall intervallo della classe. 11/55

Organizzare e rappresentare i dati Limiti della classe Classi (x) f 100-91 31 90-81 71 80-71 64 < 70 40 Intervallo aperto 12/55

Organizzare e rappresentare i dati Distribuzione di frequenza cumulativa La frequenza di un gruppo viene sommata a quella di tutti gli altri gruppi al di sotto di esso 13/55

Organizzare e rappresentare i dati Classi (x) f Cum f 100-91 31 206 90-81 71 175 80-71 64 104 < 70 40 40 N = 206 14/55

Frequenza Rappresentazione dei dati 18 16 14 12 10 8 6 4 2 0 115-119 110-114 104-109 100-104 95-99 90-94 85-89 80-84 75-79 70-74 65-69 60-64 Classi Istogramma Utilizzato solitamente per distribuzione di frequenza in classi 15/55

Frequenza Rappresentazione dei dati 18 16 14 12 10 8 6 4 2 0 1 2 3 4 5 6 7 8 9 10 11 12 Valore Poligono di frequenza Utilizzato solitamente per distribuzione di frequenza semplice 16/55

Frequenza Rappresentazione dei dati 90 80 70 60 50 40 30 20 10 0 1 2 3 7 10 15 17 11 5 4 2 2 Valore Poligono di frequenza cumulativa 17/55

Curve di distribuzione La curva di distribuzione normale E caratterizzata dalla distribuzione simmetrica dei dati intorno al centro della curva. Descritta per la prima volta dal matematico Karl Gauss (1777-1855): curva Gaussiana. 18/55

Curve di distribuzione leptocurtica mesocurtica platicurtica 19/55

Tendenza centrale MODA Valore più frequente MEDIA Media aritmetica - Somma dei valori (X) diviso la somma del numero dei valori (N): X/N MEDIANA Valore associato al 50 percentile 20/55

Tendenza centrale Se la distribuzione è normale moda, media e mediana coincidono 21/55

Frequenza Tendenza centrale Moda, Mediana, Media Dati 22/55

Curva obliqua a sinistra Curve di distribuzione Curva obliqua a destra Curva a U Curva bimodale Curva discendente Curva ascendente 23/55

Frequenza MODA Tendenza centrale 35 30 25 20 15 10 5 0 MEDIANA MEDIA 0 5 10 15 Dati 20 24/55

100% 97% 94% 91% 88% 85% 82% 79% 76% 73% 70% 67% 64% 61% 58% 55% 52% 49% 46% 43% 40% Esempio di distribuzione obliqua Intensità di una gara di mountain bike 10% 8% 6% 4% 2% 0% % HRmax 25/55

Tendenza centrale Statistica parametrica Dati normalmente distribuiti 26/55

I percentili Percentili Il percentile rappresenta un punto su una scala di 100 divisioni teoriche in modo tale che una certa frazione della popolazione risulta uguale o inferiore a quel punto. 27/55

28/55 I percentili

Calcolo dei percentili con rank order distribution X 10 9 9 7 7 7 6 5 5 5 4 4 3 3 1 Numero di canestri su 10 tiri in 15 giocatori. Qual è il percentile di 6? Numero di valori uguali o inferiori a 6 = 9 9/15 = 0.60 = 60% 6 è al 60 percentile N=15 29/55

Calcolo dei percentili con rank order distribution X 10 9 9 7 7 7 6 5 5 5 4 4 3 3 1 Quando una persona riceve lo stesso punteggio, il percentile è calcolato per il più alto valore dei dati ripetuti. Percentile per 5 = 8/15 = 0.53 = 53% N=15 30/55

Calcolo dei percentili con distribuzione cumulativa x f Cum f 90 31 206 85 71 175 80 64 104 75 40 40 Percentile di 85 175/206(N) = 0.85 = 85% 31/55

Esempio Un uomo ha 40 ml kg -1 min -1 di VO 2max. Il dato da solo non fornisce indicazioni particolari. Se però sappiamo che questo valore si inserisce al 65 percentile sappiamo che 40 ml kg -1 min -1 di VO 2max è superiore al 65% della popolazione di riferimento. 32/55

I percentili 100% 75% 50% 25% 0% Q4 4 quartile Q3 3 quartile Q2 2 quartile Q1 1 quartile 33/55

I percentili 100% 75% 50% 25% 0% Q4 4 quartile Q3 3 quartile Q2 2 quartile Q1 1 quartile 100% 90% 80% 70% 60% 50% 40% 30% 20% 10% 0% D10 10 decile D9 9 decile D8 8 decile D7 7 decile D6 6 decile D5 5 decile D4 4 decile D3 3 decile D2 2 decile D1 1 decile 34/55

Tendenza centrale Misure di tendenza centrale Le misure di tendenza centrale sono valori che descrivono le caratteristiche centrali di un set di dati. 35/55

Tendenza centrale MODA La moda è il valore che si presenta più frequentemente. Svantaggi 1. E instabile (cambia ad esempio con le classi) 2. E un dato statistico terminale (non può essere usato per altri calcoli). 3. Toglie completamente peso ai valori estremi. 36/55

Tendenza centrale MEDIANA Valore associato al 50 percentile. Divide il set di dati in due parti uguali. Non è influenzata dall entità dei valori estremi, ma da quanti ce ne sono. 37/55

Tendenza centrale MEDIA Media aritmetica ( X/N). La media è sensibile al numero e all entità dei valori estremi. I valori estremi (outlier) tirano nella loro direzione la media (possibile svantaggio). 38/55

Tendenza centrale Si usa la MODA quando: 1. Serve solo una grossolana indicazione di tendenza centrale e i dati sono normali. 39/55

Tendenza centrale Si usa la MEDIANA quando: 1. I dati sono su una scala ordinale. 2. Sono necessarie informazioni sul valore mediano del set di dati. 3. La curva di distribuzione è molto schiacciata. 40/55

Tendenza centrale Si usa la MEDIANA quando: 1. I dati sono su una scala ordinale. 2. Sono necessarie informazioni sul valore mediano del set di dati. 3. La curva di distribuzione è molto schiacciata. 41/55

Tendenza centrale Si usa la MEDIANA quando: 1. I dati sono su una scala ordinale. 2. Sono necessarie informazioni sul valore mediano del set di dati. 3. La curva di distribuzione è molto schiacciata. 42/55

Tendenza centrale Si usa la MEDIA quando: 1. I dati sono normali o vicino alla normalità. 2. Sono necessarie informazioni su tutti i dati (ordine e loro valore). 3. Serve calcolare altri parametri come la deviazione standard. 43/55

Tendenza centrale Si usa la MEDIA quando: 1. I dati sono normali o vicino alla normalità. 2. Sono necessarie informazioni su tutti i dati (ordine e loro valore). 3. Serve calcolare altri parametri come la deviazione standard. 44/55

Tendenza centrale Si usa la MEDIA quando: 1. I dati sono normali o vicino alla normalità. 2. Sono necessarie informazioni su tutti i dati (ordine e loro valore). 3. Serve calcolare altri parametri come la deviazione standard. 45/55

Frequenza Tendenza centrale Moda, Mediana, Media Dati 46/55

Frequenza MODA Tendenza centrale 35 30 25 20 15 10 5 0 MEDIANA MEDIA 0 5 10 15 Dati 20 47/55

Misure di variabilità Misure di variabilità 1. Range 2. Range interquartile (IQR) 3. Varianza 4. Deviazione stardard 48/55

Misure di variabilità Deviazione standard ( ) Una serie di dati può essere concentrata intorno alla misura centrale (i.e. distribuzione leptocurtica) oppure può essere molto dispersa (i.e. dispersione platicurtica). La deviazione standard fornisce indicazioni sulla dispersione di una serie di misure. 49/55

49/55 Misure di variabilità

Frequenza Tendenza centrale 34.13% 1.3% 13.59% 2.15% 3 2 1 68.26% 95.44% 99.74% 50/55

Misure di variabilità Esempio Età di 10 ± 3 (1 ) anni indica che il 68.26% dei dati si trova in un range compreso tra 7 (X - ) e 13 (X + ). Età di 10 ± 6 (2 ) anni indica che il 95.44% dei dati si trova in un range compreso tra 4 (X - 2 ) e 16 (X + 2 ). 51/55 Facoltà di Scienze Motorie Università degli Studi di Milano

Coefficiente di variazione (CV) Misure di variabilità CV= deviazione standard / MEDIA 100 Media CV 120 15 13 % 200 26 13 % 1240 161 13 % 52/55 Facoltà di Scienze Motorie Università degli Studi di Milano

Probabilità Probabilità Se tiro un dado ho 1 probabilità su 6 che esca il numero 4 Probabilità (P) = 1/6 = 0.17 = 17% Ho il 17% di probabilità che esca 4 (P=0.17) 53/55 Facoltà di Scienze Motorie Università degli Studi di Milano

55/55 Facoltà di Scienze Motorie Università degli Studi di Milano