Statistica descrittiva

Похожие документы
MISURE DI SINTESI 54

Obiettivi Strumenti Cosa ci faremo? Probabilità, distribuzioni campionarie. Stimatori. Indici: media, varianza,

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Esercitazioni di statistica

Statistica descrittiva II

Rappresentazioni grafiche

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Elementi di Statistica

Teoria e tecniche dei test. Concetti di base

1/55. Statistica descrittiva

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

STATISTICA DESCRITTIVA (variabili quantitative)

INDICATORI DI TENDENZA CENTRALE

STATISTICHE DESCRITTIVE Parte II

Questionario 1. Sono assegnati i seguenti dati

INDICATORI DI TENDENZA CENTRALE

STATISTICHE DESCRITTIVE

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Le misure della tendenza

La statistica descrittiva per le variabili quantitative

Esercitazioni di statistica

LE MEDIE DI POSIZIONE

Valori Medi. Docente Dott.ssa Domenica Matranga

Parlami un po di te.

Esercitazioni di Statistica

Capitolo 3 Sintesi e descrizione dei dati quantitativi

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva

Statistica. Esplicazione integrato con Appunti. Marco D Epifano

2. Variabilità mediante il confronto di valori caratteristici della

STATISTICA 1 ESERCITAZIONE 2

Gli indici di variabilità

L indagine statistica

Lezione n. 1 _Complementi di matematica

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

STATISTICA. La Statistica è la scienza che studia i fenomeni collettivi utilizzando metodi matematici.

Corso di Automazione Industriale 1. Capitolo 4

Università di Cassino. Esercitazioni di Statistica 1 del 29 Gennaio Dott. Mirko Bevilacqua

standardizzazione dei punteggi di un test

Statistica descrittiva

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Università del Piemonte Orientale. Corso di Laurea in Biotecnologie. Corso di Statistica Medica. Statistica Descrittiva: Variabili numeriche

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano:

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Elementi di Psicometria con Laboratorio di SPSS 1

Lezione 4. Statistica. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Lezione 4. A. Iodice. Indici di posizione.

Lezione 4 a - Misure di dispersione o di variabilità

Andrea Bonanomi Università Cattolica del Sacro Cuore. Principi di Statistica Descrittiva. Milano, 9 gennaio 2015 Camera di Commercio

Misure di dispersione (o di variabilità)

Elementi di Psicometria con Laboratorio di SPSS 1

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

La Variabilità statistica

STATISTICA: esercizi svolti su MODA, MEDIANA, QUARTILI, DECILI e CENTILI

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)

Indice. Percentili Decili Quartili Ranghi Percentili

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

Fonte: Esempio a fini didattici

Esempio di calcolo di rischio relativo

I principali tipi di grafici

Stesso valore medio per distribuzioni diverse

INDICI DI POSIZIONE - I QUANTILI

Lo scarto quadratico medio è s = s 2 2,15. c) Le confezioni con peso inferiore a 500g sono 18, quindi in percentuale sono 18 = 0,72 = 72%.

Elementi di statistica

Esercizi si statistica. Completi di soluzione guidata. Statistics.

Indici (Statistiche) che esprimono le caratteristiche di simmetria e

Esercitazioni di Statistica

Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti

STATISTICA NOZIONI DI BASE

Esercitazione di riepilogo 23 Aprile 2013

dott.ssa Gabriella Agrusti Docimologia 1

Indici di dispersione

Università degli Studi di Napoli Parthenope. Facoltà di Scienze Motorie a.a. 2010/2011 STATISTICA. Docente: Paolo Mazzocchi

Lezione 1.3 Corso di Statistica. Francesco Lagona

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Elementi di Statistica

Applicazioni statistiche e utilizzo del package statistico Spss - 7

STATISTICA I - CORSO DI LAUREA IN STATISTICA a.a. 2004/2005 Prova intermedia del 01 aprile 2005

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

V.C. RETTANGOLARE o UNIFORME

Statistica. Campione

Istituzioni di Statistica 1 Esercizi su tabelle di contingenza

Esercitazione: La distribuzione NORMALE

Excel come foglio di calcolo. Altri Grafici con Excel Istogrammi, grafici a torta

Транскрипт:

Statistica descrittiva Caso di 1 variabile: i dati si presentano in una tabella: Nome soggetto Alabama Dato 11.6.. Per riassumere i dati si costruisce una distribuzione delle frequenze. 1

Si determina il massimo M e il minimo m dei dati, quindi tutti i dati sono contenuti nell intervallo [m,m] (range dei valori). Poi si suddivide [m,m] in intervalli (classi) disgiunti e si contano quanti dati cadono in ciascun intervallo, (frequenza della classe). Si costruisce la tabella: Classe 0.0-2.9 Frequenza 5 2

Distribuzione di frequenze È una lista di intervalli di possibili valori di una variabile insieme con una tabulazione del numero di osservazioni per ciascun intervallo (frequenza assoluta). Le classi sono di solito scelte di uguale ampiezza e ogni dato deve cadere in una ed una sola classe. frequenza relativa= frequenza assoluta diviso la dimensione del campione. 3

Frequenza relativa di una classe è la percentuale di dati che stanno in quella classe. La classe 0.0-2.9 contiene 5 dati su 50: quindi la frequenza relativa è 5/50=0.10=10%. La somma delle frequenze relative = 1. La somma delle percentuali = 100%. Attenzione agli arrotondamenti! Istogramma= grafico della distribuzione delle frequenze 4

Istogramma Per costruire l istogramma delle frequenze sono necessari i passi seguenti: Divisione del range di variazione dei dati in sottointervalli (classi) di uguale ampiezza Etichettatura dell asse orizzontale con i sottointervalli selezionati; Determinazione delle frequenze relativa di ogni classe; Etichettatura dell asse verticale con i valori di frequenza individuati; Disegno delle frequenze nel piano definito. 5

La scelta dell ampiezza dei sottointervalli è cruciale infatti: se l intervallo è troppo ampio, l istogramma risulta troppo aggregato e non consente di individuare una funzione di densità di probabilità; se l intervallo è troppo piccolo, l istogramma evidenzia troppo eventuali picchi negativi e positivi risultando troppo brusco. Esempio:si vuole disegnare l istogramma delle frequenze dei dati relativi alla durata dei viaggi aerei di un insieme di passeggeri. 6

I campioni raccolti sono (unità di misura=ora): 0.5, 2.1, 3.4, 4.1, 4.6, 5.7, 6.2, 6.6, 7.8, 8.1, 8.3, 8.4, 8.6, 8.9, 9.2, 9.8, 10.0, 10.3, 10.5, 10.6,10.8, 11.2, 11.3, 11.6, 11.7, 12.1, 12.5, 12.6, 12.8, 12.9, 12.9, 13.2, 14.4, 15.0, 15.5, 16.3,17.0, 17.3, 18.5, 23.5. 7

Intervalli di 1 ora L ampiezza dei sottointervalli è troppo piccola 8

Intervalli di 8 ore 9

Intervalli di 3 ore 10

La statistica descrittiva mette a disposizione il calcolo di indicatori sintetici che individuano, con un singolo valore, proprietà statistiche di un campione rispetto ad una sua variabile. In particolare: indicatori di centralità: media aritmetica, moda, mediana; indicatori di variabilità: varianza, deviazione standard; misure di raggruppamento: quartili, percentili. 11

Mediana E necessario che la lista dei dati sia ordinata in ordine crescente o decrescente: la mediana è un numero x tale che almeno il 50% dei dati è minore di x e il 50% è maggiore di x. E robusta: cioè, poco influenzata dalla presenza di dati anomali 7 12 18 23 34 54 Si può calcolare anche nel caso di dati ordinali. 12

Media È adatta per variabili quantitative ed è influenzata da dati anomali, (outliers). mean n = i = 1 n X i 13

7 +12 +18+ 23+ 34 +5424.66= Esempio: Abbiamo i 6 dati La loro media è. 7 12 18 23 34 54 14

Moda La moda è il valore con frequenza più alta nell insieme delle osservazioni. E adatta a tutti i tipi di dati. Non è posta necessariamente vicino al centro della distribuzione e perciò non è propriamente una misura della tendenza centrale. Nel caso di variabili che esprimono una attitudine si presentano spesso distribuzioni bimodali. 15

Esempi In un negozio lavorano 7 impiegati, la media dei loro stipendi è $37900 e la mediana $11200. Cosa significa? Insieme ordinato di Media inf 38012 categorie. Media sup Laurea I Laurea II Dottorato 65291 33191 7570 1311 Quale è la dimensione del campione? Quale è la classe mediana? Specializz azione Master 3110 7599 16

Quartili e percentili Il primo quartile è un numero tale che il 25% dei dati è inferiore e il 75% è superiore. Il terzo quartile è un numero tale che il 75% dei dati è inferiore e il 25% è superiore. I quartili insieme alla mediana dividono i dati in 4 parti ciascuna contenente un quarto dei dati. La differenza fra il primo e il terzo quartile si dice distanza interquartilica. 17

Boxplot Rappresentano il grado di dispersione o variabilità dei dati (w.r.t. mediana e/o media) la simmetria la presenza di valori anomali Le distanze tra i quartili definiscono la dispersione dei dati Terzo Quartile Mediana Primo Quartile Min 18