Statistica descrittiva



Documenti analoghi
ALLEGATO D ANALISI STATISTICA DEI DATI METEOROLOGICI

Esplorazione dei dati

Grafici delle distribuzioni di frequenza

Misure della dispersione o della variabilità

LABORATORIO EXCEL XLSTAT 2008 SCHEDE 2 e 3 VARIABILI QUANTITATIVE

Metodi Matematici e Informatici per la Biologia Maggio 2010

Elementi di Psicometria con Laboratorio di SPSS 1

Indici (Statistiche) che esprimono le caratteristiche di simmetria e

Lezione 6: Forma di distribuzione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Indici di dispersione

Il concetto di valore medio in generale

STATISTICA DESCRITTIVA. Le misure di tendenza centrale

Analisi Statistica per le Imprese (6 CFU) - a.a Prof. L. Neri RICHIAMI DI STATISTICA DESCRITTIVA UNIVARIATA

La distribuzione Normale. La distribuzione Normale

ESERCIZI DI STATISTICA DESCRITTIVA

Esercitazione di riepilogo 23 Aprile 2013

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA

Dai dati al modello teorico

I ESERCITAZIONE. Gruppo I 100 individui. Trattamento I Nuovo Farmaco. Osservazione degli effetti sul raffreddore. Assegnazione casuale

2. Un carattere misurato in un campione: elementi di statistica descrittiva e inferenziale

CORSO DI MISURE ANALISI DEI SEGNALI NEL DOMINIO DEL TEMPO

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V

Come descrivere un fenomeno in ambito sanitario fondamenti di statistica descrittiva. Brugnaro Luca

La distribuzione Gaussiana

STATISTICA ESERCITAZIONE 11 Dott. Giuseppe Pandolfo 3 febbraio Modelli continui di probabilità: la v.c. uniforme continua

Facciamo qualche precisazione

ALLEGATO 1 Analisi delle serie storiche pluviometriche delle stazioni di Torre del Lago e di Viareggio.

Statistica. Alfonso Iodice D Enza iodicede@unina.it


STATISTICA (L-Z) - Parte I Esercitazione 3

Abbiamo costruito il grafico delle sst in funzione del tempo (dal 1880 al 1995).

Prova di autovalutazione Prof. Roberta Siciliano

EPG Metodologia della ricerca e Tecniche Multivariate dei dati. Dott.ssa Antonella Macchia a.macchia@unich.it.

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Slide Cerbara parte1 5. Le distribuzioni teoriche

Elementi di statistica

Elementi di Statistica

STATISTICA IX lezione

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Corso di Psicometria Progredito

Analisi bivariata. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it

ESERCITAZIONE 4 SOCIALE. Corso di Laurea Comunicazione e A.A. 2012/2013

11. Analisi statistica degli eventi idrologici estremi

Analisi della performance temporale della rete

LA CORRELAZIONE LINEARE

RELAZIONE TRA VARIABILI QUANTITATIVE. Lezione 7 a. Accade spesso nella ricerca in campo biomedico, così come in altri campi della

Brugnaro Luca Boscaro Gianni (2009) 1

Il confronto fra proporzioni

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

IL SOFTWARE EXCEL 3 LE FUNZIONI

I punteggi zeta e la distribuzione normale

Statistica descrittiva

Analisi dei residui. Test Esatto di Fisher. Differenza fra proporzioni

OCCUPATI SETTORE DI ATTIVITA' ECONOMICA

La Distribuzione Normale (Curva di Gauss)

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice

Statistica inferenziale

LOGISTICA APPUNTI DI STATISTICA

E naturale chiedersi alcune cose sulla media campionaria x n

Per forma di una distribuzione si intende il modo secondo il quale si dispongono i valori di un carattere intorno alla rispettiva media.

Università di Firenze - Corso di laurea in Statistica Seconda prova intermedia di Statistica. 18 dicembre 2008

Relazioni statistiche: regressione e correlazione

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

Inferenza statistica. Statistica medica 1

VARIABILI E DISTRIBUZIONI DI FREQUENZA A.A. 2010/2011

Statistica. Esercitazione 3 5 maggio 2010 Serie storiche. Connessione e indipendenza statistica

INDICE PREFAZIONE VII

Grafici. Lezione 4. Fondamenti di Informatica 2 Giuseppe Manco Ester Zumpano

Elementi di informatica

Valori medi e misure della tendenza centrale

Capitolo 12 La regressione lineare semplice

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

ELEMENTI DI STATISTICA DESCRITTIVA

Analisi dei dati. Statistica descrittiva

Università degli Studi di Ferrara - A.A. 2014/15 Dott. Valerio Muzzioli ORDINAMENTO DEI DATI

LEZIONE 7. Esercizio 7.1. Quale delle seguenti funzioni è decrescente in ( 3, 0) e ha derivata prima in 3 che vale 0? x x2. 2, x3 +2x +3.

STATISTICA DESCRITTIVA UNIVARIATA

FORMULE: Operatori matematici

SOLUZIONE DEL PROBLEMA 1 TEMA DI MATEMATICA ESAME DI STATO 2015

Cosa è un foglio elettronico

Statistica (Prof. Capitanio) Slide n. 1. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

Il Dipartimento per le Comunicazioni: uno studio dell età del personale. Miriam Tagliavia Marzo 2011

Introduzione alle relazioni multivariate. Introduzione alle relazioni multivariate

Esercizio 1. Nella Tabella A sono riportati i tempi di percorrenza, in minuti, di un tratto autostradale da parte di 40 autoveicoli.

Siamo così arrivati all aritmetica modulare, ma anche a individuare alcuni aspetti di come funziona l aritmetica del calcolatore come vedremo.

Statistica 4038 (ver. 1.2)

Metodi Matematici ed Informatici per la Biologia Esame Finale, I appello 1 Giugno 2007

3. Confronto tra medie di due campioni indipendenti o appaiati

ESERCIZIO N 4. Fatturato Supermercati [0;500) 340 [500;1000) 368 [1000;5000) 480 [5000;10000) 37 [10000;20000) 15 taglia = 1240

Statistiche campionarie

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

Indagine campionaria sul ricorso alla rendita vitalizia Esercizi

Esercizio 1 Istogrammi

Dipartimento di Scienze politiche, della comunicazione e delle relazioni internazionali - a.a

LEZIONE n. 5 (a cura di Antonio Di Marco)

Altre funzioni utili SINTASSI ED ESEMPI

Esercitazioni del corso di Statistica Prof. Mortera a.a. 2008/2009

Transcript:

Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di indicatori sintetici che individuano, con un singolo valore, proprieta` statistiche di un campione/popolazione rispetto ad una sua variabile/attributo. In particolare: indicatori di centralita`: media aritmetica, moda, mediana; indicatori di variabilita`: varianza, deviazione standard; misure di raggruppamento: quartili, percentili.

Misure di centralita`: media aritmetica mean n i 1 n X i

Media aritmetica in EXCEL AVERAGE(number1,number2,...) Number1, number2,... sono da 1 a 30 argomenti di cui calcolare la media aritmetica Gli argomenti debbono essere o numeri o nomi, array, riferimenti a campi che contengono numeri. se un argomento di tipo array o riferimento contiene testo, valori logici o celle vuote, questi valori sono ignorati; sono invece conteggiati gli zero presenti.

Media aritmetica: proprieta` Per effettuare la correzione di errori accidentali permette di sostituire i valori di ogni elemento senza cambiare il totale n 1 k n i1 x i kx x

Misure di centralita`: mediana Dato un campione di valori ordinati {X 1, X 1,..., X n } MEDIAN = X ((n+1) % 2) la mediana e` quindi il valore centrale del campione. In EXCEL: MEDIAN(number1,number2,...)

Mediana: proprieta` Robusta: poco influenzata dalla presenza di dati anomali 7 12 18 23 34 54 x 21.3 M 23

Misure di centralita`: moda la moda e` il valore con frequenza piu` alta nell insieme delle osservazioni In EXCEL MODE(number1,number2,...)

Varianza, deviazione standard misure di mutua variabilità tra i dati di una serie Devianza empirica dev n x x i 2 i1 Varianza s x i x 2 1 n n i1 2

Misure di variabilita`: deviazione standard deviazione standard varianza In EXCEL: STDEV(range) VAR(range)

Quartili e percentili Dato un campione ordinato il percentile ennesimo e` il valore che separa n% dei dati dal resto p.e. esempio la mediana puo` essere interpretata come il 50-esimo percentile In Excel PERCENTILE(range, perc) Il Quartile separa un quarto dei dati dal resto. Si parla di primo (25%), secondo (50%), terzo (75%) quartile In Excel QUARTILE(range,n) dove n puo` essere 1, 2 o 3

Altre misure descrittive MIN(range) calcola il valore minimo di un campione memorizzato in range MAX(range) calcola il valore massimo di un campione RANGE(range) calcola la differenza tra il valore minimo e massimo, ovvero il campo di variabilita` dei valori del campione.

Rappresentazioni Boxplot Rappresentano il grado di dispersione o variabilità dei dati (w.r.t. mediana e/o media) la simmetria la presenza di valori anomali Max Terzo Quartile Le distanze tra i quartili definiscono la dispersione dei dati Mediana Primo Quartile non direttamente disponibile in Excel Min

Distribuzioni di frequenza La rappresentazione con istogramma delle frequenze dei valori di una variabile numerica su un intervallo partizionato in categorie continue e` la rappresentazione di una distribuzione di frequenza Può essere interpretata come una approssimazione del grafico di una funzione che descrive come varia la frequenza di un valore rispetto al crescere (decrescere) del valore stesso Le distribuzioni di frequenza osservate spesso sono così regolari da poter essere viste come casi particolari di distribuzioni di frequenze teoriche, descritte da ben precise funzioni matematiche

Distribuzioni di frequenza teoriche Distribuzione uniforme: ogni evento (categoria) ha la stessa frequenza Distribuzione normale (o Gaussiana, o a campana) f ( y) 1 e ( y ) 2 2 2 2 media deviazione standard

Esempio di gaussiana

Simmetria Si ha simmetria quando media, moda e mediana coincidono condizione necessaria, non sufficiente Asimmetria sinistra: moda, mediana, media Asimmetria destra: media, mediana, moda

Misure della forma della distribuzione: skewness Indice di asimmetria (skewness): misura la mancanza di simmetria della distribuzione di frequenza: Un valore positivo indica una distribuzione in cui i valori sono raggruppati nel range dei valori bassi con una lunga coda che si estende verso I valori maggiori Un valore negativo indica la situazione opposta Esempio: calcolare il valore di asimmetria per la distribuzione dei tempi di interarrivo in banca (BANK.XML)

Misure della forma della distribuzione: curtosi L indice di curtosi misura la pesantezza delle code di una distribuzione: Una curtosi positiva indica che ci sono piu` valori agli estremi della distribuzione di quanto aspettato Una curtosi negativa indica ci sono meno avlori agli estremi della distribuzione di quanto aspettato.

Curtosi (cont.) Coefficiente di curtosi Una distribuzione leptocurtica ha K ~ 1/2 platicurtosi: k~0 K x 1 2 x.90.75 x x.10.25

Esercitazione Usando il file ACTORS.XLS 1. Calcolare la distribuzione su salary 2. Costruire un istogramma diviso per categorie tenendo conto del sesso Usando il file HOMEDATA.XLS 1. Calcolare la distribuzione dei prezzi delle case 2. Costruire l istogramma della distribuzionetenendo conto della posizione (NE_sector) 3. Calcolare gli indici di asimmetria e di curtosi 4. Calcolare i quartili