ELEMENTI DI STATISTICA DESCRITTIVA

Documenti analoghi
ELEMENTI DI STATISTICA

Elementi di Statistica

Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche.

Seconda Lezione. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 DISTRIBUZIONE DI FREQUENZA

INDICATORI DI TENDENZA CENTRALE

7. STATISTICA DESCRITTIVA

Le medie. Antonello Maruotti

Indici di. tendenza centrale: posizione: variabilità e dispersione: -quantili -decili -percentili. -Media -Moda -Mediana

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

Statistica. Lezioni: 7, 8. Statistica Descrittiva Univariata 3

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

Medie. Monia Ranalli. Ranalli M. Medie Settimana # 2 1 / 22

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE

Lezione n. 1 _Complementi di matematica

Statistica descrittiva II

Indici di tendenza centrale Media, mediana e moda.

Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza

Statistica Elementare

Dispensa di Statistica

Dipartimento di Fisica a.a. 2003/2004 Fisica Medica 2 Indici statistici 22/4/2005

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

MISURE DI SINTESI 54

Statistica descrittiva in una variabile

Errore nella misura sperimentale

Statistica. Matematica con Elementi di Statistica a.a. 2017/18

Distribuzione di Frequenza: Esempio

Una statistica è una quantità numerica il cui valore è determinato dai dati.

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Tipi di variabili. Indici di tendenza centrale e di dispersione

ESERCIZI DI STATISTICA SOCIALE

Lezione 4: Indici di posizione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

4. VALORI CENTRALI. Statistica sociale

4. INDICI DI POSIZIONE

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

La statistica descrittiva

Elementi di Probabilità e Statistica

La sintesi delle distribuzioni


La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Statistica descrittiva

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Matematica Lezione 22

STIME STATISTICHE. Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 2/2

Esercizi. Esercizio 1. Date le funzioni f(x) = x 2 3x + 2 e g(x) = 2x 1,

Obiettivi Strumenti Cosa ci faremo? Probabilità, distribuzioni campionarie. Stimatori. Indici: media, varianza,

Parlami un po di te.

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

Statistica Descrittiva Soluzioni 4. Medie lasche

Daniela Tondini

Teoria e tecniche dei test. Concetti di base

Valori Medi. Docente Dott.ssa Domenica Matranga

Dispersione. si cercano indici di dispersione che:

Esempi di confronti grafici


LEZIONI DI STATISTICA

STATISTICHE DESCRITTIVE

Rappresentazioni grafiche

Indici di Dispersione

Esplorazione dei dati

Indice. Prefazione. 4 Sintesi della distribuzione di un carattere La variabilità Introduzione La variabilità di una distribuzione 75

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

Sommario. Capitolo 1 I dati e la statistica 1. Capitolo 2 Statistica descrittiva: tabelle e rappresentazioni grafiche 25

DISTRIBUZIONI DI PROBABILITA (parte 1) 1 / 19

Questionario 1. Sono assegnati i seguenti dati

Nozioni di statistica

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva

p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali.

Indicatori di posizione e ampiezza di variabili aleatorie

Statistica: principi e metodi. Medie

Statistica di base per l analisi socio-economica

POPOLAZIONE E CAMPIONI

La statistica descrittiva prima parte. a cura della prof.ssa Anna Rita Valente

Istituzioni di Statistica e Statistica Economica

Statistica. Antonio Azzollini

INFORMAZIONI. p. 1/23

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Sintesi numerica di distribuzioni statistiche

Esercitazioni di Metodi Statistici per la Biologia

Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016

1.1 Obiettivi della statistica Struttura del testo 2

Statistica descrittiva

1/55. Statistica descrittiva

L indagine statistica

Slide Cerbara parte 1. Le medie

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche

Corso di STATISTICA EGA - Classe 1 aa Docenti: Luca Frigau, Claudio Conversano

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

3/19/18. Obiettivo: Descrizione di un Istogramma

Cosa studia la Statistica?

Modelli probabilistici variabili casuali

Università del Piemonte Orientale. Corso di Laurea in Biotecnologie. Corso di Statistica Medica. Statistica Descrittiva: Variabili numeriche

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Statistica, a.a. 2010/2011 Docente: D. Dabergami Lezione 1

Modelli descrittivi, statistica e simulazione

Transcript:

Dipartimento di Matematica U. Dini, Università di Firenze Viale Morgagni 67/A, 50134 - Firenze, Italy, vlacci@math.unifi.it November 15, 2015

Terminologia In un esperimento ogni risultato delle caratteristiche osservabili dell esperimento si dice esito.

Terminologia In un esperimento ogni risultato delle caratteristiche osservabili dell esperimento si dice esito. Se un esperimento può essere ripetuto si dice prova ogni singola esecuzione dell esperimento.

Terminologia In un esperimento ogni risultato delle caratteristiche osservabili dell esperimento si dice esito. Se un esperimento può essere ripetuto si dice prova ogni singola esecuzione dell esperimento. Un evento è un insieme di esiti.

Terminologia In un esperimento ogni risultato delle caratteristiche osservabili dell esperimento si dice esito. Se un esperimento può essere ripetuto si dice prova ogni singola esecuzione dell esperimento. Un evento è un insieme di esiti. I singoli esiti sono anche detti eventi elementari e, in questo senso, un evento è anche detto evento composto (da eventi elementari)).

Terminologia In un esperimento ogni risultato delle caratteristiche osservabili dell esperimento si dice esito. Se un esperimento può essere ripetuto si dice prova ogni singola esecuzione dell esperimento. Un evento è un insieme di esiti. I singoli esiti sono anche detti eventi elementari e, in questo senso, un evento è anche detto evento composto (da eventi elementari)). Un esito o un evento di un esperimento si dicono casuali o aleatori se non è possibile prevederne il verificarsi a priori in modo certo. La totalità degli eventi elementari associati ad un esperimento è lo spazio campionario dell esperimento.

Terminologia In un esperimento ogni risultato delle caratteristiche osservabili dell esperimento si dice esito. Se un esperimento può essere ripetuto si dice prova ogni singola esecuzione dell esperimento. Un evento è un insieme di esiti. I singoli esiti sono anche detti eventi elementari e, in questo senso, un evento è anche detto evento composto (da eventi elementari)). Un esito o un evento di un esperimento si dicono casuali o aleatori se non è possibile prevederne il verificarsi a priori in modo certo. La totalità degli eventi elementari associati ad un esperimento è lo spazio campionario dell esperimento. evento A A S spazio campionario

Dati campionari In genere in una raccolta di dati campionari di una popolazione o rilevazione campionaria, oltre agli esiti ovvero alle caratteristiche della popolazione che si intendono registrare, vengono indicati anche le frequenze (relative e/o assolute) per tali dati.

Dati campionari In genere in una raccolta di dati campionari di una popolazione o rilevazione campionaria, oltre agli esiti ovvero alle caratteristiche della popolazione che si intendono registrare, vengono indicati anche le frequenze (relative e/o assolute) per tali dati. Inoltre prima di procedere alla rilevazione campionaria andrebbe appositamente definito una procedura per il piano di campionamento

Dati campionari In genere in una raccolta di dati campionari di una popolazione o rilevazione campionaria, oltre agli esiti ovvero alle caratteristiche della popolazione che si intendono registrare, vengono indicati anche le frequenze (relative e/o assolute) per tali dati. Inoltre prima di procedere alla rilevazione campionaria andrebbe appositamente definito una procedura per il piano di campionamento Ad esempio, se bisogna campionare un area territoriale (abbastanza estesa), sarà cura del ricercatore stabilire se (per ragioni pratiche o teoriche) sia meglio seguire uno schema di rilevamento casuale o con geometria regolare (ad esempio uniforme o a grappoli).

Rappresentazione dei dati statistici Le frequenze ma anche le serie storiche dei dati possono essere visualizzati usando dei diagrammi; in particolare potranno essere usati dei diagrammi a punti, dei diagrammi a linea o istogrammi e degli areogrammi come i diagrammi a torta o pie charts.

Rappresentazione dei dati statistici Le frequenze ma anche le serie storiche dei dati possono essere visualizzati usando dei diagrammi; in particolare potranno essere usati dei diagrammi a punti, dei diagrammi a linea o istogrammi e degli areogrammi come i diagrammi a torta o pie charts. Quando il numero di osservazioni è molto grande, è bene considerare una rappresentazione a istogrammi per intervalli o classi di valori.

Rappresentazione dei dati statistici Le frequenze ma anche le serie storiche dei dati possono essere visualizzati usando dei diagrammi; in particolare potranno essere usati dei diagrammi a punti, dei diagrammi a linea o istogrammi e degli areogrammi come i diagrammi a torta o pie charts. Quando il numero di osservazioni è molto grande, è bene considerare una rappresentazione a istogrammi per intervalli o classi di valori. La scelta del numero di intervalli è una questione delicata ed influenza l aspetto dell istogramma.

Rappresentazione dei dati statistici Le frequenze ma anche le serie storiche dei dati possono essere visualizzati usando dei diagrammi; in particolare potranno essere usati dei diagrammi a punti, dei diagrammi a linea o istogrammi e degli areogrammi come i diagrammi a torta o pie charts. Quando il numero di osservazioni è molto grande, è bene considerare una rappresentazione a istogrammi per intervalli o classi di valori. La scelta del numero di intervalli è una questione delicata ed influenza l aspetto dell istogramma. regola (empirica) di Sturges numero classi = 1 + 3, 322 log 10 (n) con n numero di osservazioni.

Esempio di Istogramma

Esempio di Istogramma

Esempio di Istogramma

Pie chart o Diagramma a torta

Indicatori statistici di dati numerici Per ottenere una descrizione sommaria di un insieme di dati numerici e per confrontare fra loro insiemi diversi di dati numerici campionari è opportuno ricavare dei termini riassuntivi detti indicatori statistici.

Indicatori statistici di dati numerici Per ottenere una descrizione sommaria di un insieme di dati numerici e per confrontare fra loro insiemi diversi di dati numerici campionari è opportuno ricavare dei termini riassuntivi detti indicatori statistici. In particolare tra gli indicatori di tendenza centrale si evidenziano media campionaria

Indicatori statistici di dati numerici Per ottenere una descrizione sommaria di un insieme di dati numerici e per confrontare fra loro insiemi diversi di dati numerici campionari è opportuno ricavare dei termini riassuntivi detti indicatori statistici. In particolare tra gli indicatori di tendenza centrale si evidenziano media campionaria mediana

Media campionaria Se x 1, x 2,,..., x n sono i dati numerici rilevati, la media campionaria è il numero x := x 1 + x 2 + + x n n

Media campionaria Se x 1, x 2,,..., x n sono i dati numerici rilevati, la media campionaria è il numero x := x 1 + x 2 + + x n n La media campionaria x NON è necessariamente uno dei dati;

Media campionaria Se x 1, x 2,,..., x n sono i dati numerici rilevati, la media campionaria è il numero x := x 1 + x 2 + + x n n La media campionaria x NON è necessariamente uno dei dati; tuttavia min{x i } i=1,...,n x max{x i } i=1,...,n. Esistono anche ALTRE medie (geometrica, armonica, ecc.), ma quella campionaria può essere presa come baricentro dei dati.

Osservazione importante Poichè la somma di numeri reali è commutativa e associativa, allora x := n 1 {}}{ x 1 +... + x 1 + n con n 1 + n 2 +... + n n = n. n 2 {}}{ x 2 +... + x 2 + + + n n n {}}{ x n +... + x n n

Osservazione importante Poichè la somma di numeri reali è commutativa e associativa, allora x := n 1 {}}{ x 1 +... + x 1 + n con n 1 + n 2 +... + n n = n. Si noti che n 2 {}}{ x 2 +... + x 2 + + + n n n {}}{ x n +... + x n n x = x 1 p 1 + x 2 p 2 +... + x n p n ove p j = n j n è la frequenza relativa di x j.

Mediana Un altro indicatore statistico di tendenza centrale è la mediana campionaria.

Mediana Un altro indicatore statistico di tendenza centrale è la mediana campionaria. Esso è il valore che divide in due parti uguali i dati, quando questi sono ordinati in senso crescente o decrescente.

Mediana Un altro indicatore statistico di tendenza centrale è la mediana campionaria. Esso è il valore che divide in due parti uguali i dati, quando questi sono ordinati in senso crescente o decrescente. Più precisamente, se il numero n dei dati è dispari, allora il valore della mediana è dato dal dato (detto mediano) di posizione (n + 1)/2 nell elenco ordinato di dati. Se invece n è dispari vi saranno due dati mediani (quello di posizione n/2 e il successivo) e allora andrà considerata come mediana la media capionaria dei due dati mediani.

Quartili e percentili Se il numero di osservazioni/dati è elevato, può essere utile suddividere ulteriormente l insieme dei dati procedendo al calcolo della mediana della prima e della seconda metà dei dati una volta ordinati in senso crescente o decrescente.

Quartili e percentili Se il numero di osservazioni/dati è elevato, può essere utile suddividere ulteriormente l insieme dei dati procedendo al calcolo della mediana della prima e della seconda metà dei dati una volta ordinati in senso crescente o decrescente. In questo modo i dati sono suddivisi in 4 classi dette quartili.

Quartili e percentili Se il numero di osservazioni/dati è elevato, può essere utile suddividere ulteriormente l insieme dei dati procedendo al calcolo della mediana della prima e della seconda metà dei dati una volta ordinati in senso crescente o decrescente. In questo modo i dati sono suddivisi in 4 classi dette quartili. In generale, se i dati possono essere divisi in 100 classi, dette percentili, il primo quartile corrisponde al 25-simo percentili mentre il 50-esimo percentile coincide con la mediana o secondo quartile.

Quartili e percentili Se il numero di osservazioni/dati è elevato, può essere utile suddividere ulteriormente l insieme dei dati procedendo al calcolo della mediana della prima e della seconda metà dei dati una volta ordinati in senso crescente o decrescente. In questo modo i dati sono suddivisi in 4 classi dette quartili. In generale, se i dati possono essere divisi in 100 classi, dette percentili, il primo quartile corrisponde al 25-simo percentili mentre il 50-esimo percentile coincide con la mediana o secondo quartile. Per un valore p (0 p 100) si parla di p-esimo percentile.

Moda La moda campionaria (detta anche valore normale o norma) è il dato (o i dati) che si presenta(no) con frequenza massima.

Moda La moda campionaria (detta anche valore normale o norma) è il dato (o i dati) che si presenta(no) con frequenza massima. Di conseguenza si parla di distribuzione dei dati di tipo unimodale o bimodale e in generale plurimodale.

Moda La moda campionaria (detta anche valore normale o norma) è il dato (o i dati) che si presenta(no) con frequenza massima. Di conseguenza si parla di distribuzione dei dati di tipo unimodale o bimodale e in generale plurimodale. La moda è di facile identificazione in un istogramma;

Moda La moda campionaria (detta anche valore normale o norma) è il dato (o i dati) che si presenta(no) con frequenza massima. Di conseguenza si parla di distribuzione dei dati di tipo unimodale o bimodale e in generale plurimodale. La moda è di facile identificazione in un istogramma; se i dati sono raggruppati in classi, allora la classe con massima frequenza è detta classe modale.

Indicatore di dispersione dei dati Se la media campionaria x ha il ruolo di baricentro dei dati {x 1,..., x n }, allora la dispersione dei dati x j da x può essere calcolata considerando gli scarti oppure d i := x i x d i = x i x 0.

Indicatore di dispersione dei dati Se la media campionaria x ha il ruolo di baricentro dei dati {x 1,..., x n }, allora la dispersione dei dati x j da x può essere calcolata considerando gli scarti oppure Tuttavia, risulta d i := x i x d i = x i x 0. n d i = 0 i=1

Indicatore di dispersione dei dati Se la media campionaria x ha il ruolo di baricentro dei dati {x 1,..., x n }, allora la dispersione dei dati x j da x può essere calcolata considerando gli scarti oppure Tuttavia, risulta in quanto d i := x i x d i = x i x 0. n d i = 0 i=1 n n d i = (x i x) = nx nx = 0. i=1 i=1

Varianza campionaria dei dati Si dice varianza campionaria dei dati {x 1,..., x n } di media campionaria x il numero (non negativo) s 2 := n (x i x) 2 i=1 n 1 = n i=1 d 2 i n 1

Varianza campionaria dei dati Si dice varianza campionaria dei dati {x 1,..., x n } di media campionaria x il numero (non negativo) Si dice infine che s 2 := n (x i x) 2 i=1 n 1 = n i=1 n (x i x) 2 i=1 s := n 1 d 2 i n 1 è la deviazione standard o scarto quadratico medio dei dati {x 1,..., x n }.

Una formula alternativa... Da (x i x) 2 = xi 2 2x i x + x 2 e dal fatto che nx = x 1 +... + x n si ricava che la (n 1)s 2 = n (x i x) 2 = i=1 n i=1 x 2 i ( n ) 2 x i i=1 n

Referenze bibliografiche Capitolo 1 del testo Metodi Matematici e Statistici nelle Scienze della Terra Volume terzo: Tecniche statistiche A. Buccianti, F. Rosso, F. Vlacci Liguori Editore 2003