Statistica descrittiva II

Documenti analoghi
Statistica descrittiva I

Esercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

Obiettivi Strumenti Cosa ci faremo? Probabilità, distribuzioni campionarie. Stimatori. Indici: media, varianza,

ESERCIZI DI STATISTICA SOCIALE

Seconda Lezione. Ing. Andrea Ghedi AA 2009/2010. Ing. Andrea Ghedi AA 2009/2010 DISTRIBUZIONE DI FREQUENZA

Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche.

MISURE DI SINTESI 54

Statistica descrittiva in una variabile

Esercitazioni di statistica

Istituzioni di Statistica e Statistica Economica


Medie. Monia Ranalli. Ranalli M. Medie Settimana # 2 1 / 22

Statistica: principi e metodi. Medie

Indici di Dispersione

Le medie. Antonello Maruotti

0= nessun danno, 1= minore, 2= moderato, 3= grave senza pericolo di vita, 4= grave con peric. di vita, 5= critico, sopravvivenza incerta, 6= fatale.

Matematica Lezione 22

Elementi di Statistica

INDICATORI DI TENDENZA CENTRALE

Statistica Elementare

Intervalli di confidenza

Statistica Un Esempio

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

La sintesi delle distribuzioni

INDICATORI DI TENDENZA CENTRALE

Capitolo 3 Sintesi e descrizione dei dati quantitativi

Indici di. tendenza centrale: posizione: variabilità e dispersione: -quantili -decili -percentili. -Media -Moda -Mediana

STATISTICHE DESCRITTIVE

Probabilità e Statistica Esercitazioni. a.a. 2017/2018. C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Dispersione. si cercano indici di dispersione che:

Corso di Laurea triennale Tecniche della Prevenzione PERCORSO STRAORDINARIO 2007/08. Insegnamento di STATISTICA MEDICA. Modulo II

Statistica. Matematica con Elementi di Statistica a.a. 2017/18

Intervalli di confidenza

Corso di Statistica: ESERCITAZIONI


INDICATORI DI TENDENZA CENTRALE

Corso di Laurea in Economia Aziendale. Docente: Marta Nai Ruscone. Statistica. a.a. 2015/2016

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Teoria e tecniche dei test. Concetti di base

Variabilità e Concentrazione Esercitazione n 02

Indici di tendenza centrale Media, mediana e moda.

tabelle grafici misure di

4. VALORI CENTRALI. Statistica sociale

STATISTICA: esercizi svolti su MODA, MEDIANA, QUARTILI, DECILI e CENTILI

Questionario 1. Sono assegnati i seguenti dati

3/19/18. Obiettivo: Descrizione di un Istogramma

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Sintesi numerica di distribuzioni statistiche

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva

Esercizi di statistica descrittiva. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 30

STIME STATISTICHE. Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 2/2

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Distribuzione di frequenza relativa e percentuale: esempio

Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012

Statistica descrittiva

Dipartimento di Sociologia e Ricerca Sociale. Corso di Laurea in Sociologia. Insegnamento di Statistica (a.a ) dott.ssa Gaia Bertarelli

DISTRIBUZIONI DI PROBABILITA (parte 1) 1 / 19

4. INDICI DI POSIZIONE

Lezione 4: Indici di posizione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Daniela Tondini

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità

Esplorazione dei dati

Principi di Statistica Descrittiva (3)

Suggerimento a proposito di decimali

Modelli descrittivi, statistica e simulazione

Nozioni di statistica

Statistica descrittiva III

Corso di Statistica. Medie,Moda. Prof.ssa T. Laureti a.a Corso di Statistica a.a DEIM, Univ.TUSCIA - Prof.

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali.

Distribuzione di Frequenza: Esempio

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

STATISTICA AZIENDALE Modulo Controllo di Qualità

La gestione dei risultati della valutazione. Claudio Mantovani

Statistiche per riassumere i dati

Corso di Statistica. Indici di posizione: Medie,Moda Mediana, Quartili, Percentili. Prof.ssa T. Laureti a.a

Una statistica è una quantità numerica il cui valore è determinato dai dati.

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

La statistica descrittiva seconda parte. a cura della prof.ssa Anna Rita Valente

Indici di variabilità

Esercitazioni di Statistica

ESERCIZI STATISTICA DESCRITTIVA

Dipartimento di Fisica a.a. 2003/2004 Fisica Medica 2 Indici statistici 22/4/2005

La Sintesi Statistica Una serie di dati numerici è compiutamente descritta da tre proprietà principali: La tendenza centrale o posizione La

Intervalli di confidenza

V. c. multidimensionali e distribuzioni di funzioni di v.c.

Slide Cerbara parte 1. Le medie

Fonti e strumenti statistici per la comunicazione

Misure di tendenza centrale

TEST DI AUTOVALUTAZIONE STATISTICA DESCRITTIVA

Rappresentazioni grafiche

Distribuzioni Statistiche e Medie Esercitazione n 01

ELEMENTI DI STATISTICA DESCRITTIVA

STATISTICA DESCRITTIVA UNIVARIATA

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Transcript:

Probabilità e Statistica Esercitazioni a.a. 009/010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Statistica descrittiva II Ines Campa Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 1

Indici di sintesi Una buona analisi di dati quantitativi richiede anche che le caratteristiche principali delle osservazioni siano sintetizzate con opportune misure e che tali misure siano analizzate. Distinguiamo tra statistiche: misure di sintesi calcolate sulla base di un campione; parametri: misure di sintesi calcolate a partire dall intera popolazione. Noi suddividiamo le statistiche in 1) misure di tendenza centrale: media campionaria, mediana campionaria e moda campionaria; ) misure di variabilità: varianza campionaria e deviazione standard campionaria. Noi suddividiamo i parametri in 1) misure di tendenza centrale: media, mediana e moda; ) misure di variabilità: varianza e scarto quadratico medio. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p.

Misure di tendenza centrale campionarie Definizione 1. Supponiamo di avere un campione di n dati x 1, x,, x n. Si dice media campionaria e si indica con x n x n := n x i Esercizio 1. Si considerino le seguenti altezze in centimetri relative ad un campione di n = 5 persone: x 1 = 170, x = 160, x 3 = 16, x 4 = 174, x 5 = 161 Calcolare la media campionaria. Risoluzione. La media campionaria risulta x 5 = 170+160+16+174+161 centimetri. n 5 = 87 5 = 165.4 Formalizziamo ora il procedimento per il calcolo della media in presenza di una distribuzione di frequenza assoluta o relativa. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 3

freq. ass. x i n i x i n i x 1 n 1 x 1 n 1 x i n i x i n i La media risulta x n = 1 n x k n k x k n k n = k k x i n i k x i n i n i Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 4

La media risulta x n = k x i f i freq. rel. x i f i x i f i x 1 f 1 x 1 f 1 x i f i x i f i x k f k x k f k 1 = k k x i f i f i Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 5

Definizione. La mediana è l osservazione che bipartisce la serie ordinata in senso non decrescente dei dati in due gruppi di ugual numerosità. Nel primo gruppo sono comprese le unità le cui intensità sono al più uguali all intensità della mediana. Nel secondo gruppo sono comprese invece le unità le cui intensità sono almeno uguali a quelle della mediana. REGOLA 1 Se l ampiezza del campione è un numero dispari, la mediana coincide con l osservazione che occupa, nella serie ordinata in senso non decrescente delle osservazioni, la posizione n+1. REGOLA Se l ampiezza del campione è un numero pari, la mediana coincide con la media aritmetica delle osservazioni che occupano, nella serie ordinata in senso non decrescente dei dati, la posizione n e n + 1. Esercizio. Si considerino le seguenti altezze in centimetri relative ad un campione di n = 5 persone: 170, 160, 16, 174, 161 Calcolare la mediana. Risoluzione. 160 < 161 < 16 < 170 < 174 n dispari n+1 = 3. La mediana è Me = x 3 = 16 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 6

Esercizio 3. Si considerino le seguenti altezze in centimetri relative ad un gruppo di n = 6 persone: Calcolare la mediana. 165, 160, 163, 174, 161, 165 Risoluzione. 160 < 161 < 163 < 165 165 < 174 n pari n = 3 e n + 1 = 4. La mediana è Me = x 3+x 4 = 163+165 = 164 Definizione 3. La moda è la modalità che si presenta con maggior frequenza. La sintesi operata dalla moda è adeguata se la sua frequenza rappresenta almeno il 50% dei casi. Esercizio 4. Si considerino le seguenti altezze in centimetri relative ad un campione di n = 5 persone: 165, 160, 163, 174, 161, 165 Calcolare la moda. Risoluzione. La moda è 165. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 7

Esercizio 5. I dati seguenti rappresentano i tempi di vita in ore di un campione di 5 transistor 104 108 118 18 16 110 104 118 104 11 15 11 114 15 110 108 114 110 110 114 110 11 118 104 114 a) determinare media, mediana e moda campionaria. b) determinare le frequenze cumulate assoluta e relative. Risoluzione. a) Calcoliamo la media aritmetica. x 5 = 5 x i 5 = 104 + 108 + 118 + + 118 + 104 + 114 5 = 850 5 = 114 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 8

Compiliamo la seguente tabella Ne segue x i n i x i n i N i F i 104 4 416 4 0.16 108 16 6 0.4 110 5 550 11 0.44 11 1 11 1 0.48 114 4 456 16 0.64 118 3 354 19 0.76 11 4 1 0.84 15 50 3 0.9 16 1 16 4 0.96 18 1 18 5 1 Tot. 5 850 10 x 5 = x i n i 5 = 850 5 = 114, n + 1 = 5 + 1 = 13 x 13 = 114 = Me Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 9

La moda è 110, ma non è rappresentativa perché corrisponde solo al 0% delle osservazioni. b) Vedere N i e F i nella tabella riportata nella pagina precedente. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 10

Esercizio 6. La seguente tabella rappresenta la distribuzione di frequenza della lunghezza di 40 foglie espressa in mm. classi di lunghezza Determinare la media e la classe modale. frequenza (117, 1] 1 (1, 17] (17, 13] (13, 137] 4 (137, 14] 6 (14, 147] 8 (147, 15] 5 (15, 157] 4 (157, 16] (16, 167] 3 (167, 17] 1 (17, 177] totale 40 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 11

Risoluzione. c i n i v ci v ci n i (117, 1] 1 119.5 119.5 (1, 17] 14.5 49 (17, 13] 19.5 59 (13, 137] 4 134.5 538 (137, 14] 6 139.5 837 (14, 147] 8 144.5 1156 (147, 15] 5 149.5 747.5 (15, 157] 4 154.5 618 (157, 16] 159.5 319 (16, 167] 3 164.5 493.5 (167, 17] 1 169.5 169.5 (17, 177] 174.5 349 totale 40 5855 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 1

Ne segue 1 v ci n i x 40 = 40 La classe modale è (14, 147]. = 5855 40 = 146.375. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 13

Misure di posizione " non centrate" Definizione 4. Sia k un numero intero tale che 0 k 100. Assegnato un insieme di dati numerici, ordinati in modo non decrescente, ne esiste uno che è contemporaneamente maggiore o uguale di almeno il k% dei dati, e minore o uguale di almeno il (100 k)% dei dati. Se il dato con queste caratteristiche è unico, esso è per definizione il k-esimo percentile dell insieme di dati considerati. Se invece non è unico, allora sono esattamente due, e in questo caso il k-esimo percentile è definito come la loro media aritmetica. I 3 quartili Q 1, Q e Q 3 dividono la serie ordinata in modo non decrescente dei dati in 4 gruppi di ugual numerosità. I 9 decili D 1, D,, D 9 dividono la serie ordinata in modo non decrescente dei dati in 10 gruppi di ugual numerosità. I 99 centili C 1, C,, C 99 dividono la serie ordinata in modo non decrescente dei dati in 100 gruppi di ugual numerosità. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 14

Esercizio 7. I dati seguenti rappresentano i tempi di vita in ore di un campione di 5 transistor 104 108 118 18 16 110 104 118 104 11 15 11 114 15 110 108 114 110 110 114 110 11 118 104 114 Determinare C 11, D 3, D 7 e Q 1. Risoluzione. Ordiniamo i dati in modo non decrescente x 1 = 104 x = 104 x 3 = 104 x 4 = 104 x 5 = 108 x 6 = 108 x 7 = 110 x 8 = 110 x 9 = 110 x 10 = 110 x 11 = 110 x 1 = 11 x 13 = 114 x 14 = 114 x 15 = 114 x 16 = 114 x 17 = 118 x 18 = 118 x 19 = 118 x 0 = 11 x 1 = 11 x = 15 x 3 = 15 x 4 = 16 x 5 = 18 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 15

Risoluzione. (n + 1) 11 100 = 6 11 100 =.86 C 11 = x + x 3 = 104 + 104 = 104 (n + 1) 3 10 = 6 3 10 = 7.8 D 3 = x 7 + x 8 = 110 + 110 = 110 (n + 1) 7 10 n + 1 4 = 6 7 10 = 18. D 3 = x 18 + x 19 = 6 4 = 6.5 Q 1 = C 5 = x 6 + x 7 = = 118 + 118 108 + 110 = 118 = 109 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 16

Esercizio 8. Il diagramma stem and leaf riporta i giorni di vita di un campione di 19 topi, dopo essere stati sottoposti ad un trattamento radioattivo. Determinare C 15, D 3, D 7 e Q 1. 1 59 89 91 98 35 45 50 56 61 65 66 80 3 43 56 83 4 03 14 8 3 Risoluzione. (n + 1) 15 100 = 0 15 100 = 3 C 15 = x 3 = 191 (n + 1) 3 10 = 0 3 10 = 6 D 3 = x 6 = 45 (n + 1) 7 10 = 0 7 10 = 14 D 3 = x 14 = 356 n + 1 4 = 0 4 = 5 Q 1 = C 5 = x 5 = 35 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 17

Misure di variabilità campionarie Definizione 5. Supponiamo di avere un campione di n dati x 1, x,, x n. Si dice varianza campionaria e si indica con S S := n (x i x n ) n 1 Al denominatore si usa n 1 per renderla una misura adeguata nell inferenza statistica. Definizione 6. Supponiamo di avere un campione di n dati x 1, x,, x n. Si dice scarto quadratico medio campionario e si indica con S la radice quadrata della varianza campionaria: S := n (x i x n ) n 1 Uno dei casi in cui S e S possono essere uguali è quando non c è variabilità nei dati: S = S = 0, l altro è quando S = S = 1. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 18

Esercizio 9. Si considerino le seguenti altezze in centimetri relative ad un campione di n = 5 persone: x 1 = 170, x = 160, x 3 = 16, x 4 = 17, x 5 = 161 Calcolare la varianza campionaria e la deviazione standard campionaria. Risoluzione. La media campionaria risulta x 5 = 170+160+16+17+161 centimetri. Ne segue 5 = 85 5 = 165 S := n (x i x n ) n 1 = (170 165) + (160 165) 4 + + (16 165) + (17 165) + (161 165) 4 = 31 e S = S 5.568 Formalizziamo ora il procedimento per il calcolo della varianza campionaria in presenza di una distribuzione di frequenza assoluta o relativa. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 19

freq. ass. La varianza campionaria risulta x i n i (x i x n ) n i x 1 n 1 (x 1 x n ) n 1 x i n i (x i x n ) n i x k n k (x k x n ) n k n = k n i k (x i x n ) n i S = k (x i x n ) n i. n 1 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 0

freq. rel. La varianza campionaria risulta x i f i (x i x n ) f i x 1 f 1 (x 1 x n ) f 1 x i f i (x i x n ) f i x k f k (x k x n ) f k Tot 1 = k f 1 k (x i x n ) f i S = n n 1 k (x i x n ) f i Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 1

Parametri della popolazione Supponiamo che x 1, x,, x n sia una raccolta di misurazioni numeriche da una intera popolazione. Si definisce Media della popolazione µ := n x i n Varianza della popolazione σ := n (x i µ) Scarto quadratico medio o deviazione standard della popolazione σ := n n (x i µ) n Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p.