Statistica descrittiva II

Похожие документы
Esercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

Obiettivi Strumenti Cosa ci faremo? Probabilità, distribuzioni campionarie. Stimatori. Indici: media, varianza,

ESERCIZI DI STATISTICA SOCIALE

MISURE DI SINTESI 54

Esercitazioni di statistica

Istituzioni di Statistica e Statistica Economica

Medie. Monia Ranalli. Ranalli M. Medie Settimana # 2 1 / 22

Statistica: principi e metodi. Medie

Indici di Dispersione

Le medie. Antonello Maruotti

Elementi di Statistica

INDICATORI DI TENDENZA CENTRALE

Statistica Elementare

Statistica Un Esempio

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

La sintesi delle distribuzioni

INDICATORI DI TENDENZA CENTRALE

Capitolo 3 Sintesi e descrizione dei dati quantitativi

STATISTICHE DESCRITTIVE

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Statistica. Matematica con Elementi di Statistica a.a. 2017/18

Intervalli di confidenza

Corso di Statistica: ESERCITAZIONI


INDICATORI DI TENDENZA CENTRALE

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Teoria e tecniche dei test. Concetti di base

Variabilità e Concentrazione Esercitazione n 02

Indici di tendenza centrale Media, mediana e moda.

tabelle grafici misure di

4. VALORI CENTRALI. Statistica sociale

STATISTICA: esercizi svolti su MODA, MEDIANA, QUARTILI, DECILI e CENTILI

Questionario 1. Sono assegnati i seguenti dati

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva

Esercizi di statistica descrittiva. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 30

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Statistica descrittiva

4. INDICI DI POSIZIONE

Lezione 4: Indici di posizione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Daniela Tondini

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità

Nozioni di statistica

STATISTICA AZIENDALE Modulo Controllo di Qualità

Statistiche per riassumere i dati

Corso di Statistica. Indici di posizione: Medie,Moda Mediana, Quartili, Percentili. Prof.ssa T. Laureti a.a

Una statistica è una quantità numerica il cui valore è determinato dai dati.

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

La statistica descrittiva seconda parte. a cura della prof.ssa Anna Rita Valente

ESERCIZI STATISTICA DESCRITTIVA

Intervalli di confidenza

Fonti e strumenti statistici per la comunicazione

TEST DI AUTOVALUTAZIONE STATISTICA DESCRITTIVA

Rappresentazioni grafiche

Distribuzioni Statistiche e Medie Esercitazione n 01

STATISTICA DESCRITTIVA UNIVARIATA

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Транскрипт:

Probabilità e Statistica Esercitazioni a.a. 009/010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Statistica descrittiva II Ines Campa Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 1

Indici di sintesi Una buona analisi di dati quantitativi richiede anche che le caratteristiche principali delle osservazioni siano sintetizzate con opportune misure e che tali misure siano analizzate. Distinguiamo tra statistiche: misure di sintesi calcolate sulla base di un campione; parametri: misure di sintesi calcolate a partire dall intera popolazione. Noi suddividiamo le statistiche in 1) misure di tendenza centrale: media campionaria, mediana campionaria e moda campionaria; ) misure di variabilità: varianza campionaria e deviazione standard campionaria. Noi suddividiamo i parametri in 1) misure di tendenza centrale: media, mediana e moda; ) misure di variabilità: varianza e scarto quadratico medio. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p.

Misure di tendenza centrale campionarie Definizione 1. Supponiamo di avere un campione di n dati x 1, x,, x n. Si dice media campionaria e si indica con x n x n := n x i Esercizio 1. Si considerino le seguenti altezze in centimetri relative ad un campione di n = 5 persone: x 1 = 170, x = 160, x 3 = 16, x 4 = 174, x 5 = 161 Calcolare la media campionaria. Risoluzione. La media campionaria risulta x 5 = 170+160+16+174+161 centimetri. n 5 = 87 5 = 165.4 Formalizziamo ora il procedimento per il calcolo della media in presenza di una distribuzione di frequenza assoluta o relativa. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 3

freq. ass. x i n i x i n i x 1 n 1 x 1 n 1 x i n i x i n i La media risulta x n = 1 n x k n k x k n k n = k k x i n i k x i n i n i Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 4

La media risulta x n = k x i f i freq. rel. x i f i x i f i x 1 f 1 x 1 f 1 x i f i x i f i x k f k x k f k 1 = k k x i f i f i Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 5

Definizione. La mediana è l osservazione che bipartisce la serie ordinata in senso non decrescente dei dati in due gruppi di ugual numerosità. Nel primo gruppo sono comprese le unità le cui intensità sono al più uguali all intensità della mediana. Nel secondo gruppo sono comprese invece le unità le cui intensità sono almeno uguali a quelle della mediana. REGOLA 1 Se l ampiezza del campione è un numero dispari, la mediana coincide con l osservazione che occupa, nella serie ordinata in senso non decrescente delle osservazioni, la posizione n+1. REGOLA Se l ampiezza del campione è un numero pari, la mediana coincide con la media aritmetica delle osservazioni che occupano, nella serie ordinata in senso non decrescente dei dati, la posizione n e n + 1. Esercizio. Si considerino le seguenti altezze in centimetri relative ad un campione di n = 5 persone: 170, 160, 16, 174, 161 Calcolare la mediana. Risoluzione. 160 < 161 < 16 < 170 < 174 n dispari n+1 = 3. La mediana è Me = x 3 = 16 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 6

Esercizio 3. Si considerino le seguenti altezze in centimetri relative ad un gruppo di n = 6 persone: Calcolare la mediana. 165, 160, 163, 174, 161, 165 Risoluzione. 160 < 161 < 163 < 165 165 < 174 n pari n = 3 e n + 1 = 4. La mediana è Me = x 3+x 4 = 163+165 = 164 Definizione 3. La moda è la modalità che si presenta con maggior frequenza. La sintesi operata dalla moda è adeguata se la sua frequenza rappresenta almeno il 50% dei casi. Esercizio 4. Si considerino le seguenti altezze in centimetri relative ad un campione di n = 5 persone: 165, 160, 163, 174, 161, 165 Calcolare la moda. Risoluzione. La moda è 165. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 7

Esercizio 5. I dati seguenti rappresentano i tempi di vita in ore di un campione di 5 transistor 104 108 118 18 16 110 104 118 104 11 15 11 114 15 110 108 114 110 110 114 110 11 118 104 114 a) determinare media, mediana e moda campionaria. b) determinare le frequenze cumulate assoluta e relative. Risoluzione. a) Calcoliamo la media aritmetica. x 5 = 5 x i 5 = 104 + 108 + 118 + + 118 + 104 + 114 5 = 850 5 = 114 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 8

Compiliamo la seguente tabella Ne segue x i n i x i n i N i F i 104 4 416 4 0.16 108 16 6 0.4 110 5 550 11 0.44 11 1 11 1 0.48 114 4 456 16 0.64 118 3 354 19 0.76 11 4 1 0.84 15 50 3 0.9 16 1 16 4 0.96 18 1 18 5 1 Tot. 5 850 10 x 5 = x i n i 5 = 850 5 = 114, n + 1 = 5 + 1 = 13 x 13 = 114 = Me Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 9

La moda è 110, ma non è rappresentativa perché corrisponde solo al 0% delle osservazioni. b) Vedere N i e F i nella tabella riportata nella pagina precedente. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 10

Esercizio 6. La seguente tabella rappresenta la distribuzione di frequenza della lunghezza di 40 foglie espressa in mm. classi di lunghezza Determinare la media e la classe modale. frequenza (117, 1] 1 (1, 17] (17, 13] (13, 137] 4 (137, 14] 6 (14, 147] 8 (147, 15] 5 (15, 157] 4 (157, 16] (16, 167] 3 (167, 17] 1 (17, 177] totale 40 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 11

Risoluzione. c i n i v ci v ci n i (117, 1] 1 119.5 119.5 (1, 17] 14.5 49 (17, 13] 19.5 59 (13, 137] 4 134.5 538 (137, 14] 6 139.5 837 (14, 147] 8 144.5 1156 (147, 15] 5 149.5 747.5 (15, 157] 4 154.5 618 (157, 16] 159.5 319 (16, 167] 3 164.5 493.5 (167, 17] 1 169.5 169.5 (17, 177] 174.5 349 totale 40 5855 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 1

Ne segue 1 v ci n i x 40 = 40 La classe modale è (14, 147]. = 5855 40 = 146.375. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 13

Misure di posizione " non centrate" Definizione 4. Sia k un numero intero tale che 0 k 100. Assegnato un insieme di dati numerici, ordinati in modo non decrescente, ne esiste uno che è contemporaneamente maggiore o uguale di almeno il k% dei dati, e minore o uguale di almeno il (100 k)% dei dati. Se il dato con queste caratteristiche è unico, esso è per definizione il k-esimo percentile dell insieme di dati considerati. Se invece non è unico, allora sono esattamente due, e in questo caso il k-esimo percentile è definito come la loro media aritmetica. I 3 quartili Q 1, Q e Q 3 dividono la serie ordinata in modo non decrescente dei dati in 4 gruppi di ugual numerosità. I 9 decili D 1, D,, D 9 dividono la serie ordinata in modo non decrescente dei dati in 10 gruppi di ugual numerosità. I 99 centili C 1, C,, C 99 dividono la serie ordinata in modo non decrescente dei dati in 100 gruppi di ugual numerosità. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 14

Esercizio 7. I dati seguenti rappresentano i tempi di vita in ore di un campione di 5 transistor 104 108 118 18 16 110 104 118 104 11 15 11 114 15 110 108 114 110 110 114 110 11 118 104 114 Determinare C 11, D 3, D 7 e Q 1. Risoluzione. Ordiniamo i dati in modo non decrescente x 1 = 104 x = 104 x 3 = 104 x 4 = 104 x 5 = 108 x 6 = 108 x 7 = 110 x 8 = 110 x 9 = 110 x 10 = 110 x 11 = 110 x 1 = 11 x 13 = 114 x 14 = 114 x 15 = 114 x 16 = 114 x 17 = 118 x 18 = 118 x 19 = 118 x 0 = 11 x 1 = 11 x = 15 x 3 = 15 x 4 = 16 x 5 = 18 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 15

Risoluzione. (n + 1) 11 100 = 6 11 100 =.86 C 11 = x + x 3 = 104 + 104 = 104 (n + 1) 3 10 = 6 3 10 = 7.8 D 3 = x 7 + x 8 = 110 + 110 = 110 (n + 1) 7 10 n + 1 4 = 6 7 10 = 18. D 3 = x 18 + x 19 = 6 4 = 6.5 Q 1 = C 5 = x 6 + x 7 = = 118 + 118 108 + 110 = 118 = 109 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 16

Esercizio 8. Il diagramma stem and leaf riporta i giorni di vita di un campione di 19 topi, dopo essere stati sottoposti ad un trattamento radioattivo. Determinare C 15, D 3, D 7 e Q 1. 1 59 89 91 98 35 45 50 56 61 65 66 80 3 43 56 83 4 03 14 8 3 Risoluzione. (n + 1) 15 100 = 0 15 100 = 3 C 15 = x 3 = 191 (n + 1) 3 10 = 0 3 10 = 6 D 3 = x 6 = 45 (n + 1) 7 10 = 0 7 10 = 14 D 3 = x 14 = 356 n + 1 4 = 0 4 = 5 Q 1 = C 5 = x 5 = 35 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 17

Misure di variabilità campionarie Definizione 5. Supponiamo di avere un campione di n dati x 1, x,, x n. Si dice varianza campionaria e si indica con S S := n (x i x n ) n 1 Al denominatore si usa n 1 per renderla una misura adeguata nell inferenza statistica. Definizione 6. Supponiamo di avere un campione di n dati x 1, x,, x n. Si dice scarto quadratico medio campionario e si indica con S la radice quadrata della varianza campionaria: S := n (x i x n ) n 1 Uno dei casi in cui S e S possono essere uguali è quando non c è variabilità nei dati: S = S = 0, l altro è quando S = S = 1. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 18

Esercizio 9. Si considerino le seguenti altezze in centimetri relative ad un campione di n = 5 persone: x 1 = 170, x = 160, x 3 = 16, x 4 = 17, x 5 = 161 Calcolare la varianza campionaria e la deviazione standard campionaria. Risoluzione. La media campionaria risulta x 5 = 170+160+16+17+161 centimetri. Ne segue 5 = 85 5 = 165 S := n (x i x n ) n 1 = (170 165) + (160 165) 4 + + (16 165) + (17 165) + (161 165) 4 = 31 e S = S 5.568 Formalizziamo ora il procedimento per il calcolo della varianza campionaria in presenza di una distribuzione di frequenza assoluta o relativa. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 19

freq. ass. La varianza campionaria risulta x i n i (x i x n ) n i x 1 n 1 (x 1 x n ) n 1 x i n i (x i x n ) n i x k n k (x k x n ) n k n = k n i k (x i x n ) n i S = k (x i x n ) n i. n 1 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 0

freq. rel. La varianza campionaria risulta x i f i (x i x n ) f i x 1 f 1 (x 1 x n ) f 1 x i f i (x i x n ) f i x k f k (x k x n ) f k Tot 1 = k f 1 k (x i x n ) f i S = n n 1 k (x i x n ) f i Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 1

Parametri della popolazione Supponiamo che x 1, x,, x n sia una raccolta di misurazioni numeriche da una intera popolazione. Si definisce Media della popolazione µ := n x i n Varianza della popolazione σ := n (x i µ) Scarto quadratico medio o deviazione standard della popolazione σ := n n (x i µ) n Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p.