Probabilità e Statistica Esercitazioni a.a. 009/010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Statistica descrittiva II Ines Campa Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 1
Indici di sintesi Una buona analisi di dati quantitativi richiede anche che le caratteristiche principali delle osservazioni siano sintetizzate con opportune misure e che tali misure siano analizzate. Distinguiamo tra statistiche: misure di sintesi calcolate sulla base di un campione; parametri: misure di sintesi calcolate a partire dall intera popolazione. Noi suddividiamo le statistiche in 1) misure di tendenza centrale: media campionaria, mediana campionaria e moda campionaria; ) misure di variabilità: varianza campionaria e deviazione standard campionaria. Noi suddividiamo i parametri in 1) misure di tendenza centrale: media, mediana e moda; ) misure di variabilità: varianza e scarto quadratico medio. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p.
Misure di tendenza centrale campionarie Definizione 1. Supponiamo di avere un campione di n dati x 1, x,, x n. Si dice media campionaria e si indica con x n x n := n x i Esercizio 1. Si considerino le seguenti altezze in centimetri relative ad un campione di n = 5 persone: x 1 = 170, x = 160, x 3 = 16, x 4 = 174, x 5 = 161 Calcolare la media campionaria. Risoluzione. La media campionaria risulta x 5 = 170+160+16+174+161 centimetri. n 5 = 87 5 = 165.4 Formalizziamo ora il procedimento per il calcolo della media in presenza di una distribuzione di frequenza assoluta o relativa. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 3
freq. ass. x i n i x i n i x 1 n 1 x 1 n 1 x i n i x i n i La media risulta x n = 1 n x k n k x k n k n = k k x i n i k x i n i n i Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 4
La media risulta x n = k x i f i freq. rel. x i f i x i f i x 1 f 1 x 1 f 1 x i f i x i f i x k f k x k f k 1 = k k x i f i f i Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 5
Definizione. La mediana è l osservazione che bipartisce la serie ordinata in senso non decrescente dei dati in due gruppi di ugual numerosità. Nel primo gruppo sono comprese le unità le cui intensità sono al più uguali all intensità della mediana. Nel secondo gruppo sono comprese invece le unità le cui intensità sono almeno uguali a quelle della mediana. REGOLA 1 Se l ampiezza del campione è un numero dispari, la mediana coincide con l osservazione che occupa, nella serie ordinata in senso non decrescente delle osservazioni, la posizione n+1. REGOLA Se l ampiezza del campione è un numero pari, la mediana coincide con la media aritmetica delle osservazioni che occupano, nella serie ordinata in senso non decrescente dei dati, la posizione n e n + 1. Esercizio. Si considerino le seguenti altezze in centimetri relative ad un campione di n = 5 persone: 170, 160, 16, 174, 161 Calcolare la mediana. Risoluzione. 160 < 161 < 16 < 170 < 174 n dispari n+1 = 3. La mediana è Me = x 3 = 16 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 6
Esercizio 3. Si considerino le seguenti altezze in centimetri relative ad un gruppo di n = 6 persone: Calcolare la mediana. 165, 160, 163, 174, 161, 165 Risoluzione. 160 < 161 < 163 < 165 165 < 174 n pari n = 3 e n + 1 = 4. La mediana è Me = x 3+x 4 = 163+165 = 164 Definizione 3. La moda è la modalità che si presenta con maggior frequenza. La sintesi operata dalla moda è adeguata se la sua frequenza rappresenta almeno il 50% dei casi. Esercizio 4. Si considerino le seguenti altezze in centimetri relative ad un campione di n = 5 persone: 165, 160, 163, 174, 161, 165 Calcolare la moda. Risoluzione. La moda è 165. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 7
Esercizio 5. I dati seguenti rappresentano i tempi di vita in ore di un campione di 5 transistor 104 108 118 18 16 110 104 118 104 11 15 11 114 15 110 108 114 110 110 114 110 11 118 104 114 a) determinare media, mediana e moda campionaria. b) determinare le frequenze cumulate assoluta e relative. Risoluzione. a) Calcoliamo la media aritmetica. x 5 = 5 x i 5 = 104 + 108 + 118 + + 118 + 104 + 114 5 = 850 5 = 114 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 8
Compiliamo la seguente tabella Ne segue x i n i x i n i N i F i 104 4 416 4 0.16 108 16 6 0.4 110 5 550 11 0.44 11 1 11 1 0.48 114 4 456 16 0.64 118 3 354 19 0.76 11 4 1 0.84 15 50 3 0.9 16 1 16 4 0.96 18 1 18 5 1 Tot. 5 850 10 x 5 = x i n i 5 = 850 5 = 114, n + 1 = 5 + 1 = 13 x 13 = 114 = Me Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 9
La moda è 110, ma non è rappresentativa perché corrisponde solo al 0% delle osservazioni. b) Vedere N i e F i nella tabella riportata nella pagina precedente. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 10
Esercizio 6. La seguente tabella rappresenta la distribuzione di frequenza della lunghezza di 40 foglie espressa in mm. classi di lunghezza Determinare la media e la classe modale. frequenza (117, 1] 1 (1, 17] (17, 13] (13, 137] 4 (137, 14] 6 (14, 147] 8 (147, 15] 5 (15, 157] 4 (157, 16] (16, 167] 3 (167, 17] 1 (17, 177] totale 40 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 11
Risoluzione. c i n i v ci v ci n i (117, 1] 1 119.5 119.5 (1, 17] 14.5 49 (17, 13] 19.5 59 (13, 137] 4 134.5 538 (137, 14] 6 139.5 837 (14, 147] 8 144.5 1156 (147, 15] 5 149.5 747.5 (15, 157] 4 154.5 618 (157, 16] 159.5 319 (16, 167] 3 164.5 493.5 (167, 17] 1 169.5 169.5 (17, 177] 174.5 349 totale 40 5855 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 1
Ne segue 1 v ci n i x 40 = 40 La classe modale è (14, 147]. = 5855 40 = 146.375. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 13
Misure di posizione " non centrate" Definizione 4. Sia k un numero intero tale che 0 k 100. Assegnato un insieme di dati numerici, ordinati in modo non decrescente, ne esiste uno che è contemporaneamente maggiore o uguale di almeno il k% dei dati, e minore o uguale di almeno il (100 k)% dei dati. Se il dato con queste caratteristiche è unico, esso è per definizione il k-esimo percentile dell insieme di dati considerati. Se invece non è unico, allora sono esattamente due, e in questo caso il k-esimo percentile è definito come la loro media aritmetica. I 3 quartili Q 1, Q e Q 3 dividono la serie ordinata in modo non decrescente dei dati in 4 gruppi di ugual numerosità. I 9 decili D 1, D,, D 9 dividono la serie ordinata in modo non decrescente dei dati in 10 gruppi di ugual numerosità. I 99 centili C 1, C,, C 99 dividono la serie ordinata in modo non decrescente dei dati in 100 gruppi di ugual numerosità. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 14
Esercizio 7. I dati seguenti rappresentano i tempi di vita in ore di un campione di 5 transistor 104 108 118 18 16 110 104 118 104 11 15 11 114 15 110 108 114 110 110 114 110 11 118 104 114 Determinare C 11, D 3, D 7 e Q 1. Risoluzione. Ordiniamo i dati in modo non decrescente x 1 = 104 x = 104 x 3 = 104 x 4 = 104 x 5 = 108 x 6 = 108 x 7 = 110 x 8 = 110 x 9 = 110 x 10 = 110 x 11 = 110 x 1 = 11 x 13 = 114 x 14 = 114 x 15 = 114 x 16 = 114 x 17 = 118 x 18 = 118 x 19 = 118 x 0 = 11 x 1 = 11 x = 15 x 3 = 15 x 4 = 16 x 5 = 18 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 15
Risoluzione. (n + 1) 11 100 = 6 11 100 =.86 C 11 = x + x 3 = 104 + 104 = 104 (n + 1) 3 10 = 6 3 10 = 7.8 D 3 = x 7 + x 8 = 110 + 110 = 110 (n + 1) 7 10 n + 1 4 = 6 7 10 = 18. D 3 = x 18 + x 19 = 6 4 = 6.5 Q 1 = C 5 = x 6 + x 7 = = 118 + 118 108 + 110 = 118 = 109 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 16
Esercizio 8. Il diagramma stem and leaf riporta i giorni di vita di un campione di 19 topi, dopo essere stati sottoposti ad un trattamento radioattivo. Determinare C 15, D 3, D 7 e Q 1. 1 59 89 91 98 35 45 50 56 61 65 66 80 3 43 56 83 4 03 14 8 3 Risoluzione. (n + 1) 15 100 = 0 15 100 = 3 C 15 = x 3 = 191 (n + 1) 3 10 = 0 3 10 = 6 D 3 = x 6 = 45 (n + 1) 7 10 = 0 7 10 = 14 D 3 = x 14 = 356 n + 1 4 = 0 4 = 5 Q 1 = C 5 = x 5 = 35 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 17
Misure di variabilità campionarie Definizione 5. Supponiamo di avere un campione di n dati x 1, x,, x n. Si dice varianza campionaria e si indica con S S := n (x i x n ) n 1 Al denominatore si usa n 1 per renderla una misura adeguata nell inferenza statistica. Definizione 6. Supponiamo di avere un campione di n dati x 1, x,, x n. Si dice scarto quadratico medio campionario e si indica con S la radice quadrata della varianza campionaria: S := n (x i x n ) n 1 Uno dei casi in cui S e S possono essere uguali è quando non c è variabilità nei dati: S = S = 0, l altro è quando S = S = 1. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 18
Esercizio 9. Si considerino le seguenti altezze in centimetri relative ad un campione di n = 5 persone: x 1 = 170, x = 160, x 3 = 16, x 4 = 17, x 5 = 161 Calcolare la varianza campionaria e la deviazione standard campionaria. Risoluzione. La media campionaria risulta x 5 = 170+160+16+17+161 centimetri. Ne segue 5 = 85 5 = 165 S := n (x i x n ) n 1 = (170 165) + (160 165) 4 + + (16 165) + (17 165) + (161 165) 4 = 31 e S = S 5.568 Formalizziamo ora il procedimento per il calcolo della varianza campionaria in presenza di una distribuzione di frequenza assoluta o relativa. Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 19
freq. ass. La varianza campionaria risulta x i n i (x i x n ) n i x 1 n 1 (x 1 x n ) n 1 x i n i (x i x n ) n i x k n k (x k x n ) n k n = k n i k (x i x n ) n i S = k (x i x n ) n i. n 1 Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 0
freq. rel. La varianza campionaria risulta x i f i (x i x n ) f i x 1 f 1 (x 1 x n ) f 1 x i f i (x i x n ) f i x k f k (x k x n ) f k Tot 1 = k f 1 k (x i x n ) f i S = n n 1 k (x i x n ) f i Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p. 1
Parametri della popolazione Supponiamo che x 1, x,, x n sia una raccolta di misurazioni numeriche da una intera popolazione. Si definisce Media della popolazione µ := n x i n Varianza della popolazione σ := n (x i µ) Scarto quadratico medio o deviazione standard della popolazione σ := n n (x i µ) n Probabilità e Statistica - Esercitazioni - a.a. 009/010 Statistica descrittiva II - Ines Campa - p.