Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini antonio.azzollini@unibas.it Anno accademico 2018/2019
Diagramma delle frequenze relative Si chiama diagramma delle frequenze relative un diagramma cartesiano costruito con i punti medi delle classi di modalità e le frequenze relative. (10,14) (14,18) (18,22) (22,26) (26,30) (30,34) 12 16 20 24 28 32 0,17 0,30 0,30 0,10 0,10 0,03 0,35 0,263 0,175 0,088 0 (10,14) (14,18) (18,22) (22,26) (26,30) (30,34) Modello teorico
Effetto dell'aumento delle classi Criticità: al crescere del numero delle classi le frequenze relative si abbassano e laddove non sono nulle, si avvicinano al valore 1/30 (fanno eccezione la classe contenente la modalità 12,9 e quella contenente la modalità 18,3: perchè?)
Regola empirica In una distribuzione di frequenza, le frequenze assolute non devono essere tutte troppo piccole! Linea guida: mai considerare raggruppamenti con frequenze assolute tutte al di sotto di 5!
Istogramma delle densità Si definisce densità il rapporto fra la frequenza relativa e l ampiezza della classe di modalità 0,17 / 4 = 0,04 0,09 [10.14) [14.18) [18.22) [22.26) [26.30) [30.34] 0,04 0,08 0,08 0,03 0,03 0,01 0,068 0,045 0,023 0 Vantaggi: A. Stessa forma dell istogramma costruito con le frequenze assolute B. La somma delle aree dei rettangoli è 1. 4 [10;14) [14;18) [18;22) [22;26) [26;30) [30;34] 5 30 4 + 9 30 4 +!+ 1 30 4 = 1
Alla ricerca di un modello teorico Al crescere del numero delle classi (decrescere della ampiezza h) il profilo del diagramma non si schiaccia
Alla ricerca di un modello teorico Allo scopo di costruire un modello teorico, capace di esprimere le densità di frequenze di intervalli di ampiezza arbitrariamente piccola, i grafici che stiamo costruendo costituiscono una approssimazione.
Alla ricerca di un modello teorico Allo scopo di costruire un modello teorico, capace di esprimere le densità di frequenze di intervalli di ampiezza arbitrariamente piccola, i grafici che stiamo costruendo costituiscono una approssimazione. A tale scopo, sarà necessario:
Alla ricerca di un modello teorico Allo scopo di costruire un modello teorico, capace di esprimere le densità di frequenze di intervalli di ampiezza arbitrariamente piccola, i grafici che stiamo costruendo costituiscono una approssimazione. A tale scopo, sarà necessario: 1. considerare classi sempre più numerose e di ampiezza sempre minore 2. "riempire i buchi" laddove l'istogramma delle densità presenta densità nulle
Alla ricerca di un modello teorico Allo scopo di costruire un modello teorico, capace di esprimere le densità di frequenze di intervalli di ampiezza arbitrariamente piccola, i grafici che stiamo costruendo costituiscono una approssimazione. A tale scopo, sarà necessario: 1. considerare classi sempre più numerose e di ampiezza sempre minore 2. "riempire i buchi" laddove l'istogramma delle densità presenta densità nulle aumentare la taglia
Confronti Gli istogrammi di densità permettono di confrontare insiemi di dati diversi Esempio: si vuole confrontare il risultato della prima scuola con quello di un altra in cui i dati sono forniti mediante un campione di 26 studenti. 25,8; 23,2; 10,1; 24,2; 21,0; 22,3; 15,1; 22,4; 28,3; 25,7; 19,8; 21,4; 17,7; 19,3; 18,2; 21,5; 23,3; 24,3; 20,9; 27,0; 22,3; 20,9; 21,1; 25,1; 23,9; 21,1. [10;14) [14;18) [18;22) [22;26) [26;30] 1 2 10 11 2
Confronti In generale il confronto non si riesce a fare perché A. Si riferiscono a taglie diverse. B. Le classi di modalità hanno ampiezza diversa. C. Gli assi sono tarati diversamente.
Confronti Il modo corretto di confrontare i due insiemi di dati è: A. costruire un istogramma delle densità per ciascuna scuola; B. uniformare asse x e asse y. Conclusioni: nella II scuola si studia in generale di più anche se nella prima ci sono degli "sgobboni"!
Diagramma delle frequenze cumulate Nella scuola del Signor X quale percentuale di studenti intervistati trascorre meno di 15 ore a studiare? Un primo diagramma associa a ciascun elemento del campione la percentuale di dati che assume un valore uguale o inferiore ad esso. Proprietà: 1) È funzione non decrescente. 2) Assume valori tra 0 e 1. Come si calcola?
Diagramma delle frequenze cumulate 1. Gli elementi del campione vanno ordinati. 15,0; 23,7; 19,7; 15,4; 18,3; 23,0; 14,2; 20,8; 13,5; 20,7; 17,4; 18,6; 12,9; 20,3; 13,7; 21,4; 18,3; 29,8; 17,1; 18,9; 10,3; 26,1; 15,7; 14,0; 17,8; 33,8; 23,2; 12,9; 27,1; 16,6. 10,3; 12,9; 12,9; 13,5; 13,7; 14,0; 14,2; 15,0; 15,4; 15,7; 16,6; 17,1; 17,4; 17,8; 18,3; 18,3; 18,6; 18,9; 19,7; 20,3; 20,7; 20,8; 21,4; 23,0; 23,2; 23,7; 26,1; 27,1; 29,8; 33,8. 2. Agli elementi (senza ripetizioni) vanno associate le frequenze cumulate. Dati ordinati Frequenze cumulate 10,3 1/30 12,9 3/30 13,5 4/30 13,7 5/30 18,3 16/30
A cosa serve? Per rispondere al quesito iniziale: Nella scuola del Signor X quale percentuale di studenti intervistati trascorre meno di 15 ore a studiare? 0,26 Si traccia una linea verticale in corrispondenza di 15 ore fino ad incontrare il grafico (rosso) e poi si traccia una linea orizzontale fino ad incontrare l asse delle y.
A cosa serve? Ma si può rispondere anche al quesito inverso: Nella scuola del Signor X quante ore (al più) trascorre a studiare il 50% degli studenti meno volenterosi? Circa 18 ore. Possiamo essere più precisi? 0,50 Ispezionando il campione casuale e determinando quel valore che divide il campione casuale in due parti. (si veda capitolo successivo) Si traccia una linea orizzontale in corrispondenza di 0,5 fino ad incontrare il grafico (rosso) e poi si traccia una linea verticale in basso fino ad incontrare l asse delle x.
si applicano ai caratteri quantitativi, sia intervallari che razionali. Esse sono misure sintetiche che consentono il passaggio da una pluralità di informazioni ad una sola modalità. Fra tutti i tipi di medie si distinguono: medie lasche o di posizione determinate in base alla frequenza o alla posizione occupata nella graduatoria delle osservazioni individuali. (Esempi: Mediana, Quartili, Moda) medie analitiche calcolate con operazioni algebriche sui valori del carattere (Esempi: Media aritmetica, media geometrica, media armonica).
La media aritmetica Essa si applica solo ai caratteri quantitativi. Stabilisce l indice centrale dei dati: si calcola dalla somma di valori numerici presi in considerazione diviso la loro numerosità. La media aritmetica insieme di una distribuzione statistica { } x 1, x 2,, xn n di un carattere quantitativo considerato su una popolazione è data dalla seguente formula ( ) = 1 Nn µ = 1 n x 1 + x 2 +!+ x n N N Nn i=1 x i Per la media aritmetica si usa la notazione della popolazione. X quando è riferita ad un campione
La media aritmetica Osserviamo che: Per il suo calcolo vengono utilizzati tutti i valori. Un insieme di dati possiede una sola media aritmetica. La media aritmetica risente di eventuali valori anomali. Se ai dati viene aggiunta una costante, la media risulta traslata di quella costante.
La media aritmetica Osserviamo che: Per il suo calcolo vengono utilizzati tutti i valori. Un insieme di dati possiede una sola media aritmetica. La media aritmetica risente di eventuali valori anomali. Se ai dati viene aggiunta una costante, la media risulta traslata di quella costante.
La media aritmetica Osserviamo che: Per il suo calcolo vengono utilizzati tutti i valori. Un insieme di dati possiede una sola media aritmetica. La media aritmetica risente di eventuali valori anomali. Se ai dati viene aggiunta una costante, la media risulta traslata di quella costante.
La media aritmetica { } { } µ = 22 X = 1,2,3,4,5 X = 1,2,3,4,100 { } µ = µ = 3 X = 1,2,3,4,15 X = 1,2,3,4,1000 5 { } µ = 202 La media aritmetica non è una statistica robusta!
La media aritmetica Osserviamo che: Per il suo calcolo vengono utilizzati tutti i valori. Un insieme di dati possiede una sola media aritmetica. La media aritmetica risente di eventuali valori anomali. Se ai dati viene aggiunta una costante, la media risulta traslata di quella costante.
La media aritmetica Esempio: per i dati (3,4,8) la media è 5 Esempio: aggiungendo il valore 2, i dati diventano (5,6,10) e la media è 5+2=7 Esempio: calcolando la somma delle differenze fra ciascun valore e la media si ha (3-5)+(4-5)+(8-5)=0
La media aritmetica Osserviamo che: Per il suo calcolo vengono utilizzati tutti i valori. Un insieme di dati possiede una sola media aritmetica. La media aritmetica risente di eventuali valori anomali. Se ai dati viene aggiunta una costante, la media risulta traslata di quella costante. La somma delle differenze fra ciascun valore osservato e la media è nulla (ossia la somma degli scarti è nulla) Nn ( x i - µ )=0 i=1
La media aritmetica Esempio: per i dati (3,4,8) la media è 5 Esempio: calcolando la somma delle differenze fra ciascun valore e la media si ha (3-5)+(4-5)+(8-5)=0
La media aritmetica In riferimento ad un carattere trasferibile, si dice ammontare del carattere la somma dei valori individuali (che quindi non varia al trasferirsi di una modalità da una unità individuale all'altra). La media aritmetica è quella costante che, sostituita a ciascun valore individuale della distribuzione del carattere. Infatti { } x 1, x 2,, x nn, lascia invariato l ammontare µ = 1 Nn Nn Nn x x i i i=1 1=1 = Nnµ A m m o n t a r e d e l l a distribuzione originale A m m o n t a r e d e l l a distribuzione di sole µ
La media aritmetica Supponendo che un dato x i si ripeta con frequenza Nn i {x 1, x 2,, x k 1 k N Nn j =,, k j=1 N La media aritmetica si ottiene attraverso la formula µ = 1 n N k i=1 n i x i N
La media aritmetica Popolazione in esame: 88 studenti iscritti al corso di Economia Carattere osservato: voto conseguito all esame di statistica X = 29,29,24,20,22,28,19,19,21,26,20,24,21,19,25, 25,23,28,22,29,26,23,28,30,20,27,22,27,20,24, 25,18,26,29,29,23,23,24,22,25,27,26,23,18,19, 26,22,25,20,26,22,24,20,22,21,29,30,19,24,24, 26,26,29,30,29,25,28,26,22,27,27,29,26,26,22, 27,24,29,30,20,24,24,21,18,22,28,23,21 µ = 29 + 29 + 24 +!+ 28 + 23+ 21 88 = 24,32
Media aritmetica per una distribuzione di frequenze x i n i x X = x i 1 i Nn i n i 1 18 3 54 2 19 5 95 3 20 7 140 4 21 5 105 5 22 10 220 6 23 6 138 7 24 10 240 8 25 6 150 9 26 11 286 10 27 6 162 11 28 5 140 12 29 10 290 13 30 4 120 Totale 88 2.140 La media aritmetica µ = T n = 1 n { } con (con gli elementi ripetuti) T = Nn x i i=1 k X = x n n volte, n = n j N j N j N j=i N (con N k elementi distinti) k j=i N=88 Nn j x j = 2.140 88 = 24,32
La media aritmetica per classi di modalità Ricordate la distribuzione statistica relativa al numero di ore settimanali trascorse a studiare? 15,0; 23,7; 19,7; 15,4; 18,3; 23,0; 14,2; 20,8; 13,5; 20,7; 17,4; 18,6; 12,9; 20,3; 13,7; 21,4; 18,3; 29,8; 17,1; 18,9; 10,3; 26,1; 15,7; 14,0; 17,8; 33,8; 23,2; 12,9; 27,1; 16,6.
La media aritmetica per classi di modalità Ricordate la distribuzione statistica relativa al numero di ore settimanali trascorse a studiare? 15,0; 23,7; 19,7; 15,4; 18,3; 23,0; 14,2; 20,8; 13,5; 20,7; 17,4; 18,6; 12,9; 20,3; 13,7; 21,4; 18,3; 29,8; 17,1; 18,9; 10,3; 26,1; 15,7; 14,0; 17,8; 33,8; 23,2; 12,9; 27,1; 16,6. La media è µ = (15,0+23,7+19,7+...+27,1+16,6)/30=19
La media aritmetica per classi di modalità Ricordate la distribuzione statistica relativa al numero di ore settimanali trascorse a studiare? 15,0; 23,7; 19,7; 15,4; 18,3; 23,0; 14,2; 20,8; 13,5; 20,7; 17,4; 18,6; 12,9; 20,3; 13,7; 21,4; 18,3; 29,8; 17,1; 18,9; 10,3; 26,1; 15,7; 14,0; 17,8; 33,8; 23,2; 12,9; 27,1; 16,6. La media è µ = (15,0+23,7+19,7+...+27,1+16,6)/30=19 Come calcoleremmo la media se i dati ci fossero forniti attraverso una distribuzione per classi di frequenza?
La media aritmetica per classi di modalità µ = centri delle classi frequenze assolute taglia Prima scuola Classi [10;14) [14;18) [18;22) [22;26) [26;30) [30;34] Centri Classi Frequ enze 12 16 20 24 28 32 5 9 9 3 3 1 (12x5)+(16x9)+(20x9)+...+(32x1) ) + ( 16,5 +!+ 32,5 µ = 12,5 5 30 = 119,1
La media aritmetica per classi di modalità µ = centri delle classi frequenze assolute taglia Prima scuola Classi [10;14) [14;18) [18;22) [22;26) [26;30) [30;34] Centri Classi Frequ enze 12 16 20 24 28 32 5 9 9 3 3 1 (12x5)+(16x9)+(20x9)+...+(32x1) ) + ( 16,5 +!+ 32,5 µ = 12,5 5 30 = 119,1 Osserviamo che la media è pressappoco la stessa: è un caso?
La media pesata La media pesata (o ponderata) di un insieme di numeri a ciascuno dei quali sia assegnato un coefficiente (peso) è data dalla seguente formula: π = numeri pesi pesi Materia CFU Voto Materia CFU Voto Materia CFU voto Matematica generale Voto medio di uno studente alla fine del primo anno del corso di economia 6 21 Diritto privato 10 26 Economia aziendale 10 27 Economia politica 10 25 Economia e Gestione delle imprese 10 23 Geografia economica 6 27 π = 1 52 ( 6 21+10 25 +10 26 +10 23+10 27 + 6 27) = 24,96 µ = 1 6 ( 21+ 25 + 26 + 23+ 27 + 27) = 24,83
La media pesata Rientra nel caso della media pesata la media di una distribuzione di frequenze del tipo: #Stanze #Appartamenti 1 300 2 500 3 2.000 4 3.000 5 150 6 100 7 300 L a f r e q u e n z a assoluta con la quale si presenta ciascuna modalità p u ò e s s e r e interpretata come peso. π = 1 6350 ( 1 300 + 2 500 +!+ 7 300) = 3,58 µ = 1 7 ( 1+ 2 + 3+ 4 + 5 + 6 + 7) = 4
La media geometrica La media geometrica di un insieme di numeri è la radice n-esima del loro prodotto: σ = n x 1 x 2!x n Viene utilizzata quando si vuole analizzare il variare di un fenomeno nel tempo, come ad esempio il tasso di variazione dei prezzi o i tassi di rendimento di capitali. La media geometrica è tale che σ σ! σ = x 1 x 2! x n n volte
La media geometrica Esempio. Un impiegato ha ricevuto un 5% di aumento di stipendio nel 2014 e un 15% di aumento nell anno successivo. Quant è la percentuale di crescita media? 5% di aumento da 100 a 105 15% di aumento da 100 a 115 parametri: 1,05 e 1,15 σ 2 = 1,15 1,05 = 1,09886 L aumento medio è del 9,89% L impiegato che all inizio del 2014 aveva fine del 2015 ha 1,05 1,15 = 1,21 1, alla fine del 2014 ha1,05 ed alla σ σ = 1,05 1,15
La media armonica La media armonica di un insieme di numeri è l inverso della media aritmetica degli inversi. Serve per esempio a ricavare un valore centrale sulla velocità per dati che si riferiscono ad intervalli temporali diversi. δ = n n i=1 1 x i. La media armonica è tale che 1 δ + 1 δ +!+ 1 δ = 1 x 1 + 1 x 2 +!+ 1 x n
La media armonica Esempio. Si determini la velocità media di un quartetto di staffetta 4X100 sapendo che le velocità medie individuali osservate sono, in m/s V1=9,60, V2=10,05, V3=10,00, V4=10,10.
La media armonica Esempio. Si determini la velocità media di un quartetto di staffetta 4X100 sapendo che le velocità medie individuali osservate sono, in m/s V1=9,60, V2=10,05, V3=10,00, V4=10,10. Per mostrare che la velocità media si calcola attraverso la media armonica, si osservi che VM = spazio totale/tempo totale.
La media armonica Esempio. Si determini la velocità media di un quartetto di staffetta 4X100 sapendo che le velocità medie individuali osservate sono, in m/s V1=9,60, V2=10,05, V3=10,00, V4=10,10. Per mostrare che la velocità media si calcola attraverso la media armonica, si osservi che VM = spazio totale/tempo totale. Lo spazio totale è 4x100=400, mentre i tempi sono T1=100/V1, T2=100/V2, T3=100/V3, T4=100/V4
La media armonica Esempio. Si determini la velocità media di un quartetto di staffetta 4X100 sapendo che le velocità medie individuali osservate sono, in m/s V1=9,60, V2=10,05, V3=10,00, V4=10,10. Per mostrare che la velocità media si calcola attraverso la media armonica, si osservi che VM = spazio totale/tempo totale. Lo spazio totale è 4x100=400, mentre i tempi sono T1=100/V1, T2=100/V2, T3=100/V3, T4=100/V4 Dunque VM = numeri 4x100 pesi T1+T2+T3 pesi +T4
La media armonica Esempio. Si determini la velocità media di un quartetto di staffetta 4X100 sapendo che le velocità medie individuali osservate sono, in m/s V1=9,60, V2=10,05, V3=10,00, V4=10,10. Per mostrare che la velocità media si calcola attraverso la media armonica, si osservi che VM = spazio totale/tempo totale. Lo spazio totale è 4x100=400, mentre i tempi sono T1=100/V1, T2=100/V2, T3=100/V3, T4=100/V4 Dunque VM = numeri 4x100 pesi numeri 4x100 pesi = T1+T2+T3 pesi +T4 T1+T2+T3 1 pesi r +T4 + 1 = + + V1 x 1 V2 x 2 V3 V4 100 100 100 100 1 4 + 1 + V1 x 1 V2 x 2 1 + 1 + V3 x 1 V4 x 2
La media armonica vs la media aritmetica Esempio. Si determini la velocità media di quattro persone che, una dopo l altra, corrono per 2 secondi rispettivamente con velocità medie, in m/s V1=9,60, V2=10,05, V3=10,00, V4=10,10. Per mostrare che la velocità media questa volta si calcola attraverso la media aritmetica, si osservi che VM = spazio totale/tempo totale. Il tempo totale è 4x2=8, mentre gli spazi sono S1=V1T1=9,60 x 2, S2=V2T2=10,05 x 2, S3=V3T3=10,00 x 2, S4=V4T4=10,10 x 2 Dunque VM = S1+S2+S3+S4 numeri pesi V1 x2+ V2 x2+ V3 x2+v4 x2 = = 4x2 pesi 4x2 pesi pesi si si V1 + V2 + V3 + V4 pesi 4 pesi