Media geometrica La media geometrica di un insieme di n valori positivi x, x 2,, x n di un carattere quantitativo X è pari alla radice n-esima del prodotto dei singoli valori: x g n x x2 K x n Esempio sulla media geometrica Capitale iniziale: 0.000 Investimento in obbligazioni a tasso variabile 2 Qual è il tasso di interesse medio annuo? x 6 g (,05)(,02)(,072)(,09)(,074)(,045),05229
Proprietà della media geometrica - Il prodotto dei valori x, x 2,, x n assunti da un insieme di unità statistiche è pari alla potenza n-esima della media geometrica: x ( ) n x2 K xn xg 2- Il logaritmo della media geometrica è uguale alla media aritmetica dei logaritmi: log x n log ( ) g n x i i 3 Media armonica La media armonica di un insieme di n valori x, x 2,, x n di un carattere quantitativo X è definita da: x a n n i x i 4
Media potenziata di ordine r Si definisce media potenziata di ordine r la radice r-esima della media aritmetica delle potenze r-esime delle osservazioni: x n r r ( x i ) n i r 5 Box-plot 6 32 3 30 29 28 27 26 25 24 23 22 2 20 9 8 7 6 Q 0 8 Q 22 Q 2 24 Q 3 27 Q 4 30 Differenza interquartile Iqr 5 Q 2 -(Iqr,5) 6,5 Q 2 +(Iqr,5) 3,5 Voti
Confronti fra dati statistici Differenza assoluta x 2 x Divario relativo x 2 / x Variazione relativa x2 x x 7 I rapporti statistici Composizione: rapporti di parte al tutto Coesistenza: rapporti tra le frequenze di modalità alternative di uno stesso carattere Derivazione: rapporti tra il numero di eventi in un intervallo di tempo prefissato e la numerosità della popolazione che li ha generati 8
Rapporto di composizione n Calcio /n Totale 2.58/3.4940,866 9 Su 00 atleti 8,66 praticano calcio Esempio sui rapporti di composizione Quanti sono gli individui maschi? 23+2043 E le femmine? 8+028 E nel complesso? 43+284+307 0
Esempio sui rapporti di composizione Qual è la composizione per sesso dell intero gruppo? Maschi Maschi + Femmin e 43 43 + 28 0,6056 Femmin e Maschi + Femmin e 28 43 + 28 0,3944 Esempio sui rapporti di composizione Qual è la composizione del gruppo rispetto al fumo? Fumatori Fumatori + Non fumatori 4 4 + 30 0,5775 Non fumatori Fumatori + Non fumatori 30 4 + 30 0,4225 2
Esempio sui rapporti di composizione Fumano di più i maschi o le femmine? Maschi fumatori Maschi (Fumatori e Non fumatori) 23 23 + 20 0,5349 Femmin e fumatrici Femmine (Fumatrici e Non fumatrici) 8 8 + 0 0,6429 3 Esempio sui rapporti di composizione Tra i fumatori, è più facile trovare un maschio o una femmina? Maschi fumatori Fumatori (Maschi e Femmine) 23 23 + 8 0,560 Femmin e fumatrici Fumatori (Maschi e Femmine) 8 23 + 8 0,4390 4
Rapporto di coesistenza n Calcio /n Tennis 2.58/.0342,4352 5 Su 00 tennisti ci sono 243,52 calciatori Esempio sui rapporti di coesistenza Rapporto di mascolinità Nati Vivi Maschi Nati Vivi Femmin e 322.536 302.269,07 Rapporto di femminilità Nati Vivi Femmin e Nati Vivi Maschi 302.269 322.536 0,94 6
Esempio sui rapporti di coesistenza Rapporto di mascolinità Pop. Re s. Maschile Pop. Re s. Femminile 27.889.9 29.509.97 0,945 7 Esempio sui rapporti di coesistenza Indice di vecchiaia Pop. 65 e + 736.943 Iv 00 00 60,7 Pop. 460.02 0 4 8 Indice di dipendenza degli anziani Pop. 65 e + 736.943 I.a. 00 00 Pop. 2.702.25 d 5 64 27,27
Rapporto di derivazione 27.746 3.899.70 2.320 000 7,2 000 9, 9.243.690 In Emilia-Romagna ci sono 7,2 nati vivi ogni 000 abitanti In Abruzzo ci sono 9,9 nati vivi ogni 000 abitanti 9 Rapporto di derivazione Per confrontare la propensione a trascorrere le vacanze all estero dei turisti di due nazioni A e B, si deve tener conto del fatto che le due nazioni hanno popolazioni numericamente diverse. Si dovrà quindi individuare una grandezza che esprima, per una qualsiasi nazione, quanti turisti si sono recati all estero ogni 000 abitanti. Turisti andati all' estero 000 Popolazione 20
Calcolo di un numero indice 04-feb 05-feb 06-feb 07-feb 08-feb 09-feb 0-feb -feb 2-feb 3-feb PIACENZA 64 44 5 75 75 94 2 06 96 26 PARMA 63 5 47 54 66 03 92 73 68 40 REGGIO NELL'EMILIA 60 46 43 53 53 78 76 7 65 50 MODENA 48 38 54 52 5 97 99 82 96 58 BOLOGNA 70 44 37 59 60 82 69 48 86 60 FERRARA 5 33 43 50 55 06 28 23 50 89 RAVENNA 38 35 46 59 68 93 78 46 59 49 FORLI' 54 n.d. 28 n.d. n.d. 56 76 52 48 44 RIMINI 70 42 4 66 76 86 90 62 4 40 Livelli PM0 Superiore al limite di legge (al 2005) >50 b I t q q t b 2 Entro il limite di legge 0-50 Dato non disponibile n.d. Fonte: www.liberiamolaria.it PM05feb 44 4 febi5feb PM0 70 4feb 0,629 Numeri indici semplici Numeri indici a base fissa Numeri indici a base mobile 22
04-feb 05-feb 06-feb 07-feb 08-feb 09-feb 0-feb -feb 2-feb 3-feb BOLOGNA 70 44 37 59 60 82 69 48 86 60 PM05feb 44 4 febi5feb PM0 70 4feb PM06feb 37 4 febi6feb PM0 70 4feb 0,629 0,529 PM03feb 60 4 febi3feb PM0 70 4feb 0,857 Serie dei numeri indice con base 4 febbraio (%) t 04-feb 05-feb 06-feb 07-feb 08-feb 09-feb 0-feb -feb 2-feb 3-feb 4febI t (%) 00 62.9 52.9 84.3 85.7 7. 98.6 68.6 22.9 85.7 23 Serie dei numeri indice a base mobile Se interessa studiare le variazioni relative di Q da un tempo t - a quello successivo t, si divide ogni valore q t per il precedente q t-, e si ottiene la serie dei numeri indice a base mobile t It q q t t Numero indice a base mobile riferito al tempo t 24 Numero indice a base mobile delle concentrazioni di PM0 t It PM0 PM0 t t
04-feb 05-feb 06-feb 07-feb 08-feb 09-feb 0-feb -feb 2-feb 3-feb BOLOGNA 70 44 37 59 60 82 69 48 86 60 PM0 PM0 44 70 4 febi5feb 5feb 4feb PM06feb 37 5 febi6feb PM0 44 5feb 0,629 0,84 PM03feb 60 2 febi3feb PM0 86 2feb 0,698 Serie dei numeri indice a base mobile (%) t 04-feb 05-feb 06-feb 07-feb 08-feb 09-feb 0-feb -feb 2-feb 3-feb t-i t 25 (%) - 62.9 84. 59.5 0.7 36.7 84.2 69.6 79.2 69.8 Proprietà dei numeri indici semplici Identità t I t Reversibilità delle basi b I t I t b Circolarità s I I t r s r I t 26
La variabilità Il valor medio fornisce una sintesi della distribuzione di un carattere. Accanto agli indici di posizione considerati fino a ora, introduciamo altri indicatori il cui proposito è misurare la attitudine a variare del fenomeno oggetto di studio. L attitudine di un carattere quantitativo X ad assumere valori differenti tra le unità componenti un insieme statistico è chiamata variabilità. 27 La variabilità La terna {S,S2,S3} ha minore variabilità della terna {T,T2,T3}. 28
La variabilità La variabilità costituisce una caratteristica degli insiemi statistici e può essere descritta mediante indicatori che godano di particolari proprietà: una misura di variabilità deve annullarsi quando, e solo quando, tutte le unità del collettivo presentano il medesimo stato di grandezza del carattere una misura di variabilità deve assumere valori crescenti all aumentare della variabilità 29 La variabilità Gli indicatori comunemente adoperati possono essere distinti in tre categorie fondamentali: indicatori che misurano la diversità fra due particolari termini della distribuzione o fra due quartili (intervallo di variabilità, differenza interquartile) indicatori che misurano la dispersione dei valori osservati xi attorno a un valor medio (scostamenti medi) indicatori che misurano le disuguaglianze a due a due fra tutti i valori individuali (differenze medie) 30
Alcune misure di variabilità Sia x x 2 x n l insieme delle osservazioni del carattere X Intervallo di variabilità I v x n x Differenza interquartile W x ¾ x ¼ 3 Intervallo di variabilità e Differenza interquartile Voti 8 Studenti 3 9 5 20 7 2 5 22 0 23 6 24 0 25 6 26 27 6 28 5 29 0 30 4 Totale 88 Intervallo di variabilità x 8 x n 30 x ¼ 22 x ¾ 27 I v 30-8 2 Differenza interquartile W 27-22 5 32
Indicatori di variabilità 33 Consideriamo la serie delle differenze in valore assoluto tra ciascuna unità statistica e le altre. Le due somme, pari a 9 e 40, indicano che il carattere statura presenta nei riguardi del gruppo (S,S2,S3) variabilità minore che non nei riguardi del gruppo (T,T2,T3). Indicatori di variabilità 30 25 20 5 0 5 0-4 -3-2 - 0 2 3 4 x 0 x 2 0 Distrib. Distrib. 2 34
La varianza La varianza di un insieme di n valori osservati x, x 2,, x n di una variabile X con media aritmetica x è data da: σ 2 n n ( xi x) i 2 Il numeratore della varianza è detto devianza: La radice quadrata della varianza è detta deviazione standard: 35 Dev ( x i x) n i 2 s n n ( x i x) i 2 Esempio X Ore di allenamento settimanale n 6 atleti che si preparano a una gara Dati relativi a 4 differenti situazioni Determinare la media aritmetica. 36 La media aritmetica è sempre 9,5
Esempio Per i medesimi protocolli elementari, calcolare intervallo di variazione, devianza, varianza e deviazione standard. x 9,5 37 Esempio In un campione di 28 uomini adulti sono stati rilevati: X Circonferenza del torace (in cm) Y Peso corporeo (in kg) 38 a) Misurare la variabilità di X e Y mediante la deviazione standard b) E maggiore la variabilità di X o quella di Y?
Coefficiente di variazione Cv σ x 2 S(X) x Cvn Cv n 39 Esempio: Distribuzione con outlier 0% 8% 6% 4% 2% 0% 40
Esempio: Asimmetria a destra 0% 8% 6% 4% 2% 0% 4 Esempio: Distribuzione bimodale 0% 8% 6% 4% 2% 0% 42
Esempio Reti segnate in serie A (996/97-2003/2004) % di giornate di campionato 0% 8% 6% 4% 2% 0% 9 2 5 8 2 24 27 30 33 36 Reti segnate in una giornata di campionato 43 Esempio Reti segnate in serie A (996/97-2003/2004) % di giornate di campionato 0% 8% 6% 4% 2% 0% 9 2 5 8 2 24 27 30 33 36 Reti segnate in una giornata di campionato 44
Esempio Reti segnate in serie A (996/97-2003/2004) % di giornate di campionato 0% 8% 6% 4% 2% 0% 9 2 5 8 2 24 27 30 33 36 Reti segnate in una giornata di campionato 45 Curva di densità Una curva di densità è una curva tale che: Si trova sempre sopra o sull asse orizzontale L area sotto di essa è esattamente pari a Una curva di densità rappresenta il modello complessivo di una distribuzione. L area che sta sotto la curva relativamente a un certo intervallo rappresenta la proporzione di tutte le osservazioni che cadono in quell intervallo 46
Esempi di curve di densità Mediana e media Mediana Media 47 Curva di densità: Media e mediana La mediana di una curva di densità è il punto che divide l area sotto la curva esattamente a metà La media di una curva di densità è il punto in cui, se la curva fosse di materiale solido, essa rimarrebbe in equilibrio 48
Distribuzione uniforme altezza 0 Quanto vale la superficie totale sotto questa curva? Quale percentuale di osservazioni è al di sopra di 0,8? Quale percentuale di osservazioni è al di sotto di 0,6? Quale percentuale di osservazioni è fra 0,25 e 0,75? 49 Distribuzione normale x x2 50
Distribuzione normale σ A σ σ B σ A < σ < σ B 5 Distribuzione normale x σ 52
Importanza della Normale Le distribuzioni normali sono ottime rappresentazioni per alcune distribuzioni di dati reali Le distribuzioni normali sono ottime rappresentazioni dei risultati casuali Molte elaborazioni dell inferenza statistica sono basate sulle distribuzioni normali 53 La regola della Normale Nella distribuzione Normale con media x e deviazione standard σ: il 68% delle osservazioni è compreso nell intervallo [ x -σ, x +σ] il 95% delle osservazioni è compreso nell intervallo [ x -2σ, x +2σ] il 99,7% delle osservazioni è compreso nell intervallo [ x -3σ, x +3σ] 54
Standardizzazione Se x è un osservazione da una distribuzione con media x e deviazione standard σ, il valore standardizzato di x è: z x σ x 55 Relazione tra caratteri quantitativi 80 70 60 50 40 30 20 0 00 5 5,2 5,4 5,6 5,8 6 6,2 6,4 6,6 6,8 7 56
Relazione tra caratteri quantitativi x 5,92 y 34,69 40,00 30,00 Scostamenti concordi Scostamenti discordi 20,00 0,00 0,00-0,00-20,00-30,00 Scostamenti discordi Scostamenti concordi -40,00-0,80-0,60-0,40-0,20 0,00 0,20 0,40 0,60 0,80,00 57 Concordanza e Discordanza Due caratteri quantitativi presentano concordanza se la maggior parte degli scostamenti sono concordi Al contrario, sussiste discordanza se la maggior parte degli scostamenti sono discordi Un indice simmetrico per misurare la concordanza o la discordanza è la covarianza 58
La covarianza σ xy n n i ( y y)( x x) i i σ xy Media xy ( ) yx Il numeratore della covarianza è la codevianza 59 Calcolo della covarianza σ xy Media xy ( ) yx x 5,92 y 34,69 σ xy 792,685 5,92 34,69 σ xy 5,268 60
Coefficiente di correlazione lineare r σ σ x xy σ y r Codev Dev x xy Dev y 6 Calcolo di r r σ σ x xy σ y σ xy 5,268 σ x 0,3652 σ xy 6,8267 r 5,268 0,3652 6,8267 0,8573 62
Proprietà di r - r r se tra X e Y sussiste un perfetto legame lineare e i due caratteri sono concordi r - se tra X e Y sussiste un perfetto legame lineare e i due caratteri sono discordi r 0 se i due caratteri sono linearmente indipendenti 63 Regressione 80 70 60 50 40 30 20 0 00 5 5,2 5,4 5,6 5,8 6 6,2 6,4 6,6 6,8 7 64
Parametri della retta di regressione Y b0 + bx b0 y bx b Codev Dev x xy 65 Calcolo dei parametri della retta σ xy 5,268 Dev x,734 x 5,92 y 34,69 Codev xy n σ xy 3 ( 5,268) 68,4846 b Codev 68,4846,734 xy Devx 39,495 b 0 y b x 34,69 ( 39,495) 5,92 368,5 66
La retta di regressione 80 70 y 368,67-39,497x 60 50 40 30 20 0 00 5 5,2 5,4 5,6 5,8 6 6,2 6,4 6,6 6,8 7 67