Esempio sulla media geometrica

Documenti analoghi
1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

Associazione tra caratteri quantitativi: gli indici di correlazione

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Statistica di base per l analisi socio-economica

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

Valori Medi. Docente Dott.ssa Domenica Matranga

REGRESSIONE E CORRELAZIONE

Lezione 4 a - Misure di dispersione o di variabilità

Teoria e tecniche dei test. Concetti di base

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

Statistica. Alfonso Iodice D Enza

Misure di dispersione (o di variabilità)

Capitolo 3 Sintesi e descrizione dei dati quantitativi

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5

Istituzioni di Statistica e Statistica Economica

le scale di misura scala nominale scala ordinale DIAGNOSTICA PSICOLOGICA lezione si basano su tre elementi:

MISURE DI DISPERSIONE

Stesso valore medio per distribuzioni diverse

Esercizi su distribuzioni doppie, dipendenza, correlazione e regressione (Statistica I, IV Canale)

Lezioni di Statistica del 15 e 18 aprile Docente: Massimo Cristallo

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

Esercitazioni di statistica

STATISTICHE DESCRITTIVE Parte II

STATISTICA DESCRITTIVA (variabili quantitative)

Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti

ESERCIZI DI RIEPILOGO 1

Statistica Un Esempio

Statistica. Alfonso Iodice D Enza

LEZIONI DI STATISTICA MEDICA

Esercitazioni di statistica

Statistica Inferenziale

Esercitazione di Statistica Indici di associazione

La Variabilità statistica

Distribuzioni secondo due caratteri. Rappresentazioni e prime sintesi

Indici di variabilità ed eterogeneità

STATISTICHE DESCRITTIVE

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Esercitazione II Statistica e Calcolo delle Probabilità (con soluzioni)

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

MISURE DI SINTESI 54

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Nuovo Ordinamento Esame di Statistica I 24 giugno 2002 Cognome docente: J. Mortera / P. Vicard Nome

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

1/55. Statistica descrittiva

3) In una distribuzione di frequenza si può ottenere più di una moda Vero Falso

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Prefazione Ringraziamenti dell'editore Il sito web dedicato al libro Test online: la piattaforma McGraw-Hill Education Guida alla lettura

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI

SCOPO DELL ANALISI DI CORRELAZIONE

DISTRIBUZIONE NORMALE (1)

Esercizi riepilogativi (dai compiti dell A.A. 2001/02 IV canale)

Statistica descrittiva

Gli indici di variabilità

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Università del Piemonte Orientale Specializzazioni di area sanitaria Statistica Medica

Statistica. Alfonso Iodice D Enza

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

ESERCITAZIONE IV - Soluzioni

Ogni misura è composta di almeno tre dati: un numero, un'unità di misura, un'incertezza.

Esercitazioni di Statistica

ESERCIZI STATISTICA DESCRITTIVA

Questionario 1. Sono assegnati i seguenti dati

METODO DEI MINIMI QUADRATI

DISTRIBUZIONI DOPPIE (ANALISI DESCRITTIVE) Fulvio De Santis a.a Prerequisiti Popolazione, unità, carattere Come nascono i dati:

Esercitazioni di statistica

Il campionamento e l inferenza. Il campionamento e l inferenza

Statistica descrittiva II

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Elementi di statistica

Statistica. Campione

Esercitazioni di statistica

Appendice:Materiali e metodi

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno

Esercitazioni. Es 1. Dato il seguente dataset

GENETICA QUANTITATIVA

Esercitazione: La distribuzione NORMALE

LA DISTRIBUZIONE NORMALE

Esame di Statistica Seconda Prova Parziale Cognome Nome Matricola

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)

Facoltà di Scienze Politiche Corso di laurea in Servizio sociale. Compito di Statistica del 7/1/2003

Università del Piemonte Orientale. Corso di Laurea in Biotecnologie. Corso di Statistica Medica. Statistica Descrittiva: Variabili numeriche

Statistica. Alfonso Iodice D Enza

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva

Transcript:

Media geometrica La media geometrica di un insieme di n valori positivi x, x 2,, x n di un carattere quantitativo X è pari alla radice n-esima del prodotto dei singoli valori: x g n x x2 K x n Esempio sulla media geometrica Capitale iniziale: 0.000 Investimento in obbligazioni a tasso variabile 2 Qual è il tasso di interesse medio annuo? x 6 g (,05)(,02)(,072)(,09)(,074)(,045),05229

Proprietà della media geometrica - Il prodotto dei valori x, x 2,, x n assunti da un insieme di unità statistiche è pari alla potenza n-esima della media geometrica: x ( ) n x2 K xn xg 2- Il logaritmo della media geometrica è uguale alla media aritmetica dei logaritmi: log x n log ( ) g n x i i 3 Media armonica La media armonica di un insieme di n valori x, x 2,, x n di un carattere quantitativo X è definita da: x a n n i x i 4

Media potenziata di ordine r Si definisce media potenziata di ordine r la radice r-esima della media aritmetica delle potenze r-esime delle osservazioni: x n r r ( x i ) n i r 5 Box-plot 6 32 3 30 29 28 27 26 25 24 23 22 2 20 9 8 7 6 Q 0 8 Q 22 Q 2 24 Q 3 27 Q 4 30 Differenza interquartile Iqr 5 Q 2 -(Iqr,5) 6,5 Q 2 +(Iqr,5) 3,5 Voti

Confronti fra dati statistici Differenza assoluta x 2 x Divario relativo x 2 / x Variazione relativa x2 x x 7 I rapporti statistici Composizione: rapporti di parte al tutto Coesistenza: rapporti tra le frequenze di modalità alternative di uno stesso carattere Derivazione: rapporti tra il numero di eventi in un intervallo di tempo prefissato e la numerosità della popolazione che li ha generati 8

Rapporto di composizione n Calcio /n Totale 2.58/3.4940,866 9 Su 00 atleti 8,66 praticano calcio Esempio sui rapporti di composizione Quanti sono gli individui maschi? 23+2043 E le femmine? 8+028 E nel complesso? 43+284+307 0

Esempio sui rapporti di composizione Qual è la composizione per sesso dell intero gruppo? Maschi Maschi + Femmin e 43 43 + 28 0,6056 Femmin e Maschi + Femmin e 28 43 + 28 0,3944 Esempio sui rapporti di composizione Qual è la composizione del gruppo rispetto al fumo? Fumatori Fumatori + Non fumatori 4 4 + 30 0,5775 Non fumatori Fumatori + Non fumatori 30 4 + 30 0,4225 2

Esempio sui rapporti di composizione Fumano di più i maschi o le femmine? Maschi fumatori Maschi (Fumatori e Non fumatori) 23 23 + 20 0,5349 Femmin e fumatrici Femmine (Fumatrici e Non fumatrici) 8 8 + 0 0,6429 3 Esempio sui rapporti di composizione Tra i fumatori, è più facile trovare un maschio o una femmina? Maschi fumatori Fumatori (Maschi e Femmine) 23 23 + 8 0,560 Femmin e fumatrici Fumatori (Maschi e Femmine) 8 23 + 8 0,4390 4

Rapporto di coesistenza n Calcio /n Tennis 2.58/.0342,4352 5 Su 00 tennisti ci sono 243,52 calciatori Esempio sui rapporti di coesistenza Rapporto di mascolinità Nati Vivi Maschi Nati Vivi Femmin e 322.536 302.269,07 Rapporto di femminilità Nati Vivi Femmin e Nati Vivi Maschi 302.269 322.536 0,94 6

Esempio sui rapporti di coesistenza Rapporto di mascolinità Pop. Re s. Maschile Pop. Re s. Femminile 27.889.9 29.509.97 0,945 7 Esempio sui rapporti di coesistenza Indice di vecchiaia Pop. 65 e + 736.943 Iv 00 00 60,7 Pop. 460.02 0 4 8 Indice di dipendenza degli anziani Pop. 65 e + 736.943 I.a. 00 00 Pop. 2.702.25 d 5 64 27,27

Rapporto di derivazione 27.746 3.899.70 2.320 000 7,2 000 9, 9.243.690 In Emilia-Romagna ci sono 7,2 nati vivi ogni 000 abitanti In Abruzzo ci sono 9,9 nati vivi ogni 000 abitanti 9 Rapporto di derivazione Per confrontare la propensione a trascorrere le vacanze all estero dei turisti di due nazioni A e B, si deve tener conto del fatto che le due nazioni hanno popolazioni numericamente diverse. Si dovrà quindi individuare una grandezza che esprima, per una qualsiasi nazione, quanti turisti si sono recati all estero ogni 000 abitanti. Turisti andati all' estero 000 Popolazione 20

Calcolo di un numero indice 04-feb 05-feb 06-feb 07-feb 08-feb 09-feb 0-feb -feb 2-feb 3-feb PIACENZA 64 44 5 75 75 94 2 06 96 26 PARMA 63 5 47 54 66 03 92 73 68 40 REGGIO NELL'EMILIA 60 46 43 53 53 78 76 7 65 50 MODENA 48 38 54 52 5 97 99 82 96 58 BOLOGNA 70 44 37 59 60 82 69 48 86 60 FERRARA 5 33 43 50 55 06 28 23 50 89 RAVENNA 38 35 46 59 68 93 78 46 59 49 FORLI' 54 n.d. 28 n.d. n.d. 56 76 52 48 44 RIMINI 70 42 4 66 76 86 90 62 4 40 Livelli PM0 Superiore al limite di legge (al 2005) >50 b I t q q t b 2 Entro il limite di legge 0-50 Dato non disponibile n.d. Fonte: www.liberiamolaria.it PM05feb 44 4 febi5feb PM0 70 4feb 0,629 Numeri indici semplici Numeri indici a base fissa Numeri indici a base mobile 22

04-feb 05-feb 06-feb 07-feb 08-feb 09-feb 0-feb -feb 2-feb 3-feb BOLOGNA 70 44 37 59 60 82 69 48 86 60 PM05feb 44 4 febi5feb PM0 70 4feb PM06feb 37 4 febi6feb PM0 70 4feb 0,629 0,529 PM03feb 60 4 febi3feb PM0 70 4feb 0,857 Serie dei numeri indice con base 4 febbraio (%) t 04-feb 05-feb 06-feb 07-feb 08-feb 09-feb 0-feb -feb 2-feb 3-feb 4febI t (%) 00 62.9 52.9 84.3 85.7 7. 98.6 68.6 22.9 85.7 23 Serie dei numeri indice a base mobile Se interessa studiare le variazioni relative di Q da un tempo t - a quello successivo t, si divide ogni valore q t per il precedente q t-, e si ottiene la serie dei numeri indice a base mobile t It q q t t Numero indice a base mobile riferito al tempo t 24 Numero indice a base mobile delle concentrazioni di PM0 t It PM0 PM0 t t

04-feb 05-feb 06-feb 07-feb 08-feb 09-feb 0-feb -feb 2-feb 3-feb BOLOGNA 70 44 37 59 60 82 69 48 86 60 PM0 PM0 44 70 4 febi5feb 5feb 4feb PM06feb 37 5 febi6feb PM0 44 5feb 0,629 0,84 PM03feb 60 2 febi3feb PM0 86 2feb 0,698 Serie dei numeri indice a base mobile (%) t 04-feb 05-feb 06-feb 07-feb 08-feb 09-feb 0-feb -feb 2-feb 3-feb t-i t 25 (%) - 62.9 84. 59.5 0.7 36.7 84.2 69.6 79.2 69.8 Proprietà dei numeri indici semplici Identità t I t Reversibilità delle basi b I t I t b Circolarità s I I t r s r I t 26

La variabilità Il valor medio fornisce una sintesi della distribuzione di un carattere. Accanto agli indici di posizione considerati fino a ora, introduciamo altri indicatori il cui proposito è misurare la attitudine a variare del fenomeno oggetto di studio. L attitudine di un carattere quantitativo X ad assumere valori differenti tra le unità componenti un insieme statistico è chiamata variabilità. 27 La variabilità La terna {S,S2,S3} ha minore variabilità della terna {T,T2,T3}. 28

La variabilità La variabilità costituisce una caratteristica degli insiemi statistici e può essere descritta mediante indicatori che godano di particolari proprietà: una misura di variabilità deve annullarsi quando, e solo quando, tutte le unità del collettivo presentano il medesimo stato di grandezza del carattere una misura di variabilità deve assumere valori crescenti all aumentare della variabilità 29 La variabilità Gli indicatori comunemente adoperati possono essere distinti in tre categorie fondamentali: indicatori che misurano la diversità fra due particolari termini della distribuzione o fra due quartili (intervallo di variabilità, differenza interquartile) indicatori che misurano la dispersione dei valori osservati xi attorno a un valor medio (scostamenti medi) indicatori che misurano le disuguaglianze a due a due fra tutti i valori individuali (differenze medie) 30

Alcune misure di variabilità Sia x x 2 x n l insieme delle osservazioni del carattere X Intervallo di variabilità I v x n x Differenza interquartile W x ¾ x ¼ 3 Intervallo di variabilità e Differenza interquartile Voti 8 Studenti 3 9 5 20 7 2 5 22 0 23 6 24 0 25 6 26 27 6 28 5 29 0 30 4 Totale 88 Intervallo di variabilità x 8 x n 30 x ¼ 22 x ¾ 27 I v 30-8 2 Differenza interquartile W 27-22 5 32

Indicatori di variabilità 33 Consideriamo la serie delle differenze in valore assoluto tra ciascuna unità statistica e le altre. Le due somme, pari a 9 e 40, indicano che il carattere statura presenta nei riguardi del gruppo (S,S2,S3) variabilità minore che non nei riguardi del gruppo (T,T2,T3). Indicatori di variabilità 30 25 20 5 0 5 0-4 -3-2 - 0 2 3 4 x 0 x 2 0 Distrib. Distrib. 2 34

La varianza La varianza di un insieme di n valori osservati x, x 2,, x n di una variabile X con media aritmetica x è data da: σ 2 n n ( xi x) i 2 Il numeratore della varianza è detto devianza: La radice quadrata della varianza è detta deviazione standard: 35 Dev ( x i x) n i 2 s n n ( x i x) i 2 Esempio X Ore di allenamento settimanale n 6 atleti che si preparano a una gara Dati relativi a 4 differenti situazioni Determinare la media aritmetica. 36 La media aritmetica è sempre 9,5

Esempio Per i medesimi protocolli elementari, calcolare intervallo di variazione, devianza, varianza e deviazione standard. x 9,5 37 Esempio In un campione di 28 uomini adulti sono stati rilevati: X Circonferenza del torace (in cm) Y Peso corporeo (in kg) 38 a) Misurare la variabilità di X e Y mediante la deviazione standard b) E maggiore la variabilità di X o quella di Y?

Coefficiente di variazione Cv σ x 2 S(X) x Cvn Cv n 39 Esempio: Distribuzione con outlier 0% 8% 6% 4% 2% 0% 40

Esempio: Asimmetria a destra 0% 8% 6% 4% 2% 0% 4 Esempio: Distribuzione bimodale 0% 8% 6% 4% 2% 0% 42

Esempio Reti segnate in serie A (996/97-2003/2004) % di giornate di campionato 0% 8% 6% 4% 2% 0% 9 2 5 8 2 24 27 30 33 36 Reti segnate in una giornata di campionato 43 Esempio Reti segnate in serie A (996/97-2003/2004) % di giornate di campionato 0% 8% 6% 4% 2% 0% 9 2 5 8 2 24 27 30 33 36 Reti segnate in una giornata di campionato 44

Esempio Reti segnate in serie A (996/97-2003/2004) % di giornate di campionato 0% 8% 6% 4% 2% 0% 9 2 5 8 2 24 27 30 33 36 Reti segnate in una giornata di campionato 45 Curva di densità Una curva di densità è una curva tale che: Si trova sempre sopra o sull asse orizzontale L area sotto di essa è esattamente pari a Una curva di densità rappresenta il modello complessivo di una distribuzione. L area che sta sotto la curva relativamente a un certo intervallo rappresenta la proporzione di tutte le osservazioni che cadono in quell intervallo 46

Esempi di curve di densità Mediana e media Mediana Media 47 Curva di densità: Media e mediana La mediana di una curva di densità è il punto che divide l area sotto la curva esattamente a metà La media di una curva di densità è il punto in cui, se la curva fosse di materiale solido, essa rimarrebbe in equilibrio 48

Distribuzione uniforme altezza 0 Quanto vale la superficie totale sotto questa curva? Quale percentuale di osservazioni è al di sopra di 0,8? Quale percentuale di osservazioni è al di sotto di 0,6? Quale percentuale di osservazioni è fra 0,25 e 0,75? 49 Distribuzione normale x x2 50

Distribuzione normale σ A σ σ B σ A < σ < σ B 5 Distribuzione normale x σ 52

Importanza della Normale Le distribuzioni normali sono ottime rappresentazioni per alcune distribuzioni di dati reali Le distribuzioni normali sono ottime rappresentazioni dei risultati casuali Molte elaborazioni dell inferenza statistica sono basate sulle distribuzioni normali 53 La regola della Normale Nella distribuzione Normale con media x e deviazione standard σ: il 68% delle osservazioni è compreso nell intervallo [ x -σ, x +σ] il 95% delle osservazioni è compreso nell intervallo [ x -2σ, x +2σ] il 99,7% delle osservazioni è compreso nell intervallo [ x -3σ, x +3σ] 54

Standardizzazione Se x è un osservazione da una distribuzione con media x e deviazione standard σ, il valore standardizzato di x è: z x σ x 55 Relazione tra caratteri quantitativi 80 70 60 50 40 30 20 0 00 5 5,2 5,4 5,6 5,8 6 6,2 6,4 6,6 6,8 7 56

Relazione tra caratteri quantitativi x 5,92 y 34,69 40,00 30,00 Scostamenti concordi Scostamenti discordi 20,00 0,00 0,00-0,00-20,00-30,00 Scostamenti discordi Scostamenti concordi -40,00-0,80-0,60-0,40-0,20 0,00 0,20 0,40 0,60 0,80,00 57 Concordanza e Discordanza Due caratteri quantitativi presentano concordanza se la maggior parte degli scostamenti sono concordi Al contrario, sussiste discordanza se la maggior parte degli scostamenti sono discordi Un indice simmetrico per misurare la concordanza o la discordanza è la covarianza 58

La covarianza σ xy n n i ( y y)( x x) i i σ xy Media xy ( ) yx Il numeratore della covarianza è la codevianza 59 Calcolo della covarianza σ xy Media xy ( ) yx x 5,92 y 34,69 σ xy 792,685 5,92 34,69 σ xy 5,268 60

Coefficiente di correlazione lineare r σ σ x xy σ y r Codev Dev x xy Dev y 6 Calcolo di r r σ σ x xy σ y σ xy 5,268 σ x 0,3652 σ xy 6,8267 r 5,268 0,3652 6,8267 0,8573 62

Proprietà di r - r r se tra X e Y sussiste un perfetto legame lineare e i due caratteri sono concordi r - se tra X e Y sussiste un perfetto legame lineare e i due caratteri sono discordi r 0 se i due caratteri sono linearmente indipendenti 63 Regressione 80 70 60 50 40 30 20 0 00 5 5,2 5,4 5,6 5,8 6 6,2 6,4 6,6 6,8 7 64

Parametri della retta di regressione Y b0 + bx b0 y bx b Codev Dev x xy 65 Calcolo dei parametri della retta σ xy 5,268 Dev x,734 x 5,92 y 34,69 Codev xy n σ xy 3 ( 5,268) 68,4846 b Codev 68,4846,734 xy Devx 39,495 b 0 y b x 34,69 ( 39,495) 5,92 368,5 66

La retta di regressione 80 70 y 368,67-39,497x 60 50 40 30 20 0 00 5 5,2 5,4 5,6 5,8 6 6,2 6,4 6,6 6,8 7 67