Indici di variabilità relativa

Documenti analoghi
autosnodato auto-treno con rimorchio totale incidenti trattore stradale o motrice auto-articolato

DIFFERENZE REGIONALI NELLA SPESA TERRITORIALE E NEL CONSUMO DEI FARMACI NEI PRIMI NOVE MESI DEL 2012

Lezione 4 a - Misure di dispersione o di variabilità

Esercitazioni di Statistica

STATISTICHE DESCRITTIVE Parte II

Redditi Irpef e Toscana nel 2014 (anno d imposta 2013)

TOTALE DEI RISULTATI DEL CONTO ENERGIA (PRIMO, SECONDO, TERZO, QUARTO E QUINTO CONTO ENERGIA)

Dossier I dati regionali. Dossier Casa I dati regionali. A cura della Direzione Affari Economici e Centro Studi

RIEPILOGO REGIONALE PER SPECIALIZZAZIONE RIEPILOGO REGIONALE PER SPECIALIZZAZIONE

Capitolo 9 La mortalità per incidenti stradali

VALUTAZIONE D IMPATTO DELLE POLITICHE REGIONALI PER LA PROMOZIONE DELL APPROPRIATEZZA ORGANIZZATIVA

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

DIPARTIMENTO AMMINISTRAZIONE PENITENZIARIA UFFICIO STAMPA E RELAZIONI ESTERNE

ESERCIZI. La seguente tabella riporta la classificazione delle famiglie italiane secondo il reddito dichiarato (in milioni di lire) nel 1983:

Il Bilancio elettrico e le fonti rinnovabili in Italia a fine 2010

0,0,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,2,2,2,2,3,3,3, 3,3,3,4,4,4,4,4,4,5,5,6,6,7,8,8, 11

Supplemento ordinario alla GAZZETTA UFFICIALE Serie generale - n.185 NOTE ESPLICATIVE

Unità Carattere Modalità

Calcolo a preventivo della spesa annua escluse le imposte AMBITO TARIFFARIO: CENTRALE (Toscana, Umbria e Marche) (B)

MEDIAZIONE CIVILE EX D.L. 28/2010

Misure di dispersione (o di variabilità)

Siae Società Italiana degli Autori ed Editori Ufficio Statistica

La popolazione del Friuli Venezia Giulia: previsioni

Università di Cassino. Esercitazioni di Statistica 1 del 29 Gennaio Dott. Mirko Bevilacqua

Alunni con Disturbi Specifici di Apprendimento AA.SS. 2010/2011 e 2011/12

A Cura del Servizio Politiche Territoriali della Uil

chimica di base risultati delle indagini settoriali Ministero del Lavoro

Andamento delle procedure di rilascio di immobili ad uso abitativo.

Scuola infanzia e primaria

Osservatorio sul Sommerso. Terzo Rapporto su Economia Sommersa e Lavoro non Regolare in Calabria

Lezione 4. Statistica. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Lezione 4. A. Iodice. Indici di posizione.

Case, indice dei prezzi ancora su a novembre

MISURE DI SINTESI 54

L indagine statistica

I cittadini stranieri nell Italia delle regioni

Esercitazioni di Statistica

ALFID. Associazione Laica Famiglie in Difficoltà

MEDIAZIONE CIVILE EX D.L. 28/2010

COMUNICATO STAMPA. Garanzia Giovani: a cinque settimane dall avvio sono i giovani che si sono registrati

Rapporto Epidemiologico InfluNet

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 21/09/2011

Rapporto Epidemiologico InfluNet

La spesa turistica nelle regioni italiane

Direzione Centrale Affari Legali e Contenzioso

Dimensione socio-demografica. Numerosità e popolazione residente dei comuni italiani, per regione, N comuni. Pop. residente

Il metodo delle proporzioni crescenti

L IMPRESA FEMMINILE IN LIGURIA

Esercitazioni di statistica

Mettiamoci la faccia DATI SULL INIZIATIVA. Situazione al 30 Giugno 2015

MEDIAZIONE CIVILE EX D.L. 28/2010

Prospetto 4.1. Pesi per unità di volume dei principali materiali strutturali

Le imprese giovanili 1 in Piemonte

ADDIZIONALI REGIONALI IRPEF a cura del Servizio Politiche Territoriali della UIL

1,20% 1,10% 1,10% sull intero importo per qualunque reddito 0,90% 0,90% sull intero importo

MEDIAZIONE CIVILE EX D.L. 28/2010

MEDIAZIONE CIVILE EX D.L. 28/2010

Offerta E-Light Gas uso riscaldamento (calcolo a preventivo della spesa annua escluse le imposte)

MEDIAZIONE CIVILE EX D.L. 28/2010

LE ESPORTAZIONI DELLE REGIONI ITALIANE

Si, per Natale si, per Capodanno si, in un altro periodo tra 22 dicembre e 6 gennaio. Sì (totale) no

ESERCIZIO 1. Confrontare, analiticamente e graficamente, la forma e la variabilità delle due distribuzioni. Commentare i risultati ottenuti.

La Lombardia è la regione con il numero maggiore di imprese attive (circa ): la metà sono imprese individuali, ¼ sono società di capitale e ¼

CONFRONTI DELLA DISTRIBUZIONE GROCERY IN REGIONE EMILIA-ROMAGNA CON ALTRE REGIONI E ALTRE NAZIONI EUROPEE

MEDIAZIONE CIVILE EX D.L. 28/2010

17.3 FORMAZIONE AMBIENTALE

RISULTATI DELL INDAGINE CONGIUNTURALE RELATIVA AL II TRIMESTRE 2012

Le differenze nel livello dei prezzi in 20 comuni capoluogo

Le consistenze e la natimortalità

Ministero dell'istruzione, dell'università e della Ricerca Dipartimento per l'istruzione Direzione Generale per il Personale Scolastico

Osservatorio Nazionale Nota trimestrale novembre 2008

Secondo Rapporto annuale Servizi tutela del credito

Le gravidanze gemellari rappresentano l'1-2% di tutte le gravidanze. Per due terzi sono dizigotiche e per un terzo monozigotiche.

Capitolo 5 La mortalità per malattie dell apparato respiratorio

PRESENTAZIONE (DETTA ANCHE PRE-CAMPAGNA) in tutta ITALIA

I PSR delle Regioni italiane: un opportunità per l Innovation Broker Anna Vagnozzi

Le statistiche dell'istat sull'acqua: i dati del territorio

2. Variabilità mediante il confronto di valori caratteristici della

La Rete Ferroviaria FS oggi

LE ESPORTAZIONI DELLE REGIONI ITALIANE

Statistica Applicata all edilizia Lezione 3: i numeri indice

LIVELLO GENERALE DI ILLEGALITÀ

Per la Scuola - competenze e ambienti per l apprendimento

val d aosta piemonte veneto

UTILIZZO DEI DISTRIBUTORI AUTOMATICI

ALIQUOTE DELL ADDIZIONALE REGIONALE ALL'IRPEF per l anno 2015

Gennaio. Aprile In occasione. di lavoro. di trasporto 48. di lavoro Senza mezzo In itinere. mezzo di trasporto 34

Statistica. Alfonso Iodice D Enza iodicede@gmail.com

FACOLTA DI SCIENZE STATISTICHE Corso di laurea in Statistica, Imprese e Mercati Statistica economica (Prof. Filippucci) Prova del 19/12/07

Carta d identità. Delta % Perimetro GRI KPI UM GENERAZIONE

Uni.C.A. UniCredit Cassa Assistenza

fiavet Le vacanze per modalità di prenotazione [Digitare il testo]

La crescita demografica può avere impatti negativi sull ambiente: una popolazione crescente ha bisogno di maggiori quantità di risorse e quindi può

Anno scolastico 2015/2016 PROGRAMMA SVOLTO. Docente: Catini Romina. Materie: Matematica. Classe : 4 L Indirizzo Scientifico Scienze Applicate

Il Dipartimento per le Comunicazioni: uno studio dell età del personale. Miriam Tagliavia Marzo 2011

Progetto IDEL L ISPEZIONE DEL LAVORO NEL CONTRASTO AL LAVORO IRREGOLARE. Le Mappe di rischio come strumento di intelligence per le attività ispettive

CONTINUA IL TREND DI CRESCITA DEI BANDI DI GARA PER LAVORI PUBBLICI NEL CORSO DEL 2015

IL CONTRATTO DI RICOLLOCAZIONE:

I consumi alimentari in Italia in periodo di crisi

Focus Anticipazione sui principali dati della scuola statale A.S. 2015/2016. (Settembre 2015)

Povertà assoluta in Lombardia e nelle regioni del nord Italia - Anno 2014

Transcript:

Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 2014-2015 Indici di variabilità relativa Consentono di effettuare confronti sulla variabilità di fenomeni che presentano unità di misura differenti pur avendo la stessa unità di misura hanno valori medi differenti e quindi distribuzioni differenti Indici percentuali di variabilità o dispersione Sono numeri puri non hanno unità di misura 1

Indici di variabilità relativa Indici percentuali di variabilità o dispersione ottenuti dividendo l indice di variabilità (dispersione) assoluto per la media rispetto alla quale è stato calcolato Coefficiente di variazione CV 100 M Esempio X : Altezza alla nascita di neonati M(X) = 40 cm e (X) = 5 cm Y : Altezza adulti M(Y) = 168 cm e (Y) = 12 cm Qual è la distribuzione dell altezza più variabile? 5 CV( X) 100 10012.5% M 40 12 CV( Y) 100 100 7.14% M 168 La distribuzione dell altezza dei neonati è più variabile di quella degli adulti 2

Altri indici di variabilità Campo di Variazione Range interquartile R Max x ) Min( x ) W Q 3 Q1 ( j j R 0 R=0 non c è variabilità W rappresenta il campo di variazione per il 50% delle unità che si trovano attorno alla mediana: Q 3 e Q 1 sono rispettivamente il terzo e il quarto quartile. Campo di variazione o range : esempio Si ottiene sottraendo il valore più basso del carattere da quello massimo presente nel collettivo. Per esempio, se in un collettivo abbiamo rilevato il reddito mensile di 10 individui, espresso in euro: 1500, 2500, 1000, 900, 3500, 400, 740, 500, 5000, 2000 Il range, dato dalla differenza tra il massimo (5000) e il minimo (400), è pari a 4600 euro. Questo indicatore ci dice che nel collettivo c'è una variabilità tra il valore più alto e quello più basso di 4600 euro, ma non fornisce altre informazioni. 3

Esercizio: campo di variazione o range Tasso occupazione Piemonte 62,39 Valle d'aosta / Vallée d'aoste 66,17 Liguria 60,72 Lombardia 64,86 Trentino Alto Adige / Südtirol 68,33 Provincia Autonoma Bolzano / Bozen 70,84 Provincia Autonoma Trento 65,89 Veneto 63,72 Friuli-Venezia Giulia 63,11 Emilia-Romagna 66,26 Toscana 63,80 Umbria 61,02 Marche 62,40 Lazio 58,76 Abruzzo 53,95 Molise 48,48 Campania 39,17 Puglia 42,14 Basilicata 47,19 Calabria 39,31 Sicilia 39,01 Sardegna 48,55 ADFSC Calcolare il range del carattere tasso di occupazione rilevato nel 2014 nelle regioni italiane. Min=39,01 Max=70,84 R=31,83 Tra le regioni italiane la differenza tra il valore più alto e quello più basso del tasso di occupazione è del 31,83% 24/04/2015 I quartili AA 2014-2015 4

Quartili Considerando come punto di riferimento la mediana: Il Primo quartile Q 1 : modalità che nella graduatoria (crescente o decrescente) bipartisce il 50% delle osservazioni con modalità più piccole o al più uguali alla Me Il Terzo quartile Q 3 : modalità che nella graduatoria (crescente o decrescente) bipartisce il 50% delle osservazioni con modalità più grandi o al più uguali alla Me U.S. A G I F B D L H E M C x j 1 2 3 4 5 6 7 8 9 10 11 Me Q 1 Q 3 Esempio Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti Senza ordine U.S. Affitto U1 40 U2 43 U3 35 U4 33 U5 45 U6 40 U7 36 U8 36 U9 42 U10 38 U11 48 U12 51 U13 39 U14 42 U15 46 U16 59 U17 53 U18 55 U19 42 Ordine crescente Posto U.S. Affitto 1 U4 33 2 U3 35 3 U7 36 4 U8 36 5 U10 38 6 U13 39 7 U1 40 8 U6 40 9 U9 42 10 U14 42 11 U19 42 12 U2 43 13 U5 45 14 U15 46 15 U11 48 16 U12 51 17 U17 53 18 U18 55 19 U16 59 Affitto 33 35 36 36 38 39 40 40 42 42 42 43 45 46 48 51 53 55 59 Primo Quartile è 38 La mediana 42 Terzo Quartile è 48 5

Esempio: mediana e quartili Calcolo di mediana e quartili MEDIANA N 19 N 1 19 1 20 10 2 2 2 Me x x N 1 2 10 42 QUARTILI N 19 4.75 5 4 4 Q 1 x N x5 4 3 N 35 15 4 38 Q3 x N x15 48 3 4 punti vendita. Esercizio Nella tabella seguente è presentata la distribuzione del numero di addetti rilevata sui 116 punti vendita di alcune aziende. Nella tabella seguente è presentatala distribuzione della variabile numero direclami rilevato su Quanti addetti ha il 25% dei punti vendita?( Individuare il primo quartile) E il 75%? (individuare il terzo quartile) Numero addetti Frequenza Frequenza cumulata 10 18 18 12 15 33 14 25 58 16 10 68 18 19 87 29 29 116 totale 116 Percentuale cumulata 15,52 28,45 50,00 58,62 75,00 100,00 Q 1 xn x116 x29 4 4 Q3 x 116 ( x 87 ) 3 4 12 18 6

Range interquartile W Q 3 Q 1 Quantifica l estensione del 50% della distribuzione del carattere che si trova attorno alla mediana: il 50% delle unita statistiche che presentano una modalità prossima a quella centrale. Più ampio è il range interquartile, maggiore è la dispersione delle unità statistiche attorno alla mediana. E espresso nella stessa unità di misura del carattere Non è influenzato dall eventuale presenza di valori estremi o anomali assunti dal carattere nel collettivo in esame. Esempio: Range interquartile Riprendendo l esempio precedente riguardante gli affitti degli studenti Me x 42 Q x x 38 Q x x 48 1 N 5 4 W 48 38 10 N1 2 3 N 15 3 4 Cosa vuol dire? Vuol dire che il 50% degli studenti che pagano un affitto che si attesta intorno al valore mediano (42 euro) si differenziano per al massimo 10 euro. 7

Rappresentare la distribuzione di un carattere: il BoxPlot Valore Massimo Terzo quartile Mediana Primo quartile Valore minimo Box Plot con mediana Rappresentazione grafica della distribuzione di un carattere quantitativo che mette in evidenza la sua variabilità Elementi caratteristici 1 punto che individua la posizione della mediana della distribuzione 1 rettangolo (box) la cui altezza rappresenta il range interquartile: il limite inferiore del rettangolo (LIR) corrisponde al primo quartile, il limite superiore del rettangolo (LSR) corrisponde al terzo quartile 2 segmenti che partono dai lati maggiori del rettangolo e i cui estremi sono rappresentati dai valori minimo e massimo della distribuzione 8

Confronto tra tre distribuzioni: box plot Il grafico fornisce informazioni sulle diverse distribuzioni dei tassi di occupazione, disoccupazione e inattività delle regioni italiane. Visualizza per ciascuno di essi le mediane, i valori minimo e massimo e la dispersione attorno al valore mediano. Consente di rispondere ai seguenti quesiti: -quale tasso assume valori più bassi? -quale i valori più alti? - Per ciascun tasso possiamo stabilire il valore minimo e massimo assunto da almeno la metà delle regioni italiane? -rispetto a quale tasso la situazione delle regioni italiane è più eterogenea? E più omogenea? FSSC a.a 2014-2015 Box Plot con media aritmetica Il Box Plot può essere costruito considerando anche la media aritmetica come punto centrale del rettangolo. In tal caso: L altezza box è paria a 2 L estremo superiore (LSR)= M+ L estremo inferiore (LIR) =M- Gli estremi dei segmenti Superiore=M+1,96 Inferiore=M-1,96 9

Box Plot con media aritmetica: esempio Riprendendo l esempio precedente riguardante gli affitti degli studenti: M=43,32 =6,97 Segmenti: Estremo superiore= M+1,96 =43,32+1,96*6,97=56,98 Estremo inferiore= M-1,96 =43,32-1,96*6,97=29,66 Rettangolo: LSR=Estremo superiore = M+=43,32+6,97=50,29 LSIR=Estremo inferiore= M- =43,32-6,97= 36,35 Costruzione Box Plot : esempio Distribuzione delle nascite in 11 ospedali A B C D E F G H I L M 4 1 0 1 2 8 5 2 1 5 12 Distribuzione ordinata delle nascite in 11 ospedali C B D I E H A G L F M 0 1 1 1 2 2 4 5 5 8 12 Me 2 Q 1 Q 3 5 1 10

Box Plot Terzo quartile Mediana Primo quartile Box Plot con valori anomali Valori anomali: VSS= LSR + (LSR - LIR) = 5 + 1,5 (5-1) = 11 VSI= LIR - (LSR - LIR) = 1-1,5 (5-1) = -5 E anomalo il solo valore 12 dell unità M! Outlier Unità M Terzo quartile Mediana Primo quartile 11

Esercizio Sulla base della tabella seguente un cui viene riportata la distribuzione della variabile numero di cellulari per famiglia. Costruire un box plot considerando come valore medio di riferimento la mediana, controllando la presenza di valori anomali. x j n j 1 75 2 100 3 120 4 95 5 24 6 15 11 10 13 2 441 N j 75 175 295 390 414 429 439 441 P j 17,01 39,68 66,89 88,44 93,88 97,28 99,55 100,00 Me= 3 Q 1 =2 Q 3 =4 VSS= LSR + (LSR - LIR) = 4 + 1,5 (4-2) = 7 VSI= LIR - (LSR - LIR) = 2-1,5 (4-2) = -5 FSSC 24/04/2015 Caratteri qualitativi Indici di eterogeneità o mutabilità Evidenziano e quantificano la presenza di eterogeneità nella distribuzione di un carattere qualitativo. Un indice di mutabilità deve soddisfare le seguenti condizioni: assumere valore 0 se e solo se il collettivo è omogeneo rispetto al carattere considerato; crescere, assumendo valori maggiori di 0, all aumentare dell eterogeneità tra le modalità del carattere. Si possono distinguere due situazioni estreme: mutabilità nulla, tutte le unità presentano la medesima modalità del carattere mutabilità massima quando tutte le unità presentano modalità differenti del carattere oppure le diverse modalità del carattere hanno le stesse frequenze. Reclami verso due gestori dì telefonia per motivo Gestore A Gestore B Gestore C Copertura nazionale 200 600 200 Costi 200 0 150 Piano tariffario 200 0 250 Totale 600 600 600 12

Caratteri qualitativi Indice di eterogeneità di Gini Reclami verso due gestori dì telefonia per motivo (freq. Assolute) Gestore A Gestore B Gestore C Copertura nazionale 200 600 200 Costi 200 0 150 Piano tariffario 200 0 250 Totale 600 600 600 Reclami verso due gestori dì telefonia per motivo (freq. Relative) Gestore A Gestore B Gestore C Copertura nazionale 0,33 1,00 0,33 Costi 0,33 0,00 0,25 Piano tariffario 0,33 0,00 0,42 Totale 1,00 1,00 1,00 Caratteri qualitativi Indice di eterogeneità di Gini normalizzato Assume sempre valori compresi tra 0 (caso di eterogeneità nulla) e 1 (caso di eterogeneità massima) Può essere utilizzato per operare confronti del medesimo carattere osservato su collettivi differenti, con numerosità diversa, o tra distribuzioni di caratteri differenti osservati sul medesimo collettivo K = numero di modalità Nel nostro esempio K = 3 13

Caratteri qualitativi Indice di eterogeneità esercizio Date le seguenti distribuzioni di frequenze riguardanti la rilevazione delle vendite degli stessi prodotti in due supermercati differenti, indicare in quale supermercato le vendite sono più eterogenee rispetto alle marche dei prodotti considerati. Numero di prodotti venduti per marca Supermercato A Supermercato B n i Barilla 1200 360 Buitoni 870 230 Divella 360 220 Voiello 580 230 Totale 3010 1040 n j Calcolo 14