Statistica economica. Prof. Alessandra Michelangeli a.a

Documenti analoghi
Statistica economica Capitolo 4

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

STATISTICA 1 ESERCITAZIONE 6

Variabilità o Dispersione Definizione Attitudine di un fenomeno ad assumere diverse modalità

La variabilità. Antonello Maruotti

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Indici di variabilità ed eterogeneità

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

Indici di variabilità relativa

La Variabilità statistica

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Istituzioni di Statistica e Statistica Economica

Statistica Sociale - modulo A

Statistica. Alfonso Iodice D Enza

Variabilità e Concentrazione Esercitazione n 02


Statistica di base per l analisi socio-economica

Esercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

Valori Medi. Docente Dott.ssa Domenica Matranga

Esercitazioni di statistica

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4

Misure di dispersione (o di variabilità)

Lezione 4 a - Misure di dispersione o di variabilità

Variabilità. ..senza variabilità non ci sarebbe la statistica

STATISTICHE DESCRITTIVE Parte II

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

tabelle grafici misure di

Esercitazioni di Statistica

Esercitazioni. Es 1. Dato il seguente dataset

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva

Descrittiva. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali

Statistica Descrittiva Esercitazione 3. Indici di variabilità

Esempio sulla media geometrica

Teoria e tecniche dei test. Concetti di base

Stesso valore medio per distribuzioni diverse

Indici di Dispersione

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Esercitazioni di statistica

Università del Piemonte Orientale. Corsi di Laurea Triennale di Area Tecnica. Corso di Statistica e Biometria

Scale di Misurazione Lezione 2

Nozioni di statistica

SCHEDA DIDATTICA N 7

2. Variabilità mediante il confronto di valori caratteristici della

STATISTICA esercizi svolti sulla VARIABILITA

Esercitazioni del corso ufficiale di Statistica. Ottobre - Novembre Corso di Laurea in Economia Aziendale. Lezione del 09 Novembre

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica

Esempio sulla media geometrica

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Statistica Un Esempio

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità

Corso di Statistica (canale P-Z) A.A. 2009/10 Prof.ssa P. Vicard LA VARIABILITÀ

MISURE DI SINTESI 54

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

Statistica. Alfonso Iodice D Enza

Statistica. Alfonso Iodice D Enza

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche

Questionario 1. Sono assegnati i seguenti dati

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Dispensa di Statistica

Grafici e tabelle permettono di fare valutazioni qualitative, non quantitative. E necessario poter sintetizzare i dati attraverso due importanti

Corso di Statistica. Medie,Moda. Prof.ssa T. Laureti a.a Corso di Statistica a.a DEIM, Univ.TUSCIA - Prof.

Misure di dispersione (o di variabilità)

Indici di eterogeneità e di concentrazione

Esercitazioni di Statistica

Settimana 2. G. M. Marchetti. 4 Marzo 2017

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

Statistica Descrittiva Soluzioni 3. Medie potenziate

Università del Piemonte Orientale. Corso di Laurea in Biotecnologie. Corso di Statistica Medica. Statistica Descrittiva: Variabili numeriche

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

PAROLE CHIAVE Accuratezza, Accuracy, Esattezza, PRECISIONE, Precision, Ripetibilità, Affidabilità, Reliability, Scarto quadratico medio (sqm), Errore

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

A1. La curva normale (o di Gauss)

STATISTICA APPLICATA Prof.ssa Julia Mortera. Concentrazione

Esercizi di statistica descrittiva. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 30

Statistica descrittiva II

STATISTICA 1 ESERCITAZIONE 2

Sintesi numerica di distribuzioni statistiche

Capitolo 3 Sintesi e descrizione dei dati quantitativi

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

Statistica a.a Autovalutazione 1

STATISTICA A-K (2014) Soluzione esercizi da svolgere prima settimana

Statistica Economica Capitolo 2

Esercitazioni di statistica

Statistica. Alfonso Iodice D Enza

ESERCIZI DI RIEPILOGO 1

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

Statistica - Esercitazione 1 Dott. Danilo Alunni Fegatelli

Statistica descrittiva

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012

ESAME. 9 Gennaio 2017 COMPITO B

Capitolo 6. La distribuzione normale

La gestione dei risultati della valutazione. Claudio Mantovani

STATISTICHE DESCRITTIVE

Le medie. Antonello Maruotti

Transcript:

Statistica economica Prof. Alessandra Michelangeli a.a. 202-203

Argomenti della quarta settimana di lezione Sintesi della distribuzione di un carattere Indici di variabilità La variabilità di una distribuzione Indici basati sullo scostamento dalla media Teorema di Chebyshev Teorema di Markov Intervalli di variazione Box-plot Asimmetria Standardizzazione Concentrazione Omogeneità/Eterogeneità Statistica economica a.a. 202/203 2

Variabilitàdi una distribuzione: esempio Consideriamo una popolazione di 4 individui che chiameremo la popolazione A. Il carattere statistico di interesse è il numero di titoli azionari detenuti in portafoglio da ogni individuo. La distribuzione unitaria è riportata nella prima tabella mentre la seconda tabella riporta la distribuzione unitaria per una seconda popolazione che chiameremo popolazione B. Popolazione A Unità statistica # titoli azionari Individuo 0 Individuo 2 8 Individuo 3 2 Individuo 4 20 Popolazione B Unità statistica # titoli azionari Individuo 5 8 Individuo 6 9 Individuo 7 Individuo 8 2 Calcoliamo la media. Che cosa possiamo dire sulla variabilità delle due distribuzioni? Statistica economica a.a. 202/203 3

Variabilitàdi una distribuzione La variabilità di una distribuzione esprime la tendenza delle unità di una popolazione statistica ad assumere diverse modalitàdel carattere. Statistica economica a.a. 202/203 4

Requisiti fondamentali degli indici di variabilità ) Un indice di variabilitàdeve assumere il suo valore minimo se e solo se tutte le unitàdella distribuzione presentano uguale modalità del carattere. 2) Un indice di variabilitàdeve aumentare all aumentare della diversità tra le modalitàassunte dalle varie unità. N.B.Poichéstiamo considerando caratteri quantitativi, la diversitàtra le modalitàviene misurata considerando o il valore assoluto o il quadrato della differenzatra le modalitào tra la singola modalitàe la media. In questo modo, ogni diversità incrementa il valore dell indice. Statistica economica a.a. 202/203 5

Indici basati sullo scostamento dalla media aritmetica Un indice basato sugli scostamenti dalla media aritmetica è la varianza. La varianza di n valori x,x2,...,x n di una variabile X con media aritmetica x è σ 2 = n ( x i x ) 2 n i= Formula per distribuzione unitaria Il numeratore èchiamato devianza: n ( x i x ) i= 2 Statistica economica a.a. 202/203 6

Formula della varianza per distribuzioni di frequenze relative o percentuali Data la distribuzione di frequenze di una variabile X con K modalità, la varianza è data da: 2 σ K ( ) 2 K ( ) 2 nj xj x f j xj x n j= j= = = Formula 2 per distribuzione di frequenze relative σ 2 = K n ( n j x j x ) 2 K = f ( j x j x ) 2 = 00 j = j = K j = p j ( x j x ) 2 Statistica economica a.a. 202/203 Formula 3 per distribuzione di frequenze percentuali 7

Calcolo della varianza secondo la formula Popolazione A Unità statistica # titoli azionari Individuo 0 Individuo 2 8 Individuo 3 2 Individuo 4 20 Distribuzione unitaria x a 4 0 + 8 + 2 + 20 xi n i = 4 = = = 0 2 σ n 2 2 2 2 2 ( xi x) ( ) ( ) ( ) ( ) n i= 4 4 = = 0 0 + 8 0 + 2 0 + 20 0 = 208 = 52 Statistica economica a.a. 202/203 8

Calcolo della varianza secondo la formula Unità statistica Tasso (%) Grecia -6,7 Italia -2,6 Portogallo -,5 Spagna -,8 Tasso di crescita (ahiménegativo) del PIL, anno 202 2 σ n 2 = ( xi x) = n i= x a 4 6, 7 2, 6, 5, 8 xi n i = 4 = = = 3,5 2 2 2 2 = ( 6,7 ( 3,5) ) + ( 2,6 ( 3,5) ) + (,5 ( 3,5) ) + (,8 ( 3,5) ) = 4 = 7,44 = 4,36 4 Statistica economica a.a. 202/203 9

Calcolo della varianza per la distribuzione del numero di agenti inquinanti nell atmosfera Statistica economica a.a. 202/203 0

La varianza si può anche calcolare usando questa formula: σ 2 = n x 2 i ( x ) 2 n i= Formula /bis per distribuzione unitaria La varianza corrisponde quindi alla differenza tra il momento secondo e il momento primo al quadrato. Statistica economica a.a. 202/203

Data la distribuzione di frequenze di una variabile X con K modalità, la formula della varianza diventa: σ K K 2 2 2 2 2 = njxj. x = f jxj x n j= j= Formula 2/bis per σ 2 = K K n n j x 2 j. x 2 = f j x 2 j x 2 = K p 00 j x 2 j. x 2 j = j = j = distribuzione di frequenze relative Statistica economica a.a. 202/203 Formula 3/bis per distribuzione di frequenze percentuali 2

Calcolo della varianza per la distribuzione del numero di agenti inquinanti nell atmosfera usando la formula 2/bis X x j ² f j x j ²*f j 0,0097 0,0097 2 4 0,0097 0,0388 3 9 0,0388 0,3492 4 6 0,0583 0,9328 5 25 0,0874 2,850 6 36 0,65 4,940 7 49 0,65 5,7085 8 64 0,456 9,384 9 8 0,2233 8,0873 0 00 0,0583 5,8300 2 0,0583 7,0543 2 44 0,0388 5,5872 3 69 0,029 4,979 4 96 0,0000 0,0000 5 225 0,0097 2,825 66,40-59,57 = 6,82 Corrisponde al quadrato della media aritmetica. La media aritmetica si chiama anche momento primo, che viene elevato al quadrato nella formula alternativa di calcolo della varianza Statistica economica a.a. 202/203 3

Calcolo della varianza per la distribuzione del numero di abitanti in 03 cittàitaliane. Le modalità sono state suddivise in classi c j p j 25 8,45 4 x = c p = a j j 00 j = 244,74 75 39,4 300 35,92 σ = = 4 2 2 2 p j x x j 00 j= 2 2 2 2 2 = 8,45 ( 25 ) + 39,4 ( 75 ) + 35,92 ( 300 ) + 5,83 ( 750 ) (244,74) = 00 = 53582,93 σ 2 750 5,83 4 2 = p j ( x j x ) = 00 j = 2 2 2 2 = 8, 45 ( 25 244,74 ) + 39, 4 ( 75 244,74 ) + 35, 92 ( 300 244,74 ) + 5, 83 ( 750 244,74 ) = 00 = 53457, 36 Statistica economica a.a. 202/203 4

La varianza di un carattere Y ottenuto dalla trasformazione di un carattere X con media e varianza è: x σ 2 Y = α X + β Var ( ) 2 Y = α 2 σ Statistica economica a.a. 202/203 5

La varianza non possiede la stessa unitàdi misura dei valori della distribuzione. La deviazione standard (o scarto quadratico medio) ha la stessa unitàdi misura della variabile considerata. σ = 2 σ Come per la varianza, maggiore èla variabilitàdelle modalitàdel carattere assunte dalle unitàstatistiche, maggiore èla deviazione standard. Se le unitàstatistiche possiedono tutte la stessa modalità, la deviazione standard e la varianza avranno valore nullo. Statistica economica a.a. 202/203 6

Calcolo della varianza e dello scarto quadratico medio per la distribuzione del numero di abitanti in 03 cittàitaliane. Le modalità sono state suddivise in classi c j p j 25 8,45 4 x = c p = a j j 00 j = 244,74 75 39,4 300 35,92 σ = = 4 2 2 2 p j x x j 00 j= 2 2 2 2 2 = 8,45 ( 25 ) + 39,4 ( 75 ) + 35,92 ( 300 ) + 5,83 ( 750 ) (244,74) = 00 = 53582,93 750 5,83 σ 2 = σ = 39, 89 σ 2 4 2 = p j ( x j x ) = 00 j = 2 2 2 2 = 8, 45 ( 25 244,74 ) + 39, 4 ( 75 244,74 ) + 35, 92 ( 300 244,74 ) + 5, 83 ( 750 244,74 ) = 00 = 53457, 36 2 σ = σ = 39, 74 Statistica economica a.a. 202/203 7

Indici di variabilitàassoluti Deviazione standard e varianza sono indici di variabilità assoluti con la stessa unitàdi misura (elevata al quadrato per la varianza) del carattere statistico. Non èquindi possibile eseguire confronti tra la variabilitàdi caratteri che hanno unitàdi misure diverse come, per esempio, centimetri e grammi. Non ènemmeno corretto eseguire confronti tra la variabilitàdi due caratteri con la stessa unitàdi misura (per esempio i kg) ma osservati in due collettivi caratterizzati da ordini di grandezza diversi (per esempio bambini e adulti). Statistica economica a.a. 202/203 8

Coefficiente di variazione (CV) Per confrontare la variabilità di due distribuzioni per il carattere X con x > 0 può essere utilizzato il coefficiente di variazione: CV = σ 00 x Se la media aritmetica è minore di zero, deve essere considerata in valore assoluto. Statistica economica a.a. 202/203 9

Il Coefficiente di variazione (CV) è una misura della variabilità media di una distribuzione intorno al suo valore medio. Si esprime in termini percentuali in modo da poter confrontare la variabilità di più distribuzioni riferite a caratteri statistici espressi in unità di misura diverse. Tuttavia, il Coefficiente di variazione si utilizza anche per confrontare la variabilità di uno stesso carattere (quindi stessa unità di misura), osservato su popolazioni statistiche diverse. Statistica economica a.a. 202/203 20

Calcolo del coefficiente di variazione (CV) Statistica economica a.a. 202/203 2

Calcolo del coefficiente di variazione (CV) Statistica economica a.a. 202/203 22

Teorema di Chebyshev Data una distribuzione di valori x i dei quali si conoscono solo la media x e la deviazione standard σ e dato un valore reale positivo k, ( x x kσ ) 2 f i k Statistica economica a.a. 20/202 23

Applicazione del teorema di Chebyshev Popolazione con statura media 70 cm e deviazione standard uguale a 20 cm. Qual è la frequenza relativa delle persone con statura superiore o inferiore a 2 volte σ? x 2σ x x + 2σ 30 70 20 La frequenza relativa non è superiore a 0,25 (25% in termini percentuali). Statistica economica a.a. 20/202 24

Considerazioni sul teorema di Chebyshev La rilevanza del teorema di Chebyshev viene meno quando è nota la distribuzione del carattere. In questo caso, infatti, possiamo determinare con esattezza la frequenza relativa delle unità statistiche esterne (o interne) ad un determinato intervallo. x j 3 8 9 5 n j 2 4 9 4 Per il teorema di Chebyshev non più del 44,4% delle unità cade all esterno dell intervallo [2,68; 3,66]. In realtà è il 20% delle osservazioni a cadere all esterno. Statistica economica a.a. 20/202 25

Il Teorema di Chebyshev è molto utile quando la distribuzione del carattere X non è nota. Ma quando quest ultima è conosciuta, allora è meglio usarla direttamente senza ricorrere al teorema per determinare il valore esatto della frequenza con cui le modalità cadono al di fuori di un dato intervallo simmetrico intorno alla media aritmetica. Statistica economica a.a. 202/203 26

Teorema di Markov Data una variabile X che assume solo valori non negativi dei quali è nota la media aritmetica, per un qualsiasi valore a>0 vale f X a ( ) x a Statistica economica a.a. 20/202 27

Applicazione del Teorema di Markov Collettivo statistico: 200 bambini di età compresa tra 0 e 8 anni. Carattere studiato: altezza misurata in cm. Media aritmetica: 75,4 cm. Qual è al massimo la frequenza dei bambini che hanno un altezza maggiore o uguale ai 40 cm? 75, 4 f ( X 40) = 0, 5385 40 Non più del 53,85% dei bambini osservati è alto 40 cm o di più. Statistica economica a.a. 202/203 28

La standardizzazione La standardizzazione è una particolare trasformazione lineare che applicata ai dati originali riconduce qualsiasi variabile X con media x e deviazione standard σx a una nuova variabile con media nulla e varianza unitaria. Ogni osservazione viene trasformata in un nuovo valore: Attenzione, nel manuale viene usata la lettera y al posto di z. z La distribuzione risultante ha media nulla e varianza unitaria. i = x i σ x Statistica economica a.a. 202/203 29

L utilità della standardizzazione: un esempio Due studenti della Scuola di Giurisprudenza della Bicocca, Marco e Piero, sostengono, rispettivamente, l esame di Diritto costituzionale e di Diritto privato con i seguenti risultati: Voto Media dei voti conseguiti nello stesso appello Scarto quadratico medio Scarto quadratico medio Marco 28 26 2, 0,95 Piero 26 2 2,6,92 Marco ha indubbiamente conseguito un voto più alto. Tuttavia tenendo conto dell andamento generale dei due diversi appelli, Piero ha ottenuto un risultato migliore rispetto a Marco. Statistica economica a.a. 202/203 30

Statistica economica a.a. 20/202 3

Statistica economica a.a. 20/202 32

Statistica economica a.a. 20/202 33

Statistica economica a.a. 20/202 34

Intervalli di variazione () Noi studieremo due particolari intervalli di variazione: ) il range o campo di variazione e 2) il range interquartile o differenza interquartile Campo di variazione x x x n 2, Dati n valori ordinati in senso crescente, il campo di variazione è dato dalla differenza tra il valore più grande e il valore più piccolo della distribuzione, R = xn x Quando il carattere è suddiviso in classi, il campo di variazione viene calcolato come differenza tra l estremo superiore dell ultima classe e l estremo inferiore della prima classe. Statistica economica a.a. 202/203 35

Intervalli di variazione (2) Differenza interquartile Dati n valori ordinati in senso crescente, x x x n 2, la differenza interquartile è data dalla differenza tra il terzo e il primo quartile, W = Q 3 Q Ricordando la definizione data dei quartili, possiamo dire che la differenza interquartile rappresenta il campo di variazione per il 50% delle unità centrali ovvero delle unità più vicine alla mediana. La differenza interquartile non è influenzata dalla presenza di valori anomali. Statistica economica a.a. 20/202 36

Asimmetria Una distribuzione è asimmetrica se non è possibile individuare un asse verticale che suddivide la distribuzione in due parti specularmente uguali. Una distribuzione di frequenze è simmetrica se: n = n, n = n, n = n k 2 k j k j+ Statistica economica a.a. 20/202 37

Box-plot o Scatola a baffi Il box-plot è un grafico caratterizzato da tre elementi: ) una linea o punto, che indicano la posizione della mediana della distribuzione; 2) un rettangolo (box) la cui altezza indica la variabilità dei valori prossimi alla mediana; 3) due segmenti che partono dal rettangolo e i cui estremi sono determinati in base ai valori estremi della distribuzione. In genere, come altezza del box, si considera la distanza interquartile e come estremi dei due baffi il valore minimo e massimo osservati. Inoltre, abbiamo sempre evidenziato la media aritmetica attraverso una crocetta. Statistica economica a.a. 202/203 38

Box-plot: esempio N atti aggressivi 2 3 4 5 6 7 8 9 0 frequenza 3 8 30 45 22 2 0 5 2 2 0 8 6 4 2 0 Max = 0 Min = Q3=5 Q=3 Valore mediano: Me=4 Statistica economica a.a. 20/202 39

Ancora sull asimmetria Distribuzione con coda a destra o con asimmetria positiva. La media aritmetica sarà superiore alla mediana. 2 0 8 6 4 2 0 Max = 0 Min = Q3=5 Q=3 Valore mediano: Me=4 Statistica economica a.a. 202/203 40

Carattere equidistribuito Un carattere quantitativo trasferibile X, con n valori osservati, x, x,, x, 2 n è equidistribuitose ognuna delle n unità possiede /n dell ammontare complessivo del carattere, ovvero n x = x = x. i i n i = La somma di tutti gli n valori viene indicata con A dal manuale Se il carattere non è equidistribuito, vi sarà un certo grado di concentrazione del carattere che può essere misurato tramite opportuni indici. Statistica economica a.a. 202/203 4

Massima concentrazione Si ha massima concentrazione quando l intero ammontare del carattere èposseduto da una sola unità della polazione statistica, quindi: x = x =... = x = 0 e x = A. 2 n N.B.Non sempre sono realmente possibili i casi di equidistribuzionee di massima concentrazione (esempio del numero di addetti per impresa). n Statistica economica a.a. 202/203 42

Esempio: il caso del numero di addetti in 20 imprese Popolazione statistica: 20 imprese Carattere statistico: numero di addetti per impresa Media aritmetica del carattere statistico: 6,5 addetti E possibile una situazione di equidistribuzione? NO ma possiamo immaginare una situazione prossima all equidistribuzione come, per esempio, 9 imprese che hanno 6 addetti e la ventesimaimpresa che ne ha 6. N.B. Il numero totale di addetti è30 = 6,5 20 E possibile una situazione di massima concentrazione? Statisticamente si: 9 imprese non hanno addetti e la 20esima neha 30, ma nella realtàle imprese hanno bisogno di almeno un addetto per svolgere la propria attività. Stabilito che in molti casi reali le situazioni di equidistribuzione e di massima concentrazione non si possono verificare, considereremo queste come due situazioni ideali di riferimento dalla quali la situazione osservata si può più o meno discostare (Borra, Di Ciaccio, p. 89). Statistica economica a.a. 202/203 43

Relazione concentrazione/variabilità Tanto più un carattere è concentrato, tanto più elevata è la variabilità del carattere. Se il carattere non è variabile tra le unità statistiche allora la concentrazione è nulla. Statistica economica a.a. 20/202 44

Misure di concentrazione: indice C Consideriamo una carattere quantitativo trasferibile X le cui modalità sono ordinate in senso non decrescente. Indice C C n = i i= ( F Q ), i dove Statistica economica a.a. 202/203 45

Esempio delle 9 emittenti radiofoniche per misurare l indice di concentrazione Popolazione statistica: 9 emittenti radiofoniche, i =,., n Carattere statistico: introiti pubblicitari (in milioni di euro) A Statistica economica a.a. 202/203 i/n 0, 0 3 = 3 3 9 A x = = 8 7 9 A A 0, 0 7 = 3 3 9 + 4 6 A 2 x + x 2 = = 8 7 9 A A 0, 3 = 3 3 9 + 4 6 + 6 9 7 A x + x + x = = 8 7 9 A A 0, 2 4... 0, 8 3 3 3 9 + 4 6 + 6 9 7 + 3 2 0 8 7 9 3 2 3 4 = = = 9 9 i = 4 i = 3 3 9 + 4 6 +... + 8 5 7 + 8 8 9 A = = = 8 7 9 A 8 7 9 A = = = 8 7 9 A A x i A A A x 8 8 i = i 46 A x i

Calcolo dell indice C C n = ( F Q ) = (0, 0,03) + (0, 22 0,07) + (0,33 0,3) + i= i i + (0, 44 0, 24) + (0,56 0,37) + (0,67 0,52) + (0,78 0,67) + + (0,89 0,83) =,8 Statistica economica a.a. 202/203 47

Supponiamo ora che gli introiti pubblicitari siano equidistribuiti tra le 9 emittenti radiofoniche A x i = 879 milioni di euro 879 = = 39,88 milioni di euro 9 L indice C èuguale a zero perché la concentrazione è nulla. Statistica economica a.a. 202/203 48

Supponiamo infine che sola emittente concentri l intero ammontare degli introiti pubblicitari C n = F = 0, + 0, 22 + 0, 33 + i = i + 0, 44 + 0, 56 + 0, 67 + 0, 78 + + 0, 89 = 4 Statistica economica a.a. 202/203 49

Misure di concentrazione: rapporto di concentrazione di Gini Consideriamo una carattere quantitativo trasferibile X le cui modalità sono ordinate in senso non decrescente. Rapporto di concentrazione di Gini R n = F n i F i= i i= ( Q ). i Statistica economica a.a. 202/203 50

Tornando all esempio delle emittenti radiofoniche Rapporto di concentrazione di Gini R n,8 F n i i i= 4 Fi i= = = = ( Q ) 0,295 Statistica economica a.a. 202/203 5

Curva di Lorenz Q, Mediante le coppie i F i è possibile realizzare un grafico chiamato curva di Lorenz Statistica economica a.a. 20/202 52

Omogeneitàed eterogeneità Si ha massima omogeneità quando tutte le unità della popolazione statistica presentano la stessa modalità, per esempio, la j-esima. f = f =... = f = f =... = f = 0 e f = 2 j j+ k j Si ha massima eterogeneità (o minima omogeneità) quando tutte le modalità sono presenti con la stessa frequenza nella popolazione statistica. f = f =... = f =... = f = 2 j k k Statistica economica a.a. 202/203 53

Omogeneità ed Eterogeneità: casi intermedi Un carattere tende a essere distribuito in maniera omogenea se le unità statistiche assumono un numero molto limitato di modalità. Un carattere tende a essere tanto più eterogeneo quanto più le osservazioni tendono ad assumere diverse modalità con frequenza quasi uguale. Statistica economica a.a. 202/203 54

Indice di omogeneità O f n O k k 2 2 = j = 2 j j= n j= = massima omogeneità O = minima omogeneità k + +... + +... + = k = k k k k k k 2 2 2 2 2 2 j k N. B. k = k =... = k =... = k = k 2 j k Statistica economica a.a. 202/203 55

Indice di eterogeneitàdi Gini E O f n E E e k k 2 2 = = j = 2 j j = n j= = = 0 minima eterogeneità k = = massima eterogeneità k k E = k k Statistica economica a.a. 202/203 56

Applicazione dell indice di omogeneità Composizione della Camera: distinzione dei deputati per titolo di studio Titolo di studio (carattere statistico) n j Licenza media Diploma di istruzione secondaria superiore Laurea breve o diploma universitario 86 Laurea 427 anno 2008; Fonte: Competenze parlamentari 6 O 4 2 2 2 2 2 2 n j 2 n j = (630) = = ( + 86 + 6 + 427 ) = 0, 55 O 0,25 minima omogeneità 0,55 max omogeneità Statistica economica a.a. 202/203 57

Applicazione degli indici di eterogeneità Rivalutiamo ora la distribuzione precedente sul titolo dei deputati alla Camera in termini di eterogeneità. E e = O = 0,55 = 0, 45 0, 45 = = 0, 75 0, 6 Il grado di eterogeneitàdella distribuzione corrisponde al 60% del livello di eterogeneità massima E 0 minima eterogeneità 0,45 0,75 max eterogeneità Statistica economica a.a. 202/203 58

Case study di riepilogo: distribuzione dei redditi in Italia Indice di concentrazione di Ginicalcolato sui redditi familiari (dati Banca d Italia, Indagine sui redditi delle famiglie italiane): anno 99: 28,2%; anno 2004: 33,7 anno 200: 35, nel 2009: 29, in Germania e 24, in Svezia (dati Eurostat). La ricchezza netta presenta una concentrazione maggiore di quella del reddito: il 0% delle famiglie più ricche possiede il 45,9% dell intera ricchezza netta delle famiglie italiane (contro il 44,3% registrato nel 2008). L indice di Gini è pari al 62,4% nel 200. Da Banca d Italia (202), I bilanci delle famiglie italiane nell anno 200, Supplementi al Bollettino Statistico, n.6 Statistica economica a.a. 202/203 59

Famiglie Statistica economica a.a. 202/203 Case study(continua) Reddito medio annuo Quota %le di reddito Primo 0% 7.933 2,4 Dal 0 al 20% 3.738 4,2 Dal 20 al 30% 7.433 5,3 Dal 30 al 40% 2.00 6,4 Dal 40 al 50% 24.972 7,7 Dal 50 al 60% 29.500 9 Dal 60 al 70% 34.573 0,6 Dal 70 all 80% 4.252 2,6 Dall 80 al 90% 5.238 5,7 Dal 90 al 00% 85.5 26, 00 Il primo 0% delle famiglie, ordinate in base al reddito, ha il 2,4% dei redditi La quota di reddito delle famiglie appartenenti al 0 decile corrisponde circa alla somma dei primi 5 decili 60

Riferimenti bibliografici e Homework Capitolo 4 del Borra, Di Ciaccio. Gli Scostamenti semplici medi (pp. 80 e 8) non sono in programma. La definizione formale di valore anomali e valori eccedenti non è in programma. La terza formula per calcolare il Rapporto di concentrazione di Gini alla fine di pagina 90 non è in programma. Anche gli argomenti trattati a pag. 9 non rientrano nel programma di esame. Gli indici di omogeneità ed eterogeneità che rientrano nel programma di esame sono O, E ed e. Svolgere esercizi 4.2, 4.6 (gli scostamenti semplici medi dalla media aritmetica e dalla mediana nono sono da calcolare perché non sono in programma), 4.0, 4.3 a pagina 0, 02 e 03 del Borra Di Ciaccio. Gli esercizi sono da consegnare alla docente entro martedi 9 aprile 203. Statistica economica a.a. 202/203 6