Statistica 1 A.A. 2015/2016
|
|
|
- Caterina Volpi
- 9 anni fa
- Visualizzazioni
Transcript
1 Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 81
2 La variabilità: esiste la Statistica perché il mondo è vario Introduzione Nell immaginario popolare la Statistica è spesso associata alla famosa poesia di Trilussa:... te tocca un pollo all anno e, se non entra nelle spese tue t entra ne la statistica lo stesso perch é c è un antro che ne magna due... Trilussa aveva ragione: la media aritmetica tra 0 (polli mangiati dal protagonista della poesia) e 2 (polli mangiati all antro della poesia) è proprio 1! L esempio precedente mostra che esistono situazioni in cui la media aritmetica fornisce informazioni che contraddicono la realtà. 2 / 81
3 Di seguito vengono riportati i redditi medi mensili rilevati su cinque famiglie residenti al Nord, su cinque famiglie residenti al Centro e su cinque famiglie residenti al Sud. Nord Centro Sud Sulla base della descrizione del fenomeno, possiamo utilizzare le medie secondo Chisini per sintetizzare i dati; dato che il fenomeno ha natura additiva si ricava che possiamo utilizzare la media aritmetica semplice: x n = = 1200 x c = = 1200 x s = = / 81
4 Il livello di rappresentatività di una media L esempio precedente mostra che i tre campioni (Nord, Centro e Sud) sono indistinguibili mediante l utilizzo della sola misura di tendenza centrale. In questo caso ha senso chiedersi se x sintetizza in ugual modo i campioni considerati. A tal fine consideriamo i quadrati degli scarti tra i valori osservati e le medie calcolate: (x i x) 2 Nord Centro Sud L esempio precedente mostra che la misura di tendenza centrale utilizzata è un ottima misura di sintesi quando studiamo i redditi delle famiglie residenti al nord; in questo caso i valori rilevati sono molto vicini alla propria media aritmetica semplice. Quando consideriamo i campioni provenienti dal centro e dal sud, si osserva che la capacità di sintesi della media aritmetica semplice si riduce (i valori osservati si allontanano dalla propria misura di tendenza centrale). 4 / 81
5 Definizione La variabilità esprime la tendenza delle unità statistiche ad assumere diverse modalità del carattere. Le costanti sintetiche sviluppate per misurare la variabilità prendono il nome di indici di variabilità. Gli indici di variabilità si dividono in due grosse categorie: indici di variabilità assoluta; indici di variabilità relativa; 5 / 81
6 Gli indici di variabilità assoluta Tutti gli indici di variabilità assoluta soddisfano le seguenti proprietà: i. risultano nulli se e solo se tutti gli x i sono uguali fra loro; ii. assumono valori positivi se i valori x i risultano diversi fra di loro. I valori degli indici risultano tanto più elevati quanto più elevata è la variabilità fra le x i ; iii. ogni indice risulta invariante per traslazione: il valore fornito dall indice non cambia se si aggiunge una costante a ciascun x i ; iv. la misura di variabilità è espressa nella stessa unità di misura dei valori x i. 6 / 81
7 Gli indici di variazione Gli indici di variazione trovano applicazione quando la serie statistica deriva da osservazioni fatte su n unità statistiche distinte. In questo contesto le medie di riferimento traggono origine dalla definizione di Chisini e dalla natura del fenomeno oggetto di studio. Se si assume che il fenomeno ha natura additiva, la famiglia di indici a cui si perviene ha espressione n V m = m i=1 x i x a m, (1) n dove m è una quantità maggiore di zero. Gli indici che si ricavano dall espressione (1) al variare del parametro m prendono il nome di indici di variazione. 7 / 81
8 Per m = 1, dalla generica espressione si ricava l indice di variazione n V m = m i=1 x i x a m, n n i=1 V 1 = x i x a n il quale prende il nome di scostamento o scarto semplice medio dalla media. L indice V 1 misura di quanto in media semplice i valori x i si scostano dalla media aritmetica semplice. 8 / 81
9 Per m = 2, dalla generica espressione si ricava l indice di variazione n V m = m i=1 x i x a m, n V 2 = n i=1 (x i x a ) 2 il quale prende il nome di scarto quadratico medio (o deviazione standard). L indice V 2 misura di quanto in media quadratica quadratica i valori x i si scostano dalla media aritmetica semplice. n 9 / 81
10 Il quadrato dell indice V 2, ovvero: n V2 2 i=1 = (x i x a ) 2 n è noto in letteratura come varianza. Benché la varianza non sia un indice di variabilità, dato che è espressa nel quadrato dell unità di misura dei dati, essa svolge un ruolo centrale nella costruzione di diverse metodologie statistiche sia descrittive che inferenziali. Il numeratore della varianza, ovvero prende il nome di devianza. Dev x = n (x i x a ) 2 i=1 10 / 81
11 Di seguito vengono riportati i redditi mensili rilevati su 10 famiglie Calcolare gli indici di variazione per m uguale ad 1 e / 81
12 Per facilitare il calcolo degli indici richiesti consideriamo la seguente tabella. x i x i x a x i x a (x i x a ) Da cui si ricava che il reddito medio mensile è pari a Gli indici di variazione sono uguali a V 1 = 23.14/10 = (scostamento semplice medio dalla media) V 2 = 76.40/10 = 2.76 (scarto quadratico medio) 12 / 81
13 La relazione che segue consente di ottenere una formula utile per il calcolo dello scarto quadratico medio. Consideriamo la varianza: n V2 2 i=1 = (x i x a ) 2 n [ n ] = 1 (xi 2 + x a 2 2x i x a ) = n i=1 ( n ) = = 1 n n xi 2 + x a 2 2x i x a n ( n = 1 n i=1 ( n = 1 n i=1 i=1 x 2 i x 2 i i=1 + n x 2 a 2 x a + n x 2 a 2n x 2 a i=1 ) n x i = i=1 ) = n i=1 x 2 i n x 2 a. La formula precedente prende il nome di formula ridotta per il calcolo della varianza. 13 / 81
14 Applicando la formula ridotta per il calcolo della varianza si ricava quindi x i xi x a = = V 2 = = / 81
15 La formula degli indici di variazione V m = m n i=1 x i x a m n viene applicata quando si dispone di una serie statistica di valori. Quando si dispone solamente della distribuzione di frequenze in classi, si ricorre alla sua versione ponderata: n V m = m i=1 x i c x a m n i n = m n i=1 x c i x a m f i dove xi c sono i valori centrali delle classi, n i sono le frequenze assolute e x a è la media aritmetica ponderata. Osservazione: in questo caso la formula ridotta della varianza diventa n V2 2 i=1 = (x i c)2 n i x a 2. n dove x a è la media aritmetica ponderata. 15 / 81
16 Esempio: il 22 gennaio 2015, l ISTAT ha reso noti i dati relativi al fatturato dell industria per l anno Di seguito è riportata la distribuzione di frequenze del fatturato rilevato su un campione di 56 aziende. Fatturato n i Tot. 56 Calcolare la più adeguata misura di tendenza centra e di variabilità. 16 / 81
17 Dato che i dati sono rilevati su 53 aziende differenti, utilizzeremo l approccio secondo Chisini per la scelta della misura di tendenza centrale. In questo caso calcoleremo la media aritmetica ponderata e valuteremo la variabilità tramite lo scarto quadratico medio. Consideriamo la seguente tabella da cui si ricava Fatturato n i x c i x c i n i (x c i )2 (x c i )2 n i Tot x a = = V 2 = = = / 81
18 Gli indici di dispersione Gli indici di dispersione fanno riferimento a dati che derivano da misure ripetute della stessa grandezza incognita X e quindi affetti da errore. Sotto ipotesi di additività della componente erratica (ɛ i ) il modello x i = X + ɛ i, consente di definite la migliore combinazione dei dati, denotata con x p 1, che minimizza la funzione di perdita dell informazione. La quantità x p 1 viene definita media decisionale. 18 / 81
19 In presenza di dati derivanti da misure ripetute (dati omogenei), la variabilità dei dati può essere misurata mediante uno degli indici appartenenti alla famiglia parametrica degli indici di dispersione n σ p = p i=1 x i x p 1 p, (2) n dove il parametro p > 0 dipende dalla natura probabilistica degli errori accidentali. 19 / 81
20 Osservazione E importante osservare che, benché la formula degli indici di dispersione, ovvero n σ p = p i=1 x i x p 1 p, n sia molto simile alla formula degli indici di variazione n V m = m i=1 x i x a m, n esiste una differenza sostanziale tra di loro: nella formula degli indici di dispersione la scelta del parametro p influenza anche la scelta del valore medio ( x p 1 ); negli indici di variazione la media aritmetica semplice ( x a ) è sempre utilizzare come valore medio indipendentemente dal valore del parametro m. 20 / 81
21 Indice di dispersione σ p = p n i=1 x i x p 1 p n Per p = 1 si ricava l indice di dispersione n i=1 σ 1 = x i x 0 n il quale prende il nome di scostamento o scarto semplice medio dalla mediana. L indice σ 1 misura di quanto in media semplice i valori x i si scostano dal valore mediano. Indice di variazione n V m = m i=1 x i x a m, n Per m = 1 si ricava l indice di variazione n i=1 V 1 = x i x a n il quale prende il nome di scostamento o scarto semplice medio dalla media. L indice V 1 misura di quanto in media semplice i valori x i si scostano dalla media aritmetica semplice. 21 / 81
22 Indice di dispersione σ p = p n i=1 x i x p 1 p n Per p = 2 si ricava l indice di dispersione n i=1 (x i x 1 ) 2 σ 2 = il quale prende il nome di scarto quadratico medio (o deviazione standard). L indice σ 2 misura di quanto in media quadratica quadratica i valori x i si scostano dalla media aritmetica semplice. n Indice di variazione n V m = m i=1 x i x a m, n Per m = 2 si ricava l indice di variazione n i=1 (x i x a ) 2 V 2 = il quale prende il nome di scarto quadratico medio (o deviazione standard). L indice V 2 misura di quanto in media quadratica quadratica i valori x i si scostano dalla media aritmetica semplice. n Note: dato il ruolo centrale dello scarto quadratico medio e della varianza, si è soliti semplificare la notazione utilizzando i simboli σ e σ / 81
23 Quando p +, dalla formula σ p = p n i=1 x i x p 1 p n si ricava σ = x (n) x (1) 2 il quale prende il nome di semi-intervallo di variazione. In letteratura l indice 2σ = x (n) x (1) prende il nome di intervallo di variazione e costituisce un indice di variabilità assoluta parziale spesso impiegato per ottenere una valutazione approssimata della variabilità. 23 / 81
24 La seguente tabella riporta 15 misure sperimentali rilevate in un punto di un circuito elettrico tramite voltmetro digitale Misurare la variabilità dei dati riportati in tabella attraverso l utilizzo degli indici di dispersione definiti per p = 1, 2 e per p / 81
25 Per poter calcolare gli indici di dispersione richiesti è necessario calcolare le medie decisionali corrispondenti a p = 1, 2 e p +. Dopo aver ordinato i dati in ordine crescente si ricavano le seguenti medie decisionali x 0 = x 1 = x = x (15) + x (1) 2 = / 81
26 x i xi 2 x i x 0 x i x / 81
27 Mediante l utilizzo dei dati riportati nella tabella precedente si ricava: n i=1 p = 1 x 0 = σ 1 = x i x 0 = = Volt n 15 n i=1 p = 2 x 1 = σ 2 = x i x 0 2 n = = Volt p + x = σ = x (15) x (1) 2 = Volt 27 / 81
28 In molte applicazioni non si dispone della serie originale dei dati, ma soltanto della distribuzione di frequenze in classi. In questo caso l espressione (2) viene sostituita con n σ p = p i=1 x i c x p 1 p n i n n xi c x p 1 p f i, = p i=1 dove xi c è il valore centrale della classe i-esima, n i è la corrispondente frequenza assoluta e x p 1 è la media decisionale. 28 / 81
29 Esempio Di seguito viene riportata la distribuzione di frequenza in classi ottenuta mediante un campione di 50 misurazioni sperimentali relative alle resistenze elettrice di isolamento. X n i Totale 50 Assumendo che gli errori seguano una distribuzione gaussiana, calcolare il più opportuno indice di dispersione. 29 / 81
30 Assumendo che gli errori seguano una distribuzione gaussiana, il più opportuno indice di dispersione è lo scarto quadratico medio. X xi c (xi c)2 n i xi c n i (xi c)2 n i Totale Utilizzando i dati in tabella si ricava che x 1 = = σ 2 = = / 81
31 Proprietà della varianza Teorema Sia x 1, x 2,... x n una serie statistica di dati e consideriamo la trasformata lineare y i = α + βx i, con i = 1, 2,..., n. Indichiamo con σ 2 x la varianza calcolata sul primo campione. Denotata con σ 2 y la varianza calcolata sui valori y 1, y 2,..., y n, si dimostra che σ 2 y = β 2 σ 2 x. Dimostrazione n σy 2 i=1 = (y i ȳ a ) 2 n i=1 = [α + βx i (α + β x a )] 2 n n n i=1 = (βx i β x a ) 2 n i=1 = [β(x i x a )] 2 n n n = β 2 i=1 (x i x a ) 2 = β 2 σ 2 n x. = 31 / 81
32 Esempio: nel 2009 il prezzo di un determinato bene, denotato con X, è stato caratterizzato da uno scarto quadratico medio pari a euro. Sapendo che il tasso di cambio Euro/Dollaro (USA) è (un euro equivale a $) il candidato calcoli lo scarto quadratico medio del prezzo del bene X valutato in dollari. Soluzione Utilizzando il teorema si ricava che α = 0, β = quindi lo scarto quadratico medio del prezzo del bene X valutato in dollari è ottenuto mediante la formula σ y = β σ x quindi σ y = = / 81
33 Il precedente teorema consente di dimostrare la proprietà di invarianza per traslazione dello scarto quadratico medio (proprietà iii. degli indici di variabilità assoluta). Corollario Sia x 1, x 2,... x n una serie statistica di dati. Se si aggiunge una costante α ai valori rilevati lo scarto quadratico medio non varia. Dimostrazione Aggiungere una costante α ai valori osservati è equivalente a definire la traslazione Dal teorema precedente si ricava che dato che il parametro β è uguale ad 1. y i = α + x i. σ y = σ x, 33 / 81
34 Indici di diversità Se consideriamo una variabile quantitativa di tipo discreto, derivante da enumerazioni, non ha senso logico calcolare le differenze di ciascun valore x i da una media decisionale o da una media secondo il Chisini. In questo caso risulta più conveniente valutare la variabilità dei valori osservati mediante una opportuna media delle diversità fra i singoli valori, senza far ricorso a valori medi di riferimento. Gli indici statistici proposti per valutare la variabilità delle variabili quantitative discrete sono chiamati indici di diversità. 34 / 81
35 Esempio: la tabella che segue riporta il numero di unità difettose prodotte da un processo produttivo nel primo semestre dell anno / 81
36 Dato che il concetto di diversità si fonda sul confronto dei singoli valori, consideriamo la seguente tabella. N. guasti N. guasti La tabella precedente riporta il valore assoluto della differenza di tutte le possibili coppie di valori osservati, ovvero x i x j, con i j. Sulla base dei precedenti valori, un primo indici mediante il quale valutare la diversità è definito come media dei valori in tabella, ovvero: R 1 = = 3.11 Differenza semplice media con ripetizione Osservando che gli elementi sulla diagonale principale sono nulli, possiamo quantificare la variabilità tramite la seguente formula 1 = = (6 1) = 3.73 Differenza semplice media senza ripetizione 36 / 81
37 In formule i due indici calcolati in precedenza, ovvero la differenza semplice media con ripetizione e senza ripetizione, possono essere scritti nel seguente modo: R 1 = 1 = n i,j=1 x i x j n 2 n i,j=1 x i x j n(n 1) E da notare che, per la simmetria della matrice di tutte le possibili difference in coppie fra gli n valori osservati e per il fatto che la diagonale principale è composta da valori nulli, il calcolo del numeratore degli indici precedenti può essere riscritto nel seguente modo n x i x j = 2 x i x j i,j=1 i<j il quale consente di dimezzare il calcolo di tutte le possibile coppie. 37 / 81
38 La differenza semplice media con ripetizione e senza ripetizione sono casi particolari di due famigli di indici di diversità: R m = m = ( n i,j=1 x ) i x j m 1/m, (3) n 2 ( n i,j=1 x ) i x j m 1/m, (4) n(n 1) dove m > 0. La famiglia di indici di diversità definita tramite la formula (3) prende il nome di differenza media potenziata di ordine m con ripetizione, mentre la famiglia di indici definiti tramite la formula (4) prende il nome di differenza media potenziata di ordine m senza ripetizione. Note: Fra gli innumerevoli indici che si possono definire al variare del parametro m, gli unici che vengono comunemente impiegati in pratica sono quelli corrispondenti a m = / 81
39 L esempio visto in precedenza mostrava il calcolo degli indici R 1 e 1 utilizzando una serie di valori. Quando si dispone di una distribuzione di frequenze, la procedura mostrata in precedenza si modifica al fine di tener conto delle frequenze assolute. Esempio: di seguito si riportata la distribuzione di frequenze della variabile numero di unità difettose prodotte da un processo produttivo nel primo semestre dell anno Da cui si ricavano le matrici x n i Totale 6 N. guasti N. guasti x i x j n i n j x i x j n i n j / 81
40 Utilizzando la matrice x i x j n i n j x i x j n i n j si ricava che R 1 = = = = / 81
41 Quando si lavora con una distribuzione di frequenze le formule (3) e (4), utilizzate per il calcolo della differenza media potenziata di ordine m con e senza ripetizione, vengono modificate nel seguente modo: R m = m = ( n i,j=1 x ) i x j m 1/m n i n j, n 2 ( n i,j=1 x ) i x j m 1/m n i n j. n(n 1) Quando m è uguale ad 1 si ricava: R 1 = 1 = n i,j=1 x i x j n i n j n 2, Differenza semplice media con ripetizione n i,j=1 x i x j n i n j. Differenza semplice media senza ripetizione n(n 1) 41 / 81
42 Esempio: il direttore di un centro di ricerca e sviluppo di un azienda produttrice di accessori per smartphone è interessato a valutare la performance di un nuovo tipo di batteria. A tal fine è stata rilevata la variabile numero di ricariche settimanali. Di seguito si riporta la distribuzione di frequenze ottenuta. Ricariche n i Tot. 115 Valutare la variabilità tramite i più adeguati indici statistici. 42 / 81
43 Per valutare la variabilità della variabile numero di ricariche settimanali utilizziamo gli indici R 1 e 1. A tal fine costruiamo la tabella Dalla tabella precedente si ricava: n i n i X R 1 = = 1.58 (differenza semplice media con ripetizione) 1 = = 1.60 (differenza semplice media senza ripetizione) / 81
44 Esempio: Una delle problematiche più sentite nel mondo del commercio elettronico è la sicurezza nelle modalità di pagamento. Al fine di evitare il furto di informazioni e dei dati personali del venditore e del cliente, i siti di commercio elettronico utilizzano livelli di crittografia elevati. Di seguito è riportata la distribuzione di frequenze della variabile numero mensile di furti di dati. X n i Tot. 36 Valutare la variabilità tramite i più adeguati indici statistici. 44 / 81
45 Per valutare la variabilità della variabile numero di ricariche settimanali utilizziamo gli indici R 1 e 1. A tal fine costruiamo la tabella Dalla tabella precedente si ricava: n i n i X R 1 = = 1.59 (differenza semplice media con ripetizione) 1 = = (differenza semplice media senza ripetizione) 45 / 81
46 Gli esempi precedenti mostrano che il calcolo degli indici di diversità si complica al crescere della dimensione della matrice con tutte le possibili differenze a coppie. La formula di De Finetti-Paciello consente il calcolo del numeratore degli indici R 1 e 1 senza ricorrere all utilizzo della tabella. Consideriamo la seguente distribuzione di frequenza. x i n i Totale / 81
47 Il calcolo della formula di De Finetti-Paciello si fonda sull utilizzo delle frequenze assolute cumulate. Consideriamo la seguente tabella. x i n i ni c n ni c ni c(n nc i ) x (i+1) x (i) ni c(n nc i )(x (i+1) x (i) ) = = = = = = = = = = = = = = = = Totale Utilizzando i dati riportati in tabella la formula di De Finetti-Paciello fornisce i seguenti risultati R 1 = 2 k 1 i=1 nc i (n nc i )(x (i+1) x (i) ) n 2 = = = 2 k 1 i=1 nc i (n nc i )(x (i+1) x (i) ) = n(n 1) = / 81
48 Esempio: Il direttore di un supermercato è interessato a valutare la distribuzione del numero di prodotti giornalmente rubati. Di seguito si riporta la distribuzione di frequenza ottenuta dopo 53 giorni lavorativi. N. Prodotti n i Totale 53 Valutare la variabilità tramite i più adeguati indici statistici. 48 / 81
49 Per calcolare la differenza semplice media con e senza ripetizione, utilizziamo la formula di De Finetti-Paciello. Consideriamo la seguente tabella. x i n i ni c n ni c ni c(n nc i ) Totale Dato che le differenze x (i+1) x (i) sono tutte uguali al valore 1, le ultime due colonne possono essere omesse. Utilizzando i dati riportati in tabella otteniamo i seguenti risultati R 1 = 2 k 1 i=1 nc i (n nc i )(x (i+1) x (i) ) n 2 = = = 2 k 1 i=1 nc i (n nc i )(x (i+1) x (i) ) n(n 1) = = / 81
50 Indici di eterogeneità Gli indici di variabilità fin qui presentati possono essere utilizzati solo per variabili quantitative. Definizione L eterogeneità misura la variabilità delle frequenze relative f i senza coinvolgere le modalità del carattere in esame. Se tutte le unità statistiche sono portatrici della medesima modalità del carattere oggetto dello studio, diremo che l eterogeneità è nulla o siamo in presenza di massima concentrazione. x n f f 2 x 1 n x x k x k Totale n / 81
51 Se tutte le unità statistiche sono ripartite uniformemente fra le k modalità del carattere, allora l eterogeneità è massima o siamo in presenza di concentrazione nulla: x n f f 2 x 1 n/k 1/k 1/k 2 x 2 n/k 1/k 1/k x k 1 n/k 1/k 1/k 2 x k n/k 1/k 1/k 2 Totale n 1 1/k 51 / 81
52 Per valutare l eterogeneità di una distribuzione, utilizzeremo l indice proposto da Gini k { 0 eterogeneità nulla G = 1 fi 2 = 1 1 k = k 1 k massima eterogeneità i=1 La versione normalizzata dell indice di Gini è ottenuta rapportando l indice G al suo massimo valore G = k k 1 G. 52 / 81
53 Esempio: supponiamo di aver rilevato su un gruppo di soggetti, separatamente per i due sessi, il titolo di studio. Si vuole confrontare l eterogeneità delle due distribuzioni. Femmine x i n i f i fi 2 Lic. Media Maturità Laurea Totale Si ricava che G = = 0.57 e G = kg k 1 = = / 81
54 da cui si ricava che Uomini x i n i f i fi 2 Lic. Media Maturità Laurea Totale G = = G = kg k 1 = = Si deduce che la distribuzione dei maschi è più eterogenea. 54 / 81
55 Gli indici di variabilità relativa In molte applicazioni è utile confrontare la variabilità di due o più serie di valori. In questo caso gli indici di variabilità assoluta, studiati nelle pagine precedenti, non possono essere applicati per due ordini di motivi: gli indici di variabilità assoluta sono espressi nella stessa unità di misura dei dati quindi non consentono confronti fra serie di valori con diversa unità di misura; anche se le serie considerate sono espresse nella stessa unità di misura, possono essere caratterizzate da un diverso ordine medio di grandezza. In questi casi è necessario considerare gli indici di variabilità relativa. Gli indici di variabilità relativa sono dei numeri puri, ossia numeri privi di unità di misura. 55 / 81
56 I coefficienti di variazione Gli indici di variazione n V m = m i=1 x i x a m, n trovano applicazione quando la serie statistica deriva da osservazioni fatte su n unità statistiche distinte (approccio secondo Chisini). Per rimuovere gli effetti derivanti dall unità di misura dei dati e dall ordine medio di grandezza del fenomeno, si rapporta l indice V m al valore assoluto del corrispondente valore medio, ovvero: V m x a. (5) La famiglia di coefficienti definita in precedenza prende il nome di coefficiente di variazione. La quantità (5) è un numero puro (indice adimensionale) dato che numeratore e denominatore sono espressi nella stessa unità di misura dei dati. 56 / 81
57 Nelle applicazione il parametro m è usualmente uguale a 2; in questo caso il coefficiente ricavato dalla formula (5) è il seguente CV = V 2 x a il quale è talmente importante da prendere il nome dell intera famiglia di coefficienti, ovvero coefficiente di variazione. Note: nelle applicazioni si è soliti riportare il coefficiente di variazione CV moltiplicato per 100, ma questo può portare in errore nella valutazione del valore ottenuto. CV è una misura relativa alla media e la sola valutazione sensata è come percentuale della media. 57 / 81
58 Esempio. Un azienda di credito ha ripartito un campione di 143 dei propri clienti in due categorie definite solvente e insolvente. La tabella seguente riporta la distribuzione dei finanziamenti concessi dall azienda di credito in funzione delle due categorie considerate. Tipologia Solvente Insolvente Finanziamenti n i n i Tot Il candidato confronti la distribuzione di frequenze dei clienti di tipo solvente con quella di tipo insolvente mediante le più opportune misure di tendenza centrale e di variabilità. 58 / 81
59 Sulla base della descrizione del fenomeno in esame si deduce che la più opportuna misura di tendenza centrale è la media definita secondo Chisini; dato che il fenomeno in esame ha natura additiva utilizzeremo la media aritmetica ponderata per confrontare le due distribuzioni. Per confrontare le due distribuzioni in termini di variabilità utilizzeremo il coefficiente di variazione. Consideriamo i clienti di tipo solvente e quindi la tabella da cui si ricava che x s = x c i n i x c i n i (x c i )2 (x c i )2 n i Tot = 2.71 σ s = = 0.53 e CV s = = / 81
60 Consideriamo i clienti di tipo insolvente e quindi la tabella da cui si ricava che x i = x c i n i x c i n i (x c i )2 (x c i )2 n i Tot = 1.64 σ i = = 0.48 e CV i = = 0.29 Conclusioni. Sulla base dei risultati ottenuti si ricava che il livello medio dei finanziamenti concessi ai clienti di tipo solvente è maggiore rispetto a quello concesso ai clienti di tipo insolvente. Il confronto dei due coefficienti di variazione mostra che la distribuzione dei finanziamenti concessi ai clienti di tipo solvente è leggermente meno variabile di quella dei clienti di tipo insolvente; nel primo caso la variabilità dei finanziamenti concessi è uguale al 20% dei finanziamenti medi, mentre aumenta al 29% quando si considerano clienti di tipo insolvente. 60 / 81
61 I coefficienti di dispersione Gli indici di dispersione n σ p = p i=1 x i x p 1 p, n trovano applicazione quando la serie statistica deriva da osservazioni ripetute fatte sullo stesso oggetto/soggetto (approccio secondo medie decisionali). Per rimuovere gli effetti derivanti dall unità di misura dei dati e dall ordine medio di grandezza del fenomeno, si rapporta l indice σ p al valore assoluto della corrispondente media decisionale, ovvero: σ p x p 1. (6) La famiglia di coefficienti definita in precedenza prende il nome di coefficiente di dispersione. La quantità (6) è un numero puro (indice adimensionale) dato che numeratore e denominatore sono espressi nella stessa unità di misura dei dati. 61 / 81
62 I coefficienti di diversità Per definire gli indici di variabilità relativa per le variabili quantitative discrete, la logica che si segue è quella di rapportare l indice 1 (o R 1 ) al suo valore massimo teorico. Si dimostra che il valore più grande che può assumere la differenza semplice media senza ripetizione è uguale a 2 x a, da cui si ricava quello che è noto in letteratura come coefficiente di diversità semplice media senza ripetizione: 1 max 1 = 1 2 x a. (7) Note: dato che il coefficiente (7) è definito rapportando il numeratore al suo massimo teorico, esso viene interpretato come percentuale della variabilità totale. Nel caso in cui si decide di lavorare con l indice R 1, la corrispondente versione normalizzata può essere ottenuta dalla relazione: n i,j=1 1 = x i x j = n n i,j=1 x i x j n(n 1) n 1 n 2 = n n 1 R 1 62 / 81
63 Esempio: Il direttore di un supermercato è interessato a valutare la distribuzione del numero di prodotti giornalmente rubati. Di seguito si riporta la distribuzione di frequenza ottenuta dopo 53 giorni lavorativi. N. Prodotti n i Totale 53 Valutare la variabilità tramite i più adeguati indici statistici. 63 / 81
64 Per calcolare la differenza semplice media con e senza ripetizione, utilizziamo la formula di De Finetti-Paciello. Consideriamo la seguente tabella. X n i x i n i ni c n ni c ni c(n nc i ) Totale Utilizzando i dati riportati in tabella otteniamo i seguenti risultati x a = = 4.13; 1 = 1.87; 1 2 x a = Il coefficiente di diversità semplice medio senza ripetizione mostra che la variabilità della variabile numero di prodotti giornalmente rubati è il 23% della massima variabilità raggiungibile. 64 / 81
65 La concentrazione La concentrazione di un carattere X deriva dalla possibilità di trasferire l ammontare del fenomeno da un unità statistica ad un altra, avvicinandosi o allontanandosi dalla situazione di equidistribuzione dell ammontare complessivo del carattere. In tal caso il carattere viene definito trasferibile. Per esempio, sapendo che in Italia, nel 2011, l ammontare dei redditi da lavoro dipendente era di milioni di euro, possiamo essere interessati a sapere come questo ammontare fosse ripartito fra le diverse famiglie italiane. Se la maggior parte dell ammontare del reddito era detenuto da poche famiglie possiamo dire che il reddito era concentrato, al contrario se ogni famiglia deteneva la stessa quantità di reddito possiamo dire che questo era equidistribuito tra le famiglie. Il problema è definire un indice che fornisca informazioni in merito alla vicinanza alla situazione di perfetta concentrazione o di perfetta equisistribuzione. 65 / 81
66 Supponiamo di considerare il reddito annuo di 8 individui percepito nel La seguente tabella riporta i valori rilevati: dai valori precedenti si ricava che il reddito complessivo è uguale a n i=1 x i = e che il reddito medio è x = Definizione Diremo che il carattere quantitativo trasferibile X è equidistribuito quando l ammontare complessivo del carattere è ripartito equamente tra le n unità statistiche. Con riferimento all esempio precedente / 81
67 Definizione Diremo che il carattere quantitativo trasferibile X è concentrato quando l ammontare complessivo del carattere è posseduto solamente da una sola unità statistica. Con riferimento all esempio precedente si ricava: Note: La concentrazione del carattere evidenzia in modo più efficace e più interpretabile la variabilità dei caratteri trasferibili. La corrispondenza con il concetto di variabilità è immediato: se non esiste concentrazione (situazione di perfetta equidistribuzione) allora la variabilità è nulla, diversamente se la concentrazione è massima allora anche la variabilità sara massima. 67 / 81
68 Consideriamo un carattere quantitativo trasferibile X, osservato su un collettivo di n unità statistiche ed ordiniamo in senso non decrescente i valori osservati; in altri termini consideriamo la sequenza ordinata Indichiamo con: x (1) x (2)... x (n). A i = x (1) + x (2) +... x (i) l ammontare di carattere posseduto dalle i unità più povere (A n è l ammontare complessivo del carattere); Q i = A i /A n la frazione di carattere posseduto dalle i unità più povere; F i = i/n la frequenza relativa cumulata delle prime i unità. Note. Le quantità Q i ed F i forniscono informazioni in merito alla concentrazione. Se si è nel caso in cui l ammontare del carattere X è equidistribuito fra le n unità statistiche si ha che, per ogni i, Q i = F i poiché come ogni unità è un n-esimo dell intero collettivo anche il suo ammontare è un n-esimo dell ammontare totale; Se invece si è nel caso di massima concentrazione, tutte le Q i, esclusa Q n che è necessariamente uguale ad 1, valgono zero. In tutte le situazioni intermedie vale la relazione che F i Q i. 68 / 81
69 Considerando le differenze (F i Q i ), queste saranno tutte uguali a zero nel caso di equidistribuzione, tutte uguali ad F i ( escluso il caso i = n per il quale la differenza è zero) nel caso di massima concentrazione e tutte non negative nei casi intermedi di concentrazione. Le osservazioni precedenti conducono alla definizione del seguente indice: n n 1 C = (F i Q i ) = (F i Q i ). i=1 Note. La sommatoria arriva fino al termine (n 1)-esimo, poiché l n-esima differenza è sempre uguale a 0 essendo Q n = F n = 1. i=1 69 / 81
70 L indice C assume i seguenti valori estremi C = { 0 in condizione di perfetta equidistribuzione dato che F i = Q i ; n 1 i=1 F i in condizione di massima concentrazione dato che Q i = 0 Per trasformare l indice C in un indice di concentrazione relativo, variabile tra 0 ed 1, basterà dividerlo per il suo valore massimo. Con tale operazione si ottiene l indice di concentrazione chiamato rapporto di concentrazione del Gini: Osservando che R = C n 1 i=1 F i n 1 F i = i=1 n 1 i=1 = n 1 i=1 (F i Q i ) n 1 i=1 F = 1 i i n = 1 n 1 n i=1 i = 1 n n(n 1) 2 n 1 i=1 Q i n 1 i=1 F. i = n 1 2, si ricava che l indice R può essere calcolato come n 1 i=1 R = 1 2 i n / 81
71 Con riferimento all esempio precedente si ricava da cui si ricava che x (i) A i Q i Tot R = = ovvero siamo in presenza di quasi perfetta equidistribuzione del reddito (minima concentrazione) tra le otto unità considerate. 71 / 81
72 Esempio. Di seguito vengono riportati gli introiti pubblicitari (in milioni) ottenuti a fine anno dalle nove emittenti radiofoniche di una determinata nazione. Emittente Introiti Emittente Emittente Emittente Emittente Emittente Emittente Emittente Emittente Emittente Valutare la concentrazione tramite il rapporto di concentrazione del Gini. 72 / 81
73 Per calcolare l indice R, consideriamo la seguente tabella: Emittente Introiti Ai Qi Emittente Emittente Emittente Emittente Emittente Emittente Emittente Emittente Emittente Tot da cui si ricava R = = Il rapporto di concentrazione del Gini (R = 0.287) mostra che l ammontare complessivo degli introiti pubblicitari (pari a 11879) è abbastanza ben equidistribuito tra le diverse emittenti. 73 / 81
74 Associato al rapporto di concentrazione del Gini vi è un interessante grafico chiamato spezzata di regressione o curva di Lorenz, dal nome del primo autore che ne ha proposto l impiego. Il grafico è ottenuto costruendo un grafico cartesiano dove in ascissa riportiamo i valori F i e in ordinata i valori Q i. Definizione Si definisce spezzata do concentrazione o curva di Lorenz la poligonale congiungente le n coppie di valori (F i, Q i ). Note. Dato che per ogni coppia (F i, Q i ) in generale si ottiene che F i Q i si deduce che la curva di Lorenz giace sotto la bisettrice del primo-terzo quadrante. Osserviamo inoltre che ogni Q i ed F i è compreso tra 0 ed / 81
75 F i Q i Q i F i La linea continua è la poligonale congiungente le coppie di valori (F i, Q i ) ovvero la spezzata di Lorenz. 75 / 81
76 F i Q i Q i F i Il segmento tratteggiato congiungente i punti di coordinate (0, 0) e (1, 1) prende il nome di retta di equidistribuzione e descrive l andamento delle coppie (F i, Q i ) in caso di perfetta equidistribuzione dell ammontare complessivo del carattere. 76 / 81
77 F i Q i Q i F i L area compresa tra la curva di Lorenz e la retta di equidistribuzione è chiamata area di concentrazione. Nel caso di equidistribuzione l area di concentrazione è nulla dato che la retta di equidistribuzione e la spezzata di Lorenz coincidono. 77 / 81
78 Q i F i Quando ci troviamo in condizione di massima concentrazione, allora Q i = F i = 0 per i = 1,..., n 1 mentre Q n = F n = 1. Graficamente l area di concentrazione è uguale all are del triangolo rettangolo mostrato nel grafico. E facile vedere che, in questo caso, l area di concentrazione è pari ad 1/2. 78 / 81
79 Si dimostra che il rapporto di concentrazione del Gini è approssimativamente uguale al rapporto tra l area di concentrazione e la massima area di concentrazione, ovvero R area di concentrazione massima area di concentrazione = 2 area di concentrazione. = area di concentrazione 1/2 La relazione precedente è utilizzata per approssimare il rapporto di concentrazione del Gini quando si lavora con una distribuzione di frequenze in classi. Applicando la formula per area dei trapezi per il calcolo dell area di concentrazione si ricava l approssimazione: k 1 R = 1 (F i+1 F i )(Q i + Q i+1 ) dove i. k è il numero di classi; ii. F i = nc i iii. Q i = n ij=1 xi c n i i=0 sono le frequenze relative cumulate; kj=1 x i c n i e x c i è il valore centrale dell i-esima classe; Note: il calcolo dell indice precedente può essere semplificato osservando che F i+1 F i = f i = n i /n, ovvero la frequenza relativa dell i-esima classe. = 79 / 81
80 Esempio: di seguito è riportata la distribuzione di frequenza dei redditi mensili rilevati su un campione di 100 famiglie. classi n i Tot. 100 Calcolare il rapporto di concentrazione del Gini. 80 / 81
81 Per calcolare il rapporto di concentrazione del Gini consideriamo la seguente tabella: x c i n i x c i n i i j=1 x c i n i Q i Q i + Q i+1 n i (Q i + Q i+1 ) Tot da cui si ricava R = 1 k 1 i=0 n i(q i + Q i+1 ) = n Il rapporto di concentrazione del Gini (R = 0.24) mostra che il reddito complessivo mensile delle 100 famiglie è quasi perfettamente equidistribuito tra le 100 famiglie. 81 / 81
Statistica 1. Esercitazioni. Dott. Luigi Augugliaro 1. Università di Palermo
Statistica 1 Esercitazioni Dott. 1 1 Dipartimento di Scienze Statistiche e Matematiche S. Vianelli, Università di Palermo ricevimento: lunedì ore 15-17 mercoledì ore 15-17 e-mail: [email protected]
STATISTICA 1 ESERCITAZIONE 6
STATISTICA 1 ESERCITAZIONE 6 Dott. Giuseppe Pandolfo 5 Novembre 013 CONCENTRAZIONE Osservando l ammontare di un carattere quantitativo trasferibile su un collettivo statistico può essere interessante sapere
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Differenze semplici medie, confronti in termini di mutua variabilità La distribuzione del prezzo
La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali
Dip. di Scienze Umane e Sociali [email protected] Introduzione [1/2] Gli indici di variabilità consentono di riassumere le principali caratteristiche di una distribuzione (assieme alle medie) Le
STATISTICA APPLICATA Prof.ssa Julia Mortera. Concentrazione
STATISTICA APPLICATA Prof.ssa Julia Mortera Concentrazione Questo materiale non sufficiente per la conoscenza/preparazione dell argomento per il quale si rimanda al testo: Cicchitelli (2012) Statistica:
La Variabilità statistica
La Variabilità statistica Una peculiarità dei caratteri rilevati nelle unità statistiche di un collettivo, è quella di presentare valori o attributi in tutto o in parte diversi. Si chiama variabilità (nel
Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva
Fondamenti di Informatica Ester Zumpano Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva Lezione 5 Statistica descrittiva La statistica descrittiva mette a disposizione il calcolo di
TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative
TRACCIA DI STUDIO Un indice di tendenza centrale non è sufficiente a descrivere completamente un fenomeno. Gli indici di dispersione assolvono il compito di rappresentare la capacità di un fenomeno a manifestarsi
Esercitazioni di statistica
Esercitazioni di statistica Gli indici di variabilità Stefania Spina Universitá di Napoli Federico II [email protected] 8 Ottobre 2014 Stefania Spina Esercitazioni di statistica 1/43 Introduzione
1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl
1/4 Capitolo 4 La variabilità di una distribuzione Intervalli di variabilità Box-plot Indici basati sullo scostamento dalla media Confronti di variabilità Standardizzazione Statistica - Metodologie per
Indici di variabilità ed eterogeneità
Indici di variabilità ed eterogeneità Corso di STATISTICA Prof. Roberta Siciliano Ordinario di Statistica, Università di apoli Federico II Professore supplente, Università della Basilicata a.a. 011/01
Statistica. Alfonso Iodice D Enza
La per Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 1 Outline 1 La La per () Statistica 2 / 1 Outline La per 1 La 2 per () Statistica 2 / 1 Outline
Indici di eterogeneità e di concentrazione
Indici di eterogeneità e di concentrazione Dario Malchiodi e Anna Maria Zanaboni 12 gennaio 2016 1 Indici di eterogeneità Nel caso di variabili qualitative nominali la varianza e gli altri indici da essa
Variabilità e Concentrazione Esercitazione n 02
Variabilità e Concentrazione Esercitazione n 02 ESERCIZIO 1 Nella tabella di seguito sono riportati i dati relativi al tempo necessario a 8 studenti per svolgere un test di valutazione (in ore): Tempo
3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri;
Esercizio 1 Il corso di Statistica è frequentato da 10 studenti che presentano le seguenti caratteristiche Studente Sesso Colore Occhi Voto Soddisfazione Età Stefano M Nero 18 Per niente 21 Francesca F
Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione
Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo Esercizio 1. Analizzeremo la distribuzione delle famiglie italiane, classificate per numero di
Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi
ISTITUZIONI DI STATISTICA A A 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
Esercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a
Corso di Statistica Esercitazione.3 Indici di variabilità ed eterogeneità Concentrazione Asimmetria Prof.ssa T. Laureti a.a. 202-203 Esercizio Si considerino i seguenti dati relativi al numero di addetti
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.
La media e la mediana sono indicatori di centralità, che indicano un centro dei dati. Un indicatore che sintetizza in un unico numero tutti i dati, nascondendo quindi la molteplicità dei dati. Per esempio,
Statistica economica Capitolo 4
Statistica economica Capitolo Prof. Alessandra Michelangeli a.a. 03-0 Argomenti della quarta settimana di lezione Sintesi della distribuzione di un carattere Indici di variabilità La variabilità di una
Statistica Descrittiva Soluzioni 3. Medie potenziate
ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona
REGRESSIONE E CORRELAZIONE
REGRESSIONE E CORRELAZIONE Nella Statistica, per studio della connessione si intende la ricerca di eventuali relazioni, di dipendenza ed interdipendenza, intercorrenti tra due variabili statistiche 1.
Teoria e tecniche dei test. Concetti di base
Teoria e tecniche dei test Lezione 2 2013/14 ALCUNE NOZIONI STATITICHE DI BASE Concetti di base Campione e popolazione (1) La popolazione è l insieme di individui o oggetti che si vogliono studiare. Questi
STATISTICHE DESCRITTIVE Parte II
STATISTICHE DESCRITTIVE Parte II INDICI DI DISPERSIONE Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione introduzione Una
Corso di Statistica (canale P-Z) A.A. 2009/10 Prof.ssa P. Vicard LA VARIABILITÀ
Corso di Statistica (canale P-Z) A.A. 009/0 Prof.ssa P. Vicard LA VARIABILITÀ Mediante i valori medi abbiamo cercato di sintetizzare una distribuzione statistica mediante un solo valore tipico. Questo
x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )
Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 0/03 lezioni di statistica del 5 e 8 aprile 03 - di Massimo Cristallo - A. Le relazioni tra i fenomeni
Esercitazione del
Esercizi sulla regressione lineare. Esercitazione del 21.05.2013 Esercizio dal tema d esame del 13.06.2011. Si consideri il seguente campione di n = 9 osservazioni relative ai caratteri ed Y: 7 17 8 36
Nel modello omoschedastico la varianza dell errore non dipende da i ed è quindi pari a σ 0.
Regressione [] el modello di regressione lineare si assume una relazione di tipo lineare tra il valore medio della variabile dipendente Y e quello della variabile indipendente X per cui Il modello si scrive
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 6 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Associazione, correlazione e dipendenza tra caratteri In un collettivo di 11 famiglie è stata
tabelle grafici misure di
Statistica Descrittiva descrivere e riassumere un insieme di dati in maniera ordinata tabelle grafici misure di posizione dispersione associazione Misure di posizione Forniscono indicazioni sull ordine
Statistica economica. Prof. Alessandra Michelangeli a.a
Statistica economica Prof. Alessandra Michelangeli a.a. 202-203 Argomenti della quarta settimana di lezione Sintesi della distribuzione di un carattere Indici di variabilità La variabilità di una distribuzione
Istituzioni di Statistica e Statistica Economica
Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono
Statistica. Alfonso Iodice D Enza
Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 33 Outline 1 2 3 4 5 6 () Statistica 2 / 33 Misura del legame Nel caso di variabili quantitative
STATISTICA esercizi svolti sulla VARIABILITA
STATISTICA esercizi svolti sulla VARIABILITA 1 1 VARIABILITA 2 1 VARIABILITA 1.1 Esercizi 1. La seguente tabella riporta il tempo (in giorni) impiegato da sei individui per il consumo di una confezione
Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica
Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 20/202 Statistica Esercitazione 3 9 maggio 202 Coefficiente di variazione. Serie storiche.
Sperimentazioni di Fisica I mod. A Statistica - Lezione 2
Sperimentazioni di Fisica I mod. A Statistica - Lezione 2 A. Garfagnini M. Mazzocco C. Sada Dipartimento di Fisica G. Galilei, Università di Padova AA 2014/2015 Elementi di Statistica Lezione 2: 1. Istogrammi
Statistica 1 A.A. 2015/2016
Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 27 Numeri indici e rapporti statistici
Scale di Misurazione Lezione 2
Last updated April 26, 2016 Scale di Misurazione Lezione 2 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura II anno, II semestre Tipi di Variabili 1 Scale di Misurazione 1. Variabile
ESERCIZI STATISTICA DESCRITTIVA
ESERCIZI STATISTICA DESCRITTIVA Frequenze assolute e relative Titolo di studio Frequenze assolute Frequenze relative Proporzioni Percentuali Senza titolo 30 0,025 2,5 Lic. elementare 509 0,424 42,4 Licenza
Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio
Corso di Laurea: Diritto per le Imprese e le istituzioni a.a. 2016-17 Statistica Statistica Descrittiva 3 Esercizi: 5, 6 Docente: Alessandra Durio 1 Contenuti I quantili nel caso dei dati raccolti in classi
Statistica 1 A.A. 2015/2016
Corso di Laurea in Economia e Finanza Statistica 1 A.A. 2015/2016 (8 CFU, corrispondenti a 48 ore di lezione frontale e 24 ore di esercitazione) Prof. Luigi Augugliaro 1 / 35 Il modello di regressione
Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)
Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 5 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Misura dell associazione tra due caratteri Uno store manager è interessato a studiare la relazione
Indice. centrale, dispersione e forma Introduzione alla Statistica Statistica descrittiva per variabili quantitative: tendenza
XIII Presentazione del volume XV L Editore ringrazia 3 1. Introduzione alla Statistica 5 1.1 Definizione di Statistica 6 1.2 I Rami della Statistica Statistica Descrittiva, 6 Statistica Inferenziale, 6
La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci
La statistica Elaborazione e rappresentazione dei dati Gli indicatori statistici Introduzione La statistica raccoglie ed analizza gruppi di dati (su cose o persone) per trarne conclusioni e fare previsioni
Capitolo 6. La distribuzione normale
Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Ingegneria Gestionale Facoltà di Ingegneria, Università
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE
STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 2 1 INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE 1.1
Statistica. Alfonso Iodice D Enza [email protected]
La misura di Statistica Alfonso Iodice D Enza [email protected] Università degli studi di Cassino () Statistica 1 / 13 Outline La misura di 1 La 2 misura di 3 4 () Statistica 2 / 13 La La misura di In
Capitolo 6 La distribuzione normale
Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 6 La distribuzione normale Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università
BLAND-ALTMAN PLOT. + X 2i 2 la differenza ( d ) tra le due misure per ognuno degli n campioni; d i. X i. = X 1i. X 2i
BLAND-ALTMAN PLOT Il metodo di J. M. Bland e D. G. Altman è finalizzato alla verifica se due tecniche di misura sono comparabili. Resta da comprendere cosa si intenda con il termine metodi comparabili
La distribuzione delle frequenze. T 10 (s)
1 La distribuzione delle frequenze Si vuole misurare il periodo di oscillazione di un pendolo costituito da una sferetta metallica agganciata a un filo (fig. 1). A Figura 1 B Ricordiamo che il periodo
Elementi di Statistica
Università degli Studi di Palermo Dipartimento di Ingegneria Informatica Informatica ed Elementi di Statistica 3 c.f.u. Anno Accademico 2010/2011 Docente: ing. Salvatore Sorce Elementi di Statistica Statistica
Stesso valore medio per distribuzioni diverse
Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 014-015 Stesso valore medio per distribuzioni diverse u i X 11 X 1 X 13 A 1 1 B 8 1 C 0 1 D 3 3 1 E 19 34 1 F 0 41 1 Un uguale
Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione
Statistica Esercitazione alessandro polli facoltà di scienze politiche, sociologia, comunicazione Obiettivo Esercizio 1. Questo e alcuni degli esercizi che proporremo nei prossimi giorni si basano sul
La variabilità. Antonello Maruotti
La variabilità Antonello Maruotti Outline 1 Omogeneità ed eterogeneità 2 Variabilità per caratteri quantitativi 3 Varianza 4 Intervalli di variabilità 5 Teorema di Chebyshev Definizione Variabilità Attitudine
Statistica Elementare
Statistica Elementare 1. Frequenza assoluta Per popolazione si intende l insieme degli elementi che sono oggetto di una indagine statistica, ovvero l insieme delle unità, dette unità statistiche o individui
Statistica. Matematica con Elementi di Statistica a.a. 2017/18
Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo [email protected] Esercizio 1. Sintesi a cinque e misure di variabilità rispetto ad un centro Una catena di fast-food ha selezionato
Esercitazioni di Statistica
Esercitazioni di Statistica Indici di posizione e di variabilità Prof. Livia De Giovanni [email protected] Esercizio 1 Data la seguente distribuzione unitaria del carattere X: X : 4 2 4 2 6 4
