La variabilità Antonello Maruotti
Outline 1 Omogeneità ed eterogeneità 2 Variabilità per caratteri quantitativi 3 Varianza 4 Intervalli di variabilità 5 Teorema di Chebyshev
Definizione Variabilità Attitudine del carattere ad assumere modalità diverse su unità diverse.
Omogeneità Definizione Un collettivo è omogeneo rispetto ad un carattere, od anche che le sue unità sono tutte omogenee tra di loro, se tutte le unità presentano la stessa modalità del carattere. L omegeneità più bassa si ha quando le frequenze relative sono uguali tra di loro eterogeneità. Gli indici di omogeneità devono assumere il massimo nel caso di omogeneità ed il minimo nel caso di eterogeneità (vale il vicecersa per gli indici di eterogeneità).
Indici assoluti Indici di omogeneità O 1 = f 2 k, O 2 = K f f k k Indici relativi O 3 = f k log a f k o 1 = O 1 1 K 1 1 K, o 2 = O 2 1 K 1 1 K o 3 = O 3 + log a K log a K
Indici assoluti Indici di eterogeneità E 1 = 1 f 2 k, E 2 = 1 K f f k k Indici relativi E 3 = e 1 = f k log a f k Entropia K K 1 E 1, e 2 = E 2 1 K 1 e 3 = E 3 log a K
Variabilità per caratteri quantitativi Gli indici di omogeneità/eterogeneità non utilizzano tutte le informazioni fornite dalle distribuzioni secondo un carattere quantitativo. Gli indici di omogeneità/eterogeneità tengono conto soltanto del fatto che si verifichi o meno una diversità tra le modalità
Variabilità per caratteri quantitativi Definizione Gli indici di variabilità danno una misura della dispersione dei termini della distribuzione rispetto ad una media o di quanto differiscono tra loro le modalità presenti nelle unità, basandosi su misre delle diversità tra due modalità Scostamenti medi Differenze medie Intervalli di variazione
Scostamenti medi Scostamento semplice medio dalla media aritmetica S µ = 1 n x i µ n i=1 S µ = 1 x k µ n k = x k µ f k n Scostamento semplice medio dalla mediana S Me = 1 n x i Me n i=1 S Me = 1 x k Me n k = x k Me f k n
Differenze medie Differenza media senza ripetizione = = 1 n(n 1) 1 n(n 1) n i j=1 n i j=1 Differenza media con ripetizione R = n 1 n x i x j x i x j n i n j
La varianza Tra gli indici di variabilità che confrontano le modalità osservate con la media aritmetica, il più noto è la varianza. Definizione La varianza, σ 2, è la media dei quadrati degli scarti dalla media aritmetica. In formule: σ 2 = 1 (x k µ) 2 n k = (x k µ) 2 f k n = 1 xk 2 n k µ 2 = xk 2 f k µ 2 n
La varianza: proprietà E sempre non negativa. Il suo valore cresce all aumentare della variabilità. Si annulla nel caso di assenza di variabilità. Se σx 2 è la varianza di x 1, x 2,..., x n e σy 2 è la varianza di y 1, y 2,..., y n, dove y i = a + bx i, allora σy 2 = b 2 σx 2 e σ Y = b σ X
Campo di variazione e differenza interquartile Campo di variazione Range = x (n) x (1) dove x (n) e x (1) indicano il valore massimo e quello minimo della distribuzione Osservazioni: le distribuzioni possono avere come modalità estreme delle classi aperte, cosicché risulta arbitraria la scelta del valore massimo; il campo di variazione è dipendente dai due valori estremi che possono essere dei valori anomali. Differenze interquartile W = Q 3 Q 1
Teorema di Chebyshev Per una qualsiasi distribuzione di cui si conoscano solamente la media aritmetica, µ, e lo scarto quadratico medio, σ, la frequenza relativa dei termini della distribuzione, non interni ad un intorno della media di raggio fissato, non può superare un certo limite. Teorema Data una distribuzione di valori x i dei quali si conosce la media aritmetica, µ, e lo scarto quadratico medio, σ, comunque si fissi un numero reale non negativo ϵ, si ha che i termini non interni all intorno di raggio ϵ della media aritmetica hanno frequenza relativa che non supera σ2 ϵ 2. f { x i µ ϵ} σ2 ϵ 2