MISURE DI DISPERSIONE 78
MISURE DI DISPERSIONE Un insieme di dati numerici può essere sintetizzato da alcuni valori tipici, che indicano il grado di variabilità dei dati stessi. Grado di Variabilità o di Dispersione MISURE di DISPERSIONE o di Variabilità RANGE VARIANZA DEVIAZIONE STANDARD COEFFICIENTE DI VARIAZIONE 79
LA VARIABILITÀ Le popolazioni A e B hanno uguale tendenza centrale, ma diversa variabilità. Popolazione A Popolazione B dati più concentrati minore dispersione o variabilità dati meno concentrati maggiore dispersione o variabilità 80
RANGE O CAMPO DI VARIAZIONE È la differenza tra il valore massimo e il valore minimo assunti dalla variabile. Range Max - Min Esempio Calcolare il range dell età (in anni) rilevata in 9 soggetti: 4 8 8 61 31 3 50 34 3 RangeMax Min61-338 anni 81
PROPRIETÀ DEL RANGE E facilmente calcolabile; trascura tutta l informazione contenuta nei dati, ad eccezione dei valori estremi; è molto suscettibile agli OUTLIERS*; *Outlier valore estremo, che giace molto perifericamente rispetto alla restante distribuzione dei dati; 30 30 0 10 0 30 40 50 60 70 80 90 100 0 10 0 30 40 50 60 70 80 90 100 Range40 Range90 è utile nell organizzazione dei dati (come raggruppare in classi i dati in una distribuzione di frequenza). 8
VARIANZA CAMPIONARIA e DEVIAZIONE STANDARD Misurano la dispersione dei dati rispetto alla media. Come misurare questa dispersione? 1. Scarti dalla media.. Quadrati degli scarti. x i x ( x i x) 18 1.6-3.6 1.96 19 1.6 -.6 6.76 1 1.6-0.6 0.36 1.6 0.4 0.16 8 1.6 6.4 40.96 3. Somma dei quadrati degli scarti. ( x) x i 61.0 4. Media della somma dei quadrati degli scarti. ( n 1 x x) 61.0 i 5 1 15.3 anni 83
VARIANZA s ( x n i x) 1 DEVIAZIONE STANDARD È la radice quadrata della varianza. s ( x n i x) 1 Perché n-1? Operando su un campione e non sull intera popolazione, se si dividesse per n verrebbe sottostimata la varianza della popolazione. Pertanto si sottrae 1 da n, come fattore di correzione. 84
Riassumendo x i x i x ( x i x) 18 18 1.6-3.6 1,96 19 19 1.6 -.6 6,76 1 1 1.6-0.6 0,36 1.6 0.4 0,16 8 8 1.6 6.4 40,96 Σ61. varianza s ( x n i x ) 1 61. 4 15.3 dev. st. s ( x n i x ) 1 15.3 3.11 85
VARIANZA PER DATI RAGGRUPPATI Se le osservazioni non presentano frequenza unitaria o sono raggruppate in classi. x k f k s ( xi n x) 1 f i DEVIAZIONE STANDARD PER DATI RAGGRUPPATI x k f k s ( xi n x) 1 f i 86
Esempio Calcolare varianza e deviazione standard dei pesi, riportati in tabella, di 40 bambini. La media è 6. kg. x 6. kg Peso (kg) f i x i x ( x) ( xi x) 0-6. 38,44 76,88 3 6-3. 10,4 61,44 5 1-1. 1,44 17,8 6 10-0. 0,04 0,4 30 8 3.8 14,44 115,5 35 8.8 77,44 154,88 40 46,4 x i f i 46.4 s 10. 9333 kg 39 46.4 s 10.9333 3. 31kg 39 87
LA DEVIAZIONE STANDARD E LA DISTRIBUZIONE NORMALE OD LA DISTRIBUZIONE NORMALE Curve a campana, simmetriche rispetto alla media; curve definite da soli parametri: Media e Deviazione Standard; la Media posiziona la curva sull asse orizzontale; la Deviazione Standard indica quanto la curva è schiacciata. La maggior parte delle variabili biologiche seguono una distribuzione normale (ex: altezza di uomini e donne adulti, pressione di una popolazione di individui sani ). 88
LA DISTRIBUZIONE NORMALE 89
DEVIAZIONE STANDARD E DISPERSIONE DEI DATI Curva normale calcolata dai valori di pressione diastolica di 500 uomini, media8 mmhg, ds10 mmhg. L intervallo µ ± 1 DS include il 68% dei dati; l intervallo µ ± DS include il 95% dei dati; l intervallo µ ± 3 DS include il 99.7% dei dati. 90
COEFFICIENTE DI VARIAZIONE OD CV x s 100% Esempio Determinare il coefficiente di variazione della distribuzione dei pesi di 40 bambini, note la media (6. kg) e la deviazione standard (3.31 kg). CV s x 3.31kg 100 % 0.163 100% 1.63% 6.kg Il coefficiente di variazione è adimensionale (numero puro): ciò permette di confrontare il grado di dispersione di variabili misurate con scale di misura diverse. Esempio: In un dato campione c è maggior variabilità nel peso o nell altezza? 91
FONTI DI VARIABILITÀ BIOLOGICHE -Età -Sesso -Razza -Fattori genetici -Dieta -Stato socio-economico -Anamnesi medica remota -Stato emotivo -Stato di attività -Clima -Ritmi circadiani TEMPORALI ERRORI DI MISURA -Osservatori -Strumenti di misura -Condizioni dei laboratori -Stabilità dei reagenti 9
VARIABILITÀ INTRA- E INTER-SOGGETTO VARIABILITA INTRA-SOGGETTO Se si eseguono misure ripetute sullo stesso soggetto (ad esempio misura della pressione) queste osservazioni possono variare. Se le osservazioni sono ravvicinate nel tempo, la loro DS viene definita come ERRORE DI MISURA. VARIABILITA INTER-SOGGETTO Se si eseguono misure su soggetti diversi, le osservazioni saranno sicuramente diverse. Singole osservazioni su individui contengono una mistura di variabilità intra- e inter-soggetto. 93