STATISTICA esercizi svolti sulla VARIABILITA

Documenti analoghi
CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

STATISTICA: esercizi svolti sulla DIPENDENZA IN MEDIA

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Istituzioni di Statistica e Statistica Economica

Variabilità e Concentrazione Esercitazione n 02

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

STATISTICA: esercizi svolti su MODA, MEDIANA, QUARTILI, DECILI e CENTILI

STATISTICHE DESCRITTIVE Parte II

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

Statistica descrittiva II

STATISTICA esercizi svolti sulla CONCENTRAZIONE

Esercitazioni di Statistica

La variabilità. Antonello Maruotti

STATISTICA: esercizi svolti sulla MEDIA ARITMETICA

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica

STATISTICA: esercizi svolti su MEDIA GEOMETRICA MEDIA ARMONICA e MEDIA QUADRATICA

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

STATISTICA A-K (2014) Soluzione esercizi da svolgere prima settimana

ESERCIZI STATISTICA DESCRITTIVA

STATISTICHE DESCRITTIVE

Esercitazioni di statistica

Esercizi di statistica descrittiva. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 30

Statistica Descrittiva Soluzioni 3. Medie potenziate

Distribuzioni Statistiche e Medie Esercitazione n 01

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Esercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

Statistica. Alfonso Iodice D Enza

Corso di Statistica (canale P-Z) A.A. 2009/10 Prof.ssa P. Vicard LA VARIABILITÀ

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

Statistica Un Esempio

Indici di Dispersione

Tema d esame del 15/02/12

Esercitazioni. Es 1. Dato il seguente dataset

Lezione 4 a - Misure di dispersione o di variabilità

Esercizi di statistica

Statistica. Esercitazione 4 15 maggio 2012 Connessione. Medie condizionate. Covarianza e correlazione

ESAME. 9 Gennaio 2017 COMPITO B

ESEMPI DI DOMANDE PER TUTTE E DUE LE TIPOLOGIE DI PARTECIPANTI

Statistica. Esercitazione 4 17 febbraio 2011 Medie condizionate. Covarianza e correlazione

Analisi della varianza

Matematica ed elementi di statistica Corso di laurea in Scienze e tecnologie per i beni culturali - a.a Esercizi 12: Statistica Descrittiva

Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano:

Corso di Statistica: ESERCITAZIONI

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Le medie. Antonello Maruotti

Esercitazioni di statistica

STATISTICA 1 ESERCITAZIONE 6

REGRESSIONE E CORRELAZIONE

Statistica. Alfonso Iodice D Enza

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Esercitazioni di Statistica

La Variabilità statistica

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

ESERCIZI SVOLTI SUL CALCOLO INTEGRALE

Elementi di statistica

Consideriamo la distribuzione per età di tre diversi collettivi di studenti

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

STATISTICA: esercizi svolti sulla DISTRIBUZIONE NORMALE

4. INDICI DI POSIZIONE

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

INDICATORI DI TENDENZA CENTRALE

Lo scarto quadratico medio è s = s 2 2,15. c) Le confezioni con peso inferiore a 500g sono 18, quindi in percentuale sono 18 = 0,72 = 72%.

Corso di Laurea in Scienze dell Organizzazione Facoltà di Sociologia, Università degli Studi di Milano-Bicocca a.a. 2009/2010.

Dispensa di Statistica

INDICATORI DI TENDENZA CENTRALE

Esercizio 1. Ricavi 102,3 105,6 100,7 105,2 104,8 104,6 100,7 100,2 100,9 102,7 95,4 120,7

La regressione lineare. Rappresentazione analitica delle distribuzioni

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

Indici di posizione e dispersione per distribuzioni di variabili aleatorie

Statistica economica Capitolo 4

tabelle grafici misure di

Esercizi di Probabilità e Statistica

Nuovo Ordinamento Esame di Statistica 20 Giugno 2003 docente: P. Vicard Nome

Statistica Descrittiva Soluzioni 1. Caratteri e distribuzioni statistiche

ESERCIZI: riportare lo svolgimento dell esercizio e commentare il risultato

Statistica economica. Prof. Alessandra Michelangeli a.a

AMBIENTE OPENOFFICE CALC STATISTICA - SCHEDA 1

Istituzioni di Statistica 1 Esercizi su tabelle di contingenza

Statistica. Alfonso Iodice D Enza

Transcript:

STATISTICA esercizi svolti sulla VARIABILITA 1

1 VARIABILITA 2 1 VARIABILITA 1.1 Esercizi 1. La seguente tabella riporta il tempo (in giorni) impiegato da sei individui per il consumo di una confezione di pasta da 250 grammi: 1 3 5 6 15 30. Si calcolino: lo scostamento medio dalla mediana, lo scostamento medio dalla media aritmetica e lo scarto quadratico medio, commentando i risultati ottenuti. Svolgimento Per prima cosa, notiamo che i valori forniti dal testo sono già ordinati: per maggiore chiarezza, comunque li riportiamo di seguito: x (1) = 1 x (2) = 3 x (3) = 5 x (4) = 6 x (5) = 15 x (6) = 30. Dato che il loro numero è pari (N = 6), si hanno due posizioni centrali: N 2 = 3, N 2 + 1 = 4. La mediana è pertanto: x (3) + x (4) = 5 + 6 = 5.5. 2 2 Il valore assunto dalla mediana dice che nel 50% dei casi circa, la durata di un pacchetto di pasta è minore di 5.5 giorni. Analogamente, nel 50% dei casi circa, la durata di un pacchetto di pasta è superiore a 5.5 giorni. La media aritmetica è data da M 1 = 1 6 6 x i = 1 + 3 + 5 + 6 + 15 + 30 6 = 10. Per calcolare lo scostamento medio dalla mediana e dalla media aritmetica e lo scarto quadratico medio, è necessario completare la seguente tabella: x i x i Me x i M 1 (x i M 1 ) 2 1 4.5 9 81 3 2.5 7 49 5 0.5 5 25 6 0.5 4 16 15 9.5 5 25 30 24.5 20 400 Totale 42 50 596

1 VARIABILITA 3 Si ha quindi che lo scostamento medio dalla mediana è S Me = 1 6 6 x i Me = 42 6 = 7 e indica che mediamente le durate del pacchetto di pasta differiscono (si discostano) dalla durata mediana di 7 giorni. Lo scostamento medio dalla media aritmetica è: S M1 = 1 6 6 x i M 1 = 50 6 = 8. 3 e indica che mediamente le durate del pacchetto di pasta differiscono (si discostano) dalla durata media di 8. 3 giorni. Lo scarto quadratico medio è: σ = 1 6 6 (x i M 1 ) 2 = 596 6 = 9.967 e indica che mediamente le durate del pacchetto di pasta differiscono dalla durata media di 9.967 giorni. 2. La seguente tabella fornisce il reddito annuo di sette individui: individui A B C D E F G reddito (in migliaia di euro) 15 20 12 10 18 30 35. Calcolare lo scostamento medio dalla mediana, lo scostamento medio dalla media aritmetica, lo scarto quadratico medio, la devianza e la varianza. Svolgimento Per prima cosa, ordiniamo in ordine crescente i valori forniti dal testo: x (1) = 10 x (2) = 12 x (3) = 15 x (4) = 18 x (5) = 20 x (6) = 30 x (7) = 35. Dato che il loro numero è dispari (N = 7), la posizione mediana è data da: N + 1 2 = 8 2 = 4. La mediana è pertanto: x (4) = 18. Il valore assunto dalla mediana dice che circa il 50% dei redditi (dei 7 individui presi in esame) è minore di 18 (migliaia di euro). Analogamente, circa il 50% dei redditi

1 VARIABILITA 4 (dei 7 individui presi in esame) è maggiore di 18 (migliaia di euro). La media aritmetica è data da M 1 = 1 7 7 x i = 15 + 20 + 12 + 10 + 18 + 30 + 35 7 = 20. Per calcolare lo scostamento dalla mediana e dalla media aritmetica e lo scarto quadratico medio, è necessario completare la seguente tabella: x i x i Me x i M 1 (x i M 1 ) 2 15 3 5 25 20 2 0 0 12 6 2 4 10 8 10 100 18 0 8 64 30 12 10 100 35 17 15 225 TOTALE 48 50 518 Si ha quindi che lo scostamento medio dalla mediana è S Me = 1 7 7 x i Me = 48 7 = 6.857 e indica che mediamente i redditi (dei 7 individui presi in esame) differiscono (si discostano) dal reddito mediano di 6.857 migliaia di euro. Lo scostamento medio dalla media aritmetica è: S M1 = 1 7 7 x i M 1 = 50 7 = 7.143 e indica che mediamente i redditi (dei 7 individui presi in esame) differiscono (si discostano) dal reddito medio di 7.143 migliaia di euro. Lo scarto quadratico medio è: σ = 1 7 7 (x i M 1 ) 2 = 518 7 = 8.6023 e indica che mediamente i redditi (dei 7 individui presi in esame) differiscono dal reddito medio di 8.6023 migliaia di euro.

1 VARIABILITA 5 Avendo calcolato lo scarto quadratico medio, è possibile calcolare la varianza elevandolo al quadrato: σ 2 = 1 7 (x i M 1 ) 2 = 518 7 7 = 74. Dalla tabella precedente, si ricava immediatamente anche la devianza: Dev = 7 (x i M 1 ) 2 = 518. 3. La seguente tabella fornisce la distribuzione delle 100 famiglie di un quartiere secondo il carattere X = numero di figli : Determinare: numero di figli 0 1 2 3 4 5 6 frequenze assolute 30 15 20 12 10 9 4. a) il campo di variazione; b) la differenza interquartile; c) la varianza con il metodo indiretto; d) lo scostamento medio dalla media aritmetica; e) lo scostamento medio dalla mediana. Svolgimento Come prima cosa, conviene riscrivere la tabella fornita dal testo nel seguente modo, calcolando anche le frequenze cumulate: É possibile ora calcolare: a) Il campo di variazione Numero di figli (x j ) n j C j 0 30 30 1 15 45 2 20 65 3 12 77 4 10 87 5 9 96 6 4 100 Totale 100 x (N) x (1) = x (100) x (1) = 6 0 = 6. Tale valore indica che la lunghezza dell intervallo in cui sono compresi i valori del carattere X (numero di figli) è pari a 6.

1 VARIABILITA 6 b) La differenza interquartile Q 3 Q 1 = x (3 N+1 4 ) x ( N+1 4 ) = x (75.75) x (25.25) = 3 0 = 3. Tale valore indica che il 50% delle famiglie analizzate hanno un numero di figli compreso in un intervallo di ampiezza 3. c) La varianza (con il metodo indiretto) σ 2 = 1 N 7 x 2 jn j M1 2 = M2 2 M1. 2 La seguente tabella permette di calcolare: e Quindi x j n j x j n j x 2 j x 2 jn j 0 30 0 0 0 1 15 15 1 15 2 20 40 4 80 3 12 36 9 108 4 10 40 16 160 5 9 45 25 225 6 4 24 36 144 TOT 100 200 732 M 1 = 1 100 M 2 2 = 1 100 7 7 x j n j = 200 100 = 2 x 2 jn j = 732 100 = 7.32. σ 2 = 7.32 (2) 2 = 3.32 d) Lo scostamento medio dalla media aritmetica. La seguente tabella x j n j x j M 1 x j M 1 n j 0 30 2 60 1 15 1 15 2 20 0 0 3 12 1 12 4 10 2 20 5 9 3 27 6 4 4 16 TOT 100 150

1 VARIABILITA 7 permette di calcolare lo scostamento medio da M 1 : S M1 = 1 100 7 x j M 1 n j = 150 100 = 1.5. Tale valore indica che mediamente il numero di figli (delle 100 famiglie prese in esame) differisce (si discosta) dal loro valore medio di 1.5 figli. e) Lo scostamento medio dalla mediana. Per prima cosa, si calcola la mediana: ricordando che N = 100 e utilizzando le frequenze cumulate precedentemente calcolate, si ha Me = x ( N+1 2 ) = x (50.5) = 2. In questo caso, quindi Me = M 1 = 2: si avrà di conseguenza che S Me = S M1 = 1.5. É possibile quindi affermare che mediamente il numero di figli (delle 100 famiglie prese in esame) differisce (si discosta) dal loro valore mediano di 1.5 figli. 4. La seguente tabella riporta la distribuzione del carattere X= numero di stanze di 120 abitazioni della provincia di Belluno: Numero di stanze (x j ) 1 2 3 4 5 6 7 8 n j 5 22 32 35 16 7 2 1. Calcolare il campo di variazione, la differenza interquartile, lo scarto quadratico medio e lo scostamento medio dalla media aritmetica. Svolgimento Come prima cosa, conviene riscrivere la tabella fornita dal testo nel seguente modo, calcolando anche le frequenze cumulate: x j n j C j 1 5 5 2 22 27 3 32 59 4 35 94 5 16 110 6 7 117 7 2 119 8 1 120 TOTALE 120

1 VARIABILITA 8 É possibile ora calcolare: a) Il campo di variazione x (N) x (1) = x (120) x (1) = 8 1 = 7. Tale valore indica che la lunghezza dell intervallo in cui sono compresi i valori del carattere X (numero di stanze) è pari a 7. b) La differenza interquartile Q 3 Q 1 = x (3 N+1 4 ) x ( N+1 4 ) = x (90.75) x (30.25) = 4 3 = 1. Tale valore indica che il 50% delle abitazioni prese in esame hanno un numero di stanze compreso in un intervallo di ampiezza pari a 1. c) Lo scarto quadratico medio e lo scostamento medio dalla media aritmetica. Per prima cosa, è necessario calcolare la media aritmetica. Si completa pertanto la seguente tabella. la quale, permette di calcolare: M 1 = 1 120 Completando la seguente tabella x j n j x j n j 1 5 5 2 22 44 3 32 96 4 35 140 5 16 80 6 7 42 7 2 14 8 1 8 TOT 120 429 8 x j n j = 429 120 = 3.575 x j n j x j M 1 (x j M 1 ) 2 x j M 1 n j (x j M 1 ) 2 n j 1 5 2.575 6.63 12.875 33.15 2 22 1.575 2.48 34.65 54.56 3 32 0.575 0.33 18.4 10.56 4 35 0.425 0.18 14.875 6.3 5 16 1.425 2.03 22.8 32.48 6 7 2.425 5.88 16.975 41.16 7 2 3.425 11.73 6.85 23.46 8 1 4.425 19.58 4.425 19.58 TOT 120 131.85 221.25

1 VARIABILITA 9 è possibile calcolare lo scostamento medio da M 1 : S M1 = 1 120 8 x j M 1 n j = 131.85 120 = 1.09875 (mediamente il numero di stanze delle 120 abitazioni prese in esame differisce dal valore medio di 1.09875 stanze) e lo scarto quadratico medio: σ = 1 8 221.25 120 (x j M 1 ) 2 n j = 120 = 1.358 (mediamente il numero di stanze delle 120 abitazioni prese in esame differisce dal valore medio di 1.358 stanze). 5. La distribuzione del reddito annuo in euro dei 1000 abitanti di un comune è la seguente: classi di reddito redditieri 1000 5000 100 5000 15000 400. 15000 35000 300 35000 75000 200 Si determini la varianza del reddito dei 1000 abitanti. Si verifichi numericamente la relazione tra lo scarto quadratico medio e lo scostamento medio dalla media aritmetica. Svolgimento Per prima cosa, è necessario calcolare la media aritmetica, completando la seguente tabella, dove x j = l j + l+ j 2 indica il valore centrale della j-esima classe: classi di reddito x j n j x j n j 1000 5000 3000 100 300000 5000 15000 10000 400 4000000 15000 35000 25000 300 7500000 35000 75000 55000 200 11000000 TOTALE 1000 22800000 Si ha quindi che: M 1 = 1 N 4 x j n j = 22800000 1000 = 22800. Per calcolare la varianza, e lo scostamento medio da M 1 è necessario completare la seguente tabella:

1 VARIABILITA 10 classi di reddito x j n j x j M 1 x j M 1 n j (x j M 1 ) 2 (x j M 1 ) 2 n j 1000 5000 3000 100 19800 1980000 392040000 39204000000 5000 15000 10000 400 12800 5120000 163840000 65536000000 15000 35000 25000 300 2200 660000 4840000 1452000000 35000 75000 55000 200 32200 6440000 1036840000 207368000000 TOTALE 1000 14200000 313560000000 Quindi lo scostamento medio dalla media aritmetica è pari a S M1 = 1 1000 4 x j M 1 n j = 14200000 1000 = 14200 e tale valore indica che mediamente i redditi dei 1000 abitanti si discostano dal loro valore medio di 14200 euro. La varianza è pari a σ 2 = 1 1000 4 (x j M 1 ) 2 n j = 313560000000 1000 = 313560000 e lo scarto quadratico medio è σ = 1 4 313560000000 (x j M 1 ) 1000 2 n j = 1000 = 17707.625 e tale valore indica che mediamente i redditi dei 1000 abitanti si discostano dal loro valore medio di 17707.625 euro. É facile notare che i valori ottenuti verificano la relazione 14200 < 17707.625 e pertanto è soddisfatta la seguente relazione tra scarto quadratico medio e scostamento medio da M 1 : S M1 σ. 6. La distribuzione delle fatture di una grande azienda, emesse in un mese, secondo l importo in migliaia di euro è riportata nella seguente tabella: classi d importo 0 50 50 100 100 150 150 200 200 250 250 300 300 350 tot n. fatture 8 70 71 62 27 7 3 248 importo totale di classe 304 5600 8946. 10540 6210 1960 960

1 VARIABILITA 11 Calcolare lo scostamento medio dalla mediana; lo scostamento medio dalla media aritmetica; la varianza e lo scarto quadratico medio. Verificare numericamente la relazione esistente tra S Me, S M1 e σ. Svolgimento Per prima cosa, è necessario calcolare la mediana e la media aritmetica della distribuzione. Completiamo perciò la seguente tabella. La posizione mediana è data da Classi d importo n j Tot. di classe (T j ) C j 0 50 8 304 8 50 100 70 5600 78 100 150 71 8946 149 150 200 62 10540 211 200 250 27 6210 238 250 300 7 1960 245 300 350 3 960 248 TOTALE 248 34520 pos(me) = N + 1 2 = 248 + 1 2 = 124.5. Scorrendo la colonna delle frequenze cumulate, riconosciamo che la classe (100; 150] è la classe mediana. Il valore della mediana è pertanto: Me = x (124.5) = 100 + [124.5 78 0.5] (150 100) 71 = 132.39. Utilizzando l informazione relativa ai totali di classe, il calcolo della media aritmetica si può effettuare nel seguente modo: M 1 = 304 + 5600 + 8946 + 10540 + 6210 + 1960 + 960 248 = 34520 248 = 139.19. Utilizzando l informazione sui totali di classe, calcoliamo per ciascuna classe un valore rappresentativo x j, dividendo ciascun totale di classe per la frequenza della classe. Completiamo la seguente tabella. Classi d importo n j Tot. di classe x j x j Me x j Me n j 0 50 8 304 38 94.4 755.2 50 100 70 5600 80 52.39 3667.3 100 150 71 8946 126 6.39 453.69 150 200 62 10540 170 37.61 2331.82 200 250 27 6210 230 97.61 2635.47 250 300 7 1960 280 147.61 1033.27 300 350 3 960 320 187.61 562.83 TOTALE 248 11439.58

1 VARIABILITA 12 Lo scostamento medio dalla mediana è quindi S Me = 1 7 248 x j Me n j = 11439.58 248 = 46.127 e tale valore indica che mediamente gli importi delle fatture si discostano dal loro valore mediano di 46.127 (migliaia di euro). Completando la seguente tabella Classi n j x j x j M 1 x j M 1 n j (x j M 1) 2 (x j M 1) 2 n j 0 50 8 38 101.19 809.52 10239.4161 81915.33 50 100 70 80 59.19 4143.3 3503.4561 245241.93 100 150 71 126 13.19 936.49 173.9761 12352.30 150 200 62 170 30.81 1910.22 949.2561 58853.88 200 250 27 230 90.81 2451.87 8246.4561 222654.31 250 300 7 280 140.81 985.67 19827.4561 138792.19 300 350 3 320 180.81 542.43 32692.2561 98076.77 TOTALE 248 11779.50 857886.71 calcoliamo agevolmente lo scostamento medio dalla media aritmetica: S M1 = 1 7 248 x j M 1 n j = 11779.50 = 47.498 248 e tale valore indica che mediamente gli importi delle fatture si discostano dal loro valore medio di 47.498 (migliaia di euro). La varianza è data da: σ 2 = 1 248 7 (x j M 1 ) 2 n j = 857886.71 = 3459.22, 248 lo scarto quadratico medio σ = 1 7 857886.71 (x j 248 M 1) 2 n j = = 58.815 248 e possiamo interpretare tale valore dicendo che mediamente gli importi delle fatture differiscono dal loro valore medio di 58.815 (migliaia di euro). É possibile verificare infine che vale la relazione infatti S Me S M1 σ 46.127 < 47.498 < 58.815.

1 VARIABILITA 13 7. Sia X un carattere quantitativo con media aritmetica M 1 (X) = 5 e scarto quadratico medio σ(x) = 1.5. Sia Y un altro carattere quantitativo tale che Y = 0.5 2X. Determinare la media aritmetica e la varianza di Y. Svolgimento Dalla proprietà di linearità della media aritmetica, segue immediatamente che M 1 (Y ) = 0.5 2 M 1 (X) = 0.5 2 5 = 9.5. A questo punto, calcoliamo la varianza di X σ 2 (X) = (1.5) 2 = 2.25 e ricordiamo la proprietà della varianza che afferma che se tra i caratteri X e Y sussiste una relazione del tipo Y = a + b X allora tra le varianze di X e Y, vale la relazione: σ 2 (Y ) = b 2 σ 2 (X). Applicando tale proprietà, utilizzando i valori a = 0.5 e b = 2 si ricava la varianza di Y : σ 2 (Y ) = 2 2 σ 2 (X) = 4 2.25 = 9. 8. In un reparto produttivo, vengono impiegate tre macchine alle quali lavorano, rispettivamente, 4, 5 e 3 operai. La seguente tabella riporta i dati relativi alla produzione oraria (per operaio e per macchina): produzione oraria macchina 1 48 49 48 47 produzione oraria macchina 2 56 56 57 57 55 produzione oraria macchina 3 52 51 51 Determinare la varianza della produzione oraria dell intero sistema col metodo indiretto; determinare inoltre la varianza fra e nei gruppi e verificare la proprietà di scomposizione della varianza totale. Svolgimento Come prima cosa, dividiamo i 12 operai in K = 3 gruppi, a seconda della macchina a cui lavorano: si avrà quindi il primo gruppo (di numerosità N 1 pari a 4) composto dagli operai che lavorano alla prima macchina, il secondo gruppo (di numerosità N 2 pari a 5) formato dagli operai che lavorano alla seconda macchina e infine il terzo gruppo (di numerosità N 3 pari a 3) a cui appartengono gli operai che lavorano alla terza macchina. A ciascun operaio è associato un numero che rappresenta la sua produzione oraria.

1 VARIABILITA 14 É possibile a questo punto calcolare, per ciascun gruppo, la produzione oraria media (ovvero le medie parziali): X 1 = M 1 (1a macchina) = X 2 = M 1 (2a macchina) = X 3 = M 1 (3a macchina) = 48 + 49 + 48 + 47 4 59 + 59 + 57 + 57 + 55 5 52 + 51 + 51 3 = 192 4 = 48 = 281 5 = 56.2 = 154 3 = 51. 3. La proprietà associativa della media aritmetica permette di calcolare la media aritmetica totale (ovvero la produzione media oraria complessiva): X = X 1 N 1 + X 2 N 2 + X 3 N 3 = 48 4 + 56.2 5 + 51. 3 3 N 1 + N 2 + N 3 12 = 52.25. Per determinare la varianza della produzione oraria complessiva con il metodo indiretto è necessario applicare la formula: σ 2 tot = 1 N N x 2 i M1 2 = M2 2 M1. 2 Si completa la seguente tabella: Numero macchina x i x 2 i 48 2304 1 49 2401 48 2304 47 2209 56 3136 56 3136 2 57 3249 57 3249 55 3025 52 2704 3 51 2601 51 2601 TOT 628 32919 Quindi: M 2 2 = 1 12 12 x 2 i = 32919 12 = 2743.25.

1 VARIABILITA 15 A questo punto si ricava immediatamente la varianza totale: σ 2 tot = 2743.25 (52.25) 2 = 13.1875. Calcoliamo ora la varianza fra le produzioni medie delle singole macchine (ovvero la varianza fra i gruppi). Si ha quindi: σ 2 F = 1 N = 1 12 K [ X j X] 2 N j 3 [ Xj X ] 2 Nj = (48 52.25)2 4 + (56.2 52.25) 2 5 + (51. 3 52.25) 2 3 12 = 152.7833 = 12.732. 12 Per determinare la varianza nei gruppi, è necessario innanzitutto calcolare le varianze parziali. Si ha quindi (utilizzando il metodo indiretto per il calcolo della varianza), che la varianza del primo gruppo è: quella del secondo gruppo: σ 2 1 = 482 + 49 2 + 48 2 + 47 2 4 (48) 2 = 0.5 e infine per il terzo gruppo: σ 2 2 = 562 + 56 2 + 57 2 + 57 2 + 55 2 5 (56.2) 2 = 0.56 σ 2 3 = 522 + 51 2 + 51 2 3 (51. 3) 2 = 0. 2. Il calcolo della media aritmetica ponderata delle varianze parziali (varianza nei gruppi), è pertanto: σ 2 N = 1 N K σj 2 N j = 1 N 3 σ 2 j N j = 0.5 4 + 0.56 5 + 0. 2 3 12 = 0.4556. A questo punto è possibile verificare la scomposizione della varianza totale:

1 VARIABILITA 16 σ 2 N + σ 2 F = σ 2 tot 0.4556 + 12.732 = 13.1876 ( = 13.1875) Calcolando i rapporti di composizione: σ2 N σ 2 tot σ2 F σ 2 tot = 0.4556 13.1876 = 12.732 13.1876 = 0.0345 (= 3.45%) = 0.9655 (= 96.55%) è possibile notare che la varianza nei gruppi è il 3.45% della varianza totale e che la varianza fra i gruppi è il 96.55% della varianza totale. Da tali considerazioni possiamo concludere che la produzione risulta molto omogenea per ogni macchina (cioè operai che lavorano alla stessa macchina hanno più o meno la stessa produttività) ed eterogenea fra le varie macchine (cioè operai lavoranti a macchine diverse hanno produttività differenti). Le differenze di produttività tra gli operai sono dunque principalmente imputabili al fatto che utilizzano diversi macchinari. 9. La seguente tabella riporta la distribuzione del numero di alberghi delle due località turistiche A e B di un comprensorio, secondo le classi di fatturato annuale (in milioni di Euro): classi di fatturato fino a 1 1 3 3 5 5 10 10 20 20 40 Tot Numero di Alberghi in A 15 24 85 48 40 29 241 Numero di Alberghi in B 25 51 67 59 31 31 264 Si verifichi la scomposizione della varianza del fatturato annuo degli alberghi del comprensorio, commentando il risultato ottenuto. Svolgimento Per prima cosa, dividiamo in K = 2 gruppi gli alberghi del comprensorio: ovviamente avremo un primo gruppo (di numerosità N 1 pari a 241) formato dagli alberghi della località A e un secondo gruppo (di numerosità N 2 pari a 264) composto dagli alberghi della località B. Completiamo quindi la seguente tabella per agevolare i calcoli successivi (con n A j e con n B j si sono indicate rispettivamente le frequenze degli alberghi della località A e quelle degli alberghi della località B corrispondenti alla j-esima classe, mentre x j = l j + l+ j 2 (j = 1,..., 6) indica il valore centrale di ogni classe).

1 VARIABILITA 17 Classi di fatturato x j x 2 j n A j n B j n A j + n B j 0 1 0.5 0.25 15 25 40 1 3 2 4 24 51 75 3 5 4 16 85 67 152 5 10 7.5 56.25 48 59 107 10 20 15 225 40 31 71 20 40 30 900 29 31 60 Totale 241 264 505 A questo punto è possibile calcolare la media aritmetica del fatturato per gli alberghi della località A: X 1 = 1 6 x j n A 0.5 15 + 2 24 + 4 85 + 7.5 48 + 15 40 + 30 29 j = = 9.234 N 1 241 e per gli alberghi della località B: X 2 = 1 6 x j n B 0.5 25 + 2 51 + 4 67 + 7.5 59 + 15 31 + 30 31 j = = 8.409. N 2 264 La media aritmetica del fatturato degli alberghi di tutto il comprensorio è quindi, utilizzando la proprietà associativa della media aritmetica: X = 9.234 241 + 8.409 264 241 + 264 = 8.803. É possibile ora calcolare la varianza del fatturato degli alberghi di tutto il comprensorio, utilizzando le frequenze totali n A j + n B j (ed il procedimento indiretto): σ 2 tot = 1 N 6 x 2 j [n A j + n B j ] X 2 0.25 40 + 4 75 + 16 152 + 56.25 107 + 225 71 + 900 60 = (8.803) 2 505 = 78.422. Calcoliamo ora: la varianza nei gruppi Si deve innanzitutto calcolare la varianza parziale di ciascun gruppo: σ1 2 = 1 6 x 2 j n A j N X 1 2 1 0.25 15 + 4 24 + 16 85 + 56.25 48 + 225 40 + 900 29 = 241 = 39259.75 85.267 = 77.64. 241 (9.234) 2

1 VARIABILITA 18 σ2 2 = 1 6 x 2 j n B j N X 2 2 2 0.25 25 + 4 51 + 16 67 + 56.25 59 + 225 31 + 900 31 = 264 = 39475 70.711 = 78.81 264 e quindi la varianza nei gruppi (σ 2 N ): σ 2 N = σ2 1 N 1 + σ 2 2 N 2 N 1 + N 2 = la varianza fra gruppi Il calcolo della varianza fra i gruppi è invece: 77.64 241 + 78.81 264 505 = 78.252; σf 2 = [( X 1 X) 2 N 1 + ( X 2 X) 2 N 2 ] N 1 + N 2 = [(9.234 8.803)2 241 + (8.409 8.803) 2 264] 505 = 85.750 = 0.1698. 505 In base ai risultati ottenuti, si verifica la scomposizione: (8.409) 2 Calcolando i rapporti di composizione: σ2 N σ 2 tot σ2 F σ 2 tot = 78.252 78.422 = 0.1698 78.422 σ 2 N + σ 2 F = σ 2 tot 78.252 + 0.1698 = 78.4218 ( = 78.422). = 0.9978 (= 99.78%) = 0.0022 (= 0.22%) è possibile notare che la varianza nei gruppi è il 99.78% della varianza totale e che la varianza fra i gruppi è solo lo 0.22% della varianza totale. Da tali considerazioni possiamo concludere che la distribuzione dei fatturati degli alberghi delle località A e B è omogenea (varianza fra i gruppi molto piccola) e che in entrambe le località esistono alberghi con fatturati molto diversi (varianza nei gruppi molto grande). Le differenze tra i fatturati degli alberghi non sono dunque imputabili alla diversa collocazione geografica (località A o B).

1 VARIABILITA 19 10. Nel 1981 gli ospedali in Italia erano 1826 ripartiti per tipo come segue: ospedali generali 1345, ospedali specialistici 295, ospedali psichiatrici 186. Per ogni ospedale è stato rilevato il numero di posti letto ottenendo le informazioni seguenti: osp. generali osp. specialist. osp. psichiatr. n. medio di posti letto 318,51 215,58 407,22 scarto quadratico medio dei posti letto 445,96 259,54 477,84. Si determini il numero medio di posti letto per il complesso di ospedali e la varianza della stessa variabile, commentando il risultato. Svolgimento In questo caso, riconosciamo K = 3 gruppi di numerosità N 1 = 1345, N 2 = 295 e N 3 = 186, formati rispettivamente dagli ospedali generali, dagli ospedali specialistici e dagli ospedali psichiatrici. Avendo le medie della variabile numeri di posti letto per ciascun gruppo, è possibile calcolare la media aritmetica totale, utilizzando la proprietà associativa della media aritmetica: X = 1 N 3 X j N j = 318.51 1345 + 215.58 295 + 407.22 186 1345 + 295 + 186 = 567734.97 1826 = 310.917. Per calcolare la varianza totale, è necessario utilizzare la sua scomposizione in varianza nei gruppi più varianza fra i gruppi. La varianza nei gruppi è perciò (indicando con σ 2 j la varianza del j-esimo gruppo): σ 2 N = 1 N 3 σj 2 N j La varianza fra i gruppi è: σ 2 F = 1 N = (445.96)2 1345 + (259.54) 2 295 + (477.84) 2 186 1826 = 329835109.2 = 180632.59. 1826 3 [ X j X] 2 N i = [318.51 310.917]2 1345 + [215.58 310.917] 2 295 + [407.22 310.917] 2 186 1826 = 4483855.323 = 2455.56. 1826 La varianza totale è quindi pari a:

1 VARIABILITA 20 Calcolando i rapporti di composizione: σ2 N σ 2 tot σ2 F σ 2 tot = 180632.59 183088.15 = 2455.56 183088.15 σ 2 tot = σ 2 N + σ 2 F 183088.15 = 180632.59 + 2455.56. = 0.9866 (= 98.66%) = 0.0134 (= 1.34%) è possibile notare che la varianza nei gruppi è il 98.66% della varianza totale e che la varianza fra i gruppi è l 1.34% della varianza totale. Da tali considerazioni possiamo concludere che ogni gruppo è molto eterogeneo al suo interno (varianza nei gruppi alta): nell ambito di ciascuna tipologia di ospedale (generale, specialistico, psichiatrico) il numero di posti letto è molto variabile da ospedale a ospedale, mentre vi è una forte omogeneità tra le varie tipologie di ospedale (bassa varianza fra i gruppi). Le differenze tra il numero di posti letto degli ospedali non sono dunque imputabili alla diversa tipologia degli ospedali. 11. Il reddito annuo (in migliaia di euro) di sette individui è rispettivamente pari a 15, 20, 12, 10, 18, 30, 35. Determinare e interpretare la differenza media e con ripetizione del reddito. Svolgimento Per agevolare i conti, completiamo la seguente tabella scrivendo nella cella (i, j), la quantità x i x j : x i x j 15 20 12 10 18 30 35 15 0 5 3 5 3 15 20 20 5 0 8 10 2 10 15 12 3 8 0 2 6 18 23 10 5 10 2 0 8 20 25 18 3 2 6 8 0 12 17 30 15 10 18 20 12 0 5 35 20 15 23 25 17 5 0 464 Si ottiene in questo modo che: = S N(N 1) = 1 N(N 1) N N x i x j = 1 464 = 11.048 7 6

1 VARIABILITA 21 e tale valore indica che mediamente i redditi dei sette individui differiscono tra loro per 11.048 migliaia di euro. Inoltre R = S N 2 = 1 N 2 N N x i x j = 1 464 = 9.469. 72 e tale valore indica che mediamente i redditi dei sette individui differiscono tra loro (e con loro stessi) per 9.469 migliaia di euro. Un ulteriore modo per calcolare il numeratore S delle differenze medie è dato da: S = 2 N i x (i) x (j). Illustriamo il calcolo del numeratore S attraverso quest ultima formula. Per prima cosa, è necessario ordinare i valori x j : x (1) = 10 x (2) = 12 x (3) = 15 x (4) = 18 x (5) = 20 x (6) = 30 x (7) = 35 e completare la parte sotto la diagonale principale della seguente tabella, scrivendo nella cella (i,j) la quantità x (i) x (j). x (j) Somme parziali 10 12 15 18 20 30 35 x (i) per riga 10 0 0 12 2 0 2 15 5 3 0 8 18 8 6 3 0 17 20 10 8 5 2 0 25 30 20 18 15 12 10 0 75 35 25 23 20 17 15 5 0 105 232 Si ha pertanto che S = 2 N i x (i) x (j) = 2 232 = 464 e quindi, come volevasi dimostrare: = S N(N 1) = 464 7 6 = 11.048

1 VARIABILITA 22 R = S N 2 = 464 7 2 = 9.469. Giusto per completezza, viene riportato un ulteriore metodo di calcolo per il numeratore S. Completando la seguente tabella: possiamo calcolare S nel seguente modo: j x (j) 2j N 1 x (j) (2j N 1) 1 10-6 -60 2 12-4 -48 3 15-2 -30 4 18 0 0 5 20 2 40 6 30 4 120 7 35 6 210 232 S = 2 7 x (j) (2j N 1) = 2 232 = 464 e quindi ritrovare gli stessi valori calcolati precedentemente per e R. 12. La distribuzione del prezzo del pane al chilogrammo nei capoluoghi di 27 province nel 1970 e nel 1989 è riportata nella seguente tabella: prezzo lire al kg. 1970 700 800 900 950 1000 1200 tot frequenze 1 4 2 3 7 10 27 prezzo lire al kg. 1989 2100 2500 2600 2950 3000 3600 tot frequenze 2 3 2 4 6 10 27. a) Determinare la differenza media semplice e con ripetizione del prezzo del pane nel 1970; b) Si può dire che dal 1970 al 1989 ci sia stato un aumento della variabilità del fenomeno? Svolgimento a) Ricordando che in questo caso N = 27, completiamo la seguente tabella che agevolerà il calcolo delle differenze medie.

1 VARIABILITA 23 x j n j C j 2C j N n j n j (2C j N n j ) x j n j (2C j N n j ) 700 1 1-26 -26-18200 800 4 5-21 -84-67200 900 2 7-15 -30-27000 950 3 10-10 -30-28500 1000 7 17 0 0 0 1200 10 27 17 170 204000 Totale 27 63100 Utilizzando la formula per il calcolo del numeratore S, la differenza media semplice è quindi data da: = S N(N 1) = 2 N(N 1) 6 x j n j (2C j N n j ) = 2 63100 = 179.77. 27 26 Tale valore indica che i prezzi del pane nei 27 capoluoghi nel 1970 differiscono mediamente tra loro di 179.77 lire. La differenza media con ripetizione è data da: R = S N 2 = 2 N 2 6 x j n j (2C j N n j ) = 2 63100 = 173.11. (27) 2 Tale valore indica che i prezzi del pane nei 27 capoluoghi nel 1970 differiscono mediamente tra loro (e con loro stessi) di 173.11 lire. b) Osservando i valori del prezzo del pane nei due anni presi in esame, è facile rendersi conto che l ordine di grandezza è differente, ragion per cui per confrontare le variabilità dei prezzi del pane nei due anni (1970 e 1989) è necessario ricorrere a indici relativi di variabilità. Poichè al punto precedente abbiamo calcolato sulla distribuzione dei prezzi del 1970 gli indici e R, la scelta più ovvia è quella di confrontare la variabilità dei prezzi del 1970 e del 1989 con gli indici relativi: M 1 o R M 1. Per completezza, tuttavia, calcoliamo anche gli altri indici relativi noti: S M1 M 1, S Me M 1 e σ M 1. Calcoliamo perciò la mediana e la media aritmetica relative all anno 1970: M (1970) 1 = Me (1970) = x ( N+1 2 ) = x ( 27+1 2 ) = x (14) = 1000 700 1 + 800 4 + 900 2 + 950 3 + 1000 7 + 1200 10 27 = 1020.37

1 VARIABILITA 24 e la mediana e la media aritmetica relative all anno 1989: Me (1989) = x ( N+1 2 ) = x ( 27+1 2 ) = x (14) = 3000 M (1989) 2100 2 + 2500 3 + 2600 2 + 2950 4 + 3000 6 + 3600 10 1 = 27 Si completa la seguente tabella, relativa all anno 1970: = 3062.96 x j n j x j Me x j Me n j x j M 1 x j M 1 n j (x j M 1 ) 2 (x j M 1 ) 2 n j 700 1 300 300 320.37 320.37 102636.94 102636.94 800 4 200 800 220.37 881.48 48562.93 194251.72 900 2 100 200 120.37 240.74 14488.94 28977.88 950 3 50 150 70.37 211.11 4951.94 14855.82 1000 7 0 0 20.37 142.59 414.94 2904.58 1200 10 200 2000 179.63 1796.3 32266.94 322669.4 Totale 27 3450 3592.59 666296.34 grazie alla quale è possibile calcolare S (1970) Me S (1970) M 1 = 1 N = 1 N σ (1970) = 1 N 6 6 x j Me (1970) n j = 3450 27 = 127. 7 x j M (1970) 1 n j = 3592.59 27 = 133.059 6 (x j M (1970) 666296.34 1 ) 2 n j = = 159.07. 27 Completiamo l analoga tabella relativa all anno 1989: x j n j x j Me x j Me n j x j M 1 x j M 1 n j (x j M 1 ) 2 (x j M 1 ) 2 n j 2100 2 900 1800 962.96 1925.92 927291.96 1854583.92 2500 3 500 1500 562.96 1688.88 316923.96 950771.88 2600 2 400 800 462.96 925.92 214331.96 428663.92 2950 4 50 200 112.96 451.84 12759.96 51039.84 3000 6 0 0 62.96 377.76 3963.96 23783.76 3600 10 600 6000 537.04 5370.4 288411.96 2884119.6 Totale 27 10300 10740.72 6192962.92 grazie alla quale è possibile calcolare S (1989) Me = 1 N 6 x j Me (1989) n j = 10300 27 = 381.48 S (1989) M 1 = 1 N 6 x j M (1989) 1 n j = 10740.72 27 = 397.8

1 VARIABILITA 25 σ (1989) = 1 N 6 (x j M (1989) 1 ) 2 n j = 6192962.92 27 = 478.92. Ricordiamo infine di aver calcolato, per l anno 1970, e (1970) = 179.77 (1970) R = 173.11. Completiamo l analoga tabella (relativa all anno 1989): x j n j C j 2C j N n j x j n j (2C j N n j ) 2100 2 2-25 -105000 2500 3 5-20 -150000 2600 2 7-15 -78000 2950 4 11-9 -106200 3000 6 17 1 18000 3600 10 27 17 612000 190800 grazie alla quale possiamo calcolare (1989) = e S N(N 1) = 1 N(N 1) 2 6 x j n j (2C j N n j ) = 2 190800 27 26 = 543.59 (1989) R = S N 2 = 1 N 2 2 6 x j n j (2C j N n j ) = 2 190800 27 2 = 523.45. Riassumiamo nella seguente tabella i valori calcolati sia per l anno 1970 che per l anno 1989: Anno 1970 Anno 1989 Me 1000 3000 M 1 1020.37 3062.96 S Me 127. 7 381.48 S M1 133.059 397.805 σ 157.09 478.92 179.77 543.59 R 173.11 523.45 É possibile a questo punto calcolare i seguenti indici relativi di variabilità:

1 VARIABILITA 26 Anno 1970 Anno 1989 S Me M 1 : S M1 M 1 : CV = σ M 1 : M 1 : R M 1 : 127. 7 1020.37 133.059 1020.37 157.09 1020.37 179.77 1020.37 173.11 1020.37 = 0.1252 > 381.48 3062.96 = 0.1245 = 0.1304 > 397.805 3062.96 = 0.1299 = 0.1540 < 478.92 3062.96 = 0.1564 = 0.1762 < 543.59 3062.96 = 0.1774 = 0.1696 < 523.45 3062.96 = 0.1708 Il valore 0.1252 indica che lo scostamento dalla mediana del prezzo del pane nel 1970 è pari al 12.52% della media aritmetica. Il valore 0.1245 indica che lo scostamento dalla mediana del prezzo del pane nel 1989 è pari al 12.45% della media aritmetica. Il valore 0.1304 indica che lo scostamento dalla media aritmetica del prezzo del pane nel 1970 è pari al 13.04% della media aritmetica. Il valore 0.1299 indica che lo scostamento dalla media aritmetica del prezzo del pane nel 1989 è pari al 12.99% della media aritmetica. Il valore 0.1540 indica che lo scarto quadratico medio del prezzo del pane nel 1970 è pari al 15.40% della media aritmetica. Il valore 0.1564 indica che lo scarto quadratico medio del prezzo del pane nel 1989 è pari al 15.64% della media aritmetica. Il valore 0.1762 indica che la differenza media semplice del prezzo del pane nel 1970 è pari al 17.62% della media aritmetica. Il valore 0.1774 indica che la differenza media semplice del prezzo del pane nel 1989 è pari al 17.74% della media aritmetica. Il valore 0.1696 indica che la differenza media con ripetizione del prezzo del pane nel 1970 è pari al 16.96% della media aritmetica. Il valore 0.1708 indica che la differenza media con ripetizione del prezzo del pane nel 1989 è pari al 17.08% della media aritmetica. Attraverso il confronto dei valori assunti dagli indici relativi di variabilità calcolati, si può concludere che la variabilità del prezzo del pane dei 27 capoluoghi

1 VARIABILITA 27 presi in esame nel 1989 non è sensibilmente aumentata rispetto al 1970. 13. La classificazione di due gruppi di ditte produttrici di olio d oliva, che vendono rispettivamente il proprio prodotto a peso (gruppo A) e a volume (gruppo B), ha dato luogo alle seguenti distribuzioni di frequenze: gruppo A prezzo euro al kg 2 3 3 3,5 3,5 4 4 4,5 4,5 5 n. ditte 40 90 200 110 60 gruppo B prezzo euro al litro 2 3 3 3,5 3,5 4 4 4,5 4,5 5 n. ditte 100 80 70 30 20 Quale delle due distribuzioni presenta maggiore variabilità? Si effettui il confronto utilizzando indici basati sullo scostamento medio dalla media aritmetica, sullo scostamento medio dalla mediana, sullo scarto quadratico medio e sulla differenza media semplice.. Svolgimento Per prima cosa, completiamo la seguente tabella per agevolare il calcolo della mediana e della media aritmetica per ciascuno dei due gruppi (si indicano con n A j e n B j le frequenze dei gruppi A e B, inoltre con N A si è indicata la numerosità complessiva del gruppo A e con N B quella del gruppo B, infine x j = l j + l+ j 2 di ogni classe). indica il valore centrale classi di prezzo x j n A j n B j Cj A Cj B x j n A j x j n B j 2 3 2.5 40 100 40 100 100 250 3 3.5 3.25 90 80 130 180 293 260 3.5 4 3.75 200 70 330 250 750 263 4 4.5 4.25 110 30 440 280 468 128 4.5 5 4.75 60 20 500 300 285 95 Totale 500 300 1895 995 É possibile ora calcolare la mediana per ciascuno dei due gruppi: Me A = x N A +1 = x 2 ( 500+1 2 ) = x (250.5) = 3.5 + [250.5 130 0.5] 0.5 200 = 3.8 Me B = x N B +1 = x 2 ( 300+1 2 ) = x (150.5) = 3 + [150.5 130 0.5] 0.5 80 = 3.3125 e le medie aritmetiche: M A 1 = 1 N A 5 x j n A j = 1895 500 = 3.79

1 VARIABILITA 28 M B 1 = 1 N B 5 x j n B j = 995 300 = 3.31 6. Completiamo quindi la tabella relativa al gruppo A: x j n A j x j Me A x j Me A n A j x j M1 A x j M1 A na j x 2 j x 2 j na j 2.5 40 1.3 52 1.29 51.6 6.25 250 3.25 90 0.55 49.5 0.54 48.6 10.5625 950.625 3.75 200 0.05 10 0.04 8 14.0625 2812.5 4.25 110 0.45 49.5 0.46 50.6 18.0625 1986.875 4.75 60 0.95 57 0.96 57.6 22.5625 1353.75 Totale 500 218 216.4 7353.75 da cui ricaviamo σ A = 1 N A S A Me = 1 N A S A M 1 = 1 N A 5 5 x j Me A n A j = 218 500 = 0.436 x j M A 1 n A j = 216.4 500 = 0.4328 5 7353.75 x 2 j na j [MA 1 ] 2 = (3.79) 500 2 = 0.3434 = 0.586. Completiamo anche la seguente tabella (sempre relativa al gruppo A): x j n A j Cj A 2Cj A N A n A j x j n A j (2Cj A N A n A j ) 2.5 40 40-460 -46000 3.25 90 130-330 -96525 3.75 200 330-40 -30000 4.25 110 440 270 126225 4.75 60 500 440 125400 79100 grazie alla quale possiamo calcolare A = S N A (N A 1) = 1 N A (N A 1) 2 5 Calcoliamo ora le stesse grandezze per il gruppo B: x j n A j (2C A j N A n A j ) = 2 79100 500 499 = 0.6341.

1 VARIABILITA 29 x j n B j x j Me B x j Me B n B j x j M1 B x j M1 B nb j x 2 j x 2 j nb j 2.5 100 0.813 81.3 0.81 6 81. 6 6.25 625 3.25 80 0.063 5.04 0.0 6 5. 3 10.5625 845 3.75 70 0.438 30.66 0.4 3 30. 3 14.0625 984.375 4.25 30 0.938 28.14 0.9 3 28 18.0625 541.875 4.75 20 1.438 28.76 1.4 3 28. 6 22.5625 451.25 Totale 500 173.9 174 3447.5 da cui ricaviamo σ B = 1 N B S B Me = 1 N B S B M 1 = 1 N B 5 x j Me B n B j = 173.9 300 = 0.579 5 5 x 2 j nb j [MB 1 ] 2 = x j M B 1 n B j = 174 300 = 0.58 3447.5 300 (3.31 6) 2 = 0.4914 = 0.701. Completiamo anche la seguente tabella (sempre relativa al gruppo B): x j n B j Cj B 2Cj B N B n B j x j n B j (2Cj B N B n B j ) 2.5 100 100-200 -50000 3.25 80 180-20 -5200 3.75 70 250 130 34125 4.25 30 280 230 29325 4.75 20 300 280 26600 34850 grazie alla quale possiamo calcolare B = S N B (N B 1) = 1 N B (N B 1) 2 5 x j n B j (2C B j N B n B j ) = 2 34850 300 299 = 0.777. É possibile a questo punto calcolare i seguenti indici relativi di variabilità:

1 VARIABILITA 30 Gruppo A Gruppo B S Me M 1 : S M1 M 1 : CV = σ M 1 : M 1 : 0.436 3.79 0.4328 3.79 0.586 3.79 0.6341 3.79 = 0.115 < 0.579 3.31 6 = 0.1746 = 0.1142 < 0.58 3.31 6 = 0.1749 = 0.1546 < 0.701 3.31 6 = 0.2114 = 0.1673 < 0.777 3.31 6 = 0.2343 Confrontando i valori degli indici relativi di variabilità, si può concludere che presenta maggiore variabilità la distribuzione delle ditte del gruppo B. 14. Nella seguente tabella sono riportate le distribuzioni per destinazione dei viaggi di vacanza (V ) e dei viaggi di lavoro (W) effettuati dagli italiani nel 1998 (dati in migliaia): Destinazione V W Italia 67682 10944 Paesi UE 7238 1984. Resto d Europa 1989 378 Resto del mondo 2236 501 Si valuti, con un opportuno indice basato sulle differenze medie, quale delle due distribuzioni V e W presenta la variabilità più elevata. Si interpretino i valori assunti dall indice per le due distribuzioni. Svolgimento Riconosciamo innanzitutto che abbiamo a che fare con una distribuzione di unità e che la popolazione statistica è costituita da 4 unità (N = 4). Per calcolare la differenza media per i viaggi di vacanza (V ), completiamo la seguente tabella, in cui le osservazioni sono state ordinate in modo crescente secondo i valori del carattere. Destinazione i v (i) 2i N 1 v (i) (2i N 1) Resto d Europa 1 1989-3 -5967 Resto del mondo 2 2236-1 -2236 Paesi EU 3 7238 1 7238 Italia 4 67682 3 203046 Totale 79145 202081

1 VARIABILITA 31 Possiamo pertanto calcolare la differenza media: (V ) = la media aritmetica: 2 N(N 1) 4 M 1 (V ) = 1 4 v (i) (2i N 1) = 2 202081 = 33680.17, 4 3 4 e quindi l indice relativo di variabilità: v i = 79145 4 = 19786.25 (V ) M 1 (V ) = 33680.17 19786.25 = 1.702 che indica che la differenza media semplice del numero di viaggi di vacanza è il 170.2% della corrispondente media aritmetica. Consideriamo ora il carattere W: Destinazione i w (i) 2i N 1 w (i) (2i N 1) Resto d Europa 1 378-3 -1134 Resto del mondo 2 501-1 -501 Paesi EU 3 1984 1 1984 Italia 4 10944 3 32832 Totale 13807 33181 Possiamo pertanto calcolare la differenza media: (W) = la media aritmetica: 2 N(N 1) 4 M 1 (W) = 1 4 w (i) (2i N 1) = 2 33181 = 5530.1 6, 4 3 4 e quindi l indice relativo di variabilità: w i = 13807 4 = 3451.75 (W) M 1 (W) = 5530.16 3451.75 = 1.602. che indica che la differenza media semplice del numero di viaggi di lavoro è il 160.2% della corrispondente media aritmetica. Riconoscendo che (V ) M 1 (V ) = 1.702 > 1.602 = (W) M 1 (W) si può concludere che la distribuzione V presenta maggiore variabilità.

1 VARIABILITA 32 15. Una fabbrica produce tubi catodici televisivi di due tipi. Per il tipo A si ha una durata media di 1495 ore e uno scarto quadratico medio di 280 ore. Per il tipo B si ha una durata media di 1875 ore ed uno scarto quadratico medio di 310 ore. Fornire una misura della variabilità relativa e commentare il risultato. Svolgimento Un indice di variabilità relativa per i tubi di tipo A è dato da: σ A M A 1 = 280 1495 = 0.19 e tale valore indica che lo scarto quadratico medio della durata dei tubi del tipo A è il 19% della corrispondente durata media. Per quanto riguarda i tubi del tipo B si ha: σ B M B 1 = 310 1875 = 0.17. e tale valore indica che lo scarto quadratico medio della durata dei tubi del tipo B è il 17% della corrispondente durata media. Riconoscendo che σ A = 0.19 > 0.17 = σb M1 A M1 B si può concludere che la distribuzione delle durate dei tubi catodici del gruppo A presenta maggiore variabilità rispetto a quella del gruppo B.