Lezione 8. Statistica sociale Laurea specialistica in Progettazione e gestione del turismo culturale

Documenti analoghi
Quartili. Esempio Q 3. Me Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C

Quartili. Esempio Q 3 Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C

Lezione 5. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 5. A. Iodice.

Alcuni concetti di statistica: medie, varianze, covarianze e regressioni

Approfondimento 3.3. Calcolare gli indici di posizione con dati metrici singoli e raggruppati in classi

Prof.ssa Paola Vicard

Statistica 1 A.A. 2015/2016

Esercitazione parte 1 Medie e medie per dati raggruppati. Esercitazione parte 2 - Medie per dati raggruppati

Quesito 1. I seguenti dati si riferiscono ai tempi di reazione motori a uno stimolo luminoso, espressi in decimi di secondo, di un gruppo di piloti:

Esercitazioni di Statistica Dott. Danilo Alunni Fegatelli

Campionamento casuale da popolazione finita (caso senza reinserimento )

Costo manutenzione (euro)

Distribuzioni per unità

Esercitazioni di Statistica Dott.ssa Cristina Mollica

SUCCESSIONI DI FUNZIONI

STATISTICA DESCRITTIVA

MEDIE STATISTICHE. Media aritmetica, Media quadratica, Media Geometrica, Media Armonica

MEDIE ALGEBRICHE E DI POSIZIONE

2,3, (allineamenti decimali con segno, quindi chiaramente numeri reali); 4 ( = 1,33)

ELEMENTI DI STATISTICA. Giancarlo Zancanella 2015

STUDIO DEL LANCIO DI 3 DADI

STATISTICA. ES: Viene svolta un indagine per stabilire il numero di figli in 20 famiglie. I risultati sono raccolti nella seguente tabella:

Strumenti di indagine per la valutazione psicologica

1.6 Serie di potenze - Esercizi risolti

SERIE NUMERICHE Esercizi risolti. (log α) n, α > 0 c)

SERIE DI POTENZE Esercizi risolti. Esercizio 1 Determinare il raggio di convergenza e l insieme di convergenza della serie di potenze. x n.

Università degli Studi di Cassino, Anno accademico Corso di Statistica 2, Prof. M. Furno

IL CALCOLO COMBINATORIO

Appendice A. Elementi di Algebra Matriciale

Principio di induzione: esempi ed esercizi

LE MISURE DI VARIABILITÀ DI CARATTERI QUANTITATIVI

Stima della media di una variabile X definita su una popolazione finita

Dispensa di STATISTICA DESCRITTIVA

Popolazione e Campione

NUOVI CRITERI DI DIVISIBILITÀ

Esercizi svolti. 1. Calcolare i seguenti limiti: log(1 + 3x) x 2 + 2x. x sin 2x. l) lim. b) lim. x 0 sin x. 1 e x2 d) lim. c) lim.

( 4) ( ) ( ) ( ) ( ) LE DERIVATE ( ) ( ) (3) D ( x ) = 1 derivata di un monomio con a 0 1. GENERALITÀ

FUNZIONI RADICE. = x dom f Im f grafici. Corso Propedeutico di Matematica. Politecnico di Torino CeTeM. 7 Funzioni Radice RICHIAMI DI TEORIA

Titolo della lezione. Dal campione alla popolazione: stima puntuale e per intervalli

(1 2 3) (1 2) Lezione 10. I gruppi diedrali.

CALCOLO COMBINATORIO

La correlazione e la regressione. Antonello Maruotti

Tavole di Contingenza Connessione

MATEMATICA DEL DISCRETO elementi di calcolo combinatorio. anno acc. 2009/2010

STATISTICA DESCRITTIVA - SCHEDA N. 4 VARIABILI QUANTITATIVE (Trasformazioni lineari Indici di covarianza e correlazione)

Approfondimento 2.1 Scaling degli stimoli mediante il metodo del confronto a coppie

Radicali. Esistenza delle radici n-esime: Se n è pari: ogni numero reale non negativo (cioè positivo o nullo) ha esattamente una radice n-esima in R.

Appunti complementari per il Corso di Statistica

Titolo della lezione. Campionamento e Distribuzioni Campionarie

Algoritmi e Strutture Dati (Elementi)

Matematica e Statistica: Modulo di Statistica - Prof. Federico Di Palma - Appello del 12 Febbraio

Qual è il numero delle bandiere tricolori a righe verticali che si possono formare con i 7 colori dell iride?

Soluzioni. 2 2n+1 3 2n. n=1. 3 2n 9. n=1. Il numero 2 può essere raccolto fuori dal segno di sommatoria: = 2. n=1 = = 8 5.

Esercitazioni di Statistica

Aritmetica 2016/2017 Esercizi svolti in classe Seconda lezione

Proposizione 1. Due sfere di R m hanno intersezione non vuota se e solo se la somma dei loro raggi e maggiore della distanza fra i loro centri.

Precorso di Matematica, aa , (IV)

Anemia. Anemia - percentuali

Consideriamo un insieme di n oggetti di natura qualsiasi. Indicheremo questi oggetti con

Esercizi sul principio di induzione

Programma (orientativo) secondo semestre 32 ore - 16 lezioni

1. I numeri naturali. 2. Confronto degli interi naturali. 3. Il sistema di numerazione decimale

RISOLUZIONE MODERNA DI PROBLEMI ANTICHI

Teoria dei Fenomeni Aleatori AA 2012/13

IPSAA U. Patrizi Città di Castello (PG) Classe 5A Tecnico Agrario. Lezione di martedì 10 novembre 2015 (4 e 5 ora) Disciplina: MATEMATICA

Lezioni di Matematica 1 - I modulo

Università di Milano Bicocca Esercitazione 4 di Matematica per la Finanza 24 Aprile 2015

LA INTERPOLAZIONE Appartamenti venduti nel 2006 da un agenzia immobiliare di Treviso.

CAPITOLO SETTIMO GLI INDICI DI FORMA 1. INTRODUZIONE

Intervalli di confidenza

Lezione 4. Gruppi di permutazioni

Università di Napoli Federico II, DISES, A.a , CLEC, Corso di Statistica (L-Z) Lezione 22 La verifica delle ipotesi. Corso di Statistica (L-Z)

La dinamica dei sistemi - intro

Statistica 1 A.A. 2015/2016

Cenni di topologia di R

Relazioni statistiche

Probabilità 1, laurea triennale in Matematica II prova scritta sessione estiva a.a. 2008/09

Corso di Informatica

Esame di Statistica A-Di Prof. M. Romanazzi

ORDINAMENTO 2010 SESSIONE STRAORDINARIA - QUESITI QUESITO 1

ALGEBRA I MODULO PROF. VERARDI - ESERCIZI. Sezione 1 NUMERI NATURALI E INTERI

DETERMINANTI (SECONDA PARTE). NOTE DI ALGEBRA LINEARE

Elementi di Calcolo Combinatorio

UNIVERSITÀ DEGLI STUDI DI MILANO - BICOCCA

TEST STATISTICI. indica l ipotesi che il parametro della distribuzione di una variabile assume il valore 0

min z wz sub F(z) = y (3.1)

Sperimentazioni di Fisica I mod. A Lezione 2

Cosa vogliamo imparare?

Esercizi di Calcolo delle Probabilità e Statistica Matematica

DISTRIBUZIONI DOPPIE

CORSO DI STATISTICA I (Prof.ssa S. Terzi)

PRINCIPIO D INDUZIONE E DIMOSTRAZIONE MATEMATICA. A. Induzione matematica: Introduzione

Parte V La descrizione dei fenomeni attraverso la statistica

Preparazione al corso di statistica Prof.ssa Cerbara

15 - Successioni Numeriche e di Funzioni

= Pertanto. Per la formula di Navier ( σ = ), gli sforzi normali σ più elevati nella sezione varranno: di compressione);

RAPPRESENTAZIONE ANALITICA DEI PUNTALI OGIVALI PER PROIETTILI

Mole e Numero di Avogadro

Problema di Natale 1 Corso di Geometria per la Laurea in Fisica Andrea Sambusetti 19 Dicembre 2008

Richiami sulle potenze

Transcript:

Statistica sociale Laurea specialistica i Progettazioe e gestioe del turismo culturale Lezioe 8 Itroduzioe all aalisi aalisi statistica dei dati (2) Gialuca Domiutti

Si presetao quidi alcue misure statistiche che cosetoo di descrivere i sitesi le distribuzioi di frequeze costruite i precedeza. I particolare si parlerà di 1 Idici di posizioe 2 Idici di variabilità 3 Idici di variabilità relativa 4 La mutabilità 5 Rapporti statistici

1 Idici di posizioe 1 Idici di posizioe Gli idici di posizioe soo delle misure medie di sitesi che rappresetao ua distribuzioe di frequeze. Cosidereremo le misure che soo applicabili ai caratteri qualitativi (moda) e ai caratteri quatitativi (mediaa, media), ricordado che le elaborazioi che si fao sulle variabili o soo applicabili alle mutabili. 1.1 La moda (Mo) La moda è la modalità del carattere, mutabile o variabile, a cui è associata la frequeza più elevata, ovvero è la modalità o itesità più frequete. Esempio Distribuzioe di frequeze della mutabile colore dei capelli Modalità N frequeze assolute Biaco 20 Biodo chiaro 25 Biodo ceere 28 Castao chiaro 50 Castao scuro 62 Nero 15 Totale 200

1 Idici di posizioe - Moda Esempio Età degli studeti che hao frequetato il corso di Statistica sociale ell aa 2003/2004 18,00 19,00 20,00 21,00 22,00 23,00 24,00 25,00 26,00 28,00 30,00 43,00 44,00 Totale Frequeze Percetuali 27 21,1 63 49,2 16 12,5 6 4,7 3 2,3 3 2,3 2 1,6 3 2,3 1,8 1,8 1,8 1,8 1,8 128 100,0 Esempio Età degli studeti che hao frequetato il corso di Statistica sociale ell aa 2003/2004 (dati i classi) Età i classi Frequeze assolute 18 21 106 21 24 12 24 27 6 27 e oltre 4 totale 128

1 Idici di posizioe - Moda Nei casi appea visti abbiamo delle distribuzioi uimodali, ovvero c è ua sola moda i ogi distribuzioe. Se ivece ci soo più modalità alle quali è associata la massima frequeza si parla di distribuzioi multimodali. Esempio Geeri musicali preferiti dai giovai Geeri N Musica leggera 75 Jazz 48 Techo 90 Hard rock 33 New Age 90 Musica classica 67 Totale 403 Siamo i preseza di ua distribuzioe bimodale, i quato i geeri musicali che hao registrato il umero più elevato di scelte soo la musica Techo e la New Age, ciascua co 90 prefereze. Il pregio di questo idice di posizioe è la sua immediata visibilità e il fatto che può essere applicato a qualuque tipo di carattere. Il difetto pricipale è che, da sola, ci dà u iformazioe debole i quato ci dice solo qual è la modalità più frequete ma o ci cosete di capire come soo distribuite le altre modalità tra le uità statistiche osservate.

1 Idici di posizioe - Mediaa U idice più elaborato è la mediaa che, applicata a caratteri quatitativi, ci dice qual è la modalità che si trova esattamete al cetro di u isieme di dati ordiati, ovvero è quel valore che bipartisce la distribuzioe i modo tale da lasciare metà delle osservazioi al di sopra e metà delle osservazioi al di sotto del valore stesso. Questo idice ci cosete di otteere il baricetro della distribuzioe che, associato alla moda, può rappresetare i maiera più adeguata la distribuzioe delle osservazioi. Cosideriamo u isieme di soggetti ai quali è stata chiesta l età: 50 37 42 53 28 la prima operazioe da fare è ordiare i modo crescete i valori osservati 28 37 42 50 53 ci si posizioa quidi sul valore cetrale, ovvero il 42, che divide a metà la distribuzioe, ifatti è preceduto da due valori ed à seguito da altri due. La mediaa è rappresetata da 42 ai.

1 Idici di posizioe - Mediaa Sì cosideri u ulteriore distribuzioe ordiata: 28 37 42 50 68 ache i questo caso la mediaa è pari a 42 ma è cambiato u valore estremo. Si dimostra così che, se ella distribuzioe si osserva ua valore sesibilmete diverso, la mediaa è più resistete ella rappresetazioe della distribuzioe. Ifie potremmo trovarci di frote alla seguete distribuzioe: 1 3 42 79 85 uovamete la mediaa è 42 ma la distribuzioe dei dati è visibilmete più dispersa rispetto alle precedeti. Questi esempi ci fao capire come la mediaa rappreseti u idice utile per descrivere i sitesi ua distribuzioe attraverso il valore che la bipartisce ma, al cotempo, è isufficiete per capire se quel valore sia rappresetativo della distribuzioe stessa.

1 Idici di posizioe - Mediaa Idividuiamo ora la regola per calcolare la mediaa se abbiamo u umero dispari o u umero pari di osservazioi. Se il umero di osservazioi è dispari, il calcolo della mediaa sarà dato da: +1 Me = xi di 2 dove: Me = mediaa xi = modalità assuta dal carattere = umero di osservazioi Nel ostro esempio le osservazioi soo cique e l età mediaa è quella che occupa la posizioe = 3 L età corrispodete alla terza posizioe è 42 ai. Facciamo u altro esempio: la variabile è l altezza espressa i cetimetri (già ordiati) 128 136 149 153 159 166 180 Le osservazioi soo sette, quidi l altezza mediaa sarà quella corrispodete alla posizioe +1, 2 ovvero 4. Nella quarta posizioe troviamo il valore 153, questo sigifica che l altezza mediaa è pari a 153 cm.

1 Idici di posizioe - Mediaa Diverso è il caso i cui il umero di osservazioi è pari: 40 48 52 60 No esiste, come el caso di u umero dispari di osservazioi, u valore cetrale che bipartisca la distribuzioe, sarà pertato ecessario idividuare i due valori cetrali e calcolare la media, applicado la seguete formula: M e = x( / 2) + x( / 2) + 1 2 dove: = umero di osservazioi x (/2) = itesità associata al soggetto che occupa la posizioe /2, che si calcola dividedo il totale delle osservazioi per due x (/2)+1 = itesità associata al soggetto che occupa la posizioe successiva a quella trovata dividedo il totale delle osservazioi per due, ovvero /2+1 Cosideriamo l esempio: = 4 (/2) = 4/2 = 2, quidi x di (/2), ovvero l itesità associata alla secoda osservazioe, è 48 (/2)+1 = 2+1 = 3, ovvero è il valore associato alla posizioe successiva alla precedete, quidi x di (/2)+1, l itesità associata alla terza osservazioe, è 52 48 + 52 M e = = 2 100 2 = 50

1 Idici di posizioe - Mediaa Se ivece di ua sequeza di dati dispoiamo di ua distribuzioe di frequeze, precederemo i modo aalogo a quato detto sopra alla ricerca della mediaa. Cosideriamo ad esempio la distribuzioe di frequeza dell altezza di ua scolaresca di 200 bambii di scuola elemetare: Esempio Altezza dei bambii di ua scuola elemetare (i cetimetri) Altezza N N cumulate % % cumulate 125 25 25 12,5 12,5 130 75 100 37,5 50,0 132 22 122 11,0 61,0 137 33 155 16,5 77,5 140 25 180 12,5 90,0 145 20 200 10,0 100,0 totale 200 100,0 Per idividuare il valore mediao possiamo seguire due vie: 1) applicare la formula vista i precedeza o 2) utilizzare le frequeze cumulate. 1) Nel primo caso, trattadosi di u umero pari di osservazioi, applicheremo la relazioe: M e = x( / 2) + x( / 2) + 1 2 = 200 /2 = 200/2 = 100, e il valore associato al cetesimo soggetto è 130cm /2+1 = 100+1=101, e il valore associato al cetouesimo soggetto è 132cm 130 + 132 M e = = 2 262 2 = 131

1 Idici di posizioe - Mediaa 2) Seguedo il secodo metodo si calcolao le percetuali e quidi le percetuali cumulate. Si trova l itesità associata al 50%, ovvero 130 e quidi quella associata al 51% della percetuale cumulata, ovvero 132. Trattadosi di u umero pari di casi totali, si fa la semisomma dei due valori cetrali e si trova che l altezza mediaa è pari a 131cm. Per cocludere, se di ua distribuzioe coosciamo l età mediaa, ad esempio 42 ai, sappiamo che il 50% delle persoe ha u età che arriva al massimo a 42 ai metre il rimaete 50% ha u età che va da 42 ai i poi.

1 Idici di posizioe - Quatili La mediaa fa parte di ua famiglia di idici di posizioe che ripartiscoo la distribuzioe di frequeze i parti uguali, tali che al di sopra e al di sotto di ciascu valore si trova ua defiita percetuale di osservazioi: i quatili. Per capire il cocetto di quatile ripesiamo alla defiizioe di mediaa: valore che bipartisce la distribuzioe i modo tale che il 50% delle osservazioi precede e il 50% segue quel valore. Immagiiamo ora di dividere la distribuzioe i quattro parti uguali, ciascua coteete il 25% di osservazioi, che chiameremo quartili. Il valore della variabile associato al primo quartile (quartile iferiore) ci dice che il 25% delle osservazioi ha al massimo tale valore e il 75% ha almeo quel valore; il valore associato al secodo quartile ci dice che il 50% delle osservazioi sta al di sotto di tale valore e il 50% al di sopra (corrispode alla mediaa!); il valore associato al terzo quartile (quartile superiore) ci dice che il 75% delle osservazioi sta al di sotto di tale valore e il 25% al di sopra. Similmete possiamo suddividere la distribuzioe i - decili: dividoo la distribuzioe i dieci parti uguali, i modo tale che l itesità associata al primo decile ci dice che il 10% delle uità osservate arriva al massimo a quella itesità e il rimaete 90% ha u valore maggiore. Il quito decile corrispode alla mediaa. - percetili: dividoo la distribuzioe i ceto parti uguali, i modo tale che l itesità associata, ad esempio, al vetisettesimo percetile ci dice che il 27% delle uità osservate arriva al massimo a quella itesità e il rimaete 73% ha u valore maggiore. Si osserva che il 25-esimo percetile corrispode al primo quartile e il ciquatesimo percetile corrispode al quito decile e alla mediaa.

1 Idici di posizioe - Media Moda e mediaa soo utili idici medi di posizioe che però o utilizzao tutte le iformazioi raccolte ma solo quelle relative, rispettivamete, alla modalità più frequete o alle itesità che occupao la posizioe cetrale ella distribuzioe. Ua misura che ivece tiee coto di tutte le osservazioi è la media, applicabile su dati quatitativi. Si possoo calcolare diverse tipi di media: a) Media aritmetica semplice La media aritmetica si ottiee sommado tutte le itesità osservate e dividedo il risultato per il umero di osservazioi. I termii formali si avrà: X = x i=1 dove: X = la lettera X soprassegata co ua barretta orizzotale idica la media = si legge sommatoria per i che va da 1 a degli xi, ovvero la somma di tutte le xi i= 1 itesità osservate (xi) dalla prima (la umero 1) alla eesima (umero ) = totale delle osservazioi. Applichiamo il calcolo della media agli esempi usati per il calcolo della mediaa: esempio 1: 28 37 42 50 53 i 28 + 37 + 42 + 50 + 53 X = = 5 210 5 = 42

1 Idici di posizioe - Media esempio 2: 28 37 42 50 68 = 45 La media è 45 metre la mediaa è sempre 42. I questo caso la mediaa rappreseta meglio della media la distribuzioe i quato resta stabile oostate sia itrodotto u valore aomalo (68). 28 + 37 + 42 + 50 + 68 X = = 5 225 5 = 45 esempio 3: 1 3 42 79 85 = 42 1+ 3 + 42 + 79 + 85 X = = 5 210 5 = 42 La media è 42, come ell esempio1. Appare però evidete che, pur avedo la stessa media e la stessa mediaa, i dati osservati ei due esempi o presetao carattere di similarità. Nell esempio 1 media e mediaa coicidoo e be rappresetao la distribuzioe dei dati, ell esempio 3, ivece, pur coicidedo, o rappresetao altrettato bee la distribuzioe che li geera. Questo itroduce il tema della variabilità che vedremo el prossimo paragrafo.

1 Idici di posizioe Media poderata La media aritmetica poderata si applica alle distribuzioi di frequeza, quado alle diverse itesità osservate soo associate le rispettive frequeze assolute. Per capire come si arriva alla media poderata (ovvero pesata co le frequeze assolute) partiamo da ua serie di dati grezzi, ad esempio le età di u gruppo di 10 persoe: 21 24 21 25 23 23 25 23 21 24 per calcolare la media, applicado la formula della media aritmetica semplice, dovremmo procedere sommado le età e dividedo il risultato per il umero di osservazioi, ovvero: 21+ 24 + 21+ 25 + 23 + 23 + 25 + 23 + 21+ 24 X = = 10 230 =23 10 L età media è di 23,3 ai Per semplificare l operazioe, potremo raggruppare le età i ordie crescete, otteedo la seguete serie: 21 21 21 23 23 23 24 24 25 25 e per calcolare la media cosidereremo le sigole età moltiplicate per il umero di osservazioi, el seguete modo: (21* 3) + (23* 3) + (24 * 2) + (25* 2) X = = 10 230 =23 10

1 Idici di posizioe Media poderata Di fatto l operazioe di raggruppameto la utilizziamo per costruire la distribuzioe di frequeze dell età: Esempio Età di u campioe di giovai Età N F 21 3 0,3 23 3 0,3 24 2 0,2 25 2 0,2 Totale 10 1,0 E i termii formali la media aritmetica poderata sarà data da: X = xii i= 1 i = x Al umeratore troviamo la sommatoria per i che va da 1 a delle itesità xi assute dalla variabile per le rispettive frequeze i, al deomiatore troviamo la somma delle frequeze i che è pari al totale delle frequeze osservate. U ulteriore modo per calcolare la media prevede di utilizzare le frequeze relative al posto delle frequeze assolute. I questo caso la formula sarà: i =1 i i X = x i=1 i f i e, el ostro esempio, l età media sarà data da: X = (21*0,3)+(23*0,3)+(24*0,2)+(25*0,2) = 6,3+6,9+4,8+5=23

1 Idici di posizioe - Media La media aritmetica ha diverse proprietà ma oi e citeremo solo due: a) la media aritmetica è sempre compresa tra il valore miimo e quello massimo osservati. Nell ultimo esempio sulle età sapremo, i base a questa proprietà, che l età media sarà compresa tra 22 e 25 ai. b) la somma degli scarti tra i valori osservati e la loro media è ulla (ovvero pari a zero), ovvero: X = ( ) = 0 i i= 1 x x

2 Idici di variabilità Negli esempi utilizzati per il calcolo della media abbiamo prospettato due distribuzioi molto diverse che però davao il medesimo valore medio. Ricordiamoli: esempio a): 28 37 42 50 53 media = 42 esempio b): 1 3 42 79 85 media = 42 Appare evidete che se di queste due distribuzioi cooscessimo solo la media e la mediaa saremmo idotti a cocludere che si tratta di distribuzioi uguali, metre da u aalisi dei dati osservati scopriamo che si tratta di valori molto diversi tra loro. Comprediamo allora che per descrivere compiutamete ua distribuzioe accato agli idici di posizioe dobbiamo collocare delle misure della dispersioe di questi dati. Queste misure soo gli idici di variabilità, che si applicao alle variabili e ci dicoo quato siao dispersi i dati e, di cosegueza, quato la media li rappreseti i maiera adeguata. Già a vista si vede che ell esempio 1 la media di 42 rappreseta bee i dati di cui è u idice di sitesi. No altrettato accade ell esempio successivo: la media è lotaa da quasi tutti i dati osservati.

2 Idici di variabilità Esistoo diverse misure di variabilità: 2.1 Campo di variazioe o rage 2.2 Scarto iterquartile 2.3 Scostameto semplice medio 2.4 Variaza 2.5 Scarto quadratico medio

2.1 Idici di variabilità Campo di variazioe È l idice di variabilità più semplice e si ottiee per differeza tra il valore più elevato e il più piccolo. rage = x max x mi esempio a): 28 37 42 50 53 rage = 53 28 = 25 esempio b): 1 3 42 79 85 rage = 85 1 = 84 Nell esempio a) il campo di defiizioe è pari a 25 metre ell esempio b) è di 84. Se quidi associamo all iformazioe sulla media e sulla mediaa questi due dati abbiamo immediatamete la percezioe di trovarci i preseza di ua distribuzioe abbastaza cocetrata attoro al valore medio ell esempio a) e, diversamete, molto dispersa ell esempio b). Questo idice è semplice da calcolare tuttavia risete troppo dei casi estremi. Se ad esempio ci troviamo di frote ad ua distribuzioe di questo tipo: 20 23 25 26 99 verifichiamo che il rage è pari a 79 ma o riesce a descrivere adeguatamete la dispersioe dei dati.

2.2 Idici di variabilità Scarto iterquatile Lo scarto iterquartile si calcola per differeza tra il quartile superiore (Qs = terzo quartile, corrispodete al 75 percetile) e il quartile iferiore (Qi = primo quartile, corrispodete al 25 percetile): rage iterquartile = Qs - Qi È u idice più stabile, che igora le code della distribuzioe e ci dice i valori etro i quali si posizioa il 50% delle osservazioi.

2.3 2.4 2.5 Idici di variabilità Lo scostameto semplice medio, la variaza e lo scarto quadratico medio soo misure di variabilità che si calcolao utilizzado come valore di riferimeto la media. Per la costruzioe di questi idici si calcola azitutto la media, quidi si misura la distaza tra i sigoli valori osservati e il valore medio e ifie si calcola la media di questi scarti: se il valore otteuto è prossimo allo zero sigifica che la variabilità è miima, ovvero i valori osservati soo cocetrati attoro al valore medio che li rappreseta. Più elevato è il valore dell idice maggiore sarà la dispersioe dei valori osservati attoro alla media. Ricosideriamo gli esempi a) e b) e itroduciamo u ulteriore caso: esempio a): 28 37 42 50 53 esempio b): 1 3 42 79 85 esempio c): 42 42 42 42 42 La media è, i tutti i tre casi, pari a 42, ma la dispersioe dei dati osservati attoro a tale valore è visibilmete diversa.

2.3 Idici di variabilità Scostameto semplice medio Per calcolare gli idici di variabilità prima mezioati dobbiamo duque calcolare la somma degli scarti dei sigoli valori dalla media ma, i base alla prima proprietà della media, sappiamo che tale somma è ulla. Per superare questo ostacolo è quidi ecessario operare sugli scarti i modo tale che la loro somma algebrica o dia valore ullo. Nello scostameto semplice medio il problema viee risolto cosiderado gli scarti i valore assoluto: S = x I tal modo tutti gli scarti soo positivi e la somma o si aulla. Applichiamo l idice di variabilità agli esempi. esempio a): 28 37 42 50 53 esempio b): 1 3 42 79 85 esempio c): 42 42 42 42 42 i= 1 i S = 28-42 + 37-42 + 42-42 + 50-42 + 53 42 = 14 + 5 +0 + 8 + 11 = 38 = 7,6 5 5 5 S = 1-42 + 3-42 + 42-42 + 79-42 + 85 42 = 41 + 39 +0 + 37 + 43 = 160 = 32 5 5 5 S = 42-42 + 42-42 + 42-42 + 42-42 + 42 42 = 0 5 x

2.4 Idici di variabilità - Variaza U ulteriore modo per calcolare ua misura di variabilità superado il vicolo rappresetato dalla secoda proprietà della media è quello di elevare gli scarti al quadrato e poi calcolare la media. L idice così calcolato è la variaza, che viee idicata co la lettera greca sigma al quadrato: σ 2 = Calcoliamo ora la variaza sui dati dei ostri tre esempi. esempio a): 28 37 42 50 53 i= 1 x i x 2 i σ 2 = (28 42) 2 + (37-42) 2 + (42-42) 2 + (50-42) 2 + (53 42) 2 = 5 = 196 + 25 + 0 + 64 + 121 = 406 = 81,2 5 5 esempio b): 1 3 42 79 85 σ 2 = (1-42) 2 + (3-42) 2 + (42-42) 2 + (79-42) 2 + (85 42) 2 = 5 = 1.681 + 1.521 + 0 + 1.369 + 1.849 = 6.420 = 1.284 5 5

2.4 Idici di variabilità - Variaza esempio c): 42 42 42 42 42 σ 2 = (42-42) 2 + (42-42) 2 + (42-42) 2 + (42-42) 2 + (42 42) 2 = 0 5 La variaza è più utilizzata dello scostameto semplice medio, tuttavia preseta l icoveiete di esprimere la dispersioe attoro alla media al quadrato, e i tal modo satura le caratteristiche della variabile osservata. Se ipotizziamo che i dati degli esempi siao riferiti all età, o ha u sigificato logico dire che la misura di variabilità è di 81,2 ai² (ai al quadrato). Si ricorre pertato ad u altro idice, lo scarto quadratico medio.

2.5 Idici di variabilità Scarto quadratico medio Lo scarto quadratico medio σ è la radice quadrata della variaza, e cosete di riportare l idice di variabilità all uità di misura origiale: σ = σ 2 = i= 1 x i x 2 i esempio a): 28 37 42 50 53 σ = σ 2 = 81, 2 = 9,01 esempio b): 1 3 42 79 85 σ = σ 2 = 1. 284 = 35,83 esempio c): 42 42 42 42 42 σ = σ 2 = 0 Gli scarti quadratici medi così calcolati ci dicoo qual è i media la distaza tra i dati e la media della distribuzioe ell uità di misura origiale. Nell esempio c) qualuque sia l idice di variabilità utilizzato avrà sempre valore pari a zero i quato la variabilità è ulla, metre egli altri due esempi l idice è più elevato laddove la dispersioe attoro alla media è più ampia.