STATISTICHE DESCRITTIVE

Похожие документы
STATISTICHE DESCRITTIVE Parte II

Esercitazioni di statistica

Statistica descrittiva II

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Lezione 4 a - Misure di dispersione o di variabilità

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

Indice. Percentili Decili Quartili Ranghi Percentili

Statistica di base per l analisi socio-economica

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

Statistica descrittiva

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE

Capitolo 3 Sintesi e descrizione dei dati quantitativi

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Istituzioni di Statistica e Statistica Economica

Teoria e tecniche dei test. Concetti di base

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva

Statistica Un Esempio

MISURE DI SINTESI 54

Esempi di confronti grafici

1/55. Statistica descrittiva

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

Esercitazioni di Statistica

Valori Medi. Docente Dott.ssa Domenica Matranga

LEZIONI DI STATISTICA MEDICA

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Misure di dispersione (o di variabilità)

Obiettivi Strumenti Cosa ci faremo? Probabilità, distribuzioni campionarie. Stimatori. Indici: media, varianza,

Una statistica è una quantità numerica il cui valore è determinato dai dati.

Gli indici di variabilità

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Statistiche per riassumere i dati

Elementi di Statistica

Università del Piemonte Orientale. Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Statistica Descrittiva Variabili numeriche

Università del Piemonte Orientale. Corso di Laurea in Biotecnologie. Corso di Statistica Medica. Statistica Descrittiva: Variabili numeriche

Esercitazioni di Statistica

standardizzazione dei punteggi di un test

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

Corso di Psicometria Progredito

Lezione 4. Statistica. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Lezione 4. A. Iodice. Indici di posizione.

Lezione n. 1 _Complementi di matematica

Esercitazione: La distribuzione NORMALE

REGRESSIONE E CORRELAZIONE

Questionario 1. Sono assegnati i seguenti dati

LA RAPPRESENTAZIONE E LA SINTESI DEI DATI

Sintesi dei dati in una tabella. Misure di variabilità (cap. 4) Misure di forma (cap. 5) Statistica descrittiva (cap. 6)

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4

ESERCIZI DI RIEPILOGO 1

STATISTICA esercizi svolti sulla VARIABILITA

Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti

esercitazione1 12/10/2015

Elementi di statistica

La statistica descrittiva per le variabili quantitative

Esercitazioni. Es 1. Dato il seguente dataset

INDICI DI POSIZIONE - I QUANTILI

La Variabilità statistica

2. Variabilità mediante il confronto di valori caratteristici della

Rappresentazioni grafiche

MISURE DI DISPERSIONE

STATISTICA DESCRITTIVA (variabili quantitative)

STATISTICA DESCRITTIVA. Elementi di statistica medica GLI INDICI INDICI DI DISPERSIONE STATISTICA DESCRITTIVA

STATISTICA: esercizi svolti su MODA, MEDIANA, QUARTILI, DECILI e CENTILI

Corso di Statistica: ESERCITAZIONI

STATISTICA A-K (2014) Soluzione esercizi da svolgere prima settimana

Le misure della tendenza

Lezione 1.3 Corso di Statistica. Francesco Lagona

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

Esercizio 1 Nella seguente tabella sono riportate le lunghezze in millimetri di 40 foglie di platano:

a.a Esercitazioni di Statistica Medica e Biometria Corsi di Laurea triennali Ostetricia / Infermieristica Pediatrica I anno

METODO DEI MINIMI QUADRATI

VENGONO DETTI QUANTILI

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07

ESERCIZI STATISTICA DESCRITTIVA

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

ESEMPI DI DOMANDE PER TUTTE E DUE LE TIPOLOGIE DI PARTECIPANTI

Esempio sulla media geometrica

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

STATISTICA AZIENDALE Modulo Controllo di Qualità

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Транскрипт:

STATISTICHE DESCRITTIVE

ARGOMENTI DELLA LEZIONE concetti introduttivi indici di tendenza centrale indici di dispersione indici di posizione 2

concetti introduttivi Unità statistiche elementi che costituiscono l oggetto dell osservazione e le cui proprietà vengono rilevate; Popolazione insieme delle unità statistiche oggetto dell osservazione; Variabili proprietà, caratteristiche, attributi delle unità di analisi che variano da caso a caso Modalità ogni diversa presentazione della variabile osservata su ciascuna unità di analisi 3

distribuzione di frequenza Le distribuzioni di frequenza dipendono dal tipo di dati che vengono raccolti ESEMPIO X = { 2, 1, 1, 1, 2, 2, 3, 3, 3, 4, 3, 4, 4, 5, 4, 4, 5, 5, 6, 7, 5, 5, 6, 7, 8} x 1 2 3 4 5 6 7 8 f 3 3 4 5 5 2 2 1 4

INDICI DI TENDENZA CENTRALE Si tratta di statistiche che consentono di rappresentare, con un unico valore, un insieme di misure. SOMMARIO Moda Mediana Media - media aritmetica - media geometrica - media armonica 5

moda La moda di un insieme di dati è il valore che si presenta con la massima frequenza Si indica con il simbolo Mo. ESEMPIO Dato l insieme A = {2, 3, 4, 5, 6, 8, 7, 8, 5, 8, 11} si ha Mo = 8 in quanto 8 è il valore che si presenta più frequentemente. 6

mediana Se abbiamo un insieme di dati ordinati, definiamo mediana il dato che occupa la posizione centrale nella distribuzione dei dati stessi si indica con il simbolo Mdn o Me il calcolo della mediana differisce a seconda se si hanno dati non raggruppati in classi oppure dati raggruppati in classi 7

mediana Dati non raggruppati se n è dispari la mediana è il valore centrale della serie stessa; il numero i fornisce la posizione del dato all interno della serie con la seguente formula i = n +1 2 8

mediana Dati non raggruppati ESEMPIO Consideriamo la serie A = {3, 5, 9, 12, 15, 17, 18, 23, 24, 31, 34} abbiamo n = 11 e i = 11+ 1 2 pertanto Mdn = 17, ossia il sesto dato della serie. = 6 9

mediana Dati non raggruppati se n è pari nessuno dei valori è il valore centrale della serie stessa; la mediana si trova fra i due valori centrali e la sua posizione i sarà n n < i < + 1 2 2 10

mediana Dati non raggruppati ESEMPIO Consideriamo la serie A = {1, 5, 8, 12, 23, 35} abbiamo n = 6 e 6 2 6 < i < + 1 3 < i 2 < 4 pertanto la mediana è compresa tra 8 e 12, ossia tra il terzo ed il quarto dato della serie. 11

mediana Dati non raggruppati Si tenga presente che, se i dati sono in scala a intervalli, è possibile definire il valore esatto della mediana come valore medio fra i due dati centrali: Mdn = x n x n + + 1 2 2 2 Nell Esempio precedente il valore esatto della mediana sarà : Mdn = (8 + 12)/2 = 10 12

mediana Dati raggruppati Se i dati sono continui, discretizzati e raggruppati in classi di frequenza la mediana si calcola per interpolazione lineare: Mdn = L inf + n 2 F f m inf ω dove L inf, f m e ω sono rispettivamente limite inferiore, frequenza e ampiezza della classe mediana; n la numerosità dei casi e F inf la frequenza cumulata fino al limite inferiore della classe. 13

Esempio [1] Nella seguente tabella sono raccolti i dati relativi al peso dei giocatori di una rosa di una squadra di calcio (n=23). Indice i Peso in Kg f i F i 1 60-65 1 1 2 65-70 2 3 3 70-75 4 7 4 75-80 6 13 5 80-85 6 19 6 85-90 2 21 7 90-95 1 22 8 95-100 1 23 Calcolare la mediana della distribuzione data. Nota: gli intervalli di frequenza si intendono del tipo primo valore incluso secondo valore escluso. 14

Esempio [2] Per prima cosa, identifichiamo la classe mediana. 23 + 1 p osizione mediana = = 12 2 Quindi la classe che contiene la mediana è la quarta ( i=4 ). Applicando infine la formula per il calcolo della mediana otteniamo: Mdn 23 7 = 75 + 2 i5 = 78.75 6 Si può quindi affermare che il 50% dei calciatori della squadra pesa meno di 78.75 Kg. 15

media aritmetica La media aritmetica è una funzione che associa ad ogni insieme di n dati un valore numerico pari alla somma dei dati diviso il numero n dei dati stessi. x = x 1 + x 2 + n... + x n il calcolo della media ha procedure diverse a seconda che i dati siano o meno raggruppati in classi 16

media aritmetica Dati non raggruppati x n = i= 1 n x i ESEMPIO Dato l insieme A = {2, 3, 4, 5, 6, 8, 7, 8, 5, 8} si ha 2 + 3 +... + 8 x = = 5.6 10 17

media aritmetica Dati raggruppati se i dati sono raggruppati in una tabella del tipo x i x 1 x 2 x j x n f i f 1 f 2 f j f n la media si calcola con x n i= 1 = n i= 1 f i f x i i 18

media aritmetica Dati raggruppati ESEMPIO sia data la seguente tabella di frequenza x i 3 7 10 22 30 f i 2 3 4 2 1 la media sarà x = 3 2 + 7 3+ 12... + 30 1 = 11.75 19

Esempio [1] - dati raggruppati in classi - Nella seguente tabella sono raccolti i dati relativi al peso dei giocatori di una rosa di una squadra di calcio (n=23). Indice i Peso in Kg 1 60-65 1 1 2 65-70 2 3 3 70-75 4 7 4 75-80 6 13 5 80-85 6 19 6 85-90 2 21 7 90-95 1 22 8 95-100 1 23 f i F i Calcolare la media della distribuzione data. Nota: gli intervalli di frequenza si intendono del tipo primo valore incluso secondo valore escluso. 20

Esempio [2] - dati raggruppati in classi - Per calcolare la media dei dati si dovrà ricorrere alla seguente formula: x = n i= 1 n i= 1 f x Dove x vci rappresenta il valore centrale della classe i-esima. (Per valore centrale di una classe di frequenza, si intende la media tra il limite inferiore e il limite superiore della classe stessa). Ad esempio il valore centrale della seconda classe ( i=2 ) sarà: x vc 2 i f vc 65 + 70 = = 67.5 2 i i 21

Esempio [3] - dati raggruppati in classi - Applicando la formula per il calcolo della media si ottiene: x 62.5 + 1 67.5 2+ 72.5 4... + 97.5 1 = = 78.80 23 Il peso medio dei calciatori e quindi pari 78.8 Kg. 22

media geometrica La media geometrica si usa quando le grandezze si susseguono in progressione geometrica o per grandezze che misurano variabili relative per dati non raggruppati si usa G = n x1 x2... n x n n = xi i= 1 per dati raggruppati G = n x f1 f2 1 x2... x f k k = n k i= 1 x f i i 23

24 media armonica media armonica La media armonica media armonica si definisce con la seguente relazione: se i dati non sono raggruppati in classi = = + + + = n i i n x n x x x n H 1 2 1 1 1... 1 1 se i dati sono raggruppati = = + + + + + + = k i i i k k k x f n x f x f x f f f f H 1 2 2 1 1 2 1......

Moda, Mediana, Media - considerazioni finali - Sia la moda, sia la mediana, sia la media sono dette misure di tendenza centrale, ossia sono considerate un indice dell'andamento della parte centrale della distribuzione; tali indici differiscono fra loro in vari modi. La moda è significante a livello della scala nominale, la mediana è significante a livello della scala ordinale e la media a livello della scala ad intervalli. 25

INDICI DI DISPERSIONE SOMMARIO Introduzione agli Indici di Dispersione Gamma Differenza Interquartilica Varianza Deviazione Standard Coefficiente di Variazione 26

introduzione Una distribuzione di dati contiene un insieme di informazioni complesse e di per se poco maneggevole. Il ricorso ad un indice di tendenza centrale comporta una forte semplificazione, e da solo non fornisce informazioni esaurienti sulla disribuzione. Occorre anche capire quanto i dati siano dispersi intorno all indice di tendenza centrale. Esempio Consideriamo i risultati dei compiti di Psicometria di tre diverse Facoltà: Facoltà A = {18, 22, 24, 16, 19, 22, 18, 21} Facoltà B = {10, 10, 12, 10, 30, 28, 30, 30} Facoltà C = {20, 20, 20, 20, 20, 20, 20, 20} In ogni Facoltà la media dei voti è pari a 20, ma è evidente una diversa dispersione intorno a tale valore. 27

gli indici di dispersione Gli indici che vedremo servono a misurare la dispersione (o variabilità) di una data distribuzione di dati. Per questo motivo vengono definiti come indici di dispersione o indici di variabilità. Gli indici di dispersione possono assumere solo valori positivi (non ha senso parlare di dispersione negativa) o nulli (nei casi in cui tutti i dati osservati sono uguali tra loro). 28

la gamma La gamma, detta anche campo di variazione, è la differenza fra il valore massimo e quello minimo dei dati. gamma = X X max min Esempio I seguenti dati rappresentano le altezze in centimetri dei giocatori di una squadra di pallavolo. {188, 195, 198, 170, 185, 199} La gamma di tale distribuzione sarà: gamma = 199 170 = 29 29

la differenza interquartilica La differenza interquartilica, o range interquartile, è data dalla differenza tra il terzo e il primo quartile (o equivalentemente tra il 75-esimo e il 25-esimo percentile) dei dati: Q = Q Q 75 25 Nota: La differenza interquartilica, non tiene conto dei valori estremi della distribuzione dei dati, evitando così di considerare valori anomali. Per questo motivo è considerata un indice robusto. 30

la varianza La varianza σ 2 di un insieme di dati è definita come la media degli scarti al quadrato tra i dati e la media dei dati stessi. Essa assume il valore minimo di 0 quando i dati sono tutti uguali tra loro e aumenta al crescere della variabilità dei dati. Le formule per il calcolo della varianza sono differenti a seconda che i dati siano o meno raggruppati in classi. 31

formula per il calcolo della varianza - dati non raggruppati n σ 2 = i = 1 ( x x ) i n 2 dove: ( x x ) i è lo scarto tra l i-esima unità statistica e la media dei dati. 32

formula ridotta per il calcolo della varianza - dati non raggruppati La varianza può essere anche calcolata attraverso la seguente formula, che consente un calcolo più agevole e veloce: σ 2 2 2 x x i i i i = n n varianza = media dei quadrati - quadrato della media 33

Esempio [1] Un ricercatore ha valutato la capacità di memoria di 10 bambini in età prescolare ottenendo i dati sottoriportati. La capacità di memoria viene usualmente espressa dal digit span, cioè dal numero di cifre che un soggetto è in grado di ricordare [Keppel, 1992]. Calcolare la varianza dei dati, sia con la formula generale che con quella ridotta. codice soggetto digit span 1 8 2 6 3 7 4 7 5 9 6 6 7 7 8 9 9 4 10 7 34

Esempio [2] Calcoliamo innanzi tutto la media dei dati: x 8+ 6+ + 4+ 7 70 = = = 7 10 10 Utilizziamo ora la formula generale per il calcolo della varianza: 2 2 2 2 (8 7) + (6 7) + + (7 7) 20 σ = = = 2 10 10 35

Esempio [3] Utilizziamo ora la formula ridotta. Per prima cosa calcoliamo la media dei quadrati : ( x ) 2 2 2 2 8 + 6 + 7 510 = = = 51 10 10 Calcoliamo ora il quadrato della media : ( ) 2 2 x = 7 = 49 Infine utilizzando la formula ridotta per il calcolo della varianza otteniamo: ( x ) ( x) 2 51 49 2 σ 2 = 2 = = 36

formula per il calcolo della varianza - dati raggruppati σ 2 = i 2 ( x x) f i i n dove: f i è la frequenza relativa dell i-esima modalità statistica. 37

Esempio [1] Calcolare la varianza dei dati dell esempio precedente utilizzandoli in forma raggruppata. Per prima cosa rappresentiamo i dati in forma raggruppata: x i digit span f i frequenze 4 1 6 2 7 4 8 1 9 2 38

Esempio [2] Ricordando che la media dei dati è pari a 7, applichiamo la formula per il calcolo della varianza per dati raggruppati: 2 2 2 + + + 2 (4 7) 1 (6 7) 2 (9 7) 2 20 σ = = = 2 10 10 39

formula per il calcolo della varianza - dati raggruppati in classi σ 2 = i 2 ( x x) f vc i i n dove: x vci è il valore centrale dell i-esima classe di frequenza. 40

Esempio [1] In un azienda bellunese che produce occhiali sono stati rilevati gli stipendi mensili dei 20 dipendenti: Stipendio mensile in Euro Frequenze 800-1200 10 1200-1600 5 1600-2000 3 2000-2400 2 Calcolare la media e la varianza di tali dati. Nota: gli intervalli di frequenza si intendono del tipo primo valore incluso secondo valore escluso. 41

Esempio [2] Calcoliamo la media dei dati: x 1000 10+ 1400 5+ 1800 3+ 2200 2 = = 1340 20 Calcoliamo ora la varianza di tali dati: 2 2 + + 2 (1000 1340) 10 (2200 1340) 2 σ = = 164400 20 42

la deviazione standard La deviazione standard (o scarto quadratico medio) è la radice della varianza: σ = σ 2 Essa è molto utile in chiave interpretativa perché, a differenza della varianza, è espressa nella stessa unità di misura del fenomeno studiato. Esempio In campione di 20 soggetti è stata rilevata la variabile peso. In tale campione la media è pari a 70 Kg e la deviazione standard è pari a 10.7. Si potrà affermare che i soggetti differiscono mediamente di 10.7 Kg dal peso medio di 70 Kg. 43

il coefficiente di variazione [1] Il cofficiente di variazione è dato dal rapporto tra la deviazione standard e il valore assoluto della media dei dati: CV = σ x Esso è un indice di variabiltà relativa, che tiene conto oltre che della deviazione standard dei dati anche della media. Per questo motivo è molto utile per eseguire dei confronti in termini di variabilità tra fenomeni diversi tra loro. 44

il coefficiente di variazione [2] Esempio Nel reparto di ginecologia e ostetricia di un ospedale è stato rilevato il peso di un campione di 80 neonati maschi e contemporaneamente il peso dei rispettivi papà. I dati ottenuti sono espressi nella seguente tabella: gruppo media deviazione standard neonati 3.4 Kg 0.8 papà 82 Kg 15 Ci si chiede se, rispetto alla variabile peso, esiste più variabiltà nel gruppo dei neonati o in quello dei papà. 45

il coefficiente di variazione [3] Naturalmente confrontare le deviazioni standard non è di grande aiuto. Esse dipendono fortemente dalle media dei dati su cui sono state calcolate. Per poter operare un confronto sulla variabilità dei due gruppi è opportuno calcolare i rispettivi coefficienti di variazione: 0.8 CV bambini = = 3.4 15 CV papà = = 82 0.24 0.18 Osservando i risultati si può concludere che il gruppo dei bambini presenta una maggiore variabilità rispetto a quella del gruppo dei papà. 46

il coefficiente di variazione[3] In conclusione, vediamo alcuni valori particolari del CV che possono essere utili nello studio di una distribuzione di dati: CV = 0, in questo caso la deviazione standard è pari a 0. Tutti i dati sono uguali tra loro e la media può essere considerata come un indice perfetto per rappresentarli. CV 0.5, in questo caso la deviazione standard è più della metà della media. La media, in questo caso, non può essere considerata un buon indice per rappresentare i dati. CV 0.5, in questo caso la deviazione standard è meno della metà della media. La media, in questo caso, può essere considerata un buon indice per rappresentare i dati. 47

INDICI DI POSIZIONE SOMMARIO Il concetto di Quantile Percentili, Decili, Quartili Formula generale per il calcolo dei Quantili I Ranghi Percentili 48

i quantili Data una serie di dati, si definisce come Quantile di indice p e si indica con Q p,, il dato al di sotto del quale si situa una percentuale p di dati. Ad esempio la mediana può essere considerata come il quantile Q 50,, e cioè il dato al di sotto del quale si situa il 50% dei dati 49

quartili, decili, percentili I Quartili, i Decili e i Percentili non sono altro che particolari Quantili caratterizzati da diversi valori che può assumere il parametro p. 50

i quartili I Quartili dividono in 4 parti uguali la distribuzione dei dati. Essi sono: Q 25 il dato al di sotto del quale si situa il 25% (1/4) dei valori. Q 50 il dato al di sotto del quale si situa il 50% (2/4) dei valori. Esso coincide con la Mediana. Q 75 il dato al di sotto del quale si situa il 75% (3/4) dei valori. 51

i decili I Decili dividono in 10 parti uguali la distribuzione dei dati. Essi sono: Q 10 il dato al di sotto del quale si situa il 10% (1/10) dei valori. Q 20 il dato al di sotto del quale si situa il 20% (2/10) dei valori.. Q 90 il dato al di sotto del quale si situa il 90% (9/10) dei valori. 52

i percentili I Percentili dividono in 100 parti uguali la distribuzione dei dati. Essi sono: Q 1 il dato al di sotto del quale si situa l 1% (1/100) dei valori. Q 2 il dato al di sotto del quale si situa il 2% (2/100) dei valori.. Q 99 il dato al di sotto del quale si situa il 99% (99/100) dei valori. 53

calcolo dei quantili il calcolo dei quantili ha procedure diverse a seconda che i dati siano o meno raggruppati in classi vedremo nel dettaglio le formule per il calcolo dei percentili (da esse per analogia si possono immediatamente ricavare le formule per il calcolo dei decili e dei quartili) 54

formula generale per il calcolo dei percentili - dati non raggruppati [1] La posizione i di un dato percentile, detti p l indice del percentile e n la numerosità campionaria, è data dalla seguente formula: i n + 1 = 100 Esempio Data una serie di 19 valori ordinati, la posizione del 20-esimo percentile sarà: i p 19 + 1 = 20 = 4 100 Quindi Q 20 assumerà il valore del quarto dato osservato. 55

formula generale per il calcolo dei percentili - dati non raggruppati [2] Se il valore i calcolato nella formula precedente è intero allora il percentile cercato coincide esattamente con il dato che occupa la posizione i. Se invece il valore i non è intero si dovrà procedere ad utilizzare l interpolazione lineare per determinare il valore del percentile cercato: se i = a, b allora Q = X + bi( X X ) p a a+ 1 a vediamo qualche esempio!!.. 56

Esempio 1 Data la seguente serie numerica: 1, 3, 4, 5, 8, 10, 12, 13, 15 (n = 9) Calcolare l 80-esimo percentile. Q = X = X = X = 80 9+ 1 10 8 i80 i80 100 100 13 57

Esempio 2 Data la serie: 1, 3, 4, 5, 8, 10, 12, 13, 15, 18 (n = 10) Calcolare l 80-esimo percentile. Q = X = X = X 80 10 + 1 11 8,8 i 80 i 80 100 100 La posizione 8,8 risulta valida solo da un punto di vista teorica. Per poter calcolare il valore di Q 80 ricorriamo all interpolazione lineare: Q 80 = 13 + 0.8 i(15 13) = 14.6 58

Nota sull uso dell interpolazione lineare nel calcolo dei percentili L uso dell interpolazione lineare nel calcolo dei percentili è metodologicamente corretto solo se la variabile oggetto di studio è quantitativa. Nel caso di una variabile ordinale si dovrà ricorrere all arrotondamento della posizione calcolata... vediamo un esempio.. 59

Nota sull uso dell interpolazione lineare nel calcolodei percentili Si supponga, ad esempio, di aver calcolato la posizione del 40-esimo percentile di una serie di dati misurati su scala ordinale e di aver ottenuto il seguente valore i = 7.2. Non potendo ricorrere all interpolazione lineare si può optare per una delle seguente soluzioni: arrotondare la posizione teorica all intero più vicino. Nel caso dell esempio la posizione teorica 7.2 verrà arrotondata a 7, e si indicherà quindi come 40-esimo percentile il dato X 7. indicare l intervallo, che ha come limiti i numeri interi che comprendono la posizione teorica, in cui cade il percentile. Nel caso dell esempio si indicherà come intervallo che comprende il 40-esimo percentile l intervallo che va dal dato X 7 al dato X 8. 60

formula generale per il calcolo dei percentili - dati raggruppati [1] Per prima cosa si deve individuare la classe che contiene il percentile di indice p da cercare. A tale scopo, partendo dall indice p del percentile, si calcola la frequenza cumulata corrispondente: F p n = i 100 Successivamente si individua la classe che contiene tale frequenza cumulata. A questo punto si avrà: p F < F < F i 1 i i+ 1 Dove con F i si indica la frequenza cumulata della classe che contiene il percentile di indice p. 61

formula generale per il calcolo dei percentili - dati raggruppati [2] A questo punto, si applica la seguente formula: dove: Q p n i p Fi 1 = L 100 inf + ω i f L infi è il limite inferiore della classe i f i è la frequenza della classe i ω è l ampiezza della classe i F i-1 è la frequenza cumulata della classe i-1 p è l indice del percentile cercato n è la numerosità campionaria. i 62

Esempio [1] Nella seguente tabella sono raccolti i dati relativi al peso dei giocatori di una rosa di una squadra di calcio (n=23). Indice i Peso in Kg f i F i 1 60-65 1 1 2 65-70 2 3 3 70-75 4 7 4 75-80 6 13 5 80-85 6 19 6 85-90 2 21 7 90-95 1 22 8 95-100 1 23 Calcolare il 75-esimo percentile della distribuzione data. Nota: gli intervalli di frequenza si intendono del tipo primo valore incluso secondo valore escluso. 63

Esempio [2] Per prima cosa, identifichiamo la classe che contiene il 75-esimo percentile ( Q 75 ). 23 F p = i 75 = 17.25 100 Quindi la classe che contiene li 75-esimo percentile è la quinta ( i=5 ). Applicando infine la formula per il calcolo del percentile otteniamo: Q 75 23 i 75 13 = 80 + 100 5 = 83.54 6 Si può quindi affermare che il 75% dei calciatori della squadra pesa meno di 83.5 Kg. 64

i ranghi percentili [1] Il rango percentile indica la posizione occupata da un certo dato all interno della serie considerata; La posizione del dato è espressa come percentuale del totale dei dati che si trova al di sotto del dato stesso e di cui si fornisce il rango percentile. 65

i ranghi percentili [2] Si considera la seguente serie numerica: { 1, 3, 4, 5, 8, 10, 12, 13, 15 } Visto ad esempio, che l 80-percentile è pari a 13, si potrà affermare che il rango percentile di 13 è pari ad 80. Dal punto di vista formale: Q 80 =13 quindi Rp 13 = 80 66