4. INDICI DI POSIZIONE

Documenti analoghi
INDICATORI DI TENDENZA CENTRALE

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di tendenza centrale

Corso di Statistica: ESERCITAZIONI

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE

Elementi di Statistica

Istituzioni di Statistica e Statistica Economica

Le medie. Antonello Maruotti

Lezione 4: Indici di posizione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

La sintesi delle distribuzioni


Statistica descrittiva II

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Elaborazione dei dati Valori medi

Grafici e tabelle permettono di fare valutazioni qualitative, non quantitative. E necessario poter sintetizzare i dati attraverso due importanti

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

Questionario 1. Sono assegnati i seguenti dati

ESERCIZI STATISTICA DESCRITTIVA

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva

Esercitazioni di statistica

Valori Medi. Docente Dott.ssa Domenica Matranga

Obiettivi Strumenti Cosa ci faremo? Probabilità, distribuzioni campionarie. Stimatori. Indici: media, varianza,

Corso di Statistica. Medie,Moda. Prof.ssa T. Laureti a.a Corso di Statistica a.a DEIM, Univ.TUSCIA - Prof.

Statistica. Campione

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

LE MEDIE DI POSIZIONE

Programmazione con Foglio di Calcolo Cenni di Statistica Descrittiva

Sintesi numerica di distribuzioni statistiche

STATISTICA A-K (2014) Soluzione esercizi da svolgere prima settimana

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

MISURE DI SINTESI 54

La variabilità. Dott. Cazzaniga Paolo. Dip. di Scienze Umane e Sociali

La statistica descrittiva per le variabili quantitative

x i. Δ x i

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

STATISTICA: esercizi svolti su MODA, MEDIANA, QUARTILI, DECILI e CENTILI

Elementi di statistica medica

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

Esempi di confronti grafici

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

CORSO DI LAUREA IN INFERMIERISTICA. LEZIONI DI STATISTICA Parte II Elaborazione dei dati Variabilità

Tutorato di Chimica Analitica 2016/2017

REGRESSIONE E CORRELAZIONE

Esercizi di statistica descrittiva. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 30

Elementi di statistica

I 5 principi dell estimo

Università di Cassino Corso di Laurea in Scienze Motorie Biostatistica Anno accademico 2011/2012

08/04/2014. Misure di posizione. INDICI DI POSIZIONE (measures of location or central tendency) 1. MODA 2. MEDIA 3. MEDIANA

Esercitazioni di Statistica

Scale di Misurazione Lezione 2

Esercitazione 1.3. Indici di variabilità ed eterogeneità. Prof.ssa T. Laureti a.a

tabelle grafici misure di

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Lezione 4 a - Misure di dispersione o di variabilità

Indici di posizione e dispersione per distribuzioni di variabili aleatorie

Esempio di calcolo di rischio relativo

La gestione dei risultati della valutazione. Claudio Mantovani

DISTRIBUZIONE NORMALE (1)

Dispensa di Statistica

Scuola di Calcolo Scientifico con MATLAB (SCSM) 2017 Palermo Luglio 2017

1/4 Capitolo 4 Statistica - Metodologie per le scienze economiche e sociali 2/ed Copyright 2008 The McGraw-Hill Companies srl

Teoria e tecniche dei test. Concetti di base

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

UNIVERSITA DEGLI STUDI DI PERUGIA STATISTICA MEDICA. Prof.ssa Donatella Siepi tel:

Misure di tendenza centrale

LEZIONI DI STATISTICA MEDICA

x i x f i f i + log1, 07 + log1,065 = 0, log1,05+ log1,06 + log1,055+ log( 1+ i)= 1 5

Statistica Sociale - modulo A

Lezione 4. Statistica. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Lezione 4. A. Iodice. Indici di posizione.

Unità Carattere Modalità

Statistica descrittiva

STATISTICA. La Statistica è la scienza che studia i fenomeni collettivi utilizzando metodi matematici.

Variabilità e Concentrazione Esercitazione n 02

Capitolo 3 Sintesi e descrizione dei dati quantitativi

Gli indici di variabilità

STATISTICA Disciplina scien tifica che fornisce strumenti per l interpretazione delle informazioni contenute in insiemi di dati relativi a

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Elementi di Probabilità e Statistica

Livello di misura Scala Nominale Scala Ordinale Scala di Rapporti. Scala Nominale

Una successione numerica è una funzione : che associa ad ogni numero naturale un numero reale :. In simboli:

Variabili casuali. - di Massimo Cristallo -

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti

La distribuzione delle frequenze. T 10 (s)

SCHEDA DIDATTICA N 7

Facoltà di AGRARIA anno accademico 2009/10

Statistica Descrittiva Soluzioni 3. Medie potenziate

Università di Cassino. Esercitazioni di Statistica 1 del 29 Gennaio Dott. Mirko Bevilacqua

Statistica di base per l analisi socio-economica

1/55. Statistica descrittiva

2. Variabilità mediante il confronto di valori caratteristici della

Descrittiva. V Scuola Estiva AISV La statistica come strumento di analisi nelle scienze umanistiche e comportamentali

Q1 = /4 0 4 = Me = /2 4 = 3

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

Variabilità. ..senza variabilità non ci sarebbe la statistica

Statistica. Esercitazione 3 9 maggio 2012 Coefficiente di variazione. Serie storiche. Connessione e indipendenza statistica

STATISTICHE DESCRITTIVE

Corso di Statistica (canale P-Z) A.A. 2009/10 Prof.ssa P. Vicard LA VARIABILITÀ

ELEMENTI DI STATISTICA

Transcript:

UNIVERSITA DEGLI STUDI DI PERUGIA DIPARTIMENTO DI FILOSOFIA SCIENZE SOCIALI UMANE E DELLA FORMAZIONE Corso di Laurea in Scienze per l'investigazione e la Sicurezza. INDICI DI POSIZIONE Prof. Maurizio Pertichetti Statistica sociale

. INDICI DI POSIZIONE Gli indici di posizione, o misure della tendenza centrale o medie, sintetizzano la posizione di una distribuzione statistica sostituendo i dati rilevati con un solo valore (numero) reale tale da fornire una efficace rappresentazione del fenomeno nella sua globalità e da riassumerne gli aspetti ritenuti più importanti. E' undice significativo dell'insieme dei dati che esprime la posizione, sulla scala ordinata delle misurazioni, intorno alla quale si addensa la popolazione. In sostanza le medie consentono di dare una descrizione dell'ordine di grandezza di un dato fenomeno e confrontarlo con altri. Secondo la definizione classica il valore medio M è un qualsiasi valore compreso fra il minimo x e il massimo x della successione dei valori dati, ovvero x M x, e può coincidere con uno o più di essi o con nessuno di essi. E' la prima indicazione della dimensione del fenomeno. Le medie si distinguono in due tipologie: - medie analitiche (o ferme), che si ottengono effettuando operazioni matematiche su tutti i valori della distribuzione. Tra queste vi sono la media aritmetica, la media geometrica, la media quadratica; - medie di posizione (o lasche), la cui determinazione coinvolge solo alcuni valori della distribuzione. Tra queste ci sono la mediana e la moda. In questo corso saranno trattate le medie più usate, ovvero la media aritmetica, la mediana e la moda. La media aritmetica La media aritmetica, spesso indicata semplicemente come valore medio, per la sua immediata intuizione, per le proprietà di cui gode e per la facilità del calcolo, è la più utilizzata fra le espressioni sintetiche della grandezza di una serie di dati. Il concetto di media aritmetica è assai semplice. E' infatti un valore medio risultante dal quoziente tra la somma di tutti i valori, o modalità, di una distribuzione e il numero di questi valori. di una distribuzione, la media μ è Dati i valori o modalità, tra loro diversi, x, x,,,, x determinata da: Σ i= Se i valori della distribuzione si ripetono, ovvero se le modalità si presentano avendo associate le frequenze n, n,,,, n, la media μ è rappresentata dal quoziente che si ottiene facendo la somma dei prodotti di ciascun valore per la sua frequenza e dividendola per la somma di tutte le frequenze. In tal caso si parla di media ponderata perché ogni valore entra nella media col proprio peso, cioé la propria frequenza: Σ i= Σ = n i=

La media aritmetica è il valore μ che sostituito a ciascuno dei termini della distribuzione, non ne altera la somma, ovvero: Σ = i= Alcune proprietà della media aritmetica: - la somma algebrica degli scarti di ciascun termine di una successione dalla propria media aritmetica è nulla: - Σ ( - μ ) = 0 μ Σ i= i= ( - μ ) = 0 La media aritmetica costituisce il baricentro della distribuzione di frequenza e, come già detto, è sempre compresa tra i valori minimo e massimo della distribuzione. la somma dei quadrati degli scarti tra ciascun termine della successione e la propria media aritmetica è un minimo, ovvero è inferiore alla somma dei quadrati degli scarti da qualsiasi altro valore medio: Σ i= In presenza di una variabile statistica divisa intervalli, il metodo più semplice di calcolo della media aritmetica, anche se evidentemente introduce un errore di approssimazione, consiste nel sostituire le classi di intensità col valore centrale di ciascuna di esse. Inconveniente della media aritmetica è la sua scarsissima resistenza al valori eccezionali, nel senso che, anche un valore atipico può farla variare in misura elevatissima, sino a farle perdere significato. In pratica, la media aritmetica fornisce una utile sintesi quando la variabilità delle osservazioni non è elevata. ( - μ ) = minimo x x x x x 8 0 00 00 tot 7 μ Esempi di calcolo della media aritmetica Data la seguente distribuzione di valori: 8, + + + + 8 = 7 Σ = μ, +, +, +, +, = 7 i= ( volte ),8 =,8,8 In questo caso si dimostra che la media aritmetica è quella quantità μ che sostituita a ciascuna modalità, non ne altera la somma. In formula:,

Data la seguente distribuzione di frequenza: n. componenti n. famiglie 7 7 7 8 8 8 7.8 0.00..70 78 7.0 7.0.8 =,8 Data la seguente distribuzione di frequenza per classi di età: classi di età - - - 0 - - 70 7-8 valore componenti centrale.0 0.0 0 0.0 0 8 0. 0 0.70 8 78 8... =, La mediana La mediana è quell'indice di posizione che risponde al concetto più intuitivo di valore medio, essendo il valore centrale di n termini ordinati in senso non decrescente. Essa bipartisce la distribuzione delle modalità di un carattere, per cui il numero dei termini che precedono la mediana è uguale al numero dei termini che la seguono. La mediana è una misura robusta, in quanto poco influenzata dalla presenza di dati anomali. Altresì non è influenzata dalle osservazioni estreme. Quando il numero delle osservazioni è dispari, la mediana è un termine effettivo in quanto corrisponde esattamente al valore che occupa la posizione centrale nella distribuzione, quando il numero delle osservazioni è pari la mediana è invece un valore di conto in quanto è data dalla semisomma dei due valori centrali. Si distingue: per caratteri discreti: con modalità ordinate se: n dispari la mediana è data dal valore corrispondente al posto centrale C = n+/. Per cui Me è n pari uguale a x che corrisponde a C. la mediana è data dal valore corrispondente alla semisomma dei due posti centrali C=n/ e C=(n/)+. Per cui Me corrisponde a (C+C)/ per caratteri continui con modalità raggruppate in classi: preliminarmente si deve individuare la classe mediana, che è quella che corrisponde alla modalità associata alla prima frequenza cumulata relativa superiore al 0 per cento. successivamente per stabilire la mediana, ovvero quale valore scegliere all'interno dell'intervallo della classe, si applica la formula: Me = L me + n - f Me Σ Me c

dove: - L Me è il confine inferiore della classe mediana; - n è la frequenza totale; - Σ Me è l'accumulo delle frequenze di tutte le classi inferiori alla classe mediana; - f Me è la frequenza della classe mediana; - c è l'ampiezza della classe mediana. Esempi di calcolo della mediana Date le seguenti distribuzioni d'intensità: a),,,,, 7, 8, 8,,,,,,, 7 8 8 7 8 0 ( 7 valori ) ( 7 valori ) b),,,,, 7, 8, 8,,,,,,,, a) b) le modalità della distribuzione sono in numero dispari () per cui la mediana è quel valore di x che corrisponde alla posizione ( + )/ = 8. All'8 posto c'è la modalità 8 e quindi Me=8. in questo caso le modalità della distribuzione sono in numero pari () per cui la mediana è quel valore dato dalla semisomma dei valori di x corrispondenti alle posizioni /=8 e (/)+=. All'8 e ci sono le modalità 8 e, per cui (8+)/ = 8, e quindi Me=8,. 7 8 8 7 8 0 ( 8 valori ) ( 8 valori ) a) n' i b) 7 8 8 0 totale Data la seguente distribuzione: xi 7 8 totale ni n' i 8 0 Me = 8 in quanto è dato dal valore d'intensità in corrispondenza del quale le frequenze cumulate hanno appena superato la semisomma delle frequenze totali n/=7,. Poiché i posti centrali sono 8 e e dalle frequenze cumulate si desume che si riferiscono alla modalità 8 e, Me = 8,. 0 0 n' i Poiché n= è dispari il posto centrale è C=(+)/=. La modalità che corrisponde al 0 posto è in quanto è la prima modalità a cui corrisponde una frequenza cumulata superiore a n/=/=,. 0 0 0 7 8

Data la seguente distribuzione: n' i 0 Poiché n= è pari, i posti centrali sono C=/=7 0 e C=(/)+=8 0. Tali posizioni si riferiscono entrambi alla modalità in quanto è la prima cui corrisponde una frequenza cumulata superiore a n/=/=7. 7 8 0 Data la seguente distribuzione di frequenza per classi di età: Classi di età 0 - - - ed oltre Partecipanti 0 07 0 07 n' i 87 7 07 La classe mediana è la classe -, in quanto è la prima cui corrisponde una frequenza cumulata superiore a n/=07/=0,. posti o 0 o o 88 o 7 o 8 o 07 o 87 o c'è la classe 0- Me = L me + n c'è la classe - - Σ Me f Me c c'è la classe - dove: - L me il confine inferiore della classe mediana è ; - n la frequenza totale è 07; - Σ Me l'accumulo delle frequenze di tutte le classi inferiori alla classe mediana è 87; - f Me la frequenza della classe mediana è ; - c l'ampiezza della classe mediana è 0. 88 o 0, 7 o c'è la classe e + Me = + 07-87 0 =,

La moda La moda, detta anche valore normale, è undice di posizione ed è la modalità del carattere cui corrisponde la massima frequenza. Ha significato di sintesi quando la distribuzione è unimodale, ossia presenta una sola moda. Una distribuzione si dice zeromodale se non presenta alcuna moda, ovvero tutti i termini hanno la stessa frequenza. Non è influenzata dalla presenza di nessun valore estremo, tuttavia viene utilizzata prevalentemente a scopi descrittivi. Per caratteri discreti la moda si individua facilmente, scorrendo lungo la colonna delle frequenze. Per caratteri continui con modalità raggruppate in classi, analogamente a quanto visto per la mediana, prima si individua la classe modale, quindi per stabilire il valore si applica la formula: Mo = L mo + Δ Δ + Δ c dove: - L mo è il confine inferiore della classe modale; - Δ è l'eccesso della frequenza modale sulla frequenza della classe immediatamente inferiore; - Δ è l'eccesso della frequenza modale sulla frequenza della classe immediatamente superiore; - c è l'ampiezza della classe modale. Esempi di calcolo della moda Data la seguente distribuzione:,,,,, 7, 8, 8,,,,,,,, 7 8 In questo caso la moda è Mo =, in quanto il dato si presenta volte. Ovvero ha la frequenza più alta di tutti gli altri. Data la seguente distribuzione di frequenza per classi di età: classi di età iscritti 8 0 7 7 7 0 8 7

La classe modale è la quinta in quanto ad essa corrisponde la frequenza massima ( iscritti). La moda è invece data da: - L mo = - Δ = 0 Δ Mo = L 0 mo + c = + = 7,8 - Δ = Δ + Δ 0 + - c = Data la seguente distribuzione di frequenza per classi di età: Classi addetti Aziende 0 0 70 0 00 0 0 70 0 00 0 0 8 0 0 La classe modale in questo caso è la terza in quanto ha associata la frequenza massima ( addetti). La moda è invece data da: - L mo = 70 - Δ = Δ Mo = L 70 + 0 = 77,0 - Δ mo + c = = Δ + Δ + - c = 0