LA MEDIANA (Caratteri almeno qualitativi ordinati)

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "LA MEDIANA (Caratteri almeno qualitativi ordinati)"

Transcript

1 LA MEDIANA (Caratteri almeno qualitativi ordinati) Fino ad ora ci siamo occupati della determinazione di misure di sintesi per caratteri quantitativi. In questo modo abbiamo definito ed illustrato le medie, in particolare la media aritmetica e le media geometrica. Come abbiamo visto il calcolo di queste medie consiste nell eseguire alcune operazioni (somma o prodotto) con le modalità del carattere; è per questo che occorre che i caratteri siano quantitativi. Ma cosa fare quando non lavoriamo con caratteri quantitativi? Consideriamo caratteri che siano almeno qualitativi ordinati, cioè le cui modalità (e di conseguenza le unità) possano essere ordinate - dalla meno importante alla più importante (se il carattere è qualitativo) - dalla più piccola alla più grande (se il carattere è quantitativo). Distribuzioni di frequenze Consideriamo la distribuzione di frequenze in cui abbiamo già ordinato le modalità, cioè dove x 1 < x 2 < < x k. x i x 1 x 2 x k f i f 1 f 2 f k Il nostro obiettivo è: riassumere alcune delle informazioni in essa contenute mediante un valore di sintesi. Esempio: abbiamo intervistato 100 persone e abbiamo ottenuto la seguente distribuzione per titolo di studio. Intanto osserviamo che il carattere è qualitativo ordinato e riportiamo la nostra distribuzione con le modalità già ordinate in modo crescente. In questo modo possiamo calcolare subito le frequenze cumulate assolute e relative. Titolo di studio n i f i N i F i Nessuno (N) Lic. Elementare (E) Lic. Media Inf. (MI) Freq. Rel. complessiva = 0.37<0.5 Lic. Media Sup. (MS) Laurea (L) Freq. Rel. complessiva = 0.19<0.5 Totale Osserviamo che: la modalità MS presenta una caratteristica speciale. E l unica modalità tale che: 1. le modalità minori di MS hanno una frequenza relativa cumulata minore di 0.5 (infatti F(MI) = 0.37) 2. le modalità maggiori di MS hanno una frequenza relativa complessiva minore di 0.5 (infatti F(L) = 0.19). 1

2 In altre parole MS è l unica modalità che spezza la distribuzione di frequenze in due parti, ognuna delle quali con frequenza relativa minore di 0.5. MS viene detta, grazie a questa proprietà, mediana della distribuzione. Definizione: la mediana di una distribuzione è la più piccola modalità che lascia alla sua sinistra e alla sua destra una frequenza relativa minore o uguale a 0.5. Ossia la mediana è la più piccola modalità, diciamo x j, tale che F j-1 < 0.5 e F j 0.5 Esempio: numero di esami superati da un gruppo di 20 studenti del 1 anno all inizio del terzo quadrimestre. Esami n i f i F i Totale 20 1 Qual è la modalità mediana? Risposta: 2 esami Verifichiamo: F(1) = 0.25 < 0.5 e F(2) = 0.65 > 0.5 Dalla definizione che abbiamo dato di mediana e dagli esempi presentati, si vede che la mediana è un valore di sintesi che va ad indicare un punto centrale della distribuzione. In sostanza la mediana è un centro intorno al quale si dispone la distribuzione. Osservazione: è immediato vedere che la mediana può essere ricavata graficamente dalla funzione di ripartizione Mediana n.esami 2

3 Fin qui abbiamo visto come si calcola la mediana quando i dati sono in forma di distribuzione di frequenze. Distribuzioni unitarie. Passiamo adesso a considerare il caso in cui i dati sono in forma di distribuzione unitaria. Esempio: si chiede a 5 persone di esprimere, con un numero tra 0 e 10, il loro livello di soddisfazione relativo al consumo di un determinato bene. Le risposte sono state Come prima cosa mettiamo in ordine crescente le 5 risposte La modalità 4 è la mediana. Infatti è la modalità che - lascia alla sua sinistra meno del 50% delle osservazioni, esattamente ne lascia il = 40%, 5 - lascia alla sua destra meno del 50% delle osservazioni, esattamente ne lascia = 40% 5 In altre parole 4 è la modalità presentata dall unità che occupa il posto centrale nella distribuzione unitaria. Consideriamo lo stesso esempio ma limitiamoci a rilevare il livello di soddisfazione di solo quattro persone. Le risposte sono Come prima cosa mettiamo in ordine crescente le 4 risposte La modalità 2 è la mediana. Infatti è la più piccola modalità che - lascia alla sua sinistra meno del 50% delle osservazioni, esattamente ne lascia = 25% in quanto F(0)=1/4 e 4 - lascia alla sua destra il 50% delle osservazioni, esattamente ne lascia il = 50% In generale, quando si ha una distribuzione unitaria x 1, x 2,, x n dove i termini sono posti in ordine non decrescente, 3

4 a) se la numerosità del collettivo è dispari allora la mediana (che indichiamo con M e ) è data x N + 1 e cioè dalla modalità presentata dall unità che occupa il posto centrale 2 nella distribuzione ordinata; b) se la numerosità del collettivo è pari allora la mediana è data da x N e cioè dalla 2 modalità presentata dall unità che occupa il posto 2 N nella distribuzione ordinata. Esempio: Consideriamo dati relativi al rendimento percentuale a un anno di 17 fondi di investimento. Abbiamo questi dati in forma di distribuzione unitaria; Ordiniamo le osservazioni N=17, quindi siamo nel caso dispari e sappiamo che la mediana è data dalla modalità associata all osservazione che occupa il 9 posto ovvero M e =30.5 Osservazione: in molti libri di testo il caso di N pari viene trattato come segue. Si nota innanzitutto che ci sono due unità centrali (nell esempio del livello di soddisfazione sono la seconda e la terza osservazione). Pertanto esistono due modalità mediane: quella associata alla seconda osservazione e quella associata alla terza. Se il carattere è quantitativo si può considerare come mediana la semisomma di questa due modalità. In generale data la distribuzione unitaria con N pari, le modalità mediane sono x N e x N xn + xn Inoltre se il carattere è quantitativo si pone per convenzione M e = 2 Nell esempio del livello di soddisfazione non è possibile fare questa operazione perché il carattere è qualitativo. Se invece torniamo all esempio dei fondi di investimento e supponiamo di rilevare il rendimento percentuale anche di altri tre fondi (siano essi ). Abbiamo la seguente distribuzione unitaria ordinata Osserviamo che N=20, quindi le modalità mediane sono quelle associate alle unità che occupano il 10 e il 11 posto nella lista ordinata ovvero 30.1 e Il carattere è quantitativo e si può scrivere che M e = ( )/2=30.3 Esempio (delle ore di straordinario dell infermiere) La distribuzione unitaria relativa alle ore di straordinario fatte da un infermiere nei 12 mesi dell anno è: 10, 12, 11, 5, 7, 10, 5, 0, 7, 10, 7, 12. Troviamo la mediana. Come prima cosa ordiniamo le osservazioni in modo non decrescente. La distribuzione ordinata è 4

5 Siamo nel caso di N pari e quindi applicando il punto b) abbiamo che la mediana è x 6 cioè 7 ore. Consideriamo i dati mensili, relativi alle ore di straordinario di un secondo infermiere. 10, 12, 11, 5, 7, 10, 5, 0, 7, 10, 7, 16. Vediamo che il secondo infermiere ha fatto ogni messe le stesse ore di straordinario fatte dal primo infermiere con la sola eccezione del mese di dicembre (l ultimo della lista) durante il quale il secondo infermiere ha fatto 16 e non 12 ore di straordinario. Calcoliamo la mediana. La distribuzione ordinata è N=12 quindi M e = x6 = 7. Vediamo quindi che il valore mediano è lo stesso per il primo e per il secondo infermiere anche se il secondo nel mese di dicembre ha fatto più ore di straordinario. Calcoliamo, ora, la media aritmetica di questa distribuzione; è µ = = Quindi il numero medio di ore di straordinario fatte dal secondo infermiere è 8.33 mentre il numero medio di ore di straordinario fatte dal primo infermiere era 8. Notiamo che è bastato cambiare un solo dato (in particolare il valore più grande) perché la media aritmetica ne risentisse subito. Infatti la media aritmetica ha reagito ad un valore estremo più alto crescendo. La mediana invece è rimasta la stessa. La proprietà di robustezza In termini più formali si dice che la mediana gode della proprietà di robustezza. Questa proprietà risulta particolarmente utile quando abbiamo il sospetto che alcune modalità molto grandi o molto piccole siano anomale e frutto di errore di rilevazione o semplicemente di situazioni fortemente atipiche. La media aritmetica non gode della proprietà di robustezza perché è sensibile alla presenza di valori estremi. Quindi da un lato abbiamo che la media aritmetica, in quanto valore calcolabile solo per caratteri quantitativi, è il valore centrale più informativo. D altro lato abbiamo che, dal momento che la media aritmetica ha la caratteristica di essere molto informativa, presenta lo svantaggio di essere molto sensibile alla presenza di valori estremi oppure di valori anomali. La mediana, invece, potendo essere calcolata anche solo per caratteri qualitativi ordinabili è molto poco sensibile alla presenza di valori anomali. La mediana infatti indica quella modalità che bipartisce la distribuzione. Infatti: al più il 50% delle unità presenta modalità più piccole o al più uguali alla mediana e al più il 50% delle unità presenta valori più grandi o al più uguali alla mediana. Osservazione: la media aritmetica e la mediana calcolate a partire dallo stesso data set, come abbiamo visto, possono essere diverse. Ciò non deve stupire perché esse corrispondono a due diverse definizioni di centro di una distribuzione. Quando la media aritmetica e la mediana di una stessa distribuzione sono molto diverse tra loro, allora è consigliabile riportarle entrambe. Consideriamo la seguente distribuzione di redditi $40000 $50000 $58000 $60000 $

6 Questa è sintetizzata meglio dalla mediana (piuttosto che dalla media aritmetica) perché la mediana non è influenzata dal valore estremo $ Infatti M e =$58000 e µ=$ Quindi quando vi offriranno un lavoro, non chiedete a chi ve lo sta offrendo lo stipendio medio nell azienda. Prima di scegliere se accettare l offerta, chiedete lo stipendio mediano! Distribuzioni in classi. Vediamo prima di tutto un esempio. Consideriamo la distribuzione dei tempi attesa di 90 clienti di una banca prima di essere serviti. La distribuzione è la seguente Minuti di n i f i F i attesa Il carattere rilevato tempo di attesa è quantitativo continuo quindi la funzione di ripartizione è continua (in particolare è data dalla spezzata nella figura sotto). Vediamo come si individua graficamente la mediana a partire dalla funzione di ripartizione. Sappiamo che la mediana è la modalità posseduta da quella unità che occupa il centro della distribuzione (una volta ordinata). In sostanza la mediana è quel valore che, dividendo in due parti uguali la distribuzione, fa sì che F(M e )=0.5. Pertanto tracciamo la retta orizzontale F(x) = 0.5. Questa interseca la funzione di ripartizione; proiettiamo questo punto di intersezione sull asse delle ascisse. Questo punto (ovvero il quadrato rosso sull asse delle ascisse) è la mediana. Quindi abbiamo individuato: 1. la classe mediana, che è la mediana (approssimativamente), che è circa 7 minuti. 1 F(x) tempo attesa (x) Mediana 6

7 ******* Consideriamo qui il caso in cui si sia rilevato un carattere quantitativo (continuo) e la distribuzione sia in classi. Questo rappresenta il caso più complicato perché è il caso in cui abbiamo meno informazioni: di ogni unità conosciamo solo la classe a cui appartiene ma non il valore esatto della modalità che presenta. In altre parole disponiamo solo delle classi e delle rispettive frequenze ma non sappiamo nulla della distribuzione delle unità all interno delle classi. Occorre quindi, come abbiamo sempre fatto quando ci siamo trovati in questa situazione, introdurre l ipotesi di uniforme distribuzione delle unità all interno di ogni classe. Definizione: la mediana è l unico valore x tale che F(x) = 0.5. Vediamo come si calcola la mediana. 1) A partire dalla distribuzione di frequenze, calcolo le frequenze cumulate X f i F i c 0 - c 1 f 1 F 1 c 1 c 2 f 2 F 2 c i-1 - c i f i F i c K-1 - c K f K F K 2) Cerco la classe mediana, cioè la classe (c i-1, c i ) tale che F i-1 < 0.5 e F i 0.5 La mediana è in (c i-1, c i ). 3) Adesso dobbiamo individuare la mediana all interno della classe mediana. Per fare ciò abbiamo bisogno della funzione di ripartizione.sappiamo che F (x) = Fi 1 + hi( x c) per c x < ci quindi è molto semplice individuare in (c i-1, c i ) quel punto x tale F(x) = 0.5 Basta risolvere: 0.5 = Fi 1 + hi( x c) Dopo i seguenti passaggi 0.5 Fi 1 = hix hic i da cui segue h x = 0.5 F si ha i 1 + h c i Indichiamo questo valore x con M e 1 x = c + ( 0.5 F ). h i fi È importante notare che, poiché hi =, la formula per la mediana può ci c essere equivalentemente scritta come segue 7

8 M e = c ci c + f i ( 0.5 F ) Le due formule sono equivalenti; può essere utile usare la seconda qualora si siano già calcolate le densità. Esempio. Consideriamo la seguente distribuzione in classi (di cui abbiamo in precedenza calcolato le media aritmetica) Classe c i 1 c i f i F i Totale 1 Individuiamo la classe mediana. Vediamo che è la classe perché F(170)<0.5 precisamente F(170)= e F(175) > 0.5 precisamente F(175)= La mediana è data da M e = ( ) = = Osservazione: come abbiamo visto la mediana viene calcolata usando in modo inverso la funzione di ripartizione. Questo ci fa capire che la mediana può anche essere individuata graficamente proprio a partire dal grafico della funzione di ripartizione. Torniamo all esempio dei tempi di attesa in banca e calcoliamo esattamente la mediana 10 5 M e = 5 + ( ) = Quindi abbiamo una conferma dell esattezza del risultato ottenuto mediante la semplice analisi grafica. Proprietà della mediana Vediamo se la mediana gode delle proprietà che avevamo presentato come desiderabili per i valori medi. La mediana è: 1. Consistente 2. Monotona in senso debole Se consideriamo le due distribuzioni 30,30,30 e 30,30,50 osserviamo che la mediana sia nel primo caso che nel secondo caso è pari a 30 anche se la seconda distribuzione è statisticamente più grande. 3. Interna 8

9 4. Non necessariamente Associativa Per dimostrare questa affermazione è sufficiente mostrare un esempio dove non è valida la proprietà associativa. Consideriamo la distribuzione unitaria 2,2,2,4,3,3,4 e la sua partizione nelle due distribuzioni parziali 2,2,2,4 e 3,3,4. Calcoliamo la mediana delle due distribuzioni parziali: M = 2 e M = 3. Osserviamo che la mediana della distribuzione 2,2,2,2,3,3,3, è pari a 2, ed è diversa da quella della distribuzione iniziale, pari a 3. Inoltre abbiamo già visto che la mediana è 5. Robusta In altri termini, è poco influenzata dai valori estremi della distribuzione. Ad esempio, osserviamo che le due distribuzioni 1, 2, 3 e 1, 2, 100 hanno la stessa mediana ma una diversa media aritmetica. Questa proprietà risulta particolarmente utile quando abbiamo il sospetto che alcune modalità molto grandi o molto piccole siano anomale e frutto di errori di rilevazione o semplicemente di situazioni fortemente atipiche. e 1 e 2 9

10 QUANTILI E QUARTILI Definizione: data una frazione α, 0 < α < 1, il quantile di ordine α, è la più piccola modalità x del carattere tale che F j-1 < α e F j α Notiamo che se α=0.5 allora si ha la mediana. Il caso che si presenta più di frequente è quello dei quartili. I quartili dividono la distribuzione in quattro parti, ognuna delle quali contiene il 25% della numerosità totale. Il primo quartile è la modalità che lascia alla sua sinistra al più il 25% delle unità e alla sua destra al più il 75% delle unità. Si indica con Q 1 e corrisponde al caso α=0.25 Il secondo quartile è la modalità che lascia alla sua sinistra al più il 50% delle unità e alla sua destra al più il 50% delle unità. Cioè il secondo quartile è la mediana e lo si indica con M e e corrisponde al caso α=0.5. Il terzo quartile è la modalità che lascia alla sua sinistra al più il 75% delle unità e alla sua destra al più il 25% delle unità. Si indica con Q 3 e corrisponde al caso α=0.75. I quantili si definiscono e, di conseguenza, si calcolano in modo analogo alla mediana. Pertanto, proprio come la mediana, i quantili vengono calcolati con l ausilio della funzione di ripartizione e quindi possono anche essere individuati graficamente a partire dal grafico della funzione di ripartizione stessa. Consideriamo prima il caso delle distribuzioni di frequenza (non in classi). Esempio (degli esami superati). Esami n i f i F i Totale 20 1 Q 1 = 1 Q 2 = M e = 2 Q 3 = 3 Consideriamo le distribuzioni in classi. Definizione: data una frazione α, 0 < α < 1, il quantile di ordine α, è la modalità x del carattere tale che F(x) = α Notiamo che se α=0.5 allora si ha la mediana. Come per il calcolo della mediana, si determina il quantile di ordine α come segue: 1) Si calcolano le frequenze cumulate 2) si individua la classe in cui cade il quantile 3) si applica la formula 10

11 i ( x c ) α = F + h da cui si ricava x = c + 1 h i i ( α F ) = c + ( α F ) c c f i Concentriamo l attenzione sul calcolo dei tre quartili. Il primo quartile si calcola applicando la procedura sopra e ponendo α=0.25. Il secondo quartile (ovverosia la mediana) si calcola applicando la procedura sopra e ponendo α=0. 5. Il terzo quartile si calcola applicando la procedura sopra e ponendo α=0.75. Per chiarire meglio riprendiamo l esempio della statura visto nella parte dedicata alla mediana. Esempio (statura). Classe c i 1 c i f i F i Totale 1 Calcoliamo il primo quartile. Individuiamo la classe a cui appartiene. Vediamo che è la classe perché F(165)<0.25 precisamente F(165)= e F(170) > 0.25 precisamente. F(170)=0.287 Il primo quartile è dato da Q 1 = ( ) = = Non ci soffermiamo sul calcolo della mediana che abbiamo già visto prima. M e = Passiamo al calcolo del terzo quartile. Individuiamo la classe a cui appartiene. Vediamo che è la classe perché F(175)<0.75 precisamente F(175)= e F(180) > 0.75 precisamente. F(180)= Il primo quartile è dato da Q 3 = ( ) = =

12 LA MODA (Caratteri di qualunque tipo) L ultima tipologia di caratteri per i quali ancora non è stato proposto un valore medio è quella dei caratteri qualitativi sconnessi. Il valore medio che andiamo a introdurre può pertanto essere calcolato per tutti quanti i tipi di carattere. In questo caso, il criterio di sintesi più semplice si ottiene prendendo come valore medio, la moda, M o, della distribuzione. Distribuzioni di frequenze Definizione: la moda è la modalità a cui è associata la massima frequenza (assoluta, relativa o percentuale). Esempio: consideriamo la distribuzione per tipo, di 21 fondi di investimento Tipo di azioni n i (obiettivo) GI 6 IL 7 MC 2 SC 4 TK 2 Totale 21 La moda è data dal tipo di azione IL perché ha la frequenza più alta. Esempio: consideriamo la distribuzione per confessione Religione n i Cristiana 317 Musulmana 269 Animista 68 Altro 8 Totale 662 La moda è la religione cristiana perché è quella che ha la frequenza maggiore. Osservazione: la moda si trova molto facilmente mediante il grafico con il quale si rappresenta la distribuzione. Se, ad esempio, rileviamo un carattere qualitativo sconnesso (come nell esempio della religione) la moda è indicata dalla modalità a cui corrisponde la colonna più alta o il nastro più lungo. Ad esempio nel caso dei fondi di investimento il diagramma a barre verticali è dato dal grafico seguente da cui si vede che la colonna più alta è quella relativa a IL. 12

13 Tipo di azioni GI IL MC SC TK Per i caratteri quantitativi divisi in classi invece della moda si può individuare la classe modale. Definizione: la classe modale è la classe a cui è associata la massima densità (assoluta, relativa o percentuale). Quindi, proprio come nel caso della rappresentazione grafica, anche ora, quando abbiamo una distribuzione in classi dobbiamo ragionare in termini di densità e non di frequenza. Ne deriva che quando si ha una distribuzione in classi il grafico da cui si può individuare la classe modale è l istogramma di densità. Esempio: la tabella seguente riporta la distribuzione in classi di reddito delle famiglie bianche negli Stati Uniti (anno 1987). Come esercizio, costruire gli istogrammi relativi alle due distribuzioni che seguono. Cerchiamo la classe modale. Reddito (in migliaia di $) f i α i h i Totale 1 Pertanto calcoliamo le densità e vediamo che la classe modale è (migliaia di $) Vediamo l istogramma 13

14 0,02 Densità 0,01 0, Reddito Consideriamo adesso la stessa distribuzione ma questa volta riferita alle famiglie non bianche. f i Reddito (in migliaia di $) α i h i Totale 1 La classe modale è In questo modo, possiamo vedere che nel 1987 negli Stati Uniti la classe di reddito con maggiore frequenza (a cui, cioè appartiene il numero maggiore di famiglie) è più bassa quando si considerano le famiglie di colore piuttosto che le altre. Proprietà della moda 1. Consistente 2. non necessariamente Monotona Ad esempio se consideriamo le due distribuzioni 1, 2, 2, 3, 3, 3 e 1, 2, 2, 3, 4, 5 osserviamo che la moda nel primo caso è pari a 3 mentre nel secondo è pari a 2 anche se la seconda distribuzione è statisticamente più grande. 3. Interna 4. non necessariamente associativa 14

15 Consideriamo la distribuzione unitaria 1,3,3,4,2,2,2,2 e la sua partizione nelle due distribuzioni parziali 1,3,3,4 e 2,2,2,2. Le mode delle due distribuzioni parziali risultano rispettivamente i valori 3 e 2. Quindi la distribuzione 3,3,3,3,2,2,2,2 ha due mode pari a 2 e 3 (distribuzione bimodale), mentre la moda della distribuzione iniziale è pari a non necessariamente unica Una distribuzione può presentare più di una moda se vi sono più modalità che presentano il massimo delle frequenze. Nel caso in cui una distribuzione abbia più di una moda si dice plurimodale. Esempio: supponiamo di avere una distribuzione del tipo che segue n i n o figli Si vede immediatamente che questa distribuzione ha due mode perché la frequenza massima è 100 e sono ben due le modalità (ovvero 0 figli e 2 figli) a presentare una frequenza pari a 100. Pertanto questa distribuzione viene detta plurimodale o, più precisamente, bimodale. 15

16 Alcune considerazioni sui valori medi Abbiamo visto che ogni valore medio fornisce delle informazioni sulla distribuzione. Media, mediana e moda forniscono la stessa quantità di informazione? La risposta è NO. Esse infatti sono calcolate per tipi diversi di caratteri (in particolare modo per caratteri che occupano posti diversi della gerarchia). Si ha che tanto più è alto il posto nella gerarchia occupato dal carattere che analizziamo, tanto più è informativo il valore medio specifico per quel carattere. D altro lato un valore medio tanto più è informativo, tanto meno è robusto. Più chiaramente: - se analizzo lo stato civile (carattere qualitativo sconnesso) posso solo calcolare la moda. Il carattere qualitativo sconnesso (nel nostro esempio lo stato civile) occupa il posto più basso nella gerarchia e quindi la moda è un valore medio con bassa capacità informativa. Basta infatti osservare che per trovare la moda di una distribuzione non è necessario eseguire alcuna operazione (anche perché, vista la natura del carattere, non sarebbe possibile farla). D altro lato la moda è il valore medio più robusto. - Se ho una distribuzione del collettivo per titolo di studio (carattere qualitativo ordinato) il valore medio specifico per questa distribuzione è la mediana (ovviamente potrei anche calcolare la moda): Il carattere qualitativo ordinato occupa un posto medio nella gerarchia e quindi la mediana è un valore medio con capacità informativa media e robustezza media. - Se ho una distribuzione del collettivo per reddito (carattere quantitativo) il valore medio specifico per questa distribuzione è la media (ovviamente potrei anche calcolare la mediana e la moda): Il carattere quantitativo occupa il posto più elevato nella gerarchia e quindi la media è un valore medio con elevata capacità informativa. Questo perché esso è ottenuto eseguendo operazioni algebriche sulle modalità e tiene pertanto conto di ogni singola valore numerico delle modalità. La media è il valore medio meno robusto Livello nella gerarchia Tipo di caratteri Tipo di grafico Alto Quantitativi Istogramma di densità Medio Basso Qualitativi Ordinati Qualitativi Sconnessi Istogramma di frequenze Diagramma barre Grafico a torta Valori medi calcolabili Media (specifico del suo livello) Mediana Moda Mediana (specifico del suo livello) Moda Moda (specifico del suo livello) Osservazione: abbiamo appena elencato la capacità informativa del valore medio specifico per il livello gerarchico del carattere. Supponiamo adesso di avere rilevato un carattere quantitativo; sappiamo che, volendo sintetizzare la distribuzione, possiamo scegliere tra moda, mediana e media. Quale delle tre è meglio calcolare? Escludiamo la moda perché ha capacità informativa troppo bassa. Che valore medio scegliere tra mediana e media? E difficile dirsi ma si possono fare delle considerazioni: 16

17 1. si vuole cercare di evitare ogni perdita di informazione; ne segue che è preferibile la scelta della media. 2. Si deve stare molto attenti, come abbiamo già visto, alla presenza di valori anomali nella nostra distribuzione. la media è molto informativa e quindi è anche molto sensibile ad essi. Questa considerazione porta quindi ad optare per la mediana che è robusta. Da queste due considerazioni segue che la scelta del valore medio da calcolare deve essere sempre preceduta da una valutazione iniziale della qualità dei dati di cui si dispone. Torniamo alla media aritmetica e alla sua capacità informativa. La media è informativa al punto di consentire di ricostruire anche un dato mancante nella nostra distribuzione. Vediamo un esempio. Supponiamo di avere rilevato il voto preso all esame di statistica da 6 studenti. Ne abbiamo anche calcolato la media aritmetica che è µ = Adesso vogliamo guardare i sei voti e ci accorgiamo che la parte inferiore del foglio su cui sono riportati i voti si è strappata e quindi il sesto voto è finito nel cestino. Ci è rimasta solo la seguente distribuzione x dove con x ho indicato il voto mancante. Possiamo ricostruire il valore mancante x usando la definizione stessa di media aritmetica x = da cui segue x = ( ) = 28 17

ESERCIZI DI STATISTICA SOCIALE

ESERCIZI DI STATISTICA SOCIALE ESERCIZI DI STATISTICA SOCIALE FREQUENZA ASSOLUTA Data una distribuzione semplice di dati, ovvero una serie di microdati, si chiama frequenza assoluta di ogni modalità del carattere studiato il numero

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Indici di posizione e di variabilità Prof. Livia De Giovanni lstatistica@dis.uniroma1.it Esercizio 1 Data la seguente distribuzione unitaria del carattere X: X : 4 2 4 2 6 4

Dettagli

Le medie. Antonello Maruotti

Le medie. Antonello Maruotti Le medie Antonello Maruotti Outline 1 Medie di posizione 2 Definizione Moda La moda di un collettivo, distributio secondo un carattere qualsiasi, è la modalità prevalente del carattere ossia quella a cui

Dettagli

Fonti e strumenti statistici per la comunicazione

Fonti e strumenti statistici per la comunicazione Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 018-019 Indici Medi Sintesi della distribuzione: gli indici medi Le distribuzioni delle variabili possono essere sintetizzate

Dettagli

Statistica Descrittiva Soluzioni 4. Medie lasche

Statistica Descrittiva Soluzioni 4. Medie lasche ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

Introduzione. Medie di posizione. Medie analitiche. non richiedono operazioni algebriche sulle modalità Mediana e moda

Introduzione. Medie di posizione. Medie analitiche. non richiedono operazioni algebriche sulle modalità Mediana e moda Introduzione Medie di posizione non richiedono operazioni algebriche sulle modalità Mediana e moda Medie analitiche calcolate con operazioni algebriche sulle modalità, richiedono dei caratteri quantitativi

Dettagli

Suggerimento a proposito di decimali

Suggerimento a proposito di decimali Fonti e strumenti statistici per la comunicazione Prof.ssa Isabella Mingo A.A. 017-018 Suggerimento a proposito di decimali Quando si calcolano le frequenze relative è opportuno mantenere almeno 4 cifre

Dettagli

MISURE DI SINTESI 54

MISURE DI SINTESI 54 MISURE DI SINTESI 54 MISURE DESCRITTIVE DI SINTESI 1. MISURE DI TENDENZA CENTRALE 2. MISURE DI VARIABILITÀ 30 0 µ Le due distribuzioni hanno uguale tendenza centrale, ma diversa variabilità. 30 0 Le due

Dettagli

La sintesi delle distribuzioni

La sintesi delle distribuzioni Dip. di Scienze Umane e Sociali paolo.cazzaniga@unibg.it Outline 1 Introduzione 2 3 4 Outline 1 Introduzione 2 3 4 Introduzione Analisi descrittiva monovariata: segue la raccolta dei dati e il calcolo

Dettagli

Indici di tendenza centrale Media, mediana e moda.

Indici di tendenza centrale Media, mediana e moda. Indici di tendenza centrale Media, mediana e moda. Indici di tendenza centrale Gli indici di tendenza centrale individuano gli aspetti tipici, ovvero i valori più rappresentativi della distribuzione Questi

Dettagli

Medie. Monia Ranalli. Ranalli M. Medie Settimana # 2 1 / 22

Medie. Monia Ranalli. Ranalli M. Medie Settimana # 2 1 / 22 Medie Monia Ranalli Ranalli M. Medie Settimana # 2 1 / 22 Sommario Medie analitiche Media aritmetica Definizione Proprietà Medie di posizione Moda Definizione Proprietà Mediana Definizione Proprietà Calcolo

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it TIPI DI MEDIA: GEOMETRICA, QUADRATICA, ARMONICA Esercizio 1. Uno scommettitore puntando una somma iniziale

Dettagli

Lezione 4. Statistica. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Lezione 4. A. Iodice. Indici di posizione.

Lezione 4. Statistica. Alfonso Iodice D Enza iodicede@unicas.it. Università degli studi di Cassino. Lezione 4. A. Iodice. Indici di posizione. Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 28 Outline 1 Indici 2 3 mediana distribuzioni 4 5 () Statistica 2 / 28 Indici robusti (o ): La moda

Dettagli

Misure di tendenza centrale

Misure di tendenza centrale Misure di tendenza centrale Misure di tendenza centrale Medie ferme Medie di posizione * Media aritmetica * Media geometrica Ecc. * Moda * Mediana 51 Medie ferme Le medie ferme si calcolano usando tutti

Dettagli

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri;

3. rappresentare mediante i grafici ritenuti più idonei le distribuzioni di frequenze assolute dei diversi caratteri; Esercizio 1 Il corso di Statistica è frequentato da 10 studenti che presentano le seguenti caratteristiche Studente Sesso Colore Occhi Voto Soddisfazione Età Stefano M Nero 18 Per niente 21 Francesca F

Dettagli

Slide Cerbara parte 1. Le medie

Slide Cerbara parte 1. Le medie Slide Cerbara parte 1 Le medie Le medie Non una ma tante: le medie sono di tanti tipi e rappresentano un valore, una modalità caratteristica e che possa sintetizzare una intera distribuzione. 1. La media

Dettagli

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica

Statistica Corso Base (Serale) Dott.ssa Cristina Mollica Statistica Corso Base (Serale) Dott.ssa Cristina Mollica cristina.mollica@uniroma1.it Indici di posizione Esercizio 1: I seguenti valori si riferiscono al diametro del fusto rilevato su piante da laboratorio:

Dettagli

Rappresentazioni grafiche

Rappresentazioni grafiche Rappresentazioni grafiche Su una popolazione di n = 20 unità sono stati rilevati i seguenti fenomeni: stato civile (X) livello di scolarità (Y ) numero di figli a carico (Z) reddito in migliaia di (W )

Dettagli

4. VALORI CENTRALI. Statistica sociale

4. VALORI CENTRALI. Statistica sociale UNIVERSITA DEGLI STUDI DI PERUGIA DIPARTIMENTO DI FILOSOFIA SCIENZE SOCIALI UMANE E DELLA FORMAZIONE Corso di Laurea in Scienze per l'investigazione e la Sicurezza. VALORI CENTRALI Prof. Maurizio Pertichetti

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Medie Prof. Livia De Giovanni ldegiovanni@luiss.it Dott. Flaminia Musella fmusella@uniroma3.it Esercizio 1 Data la seguente distribuzione unitaria del carattere X: X : 4 2 4

Dettagli

ESERCIZI. La seguente tabella riporta la classificazione delle famiglie italiane secondo il reddito dichiarato (in milioni di lire) nel 1983:

ESERCIZI. La seguente tabella riporta la classificazione delle famiglie italiane secondo il reddito dichiarato (in milioni di lire) nel 1983: ESERCIZI ESERCIZIO_1 La seguente tabella riporta la classificazione delle famiglie italiane secondo il reddito dichiarato (in milioni di lire) nel 1983: Reddito Numero di famiglie (in migliaia) 0 6 1.128

Dettagli

Matematica Lezione 22

Matematica Lezione 22 Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 22 Sonia Cannas 14/12/2018 Indici di posizione Indici di posizione Gli indici di posizione, detti anche misure di tendenza centrale,

Dettagli

Dalla distribuzione unitaria a quella di frequenza

Dalla distribuzione unitaria a quella di frequenza Dalla distribuzione unitaria a quella di frequenza Cognome sesso età Livello soddisfaz ione Tipo albergo (categoria) Giorni permanenza Bianchi F 8 basso 4 Alimov F 5 medio 3 6 More M 19 alto 4 Wieser F

Dettagli

Statistica Descrittiva Soluzioni 3. Medie potenziate

Statistica Descrittiva Soluzioni 3. Medie potenziate ISTITUZIONI DI STATISTICA A. A. 2007/2008 Marco Minozzo e Annamaria Guolo Laurea in Economia del Commercio Internazionale Laurea in Economia e Amministrazione delle Imprese Università degli Studi di Verona

Dettagli

4. INDICI DI POSIZIONE

4. INDICI DI POSIZIONE UNIVERSITA DEGLI STUDI DI PERUGIA DIPARTIMENTO DI FILOSOFIA SCIENZE SOCIALI UMANE E DELLA FORMAZIONE Corso di Laurea in Scienze per l'investigazione e la Sicurezza. INDICI DI POSIZIONE Prof. Maurizio Pertichetti

Dettagli

Istituzioni di Statistica e Statistica Economica

Istituzioni di Statistica e Statistica Economica Istituzioni di Statistica e Statistica Economica Università degli Studi di Perugia Facoltà di Economia, Assisi, a.a. 2013/14 Esercitazione n. 1 A. I dati riportati nella seguente tabella si riferiscono

Dettagli

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche:

Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Istituzioni di Statistica 1 Esercizi su indici di posizione e di variabilità Esercizio 1 Questa tabella esprime i tempi di durata di 200 apparecchiature elettriche: Durata (ore) Frequenza 0 100? 100 200

Dettagli

Corso di Statistica. Medie,Moda. Prof.ssa T. Laureti a.a Corso di Statistica a.a DEIM, Univ.TUSCIA - Prof.

Corso di Statistica. Medie,Moda. Prof.ssa T. Laureti a.a Corso di Statistica a.a DEIM, Univ.TUSCIA - Prof. Corso di Statistica Indici di posizione: Medie,Moda Mediana, Quartili, Percentili Prof.ssa T. Laureti a.a. 203-204 Indicatori sintetici Gli aspetti più importanti di una distribuzione di frequenza riguardano:.

Dettagli

Valori Medi. Docente Dott.ssa Domenica Matranga

Valori Medi. Docente Dott.ssa Domenica Matranga Valori Medi Docente Dott.ssa Domenica Matranga Valori medi Medie analitiche - Media aritmetica - Media armonica - Media geometrica - Media quadratica Medie di posizione - Moda -Mediana - Quantili La media

Dettagli

Distribuzione di frequenza relativa e percentuale: esempio

Distribuzione di frequenza relativa e percentuale: esempio Distribuzione di frequenza relativa e percentuale: esempio Sesso Freq. assol. F 3 M Totale 5 Sesso % F 60 M 40 Totale 100 Sesso Freq. assol. F 180 M 10 Totale 300 Sesso % F 60 M 40 Totale 100 Attenzione:

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 3 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Indici di posizione per caratteri quantitativi discreti e continui Il seguente data set riporta la rilevazione

Dettagli

Esercizio 1. Ricavi 102,3 105,6 100,7 105,2 104,8 104,6 100,7 100,2 100,9 102,7 95,4 120,7

Esercizio 1. Ricavi 102,3 105,6 100,7 105,2 104,8 104,6 100,7 100,2 100,9 102,7 95,4 120,7 Esercizio 1 Un azienda del settore abbigliamento operante nella provincia di Frosinone ha registrato i seguenti ricavi annui (in migliaia di Euro) derivanti dalla vendita di capi in pelle: Anni 1991 1992

Dettagli

Corso di Statistica. Indici di posizione: Medie,Moda Mediana, Quartili, Percentili. Prof.ssa T. Laureti a.a

Corso di Statistica. Indici di posizione: Medie,Moda Mediana, Quartili, Percentili. Prof.ssa T. Laureti a.a Corso di Statistica Indici di posizione: Medie,Moda Mediana, Quartili, Percentili Prof.ssa T. Laureti a.a. 202-203 Corso di Statistica a.a. 202-203 DEIM, Univ.TUSCIA - Prof.ssa Laureti Indicatori sintetici

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Rappresentazioni grafiche Prof. Livia De Giovanni statistica@dis.uniroma1.it Esercizio 1 Si consideri la seguente distribuzione delle industrie tessili secondo il fatturato

Dettagli

Statistica. Matematica con Elementi di Statistica a.a. 2017/18

Statistica. Matematica con Elementi di Statistica a.a. 2017/18 Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati

Dettagli

L indagine statistica

L indagine statistica 1 L indagine statistica DEFINIZIONE. La statistica è quella disciplina che si occupa della raccolta di dati quantitativi relativi a diversi fenomeni, della loro elaborazione e del loro utilizzo a fini

Dettagli

Università di Cassino. Esercitazioni di Statistica 1 del 29 Gennaio 2010. Dott. Mirko Bevilacqua

Università di Cassino. Esercitazioni di Statistica 1 del 29 Gennaio 2010. Dott. Mirko Bevilacqua Università di Cassino Esercitazioni di Statistica del 29 Gennaio 200 Dott. Mirko Bevilacqua DATASET STUDENTI N SESSO ALTEZZA PESO CORSO NUMERO COLORE COLORE (cm) (kg) LAUREA SCARPA OCCHI CAPELLI M 79 65

Dettagli

STIME STATISTICHE. Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 2/2

STIME STATISTICHE. Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 2/2 p. 1/1 INFORMAZIONI Prossime lezioni Giorno Ora Dove 10/02 14:30 P50 11/02 14:30 Laboratorio (via Loredan) 17/02 14:30 P50 23/02 14:30 P50 25/02 14:30 Aula informatica (6-7 gruppi) 02/03 14:30 P50 04/03

Dettagli

Istituzioni di Statistica 1 Esercizi su tabelle di contingenza

Istituzioni di Statistica 1 Esercizi su tabelle di contingenza Istituzioni di Statistica 1 Esercizi su tabelle di contingenza Esercizio 1 Per stimare la percentuale di fumatori nella popolazione italiana adulta viene intervistato un campione di 60 donne e uno di 40

Dettagli

http://www.biostatistica.unich.it STATISTICA DESCRITTIVA LE MISURE DI TENDENZA CENTRALE OBIETTIVO Individuare un indice che rappresenti significativamente un insieme di dati statistici. Esempio: Nella

Dettagli

2. Variabilità mediante il confronto di valori caratteristici della

2. Variabilità mediante il confronto di valori caratteristici della 2. Variabilità mediante il confronto di valori caratteristici della distribuzione Un approccio alternativo, e spesso utile, alla misura della variabilità è quello basato sul confronto di valori caratteristici

Dettagli

DISTRIBUZIONE DI UN CARATTERE

DISTRIBUZIONE DI UN CARATTERE Corso di Statistica (canale P-Z) A.A. 2009/10 Prof.ssa P. Vicard DISTRIBUZIONE DI UN CARATTERE Terminata la fase di acquisizione dei dati, iniziamo a vedere come rappresentarli e sintetizzarli. Il primo

Dettagli

Lezione n Considerazioni preliminari

Lezione n Considerazioni preliminari 1 Considerazioni preliminari Abbiamo visto come con le medie sia possibile sintetizzare i dati rilevati in un collettivo, allo scopo di descrivere il fenomeno che ci interessa studiare Con le medie analitiche

Dettagli

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Statistica. Matematica con Elementi di Statistica a.a. 2015/16 Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati

Dettagli

Lezione 4: Indici di posizione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria

Lezione 4: Indici di posizione Corso di Statistica Facoltà di Economia Università della Basilicata. Prof. Massimo Aria Lezione 4: Indici di posizione Corso di Statistica Facoltà di Economia Università della Basilicata Prof. Massimo Aria aria@unina.it Indice di posizione Obiettivo di una misura di posizione è quello di

Dettagli

STATISTICA 1 ESERCITAZIONE 2

STATISTICA 1 ESERCITAZIONE 2 Frequenze STATISTICA 1 ESERCITAZIONE 2 Dott. Giuseppe Pandolfo 7 Ottobre 2013 RAPPRESENTAZIONE GRAFICA DEI DATI Le rappresentazioni grafiche dei dati consentono di cogliere la struttura e gli aspetti caratterizzanti

Dettagli

Una statistica è una quantità numerica il cui valore è determinato dai dati.

Una statistica è una quantità numerica il cui valore è determinato dai dati. STATISTICHE CAMPIONARIE Quando i dati sono molti e illeggibili nella forma grezza, si rende necessario introdurre quantità numeriche che possano essere usate per sintetizzarli. Queste misure riassuntive

Dettagli

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva LE MISURE DI TENDENZA CENTRALE Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva Individuare un indice che rappresenti significativamente un insieme di dati statistici

Dettagli

Livello di misura Scala Nominale Scala Ordinale Scala di Rapporti. Scala Nominale

Livello di misura Scala Nominale Scala Ordinale Scala di Rapporti. Scala Nominale Esercitazione Supponiamo che il collettivo che si vuole studiare sia composto da un gruppo di turisti. La seguente tabella raccoglie l osservazione di alcuni caratteri di interesse. Costo Soggetto Titolo

Dettagli

Statistica descrittiva II

Statistica descrittiva II Probabilità e Statistica Esercitazioni a.a. 009/010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Statistica descrittiva II Ines Campa Probabilità e Statistica - Esercitazioni

Dettagli

p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali.

p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica che sia affetta da errori casuali. p. 1/2 STIME STATISTICHE Consideriamo il caso della misura di una grandezza fisica

Dettagli

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici) Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:

Dettagli

STATISTICA: esercizi svolti sulla MEDIA ARITMETICA

STATISTICA: esercizi svolti sulla MEDIA ARITMETICA STATISTICA: esercizi svolti sulla MEDIA ARITMETICA 1 1 MEDIA ARITMETICA 2 1 MEDIA ARITMETICA 1. La seguente tabella riporta il numero di persone divise per sesso che si sono presentate durante l anno 1997

Dettagli

Statistica descrittiva

Statistica descrittiva Statistica descrittiva Caso di 1 variabile: i dati si presentano in una tabella: Nome soggetto Alabama Dato 11.6.. Per riassumere i dati si costruisce una distribuzione delle frequenze. 1 Si determina

Dettagli

Daniela Tondini

Daniela Tondini Daniela Tondini dtondini@unite.it Facoltà di Medicina veterinaria CdS in Tutela e benessere animale Università degli Studi di Teramo 1 INDICI STATISTICI La moda M O di una distribuzione di frequenza X,

Dettagli

METODO DI CAVALIERI-SIMPSON (o delle parabole) (per il calcolo approssimato 1 di integrali definiti)

METODO DI CAVALIERI-SIMPSON (o delle parabole) (per il calcolo approssimato 1 di integrali definiti) METODO DI CVLIERI-SIMPSON (o delle parabole) (per il calcolo approssimato di integrali definiti) ssieme ai metodi dei Rettangoli e dei Trapezi costituisce l insieme dei metodi di Integrazione Numerica

Dettagli

ESERCITAZIONE I - SOLUZIONI

ESERCITAZIONE I - SOLUZIONI Esercizio 1 a) - Età: quantitativo continuo - Sesso: qualitativo sconnesso ESERCITAZIONE I - SOLUZIONI - Codice: qualitativo ordinabile (scala di gravità) - Tempo previsto di attesa: quantitativo continuo

Dettagli

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio Corso di Laurea: Diritto per le Imprese e le istituzioni a.a. 2016-17 Statistica Statistica Descrittiva 3 Esercizi: 5, 6 Docente: Alessandra Durio 1 Contenuti I quantili nel caso dei dati raccolti in classi

Dettagli

Soggetto Genere Costo del soggiorno Titolo di studio

Soggetto Genere Costo del soggiorno Titolo di studio Esercitazione n. 1 Corso di Statistica Università della Basilicata Prof. Roberta Siciliano La tabella seguente raccoglie i dati grezzi, relativamente ad un gruppo di 30 turisti per i quali sono state osservate

Dettagli

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici)

Statistica. POPOLAZIONE: serie di dati, che rappresenta linsieme che si vuole indagare (reali, sperimentali, matematici) Statistica La statistica può essere vista come la scienza che organizza ed analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva:

Dettagli

Statistica Elementare

Statistica Elementare Statistica Elementare 1. Frequenza assoluta Per popolazione si intende l insieme degli elementi che sono oggetto di una indagine statistica, ovvero l insieme delle unità, dette unità statistiche o individui

Dettagli

Compiti tematici dai capitoli 2,3,4

Compiti tematici dai capitoli 2,3,4 Compiti tematici dai capitoli 2,3,4 a cura di Giovanni M. Marchetti 2016 ver. 0.8 1. In un indagine recente, i rispondenti sono stati classificati rispetto al sesso, lo stato civile e l area geografica

Dettagli

http://www.biostatistica.unich.it 1 STATISTICA DESCRITTIVA Le misure di tendenza centrale 2 OBIETTIVO Individuare un indice che rappresenti significativamente un insieme di dati statistici. 3 Esempio Nella

Dettagli

Sintesi numerica di distribuzioni statistiche

Sintesi numerica di distribuzioni statistiche Sintesi numerica di distribuzioni statistiche La sintesi numerica di una distribuzione statistica è basata sulla costruzione di particolari indici numerici che delineano alcuni aspetti essenziali della

Dettagli

Statistica. Lezioni: 5, 6. Statistica Descrittiva Univariata 2

Statistica. Lezioni: 5, 6. Statistica Descrittiva Univariata 2 Corsi di Laurea: a.a. 2017-18 Diritto per le Imprese e le istituzioni Scienze dell Amministrazione e Consulenza del Lavoro sienze Internazionali dello Sviluppo e della Cooperazione Statistica Statistica

Dettagli

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento. Esercizio 1 Un chimico che lavora per una fabbrica di batterie, sta cercando una batteria

Dettagli

Esempi di confronti grafici

Esempi di confronti grafici Esempi di confronti grafici Esempi di confronti grafici 7/3 Capitolo 3 LE MEDIE La media aritmetica La media geometrica La trimmed mean La mediana La moda I percentili Statistica - Metodologie per

Dettagli

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa

Esercizi Svolti. 2. Costruire la distribuzione delle frequenze cumulate del tempo di attesa Esercizi Svolti Esercizio 1 Per una certa linea urbana di autobus sono state effettuate una serie di rilevazioni sui tempi di attesa ad una determinata fermata; la corrispondente distribuzione di frequenza

Dettagli

Q1 = /4 0 4 = Me = /2 4 = 3

Q1 = /4 0 4 = Me = /2 4 = 3 Soluzioni Esercizi Capitolo - versione on-line Esercizio.: Calcoliamo le densità di frequenza x i x i+1 n i N i a i l i F i 0 1 4 4 1 4/1=4 4/10 = 0.4 1 5 6 4 /4=0.5 6/10 = 0.6 5 10 4 10 5 4/5=0.8 10/10

Dettagli

Materiale didattico per il corso di Statistica I Prima esercitazione: SOLUZIONI

Materiale didattico per il corso di Statistica I Prima esercitazione: SOLUZIONI Materiale didattico per il corso di Statistica I Prima esercitazione: SOLUZIONI Claudia Furlan 1 Anno Accademico 2006-2007 1 Ringrazio Carlo Gaetan e Nicola Sartori e Aldo Solari per il materiale, aggiunte

Dettagli

ELEMENTI DI STATISTICA DESCRITTIVA

ELEMENTI DI STATISTICA DESCRITTIVA Dipartimento di Matematica U. Dini, Università di Firenze Viale Morgagni 67/A, 50134 - Firenze, Italy, vlacci@math.unifi.it November 15, 2015 Terminologia In un esperimento ogni risultato delle caratteristiche

Dettagli

Questionario 1. Sono assegnati i seguenti dati

Questionario 1. Sono assegnati i seguenti dati Questionario 1. Sono assegnati i seguenti dati 30 30 10 30 50 30 60 60 30 20 20 20 30 20 30 30 20 10 10 40 20 30 10 10 10 30 40 30 20 20 40 40 40 dire se i dati illustrati sono unità statistiche valori

Dettagli

7. STATISTICA DESCRITTIVA

7. STATISTICA DESCRITTIVA 7. STATISTICA DESCRITTIVA Quando si effettua un indagine statistica si ha a che fare con un numeroso insieme di oggetti, detto popolazione del quale si intende esaminare una o più caratteristiche (matricole

Dettagli

Matematica Lezione 21

Matematica Lezione 21 Università di Cagliari Corso di Laurea in Farmacia Matematica Lezione 21 Sonia Cannas 13/12/2018 Introduzione alla statistica descrittiva Statistica La statistica è una disciplina il cui fine è lo studio

Dettagli

UNITÀ DIDATTICA 5 LA RETTA

UNITÀ DIDATTICA 5 LA RETTA UNITÀ DIDATTICA 5 LA RETTA 5.1 - La retta Equazione generica della retta Dalle considerazioni emerse nel precedente capitolo abbiamo compreso come una funzione possa essere rappresentata da un insieme

Dettagli

Corso di Statistica (canale P-Z) A.A. 2009/10 Prof.ssa P. Vicard LA VARIABILITÀ

Corso di Statistica (canale P-Z) A.A. 2009/10 Prof.ssa P. Vicard LA VARIABILITÀ Corso di Statistica (canale P-Z) A.A. 009/0 Prof.ssa P. Vicard LA VARIABILITÀ Mediante i valori medi abbiamo cercato di sintetizzare una distribuzione statistica mediante un solo valore tipico. Questo

Dettagli

La statistica descrittiva per le variabili quantitative

La statistica descrittiva per le variabili quantitative La statistica descrittiva per le variabili quantitative E la sintesi dei dati Gli indici di posizione/tendenza centrale OBIETTIVO Individuare un indice che rappresenti significativamente un insieme di

Dettagli

ESPLORAZIONE DEI DATI CON SINTESI NUMERICHE 1 / 22

ESPLORAZIONE DEI DATI CON SINTESI NUMERICHE 1 / 22 ESPLORAZIONE DEI DATI CON SINTESI NUMERICHE 1 / 22 Forma della distribuzione 2 / 22 Si chiama moda il valore della distribuzione che si presenta più frequentemente, in questo punto osserviamo un picco

Dettagli

ax 1 + bx 2 + c = 0, r : 2x 1 3x 2 + 1 = 0.

ax 1 + bx 2 + c = 0, r : 2x 1 3x 2 + 1 = 0. . Rette in R ; circonferenze. In questo paragrafo studiamo le rette e le circonferenze in R. Ci sono due modi per descrivere una retta in R : mediante una equazione cartesiana oppure mediante una equazione

Dettagli

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 2 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Indici di posizione variabilità e forma per caratteri qualitativi Il seguente data set riporta la rilevazione

Dettagli

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2 Sperimentazioni di Fisica I mod. A Statistica - Lezione 2 A. Garfagnini M. Mazzocco C. Sada Dipartimento di Fisica G. Galilei, Università di Padova AA 2014/2015 Elementi di Statistica Lezione 2: 1. Istogrammi

Dettagli

Statistica: principi e metodi. Medie

Statistica: principi e metodi. Medie Statistica: principi e metodi Capitolo 4 Medie Cap. 4- Medie le medie sono lo strumento con cui si sintetizzano i dati statistici. l uso della media consente all individuo di rappresentarsi mentalmente

Dettagli

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini

Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica. Antonio Azzollini Dipartimento di Matematica, Informatica ed Economia (DiMIE) Statistica Antonio Azzollini antonio.azzollini@unibas.it Anno accademico 2018/2019 Diagramma delle frequenze relative Si chiama diagramma delle

Dettagli

Metodi statistici per le ricerche di mercato

Metodi statistici per le ricerche di mercato Metodi statistici per le ricerche di mercato Prof.ssa Isabella Mingo A.A. 2016-2017 Facoltà di Scienze Politiche, Sociologia, Comunicazione Corso di laurea Magistrale in «Organizzazione e marketing per

Dettagli

Obiettivi Strumenti Cosa ci faremo? Probabilità, distribuzioni campionarie. Stimatori. Indici: media, varianza,

Obiettivi Strumenti Cosa ci faremo? Probabilità, distribuzioni campionarie. Stimatori. Indici: media, varianza, Obiettivi Strumenti Cosa ci faremo? inferenza Probabilità, distribuzioni campionarie uso stima Stimatori significato teorico descrizione Indici: media, varianza, calcolo Misure di posizione e di tendenza

Dettagli

DAC Digital Analogic Converter

DAC Digital Analogic Converter DAC Digital Analogic Converter Osserviamo lo schema elettrico riportato qui a lato, rappresenta un convertitore Digitale-Analogico a n Bit. Si osservino le resistenze che di volta in volta sono divise

Dettagli

Esercitazioni di statistica

Esercitazioni di statistica Esercitazioni di statistica Gli indici statistici di sintesi: Gli indici di centralità Stefania Spina Universitá di Napoli Federico II stefania.spina@unina.it 7 Ottobre 2014 Stefania Spina Esercitazioni

Dettagli

Statistica - Esercitazione 1 Dott. Danilo Alunni Fegatelli

Statistica - Esercitazione 1 Dott. Danilo Alunni Fegatelli Esercizio 1: Statistica - Esercitazione 1 Dott. Danilo Alunni Fegatelli danilo.alunnifegatelli@uniroma1.it (a) Religione (b) Reddito familiare (c) Salario in Euro (d) Classe di reddito (I, II, ecc.) (e)

Dettagli

Alcune nozioni di Statistica

Alcune nozioni di Statistica Alcune nozioni di Statistica La statistica è un insieme di metodi che servono a descrivere ed elaborare i dati relativi ad un determinato insieme di individui. Tale insieme di individui è chiamato popolazione.

Dettagli

Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche.

Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche. Misure di tendenza centrale e di variabilità: Media: è la più comune misura di tendenza centrale. Può essere calcolata per variabili numeriche. Il valore medio di una variabile in un gruppo di osservazioni

Dettagli

La struttura dei dati

La struttura dei dati La struttura dei dati Carattere Qualitativo (mutabile statistica) Unità statistica Osservazione di uno o più caratteri Carattere Quantitativo (variabile statistica) Collettivo statistico Pagina 1 Rilevazione

Dettagli

Come calcolare i principali riassunti statistici di un insieme di dati

Come calcolare i principali riassunti statistici di un insieme di dati Come calcolare i principali riassunti statistici di un insieme di dati Riprendiamo l esempio sulla rilevazione dei ricavi della Società XXXX nell anno 2000. Partiamo dalla prima soluzione, quella in cui

Dettagli

Problemi sulla circonferenza verso l esame di stato

Problemi sulla circonferenza verso l esame di stato Problemi sulla circonferenza verso l esame di stato * * * n. 0 pag. 06 a) Scrivi l equazione della circonferenza γ 1 di centro P ; ) e passante per il punto A0; 1). b) Scrivi l equazione della circonferenza

Dettagli

a rappresenta l intercetta o termine noto della retta, ossia il valore della y quando x = 0.

a rappresenta l intercetta o termine noto della retta, ossia il valore della y quando x = 0. Esercitazioni sulla prima parte delle lezioni di Micro Richiamo di Analisi Matematica La forma funzionale più semplice è la retta, la quale può essere genericamente descritta dalla seguente relazione:

Dettagli

Statistica. Campione

Statistica. Campione 1 STATISTICA DESCRITTIVA Temi considerati 1) 2) Distribuzioni statistiche 3) Rappresentazioni grafiche 4) Misure di tendenza centrale 5) Medie ferme o basali 6) Medie lasche o di posizione 7) Dispersione

Dettagli

Distribuzione di Frequenza: Esempio

Distribuzione di Frequenza: Esempio Statistica La statistica è la scienza che organizza e analizza dati numerici per fini descrittivi o per permettere di prendere delle decisioni e fare previsioni. Statistica descrittiva: dalla mole di dati

Dettagli

Statistica descrittiva in una variabile

Statistica descrittiva in una variabile Statistica descrittiva in una variabile Dott. Nicola Pintus A.a. 2018-2019 Cosa è la statistica? La statistica è la scienza che studia con metodi matematici fenomeni collettivi. La statistica descrittiva

Dettagli

INDICATORI DI TENDENZA CENTRALE

INDICATORI DI TENDENZA CENTRALE Psicometria (8 CFU) Corso di laurea triennale INDICATORI DI TENDENZA CENTRALE Torna alla pri ma pagina INDICATORI DI TENDENZA CENTRALE Consentono di sintetizzare un insieme di misure tramite un unico valore

Dettagli