Modelli descrittivi, statistica e simulazione

Documenti analoghi
Corso di. Dott.ssa Donatella Cocca

Una distribuzione può essere descritta per mezzo dei suoi frattili.

INDICI STATISTICI MEDIA, MODA, MEDIANA, VARIANZA

STATISTICA SOCIALE Corso di laurea in Scienze Turistiche, a.a. 2007/2008 Esercizi 16 novembre2007

Variabili statistiche - Sommario

STATISTICA DESCRITTIVA CON EXCEL

Università degli Studi di Urbino Facoltà di Economia

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 17/09/2012

Incertezza di sensibilità < fluttuazione intrinseca delle misure.

Esame di Statistica tema A Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011

LA COMPATIBILITA tra due misure:

Scienze Geologiche. Corso di Probabilità e Statistica. Prove di esame con soluzioni

Università di Cassino. Esercitazioni di Statistica 1 del 19 Febbraio Dott. Mirko Bevilacqua

Precisione e Cifre Significative

1) Dato un carattere X il rapporto tra devianza entro e devianza totale è 0.25 e la devianza totale è 40. La devianza tra vale: a) 10 b) 20 c) 30

Ministero della Salute D.G. della programmazione sanitaria --- GLI ACC - L ANALISI DELLA VARIABILITÀ METODOLOGIA

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

Relazioni tra variabili: Correlazione e regressione lineare

Lezione 10. L equilibrio del mercato finanziario: la struttura dei tassi d interesse

LE MEDIE. Quadratica. Italo Nofroni. Statistica medica. Medie. Le medie vengono classificate in

Teoria degli errori. La misura implica un giudizio sull uguaglianza tra la grandezza incognita e la grandezza campione. Misure indirette: velocita

LE MEDIE. Quadratica. Italo Nofroni. Statistica medica. Medie. Le medie vengono classificate in due gruppi

Scelta dell Ubicazione. di un Impianto Industriale. Corso di Progettazione Impianti Industriali Prof. Sergio Cavalieri

Transcript:

Modell descrttv, statstca e smulazone Master per Smart Logstcs specalst Roberto Cordone (roberto.cordone@unm.t) Statstca descrttva Cernusco S.N., govedì 28 gennao 2016 (9.00/13.00) 1 / 15

Indc d poszone Un ndce d poszone cerca d rassumere l ntera dstrbuzone d una popolazone n un solo valore Idee possbl: per caratter nomnal, l unco ndce possble è la moda, coè l valore pù frequente per caratter quanttatv o qualtatv ordnal, s può defnre la medana, coè l valore tale che metà della popolazone lo precede e metà lo segue per caratter quanttatv, s può defnre la meda, che combna valor delle sngole untà n modo che la loro somma sa nvarata 2 / 15

Moda Vantagg è l unco ndce possble per caratter nomnal è sgnfcatva se la sua frequenza assoluta prevale nettamente sugl altr valor Svantagg non è sgnfcatva se la frequenza è quas unforme può essere multpla (anche con mode prncpal e secondare) (Ved Eserczo 1-3) 3 / 15

Medana La medana dvde la popolazone n due popolazon d ugual numero: 1 una con l 50% d untà precedent la medana 2 una con l 50% d untà successv alla medana S calcola ordnando la popolazone e contando gl element se sono dspar, s prende l elemento ntermedo 10 11 13 15 16 23 26 medana = 15 se sono par, s prende l valor medo de due element ntermed: 10 11 13 15 16 23 medana = 13 + 15 2 = 14 4 / 15

Medana Vantagg rchede solo che caratter sano ordnat (Ved Eserczo 2-1) è robusta rspetto a untà con valor estrem (outlers) per caratter quanttatv, mnmzza la somma degl scart (dfferenze) assolut fra valor msurat e la medana x medana è mnma coè è l valore medamente pù vcno a tutt gl altr Nota: la somma è sulle sngole untà, non su valor de caratter 5 / 15

Quantl Il concetto d medana s può generalzzare consderando element che dvdono la popolazone n proporzon dverse dal 50% 50% Per esempo, cnque quartl 0 Q0 o mnmo è l valore mnmo della popolazone 1 Q1 o prmo quartle è l valore che separa l 25% nferore della popolazone dal 75% superore 2 Q2 o secondo quartle è un altro nome della medana 3 Q3 o terzo quartle è l valore che separa l 75% nferore della popolazone dal 25% superore 4 Q4 o massmo è l valore massmo della popolazone Analogamente s defnscono quntl, decl, percentl 6 / 15

Dagramm box-and-whskers I quartl s rappresentano grafcamente con dagramm box-and-whskers (o box-plot) un segmento che collega mnmo e prmo quartle una scatola rettangolare che collega prmo e secondo quartle una scatola rettangolare che collega secondo e terzo quartle un segmento che collea terzo quartle e massmo (Ved Eserczo 2-2) 7 / 15

Meda La meda artmetca è l numero che, sosttuto a cascun carattere n una somma su tutta la popolazone, lasca la somma nvarata µ = x n N dove la frequenza n raccogle n un termne le untà d ugual valore x È utle perché capta spesso d sommare caratter per calcolare un totale (per es., quando rappresentano cost, temp, pes, volum... ) Se s fanno operazon dverse dalla somma, sono opportune altre mede: la meda geometrca lasca nvarato l prodotto; la meda armonca lasca nvarata la somma degl nvers. 8 / 15

Meda Vantagg: Gode d molte propretà matematche utl ne calcol rende nulla la somma degl scart (x µ) = 0 Nota: la somma è sulle sngole untà, non su valor de caratter mnmzza la somma de quadrat degl scart (x µ) 2 Nota: la somma è sulle sngole untà, non su valor de caratter Svantagg è nfluenzata da valor estrem, anche poch, se molto dvers ( se o mango due poll e tu zero, è come mangarne uno a testa ) 9 / 15

Indc d varabltà Gl ndc d poszone non sempre descrvono la dstrbuzone soddsfacentemente Dat tre nsem d temp d carco merc o temp d servzo alla cassa Popolazone Temp 1 10 12 24 24 37 40 2 18 22 24 24 29 30 3 21 24 24 24 26 28 qual è la stuazone mglore (pù effcente, coè con temp mnor)? Le tre popolazon hanno 1 moda 24, medana 24 e meda 24.5 2 moda 24, medana 24 e meda 24.5 3 moda 24, medana 24 e meda 24.5 Ma la terza è preferble, perché molto pù concentrata: gl ndc d poszone sono sgnfcatv e s possono usare per prevedere la qualtà del servzo e decdere se nvestre per mglorarlo 10 / 15

Indc ordnal Quest ndc corrspondono alla medana Sono dfferenze fra quantl: campo d varazone (o range) è la dfferenza fra massmo e mnmo R = max x mn x = Q4 Q0 dfferenza nterquartle è la dfferenza fra prmo e terzo quartle IQR = Q3 Q1 La seconda é pù robusta (la prma subsce molto gl outlers) Quest ndc sono null se e solo se valor sono tutt ugual crescono quando la varabltà della popolazone cresce 11 / 15

Indc d dspersone Quest ndc corrspondono alla meda e dpendono da essa varanza è la meda artmetca de quadrat degl scart σ 2 = n (x µ) 2 uguale alla dfferenza fra meda de quadrat e quadrato della meda σ 2 = N n x 2 N µ 2 (che è molto pù veloce e semplce) scarto quadratco o devazone standard è la radce quadrata della varanza σ = n (x µ) 2 N Anche quest ndc sono null se e solo se valor sono tutt ugual crescono quando la varabltà della popolazone cresce 12 / 15

Dsuguaglanza d Čebyšëv S dmostra che una frazone par ad almeno (1 1 ) della popolazone k2 cade nell ntervallo [µ kσ, µ + kσ] In termn pù pratc almeno l 75% de valor sono compres tra µ 2σ e µ + 2σ almeno l 96% de valor sono compres tra µ 5σ e µ + 5σ almeno l 99% de valor sono compres tra µ 10σ e µ + 10σ Nota bene: l ntervallo è stmato per eccesso! I percentl effettv, una volta calcolat, d solto sono pù strett (Ved Eserczo 2-2) 13 / 15

Indc d forma: asmmetra Con ugual ndc d poszone e varabltà, s può avere forma dversa L asmmetra (o skewness) ndca se la dstrbuzone pende da un lato CS = 1 N (x µ) 3 Il segno ndca l verso della pendenza se CS < 0, pende a snstra; se CS = 0, è (complessvamente) smmetrca; se CS > 0, pende a destra. Il valore assoluto msura l ntenstà: per CS > 1, l asmmetra è forte σ 3 Nota: la defnzone d Excel è leggermente dversa (pù grande n valore assoluto) 14 / 15

Indc d forma: curtos La curtos msura la curvatura della dstrbuzone CK = 1 N (x µ) 4 σ 4 Il segno della dfferenza CK 3 ndca l ntenstà della curvatura se CK 3 < 0, la dstrbuzone è patta (platcurtca); se CK 3 = 0, la dstrbuzone è moderatamente curva; se CK 3 > 0, la dstrbuzone è appuntta (leptocurtca). (Ved Eserczo 2-3 ed Eserczo 2-4) Nota: Excel calcola CK 3 e ha una defnzone leggermente dversa (maggore) 15 / 15