Modell descrttv, statstca e smulazone Master per Smart Logstcs specalst Roberto Cordone (roberto.cordone@unm.t) Statstca descrttva Cernusco S.N., govedì 28 gennao 2016 (9.00/13.00) 1 / 15
Indc d poszone Un ndce d poszone cerca d rassumere l ntera dstrbuzone d una popolazone n un solo valore Idee possbl: per caratter nomnal, l unco ndce possble è la moda, coè l valore pù frequente per caratter quanttatv o qualtatv ordnal, s può defnre la medana, coè l valore tale che metà della popolazone lo precede e metà lo segue per caratter quanttatv, s può defnre la meda, che combna valor delle sngole untà n modo che la loro somma sa nvarata 2 / 15
Moda Vantagg è l unco ndce possble per caratter nomnal è sgnfcatva se la sua frequenza assoluta prevale nettamente sugl altr valor Svantagg non è sgnfcatva se la frequenza è quas unforme può essere multpla (anche con mode prncpal e secondare) (Ved Eserczo 1-3) 3 / 15
Medana La medana dvde la popolazone n due popolazon d ugual numero: 1 una con l 50% d untà precedent la medana 2 una con l 50% d untà successv alla medana S calcola ordnando la popolazone e contando gl element se sono dspar, s prende l elemento ntermedo 10 11 13 15 16 23 26 medana = 15 se sono par, s prende l valor medo de due element ntermed: 10 11 13 15 16 23 medana = 13 + 15 2 = 14 4 / 15
Medana Vantagg rchede solo che caratter sano ordnat (Ved Eserczo 2-1) è robusta rspetto a untà con valor estrem (outlers) per caratter quanttatv, mnmzza la somma degl scart (dfferenze) assolut fra valor msurat e la medana x medana è mnma coè è l valore medamente pù vcno a tutt gl altr Nota: la somma è sulle sngole untà, non su valor de caratter 5 / 15
Quantl Il concetto d medana s può generalzzare consderando element che dvdono la popolazone n proporzon dverse dal 50% 50% Per esempo, cnque quartl 0 Q0 o mnmo è l valore mnmo della popolazone 1 Q1 o prmo quartle è l valore che separa l 25% nferore della popolazone dal 75% superore 2 Q2 o secondo quartle è un altro nome della medana 3 Q3 o terzo quartle è l valore che separa l 75% nferore della popolazone dal 25% superore 4 Q4 o massmo è l valore massmo della popolazone Analogamente s defnscono quntl, decl, percentl 6 / 15
Dagramm box-and-whskers I quartl s rappresentano grafcamente con dagramm box-and-whskers (o box-plot) un segmento che collega mnmo e prmo quartle una scatola rettangolare che collega prmo e secondo quartle una scatola rettangolare che collega secondo e terzo quartle un segmento che collea terzo quartle e massmo (Ved Eserczo 2-2) 7 / 15
Meda La meda artmetca è l numero che, sosttuto a cascun carattere n una somma su tutta la popolazone, lasca la somma nvarata µ = x n N dove la frequenza n raccogle n un termne le untà d ugual valore x È utle perché capta spesso d sommare caratter per calcolare un totale (per es., quando rappresentano cost, temp, pes, volum... ) Se s fanno operazon dverse dalla somma, sono opportune altre mede: la meda geometrca lasca nvarato l prodotto; la meda armonca lasca nvarata la somma degl nvers. 8 / 15
Meda Vantagg: Gode d molte propretà matematche utl ne calcol rende nulla la somma degl scart (x µ) = 0 Nota: la somma è sulle sngole untà, non su valor de caratter mnmzza la somma de quadrat degl scart (x µ) 2 Nota: la somma è sulle sngole untà, non su valor de caratter Svantagg è nfluenzata da valor estrem, anche poch, se molto dvers ( se o mango due poll e tu zero, è come mangarne uno a testa ) 9 / 15
Indc d varabltà Gl ndc d poszone non sempre descrvono la dstrbuzone soddsfacentemente Dat tre nsem d temp d carco merc o temp d servzo alla cassa Popolazone Temp 1 10 12 24 24 37 40 2 18 22 24 24 29 30 3 21 24 24 24 26 28 qual è la stuazone mglore (pù effcente, coè con temp mnor)? Le tre popolazon hanno 1 moda 24, medana 24 e meda 24.5 2 moda 24, medana 24 e meda 24.5 3 moda 24, medana 24 e meda 24.5 Ma la terza è preferble, perché molto pù concentrata: gl ndc d poszone sono sgnfcatv e s possono usare per prevedere la qualtà del servzo e decdere se nvestre per mglorarlo 10 / 15
Indc ordnal Quest ndc corrspondono alla medana Sono dfferenze fra quantl: campo d varazone (o range) è la dfferenza fra massmo e mnmo R = max x mn x = Q4 Q0 dfferenza nterquartle è la dfferenza fra prmo e terzo quartle IQR = Q3 Q1 La seconda é pù robusta (la prma subsce molto gl outlers) Quest ndc sono null se e solo se valor sono tutt ugual crescono quando la varabltà della popolazone cresce 11 / 15
Indc d dspersone Quest ndc corrspondono alla meda e dpendono da essa varanza è la meda artmetca de quadrat degl scart σ 2 = n (x µ) 2 uguale alla dfferenza fra meda de quadrat e quadrato della meda σ 2 = N n x 2 N µ 2 (che è molto pù veloce e semplce) scarto quadratco o devazone standard è la radce quadrata della varanza σ = n (x µ) 2 N Anche quest ndc sono null se e solo se valor sono tutt ugual crescono quando la varabltà della popolazone cresce 12 / 15
Dsuguaglanza d Čebyšëv S dmostra che una frazone par ad almeno (1 1 ) della popolazone k2 cade nell ntervallo [µ kσ, µ + kσ] In termn pù pratc almeno l 75% de valor sono compres tra µ 2σ e µ + 2σ almeno l 96% de valor sono compres tra µ 5σ e µ + 5σ almeno l 99% de valor sono compres tra µ 10σ e µ + 10σ Nota bene: l ntervallo è stmato per eccesso! I percentl effettv, una volta calcolat, d solto sono pù strett (Ved Eserczo 2-2) 13 / 15
Indc d forma: asmmetra Con ugual ndc d poszone e varabltà, s può avere forma dversa L asmmetra (o skewness) ndca se la dstrbuzone pende da un lato CS = 1 N (x µ) 3 Il segno ndca l verso della pendenza se CS < 0, pende a snstra; se CS = 0, è (complessvamente) smmetrca; se CS > 0, pende a destra. Il valore assoluto msura l ntenstà: per CS > 1, l asmmetra è forte σ 3 Nota: la defnzone d Excel è leggermente dversa (pù grande n valore assoluto) 14 / 15
Indc d forma: curtos La curtos msura la curvatura della dstrbuzone CK = 1 N (x µ) 4 σ 4 Il segno della dfferenza CK 3 ndca l ntenstà della curvatura se CK 3 < 0, la dstrbuzone è patta (platcurtca); se CK 3 = 0, la dstrbuzone è moderatamente curva; se CK 3 > 0, la dstrbuzone è appuntta (leptocurtca). (Ved Eserczo 2-3 ed Eserczo 2-4) Nota: Excel calcola CK 3 e ha una defnzone leggermente dversa (maggore) 15 / 15