STATISTICA DESCRITTIVA

Documenti analoghi
Lezione 4. La Variabilità. Lezione 4 1

Esercizi su Rappresentazioni di Dati e Statistica

La classe che mostra la distribuzione più elevata è quella 60-90, che corrisponde a un uso elevato dell automobile. f i fr (= f i/n) fr% (=fr*100)

frazione 1 n dell ammontare complessivo del carattere A x

Indici di Posizione. Gli indici si posizione sono misure sintetiche ( valori caratteristici ) che descrivono la tendenza centrale di un fenomeno

ALCUNI ELEMENTI DI STATISTICA DESCRITTIVA

Elementi di Statistica descrittiva Parte II

Stim e puntuali. Vocabolario. Cambiando campione casuale, cambia l istogramma e cambiano gli indici

LE MISURE DI TENDENZA CENTRALE. Dott. Giuseppe Di Martino Scuola di Specializzazione in Igiene e Medicina Preventiva

Corso di. Dott.ssa Donatella Cocca

TRATTAMENTO STATISTICO DEI DATI ANALITICI

STATISTICA DESCRITTIVA - SCHEDA N. 4 VARIABILI QUANTITATIVE Trasformazioni lineari Indici di covarianza e correlazione

ESERCIZI SU DISTRIBUZIONI CAMPIONARIE

DI IDROLOGIA TECNICA PARTE II

SCHEDA DIDATTICA N 5

Quartili. Esempio Q 3. Me Q 1. Distribuzione unitaria degli affitti settimanali in euro pagati da 19 studenti U.S. A G I F B D L H E M C

Design of experiments (DOE) e Analisi statistica

STATISTICA DESCRITTIVA. Le misure di tendenza centrale

Dimostrazione della Formula per la determinazione del numero di divisori-test di primalità, di Giorgio Lamberti

Modelli descrittivi, statistica e simulazione

Matematica elementare art.1 di Raimondo Valeri

La volatilità storica, le misure di rischio asimmetrico e la tracking error volatility

STATISTICA Lezioni ed esercizi

COMPLEMENTI DI STATISTICA. L. Greco, S. Naddeo

UNI CEI ENV (GUIDA ALL ESPRESSIONE DELL INCERTEZZA DI MISURA)

per il controllo qualità in campo tessile ing. Piero Di Girolamo

Incertezza di misura

ALCUNI ELEMENTI DI TEORIA DELLA STIMA

Organizzazione del corso. Elementi di Informatica. Orario lezioni ed esami. Crediti. Dispense e lucidi. Ricevimento studenti

SIMULAZIONE DI ESAME ESERCIZI. Cattedra di Statistica Medica-Università degli Studi di Bari-Prof.ssa G. Serio 1

Lezione 4 a - Misure di dispersione o di variabilità

IL MODELLO DI REGRESSIONE LINEARE MULTIPLA

FACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 17/09/2012

Lezione 1. I numeri complessi

ARGOMENTO: MISURA DELLA RESISTENZA ELETTRICA CON IL METODO VOLT-AMPEROMETRICO.

STATISTICA DESCRITTIVA

Transcript:

STATISTICA DESCRITTIVA Le msure d tedeza cetrale OBIETTIVO Idvduare u dce che rappreset sgfcatvamete u seme d dat statstc. Esempo Nella tabella seguete soo rportat valor del tasso glcemco rlevat su 0 pazet: Calcolo delle frequeze d og classe: assolute e relatve percetual Pazete 5 6 7 8 9 0 Totale Glcema (mg/00cc) x =0 x =97 x =90 x =9 x 5 =07 x 6 =7 x 7 =9 x 8 =8 x 9 =9 x 0 =96 950 Class d valor d glcema 70 80 80 90 90 00 00 0 0 0 Totale Frequeza assoluta 0 Frequeza relatva / 0 00% = 0 % / 0 00% = 0 % / 0 00% = 0 % / 0 00% = 0 % / 0 00% = 0 % 00 %

Costruzoe dell'stogramma e del polgoo d frequeza LE MISURE DI POSIZIONE Frequeza ass oluta 5 0 70-80 80-90 90-00 GLICEMIA 00-0 0-0 Frequeza ass oluta 5 0 70-80 80-90 90-00 Glcema 00-0 0-0 meda artmetca; medaa; moda; meda armoca; meda geometrca. 5 6 LA MEDIA ARITMETICA dato u seme d elemet {x, x,... x } DEFINIZIONE: La meda artmetca è quel valore che avrebbero tutte le osservazo se o c fosse la varabltà (casuale o sstematca). Pù precsamete, è quel valore che sosttuto a cascu degl dat e fa rmaere costate la somma. 7 S dce meda artmetca semplce d umer l umero che s ottee dvdedo la loro somma per. x = x + x +... x 8

Formalmete possamo esprmere la meda artmetca semplce attraverso la seguete formula: x = = x Nell Esempo esame s ha: x = x 950 0 = = = 95mg /00 cc 9 0 Esempo Rportamo temp d sopravvveza (mes) d 9 pazet co cacro dell addome Mes d sopravvveza (x ) 8,5 9, 7, Frequeza (f ) 8 x f 7 6,8 58, S dce meda artmetca pesata d umer: x p + x p +...+ x p p + p +...+ p m m m 6,8,6 0, Totale 9 0, 56, Dove pes p j soo le frequeze assolute d og modaltà

Nell esempo precedete la meda artmetca (poderata) è data da: x = = 56, 9 = = = x f f 8, Propretà della meda artmetca: compresa tra l mmo de dat e l massmo de dat; (x x ) = la somma degl scart dalla meda è 0 zero; (x assume valore mmo per z = meda z) artmetca; la meda de valor: x è par a la meda artmetca (dove è u umero reale qualsas) la meda de valor: x ± h è par a: meda artmetca±h (dove h è u umero reale qualsas). Lughezza(cm) u campoe d 66 eoat 55.9 7.9 55. 57. 8.5 5. 5. 5. 5. 5.7 5. 5.0 5.0 56.0 56. 50.8 9.5 5.6 50.5 5.8 5.7 9. 5. 5.8 5.9 5. 5. 5.0 5. 59. 5. 55.6 5.5 5.7 5.6 56. 5.7 57.6 5.5 5.8 5. 5.5 50.0 5. 5.7 5.5 5.9 58.9 5.8 5. 5. 9.5 5.7 5. 5.5 5. 55.5 50. 55. 5.6 55.6 5. 5.7 56. 5.7 5.8 la meda artmetca de 66 valor d lughezza è: =(55.9+5.+5.0+50.5+5.9+5.+ +5.8)/66 +5.8)/66 = 57.500/66 = 5.95 5 MEDIA per dat raggruppat class x 8.0 9.5 5.0 5.5 5.0 55.5 57.0 58.5 60.0 Somma f 5 0 5 66 %.0.55 8.8.7. 5.5 7.58 6.06.5 00 X f 96.00 8.50 6.00 787.50 756.00 555.00 85.00.00 60.00 5.00 Nell'esempo del campoe d 66 msure d lughezza de eoat: 8.0 + 9.5 +... 60.0 5.0 x = = = 5.55 + +... 66 6

La meda artmetca è la msura d poszoe pù usata ma. A volte, altre msure come la medaa e la moda s dmostrao utl. S cosder u campoe d valor d VES (veloctà d ertrosedmetazoe, mm/ora) msurat 7 pazet {8, 5, 7, 6, 5, 5, } I questo caso, la meda che è = 0 mm/ora o è u valore tpco della dstrbuzoe: soltato u valore su 7 è superore alla meda! Esempo Età alla morte d 5 soggett x = a; x = 70 a; x = 7 a; x = 6 a; x 5 = 68 a. La meda artmetca è par a: x = ( + 70 + 7 + 6 + 68) / 5 = 6a Lmte della meda artmetca: è otevolmete fluezata da valor estrem della dstrbuzoe. dstrbuzoe. 7 8 LA MEDIANA DEFINIZIONE: La medaa (Me) è quell osservazoe che bpartsce la dstrbuzoe modo tale da lascare al d sotto lo stesso umero d term che lasca al d sopra. Rtorado all Esempo della Glcema, per l calcolo della medaa è ecessaro dsporre dat orde crescete: 7, 8, 90, 9, 9, 96, 97, 0, 07, 9 L'dea che e alla base della medaa e d cercare u umero che sa pù grade d u 50% delle osservazo e pù pccolo del restate 50%. Me = (9+96)/ = 95 mg/00 cc 9 0 5

Il fatto che medaa e meda artmetca questo caso cocdao o è casuale quato la dstrbuzoe è smmetrca. Ma, geerale, cò o avvee. Vataggo ell uso della medaa: o è fluezata dalle osservazo aberrat o estreme. Le fas operatve per l calcolo della medaa soo le seguet: I preseza d ua dstrbuzoe d frequeze è ecessaro cosderare le frequeze cumulate ) ordameto crescete de dat; ) se l umero d dat è dspar,, la medaa corrspode al dato che occupa la (+)/ esma poszoe ) se l umero d dat è par,, la medaa è data dalla meda artmetca de due dat che occupao la poszoe / e quella /+. Vot ordat (x ) 8 0 7 0 Frequeze (f ) (0.5) (.0) 8 (.) (0.5) (0.5) (5.) Freq. Cum. (F ) + = 6 6+8 = + = 6 6+ = 8 8+ = 9 Freq.Cum. (F %) 0.5.5 7.6 8. 9.6 00 Totale 9 9 6

Vot ordat 8 0 Frequeze (0.5) (.0) Freq.Cum. F 6 Freq.Cum. F % 0.5.5 I QUANTILI Geeralzzao la medaa. 7 La Medaa 0 Totale 8 (.) (0.5) (0.5) (5.) (0.5) 6 8 9 9 7.6 8. 9.6 00 L'dea alla base d u quatle-p dove p [0; ] e d cercare u umero che sa pù grade p% de dat osservat e pù pccolo del restate (-p%) de dat 5 6 I quatl co p uguale a 0,5; 0,50 e 0,75 vegoo chamat rspettvamete l prmo, l secodo e l terzo quartle. Dvdoo la popolazoe quattro part ugual. S osserv che l quartle cocde co la medaa. I quatl co p = 0,0; ; 0,99 s chamao percetl. LA MODA DEFINIZIONE: La Moda (Mo) è l osservazoe che s verfca co maggore frequeza ua data dstrbuzoe. S possoo avere ache pù valor modal. 7 8 7

quale msura d poszoe usare? A quale msura d tedeza cetrale c rferamo? Il propretaro d ua dtta afferma "Lo stpedo mesle ella ostra dtta è.700 euro" Il sdacato de lavorator dce che lo stpedo medo è d.700 euro. L'agete delle tasse dce che lo stpedo medo è stato d.00 euro. Queste rsposte dverse soo state otteute tutte da dat della seguete tabella. Stpedo mesle N d lavorator.00 Meda artmetca= lre.700.700 Medaa = lre.00.00 9.600 Moda = lre.700 6.500 9.00.000 9 terpretazoe delle msure d poszoe La meda artmetca dca che, se l dearo fosse dstrbuto modo che cascuo rcevesse la stessa somma, cascu dpedete avrebbe avuto.700 euro La moda c dce che la paga mesle pù comue è d.700.euro La moda s cosdera spesso come l valore tpco dell'seme d dat poché è quello che s preseta pù spesso. No tee però coto degl altr valor e spesso u seme d dat v è pù d u valore che corrspode alla defzoe d moda. La medaa dca che crca metà degl addett percepscoo meo d.00.euro, e metà d pù. La medaa o è fluezata da valor estrem evetualmete preset ma solo dal fatto che ess sao sotto o sopra l cetro dell'seme de dat. 0 Relazoe tra meda, medaa e moda I ua dstrbuzoe perfettamete smmetrca, la meda, la medaa e la moda hao lo stesso valore. I ua dstrbuzoe asmmetrca, la meda s poszoa ella drezoe dell asmmetra. Nelle dstrbuzo d dat bologc, l asmmetra l è quas sempre verso destra (asmmetra postva, verso valor pù elevat), e qud la meda è > della medaa o della moda STATISTICA DESCRITTIVA Le msure d varabltà 8

I asseza d varabltà ua popolazoe la statstca o sarebbe ecessara: u sgolo elemeto o utà campoara sarebbe suffcete a determare tutto cò che occorre sapere su ua popolazoe. Ne cosegue, percò, che el presetare formazo su u campoe o è suffcete forre semplcemete ua msura della meda ma servoo formazo sulla varabltà. Esempo S cosdero zalmete, le seguet due dstrbuzo d valor rfert all et età d 0 dvdu: Soggett 5 Tot Meda Artmetca I gruppo 0aa 0aa 0aa 50aa 60aa 00aa 00aa/5=0aa II gruppo 0aa 5aa 0aa 55aa 70aa 00aa 00aa/5=0aa LE MISURE DI VARIABILITÀ Campo d varazoe (Rage); Devaza; Varaza (S o σ ); Devazoe Stadard (S o σ); Coeffcete d varazoe (dce d varabltà relatva). IL CAMPO DI VARIAZIONE O RANGE DEFINIZIONE: Il Campo d varazoe o Rage corrspode alla dffereza fra la modaltà pù pccola e la modaltà pù grade della dstrbuzoe Rage = Xmax - Xm 5 6 9

Lmt del campo d varazoe: Occorre allora u dce d dspersoe che cosder tutt dat (e o solo quell estrem), cofrotado quest co l loro valor medo. è troppo fluezato da valor estrem; tee coto de due sol valor estrem, trascurado tutt gl altr. a dea a dea = = ( x - x ) f x - x f a dea = ( x - x ) f 7 8 LA DEVIANZA DEFINIZIONE: La somma de quadrat degl scart dalla meda artmetca = ( x - x ) f 9 Esempo Valor del tasso glcemco 0 soggett x (glcema mg/00cc ) 0 97 90 9 07 7-576 La 9 quattà 596 - esprme la 8-96 Devaza della dstrbuzoe (Dev). 9-9 96 x _ = 95 x -x (x -x) +8 + -5 + + + 9 6 5 576 596 0 0

LA VARIANZA DEFINIZIONE: La somma de quadrat degl scart dalla meda artmetca dvs per la umerostà del campoe LA DEVIAZIONE STANDARD DEFINIZIONE: La radce quadrata della varaza = ( x - x ) f / = ( x x ) f Calcolare la devazoe stadard (DS) delle seguet 0 osservazo (mm): 8 79 8 8 80 78 80 87 8 8. S calcol la meda x = x x 8 = = 0 8.0. S calcolo gl scart dalla meda sottraedo da cascu valore la meda; s elev al quadrato tale quattà (l quadrato elde l sego -): (8-8.) = 0.6 (78-8.) =.56 (79-8.) = 5.76 (80-8.) =.96 (8-8.) = 0.6 (87-8.) =.6 (8-8.) =.56 (8-8.) = 0.6 (80-8.) =.96 (8-8.) = 0.6. S sommo tal quattà: : la somma è par a 56.. La somma ( x x ) è detta somma de quadrat degl scart o, pù semplcemete, somma de quadrat.

. S dvda tale quattà per l umero d osservazo meo : SCARTO INTERQUARTILE somma de quadrat ( ) ( x x) 56. = = 6. 7 = 5. La devazoe stadard è la radce quadrata d tale valore: DS = 6.7 =.50mm Qud la devazoe stadard del campoe d 0 utà estratto dalla popolazoe è par a.50 mm. 9 5 Scarto terquartle = ( quartle)-( ( quartle) E' molto pù resstete della varaza preseza d poche osservazo estreme. Per questo motvo e usato soprattutto elle stuazo cu s sospetta la possble preseza d osservazo aomale. 6 IL COEFFICIENTE DI VARIAZIONE C.V. = (devazoe stadard) (meda artmetca) La varabltà guarda alle dffereze tra le utà spermetal. E' pero evdete che l sgfcato pratco delle dffereze può dpedere dal lvello del feomeo cosderato. Può qud essere teressate dsporre d ua qualche msura d varabltà aggustata qualche maera per teere coto del lvello del feomeo. 7 Esempo Data la meda e la devazoe stadard d campo d (a) eoat, (b) bamb d tre a e (c) bamb d 0 a, dobbamo chederc se la varabltà relatva s modfca co l età. (a) Neoat x =, Kg; DS = 0, Kg CV = 0,/, 00 = 7,% (b) Bamb d a x = 6,0 Kg; DS =,5 Kg CV =,5/6,0 00 = 8, % (b) Bamb d 0 a x = 5,0 Kg; DS =,8 Kg CV =,8/5,0 00 = 9, % Osservado tre valor del CV, s può otare che la varabltà relatva aumeta co l età. 8

BOX-PLOT Il ome derva dall'glese (box ad whsers plot spesso, ache talao, abbrevato boxplot). INDICI DI SIMMETRIA Dstrbuzoe smmetrca: le osservazo equdstat dalla medaa (cocdete questo caso col massmo cetrale) presetao la stessa frequeza relatva U esempo mportate è forto dalla curva d dstrbuzoe ormale 9 50 Dstrbuzoe asmmetrca postva: la curva d frequeza ha ua coda pù luga a destra del massmo cetrale. Dstrbuzoe asmmetrca egatva: la curva d frequeza ha ua coda pù luga a sstra del massmo cetrale 5 5

U dce statstco che permette d formare del grado d smmetra/asmmetra d ua dstrbuzoe d dat quattatv è l dce d asmmetra: γ = μ σ dove μ = N ( x x) I merto a valor che tale dce può assumere s può dre che: se la dstrbuzoe è smmetrca, se la dstrbuzoe è asmmetrca postva (a destra), = σ = N ( x x) = γ = 0 γ > 0 Come msura della asmmetra vegoo utlzzate ache le seguet formule emprche (che rchedoo la coosceza d moda, medaa, meda e devazoe stadard): x Mo DS oppure (x Me) DS el caso d smmetra s ha u valore ullo,, per l asmmetra postva u valore postvo e per quella egatva u valore more d zero. se la dstrbuzoe è asmmetrca egatva (a sstra), γ < 0 5 5 INDICI DI CURTOSI Vegoo costrut dc statstc che msurao, qualche modo, lo scostameto della dstrbuzoe emprca del carattere quattatvo X da quella relatva alla stuazoe espressa dalla curva ormale. μ = = (x x) μ β = σ σ = = ( x x) 55 Se la varable è perfettamete ormale β = la dstrbuzoe è detta perormale (rspetto alla dstrbuzoe ormale s ha ua maggore frequeza per valor cetral ed estrem, more per valor termed); β > la dstrbuzoe è detta poormale (rspetto alla dstrbuzoe ormale s ha ua more frequeza per valor cetral ed estrem, maggore per valor termed). β < 56

ESEMPIO Per verfcare se ua certa molecola aveva u qualche effetto come sofero e stato codotto l seguete espermeto: I DATI A A 0 volotar, seza ua stora pregressa d soa, e stato sommstrato ua otte u placebo e u altra otte ua pllola coteete l sofero. L'dvduo gorava quale pllola aveva assuto. Per og dvduo e per tutte e due le ott soo state croometrate le ore d soo. E' stata po calcolata la varable, deomata soo extra, defta come: ore d soo ella otte co sofero - ore d soo ella otte co placebo L'espermeto e stato po rpetuto per ua varate della molecola studo. 57 58 molecola studo. L'effetto del farmaco orgale o e del tutto charo vsto che l 0% de soggett ha dormto d meo. Nello stesso tempo pero u 0% de soggett ha spermetato u aumeto d soo superore alle tre ore. Gl dc d poszoe per l farmaco orgale dcao ua moderata attvtà sofera. L'effetto della molecola modfcata sembra essere pù varable tra soggett d quello della molecola orgara. 59 5