Statstca Captolo 3 Descrzone Numerca de Dat Cap. 3-1
Obettv del Captolo Dopo aver completato l captolo, sarete n grado d: Calcolare ed nterpretare la meda, la medana e la moda d un set tdd dat Trovare l campo d varazone, varanza, scarto quadratco medo, e coeffcente d varazone e conoscere l loro sgnfcato Applcare la regola emprca per descrvere la varazone de valor della popolazone attorno alla meda Spegare la meda pesata e quando usarla Spegare come una retta d regressone ottenuta con l metodo de mnm quadrat stma la relazone lneare fra due varabl Cap. 3-2
Argoment Trattat nel Captolo Msure d tendenza centrale, varabltà, e forma Meda, medana, moda, meda geometrca Quartl Campo d varazone, dfferenza nterquartle, varanza e scarto quadratco medo, coeffcente d varazone Dstrbuzon smmetrche e asmmetrche Msure d sntes per la popolazonep Meda, varanza, e scarto quadratco medo La regola emprca e la dsuguaglanza d Chebyshev Cap. 3-3
Argoment Trattat nel Captolo Cnque numer d sntes e Box Plot Covaranza e coeffcente d correlazone (contnuazone) Problem con le msure usate per descrvere dat numercamente e consderazon etche Cap. 3-4
Descrzone Numerca de Dat Descrzone numerca de dat Tendenza Centrale Meda Artmetca Medana Moda Varabltà Campo d Varazone Dfferenza Interquartle Varanza Scarto Quadratco Medo Coeffcente d Varazone Cap. 3-5
Msure d Tendenza Centrale Panoramca a Tendenza Centrale Meda Medana Moda x n 1 n x Meda Artmetca Valore centrale delle osservazon ordnate Valore pù frequente Cap. 3-6
Meda Artmetca La meda artmetca t (meda) è la msura d tendenza centrale pù comune Per una popolazone d N valor: N N x x x N 1 1 2 Valor della N Per un campone d dmensone n: x n x x x n x x popolazone Dmensone della popolazone 1 1 2 Valor osservat n n Dmensone del campone Cap. 3-7
Meda Artmetca La msura d tendenza centrale pù comune (contnuazone) Meda = somma de valor dvso l numero d valor Influenzata da valor estrem (outler) 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 Meda = 3 Meda = 4 1 2 3 4 5 15 1 2 3 4 10 20 3 5 5 5 5 4 Cap. 3-8
Medana In una lsta ordnata, la medana è l valore centrale (50% prma, 50% dopo) 0 1 2 3 4 5 6 7 8 9 10 0 1 2 3 4 5 6 7 8 9 10 Medana = 3 Medana = 3 Non nfluenzata da valor estrem Cap. 3-9
Trovare la Medana La poszone della medana: Poszone Medana 1 n 2 poszone nella sequenza ordnata Se l numero d valor è dspar, la medana è l valore centrale Se l numero d valor è par, la medana è la meda de due valor central n 11 Nota che non è l valore della medana, ma la 2 poszone della medana nella sequenza ordnata Cap. 3-10
Moda Una msura d tendenza centrale Valore che rcorre pù frequentemente Non nfluenzata da valor estrem Usata sa per dat numerc che categorc Può non esserc una moda C può essere pù d una moda 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 0 1 2 3 4 5 6 Moda = 9 No Moda Cap. 3-11
Esempo Replogatvo Cnque case su una collna presso una spagga Prezz delle case: $2,000,000 500,000 300,000 $300 K 100,000 100,000 $2,000 K $500 K $100 K $100 K Cap. 3-12
Esempo Replogatvo: Msure d Sntes Prezz delle case: $2,000,000 500,000 300,000000 100,000 100,000 Somma 3,000,000 Meda: ($3,000,000/5) = $600,000 Medana: valore centrale de dat ordnat = $300,000 Moda: valore pù frequente = $100,000 Cap. 3-13
Quale msura d tendenza centrale è la mglore? La meda èusata n generale, a meno che c sano valor estrem (outler) La medana èusata spesso sccome non è nfluenzata da valor estrem. Esempo: Il prezzo medano delle case può essere rportato per una regone meno sensble agl outler Cap. 3-14
Forma della Dstrbuzone Descrve come dat sono dstrbut Msure della forma Smmetrca o asmmetrca Oblqua a snstra Meda < Medana Smmetrca Meda = Medana Oblqua a destra Meda > Medana Cap. 3-15
Msure d Varabltà Varabltà Campo d Varazone Dfferenza Interquartle Varanza Scarto Quadratco Medo Coeffcente d Varazone Le msure d varabltà fornscono nformazon sulla dspersone o varabltà de valor. Stesso centro, dversa varabltà Cap. 3-16
Campo d Varazone La pù semplce msura d varabltà Dfferenza tra l massmo e l mnmo de valor osservat: Campo d varazone = X massmo X mnmo Esempo: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 Campo d Varazone = 14-1=13 13 Cap. 3-17
Svantagg del Campo d Varazone Ignora l modo n cu dat sono dstrbut b t 7 8 9 10 11 12 Campo d Var. = 12-7 = 5 7 8 9 10 11 12 Campo d Var. = 12-7 = 5 Sensble agl outler 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,5 Campo d Var. = 5-1 = 4 1,1,1,1,1,1,1,1,1,1,1,2,2,2,2,2,2,2,2,3,3,3,3,4,120 Campo d Var = 120-1 = 119 Cap. 3-18
Dfferenza Interquartle Possamo elmnare l problema degl outler usando la dfferenza nterquartle Elmna valor osservat pù alt e pù bass e calcola l campo d varazone del 50% centrale de dat Dfferenza Interquartle = 3 zo quartle 1 mo quartle S not come l prmo quartle è l osservazone d poszone 0.25(n+1) nella sere ordnata, mentre l terzo quartle occupa la poszone 0.75(n+1) IQR = Q 3 Q 1 Cap. 3-19
Dfferenza Interquartle Esempo: X mnmo Q1 Medana (Q2) Q3 25% 25% 25% 25% X massmo 12 30 45 57 70 Dfferenza Interquartle = 57 30 = 27 Cap. 3-20
Quartl I Quartl dvdono la sequenza ordnata de dat n 4 segment contenent lo stesso numero d valor 25% 25% 25% 25% Q1 Q2 Q3 Il prmo quartle, Q 1, è l valore per l quale 25% delle osservazon sono mnor e 75% sono maggor d esso Q 2 concde con la medana (50% sono mnor, 50% sono maggor) Solo 25% delle osservazon sono maggor del terzo quartle Cap. 3-21
Formule per Quartl Un quartle s trova determnando l valore della sua poszone nella sequenza ordnata de dat, dove Poszone prmo quartle: Poszone secondo quartle: (la poszone della medana) Poszone terzo quartle: Q 1 = 0.25(n+1) Q 2 = 0.50(n+1) Q 3 = 0.75(n+1) dove n èl numero d valor osservat Cap. 3-22
Quartl Esempo: Trova l prmo quartle Dat Camponar Ordnat: 11 12 13 16 16 17 18 21 22 (n = 9) Q 1 = è nella 0.25(9+1)=2.5 poszone nella sequenza ordnata de dat, usamo qund la meda fra l 2 do e l 3 zo valore, per cu Q 1 = 12.5 Cap. 3-23
Varanza della Popolazone Meda de quadrat delle dfferenze fra cascuna osservazone e la meda Varanza della Popolazone: N 2 1 (x N ) ) 2 dove = meda della popolazone N = dmensone della popolazone x = mo valore della varable X Cap. 3-24
Varanza Camponara Meda (approssmatvamente) de quadrat delle dfferenze fra cascuna osservazone e la meda Varanza camponara: (x x) 2 n s 2 1 n -1 dove X = meda artmetca n = dmensone del campone X = mo valore della varable X Cap. 3-25
Scarto Quadratco Medo della Popolazone Msura d varabltà comunemente usata Mostra la varabltà rspetto alla meda Ha la stessa untà d msura de dat orgnal Scarto Quadratco Medo della Popolazone: N 1 (x N ) 2 Cap. 3-26
Scarto Quadratco Medo Camponaro Msura d varabltà comunemente usata Mostra la varabltà rspetto alla meda Ha la stessa untà d msura de dat orgnal Scarto Quadratco Medo Camponaro: n 1 S (x n -1 x) 2 Cap. 3-27
Esempo d Calcolo: Scarto Quadratco Medo Camponaro Dat Camponar (x ) : 10 12 14 15 17 18 18 24 n = 8 Meda = x = 16 s (10 X ) 2 (12 x) 2 (14 n 1 x) 2 (24 x) 2 (10 16) 2 (12 16) 2 (14 8 1 16) 2 (24 16) 2 130 Una msura della 4.3095 7 dspersone meda attorno alla meda Cap. 3-28
Msurando la Varabltà Scarto quadratco medo pccolo Scarto quadratco medo grande Cap. 3-29
Confrontando lo Scarto Quadratco Medo Dat A 11 12 13 14 15 16 17 18 19 20 21 Meda = 15.5 s = 3.338 Dat B Meda = 15.5 11 12 13 14 15 16 17 18 19 20 21 s=0926s = 0.926 Dat C 11 12 13 14 15 16 17 18 19 20 21 Meda = 15.5 s = 4.570 Cap. 3-30
Vantagg della Varanza e dello Scarto Quadratco Medo Sono calcolat usando tutt valor nel set d dat Valor lontan dalla meda hanno pù peso (pochè s usa l quadrato delle devazon dalla meda) Cap. 3-31
Teorema d Chebyshev Per ogn popolazone con meda, scarto quadratco a medo, e k > 1, la apece percentuale uae d osservazon che appartengono all ntervallo è almeno [ -k ; + k] 100[1 (1/k 2 )]% Cap. 3-32
Teorema d Chebyshev Indpendentemente da come dat sono dstrbut, almeno (1-1/k 2 ) de valor cadranno entro k scart quadratc med dalla meda (per k > 1) Esemp: (contnuazone) Almeno entro (1-1/1 2 ) = 0%... k=1 ( ±1) (1-1/2 2 ) = 75%... k=2 ( ±2) (1-1/3 2 ) = 89%. k=3 ( ±3) Cap. 3-33
La Regola Emprca Se la dstrbuzone de dat ha una forma smmetrca e campanulare, allora l ntervallo: 1 contene crca 68% de valor della popolazone o del campone 68% 1 Cap. 3-34
La Regola Emprca 2 contene crca 95% de valor della popolazone o del campone 3 contene crca 99.7% de valor della popolazone p o del campone 95% 99.7% 2 3 Cap. 3-35
Coeffcente d Varazone Msura la varabltà relatva Sempre n percentuale (%) Mostra la varabltà relatva rspetto alla meda Può essere usato per confrontare due o pù set d dat msurat con untà d msura dversa CV s 100% CV x 100% Cap. 3-36
Confronto fra Coeffcent d Varazone Azone A: Prezzo medo scorso anno = $50 Scarto quadratco medo = $5 CV A Azone B: s x 100% $5 100% 10% $50 Prezzo medo scorso anno = $100 Entrambe le azon hanno lo stesso scarto quadratco medo, ma l azone B è meno varable rspetto al suo prezzo medo Scarto quadratco medo = $5 meno varable s CV B x 100% $5 100% 5% $100 Cap. 3-37
Usando Mcrosoft Excel Statstca Descrttva può essere condotta usando Mcrosoft Excel Selezona l menu: strument / anals dat / statstca descrttva Inserre dettagl nella fnestra d dalogo Cap. 3-38
Usando Excel Selezona l menu: strument / anals dat / statstca descrttva Cap. 3-39
Usng Excel (contnuazone) Inserre e dettagl nella fnestra d dalogo Selezona l opzone Replogo statstche Clccare su OK Cap. 3-40
Output d Excel Output d Mcrosoft Excel d statstca descrttva usando dat sul prezzo delle case: Prezz delle case: $2,000,000 500,000 300,000 100,000000 100,000 Cap. 3-41
Meda Pesata Meda Pesata La meda pesata d un set d dat è n n 2 2 1 1 n 1 x w x w w x w x x n 2 1 n n 2 2 1 1 n 1 1 w w w w x Dove w èl peso assegnato alla ma osservazone 1 Usata quando dat sono gà raggruppat n n class, con w valor nella ma classe Cap. 3-42 con w valor nella classe
Approssmazon per Dat Raggruppat Supponamo un set d dat contene valor m 1, m 2,..., m k, che occorrono con frequenze f 1, f 2,... f K Per una popolazone d N osservazon la meda è K 1 fm dove N Per un campone d n osservazon, la meda è K 1 x N fm n dove n K 1 f K f 1 Cap. 3-43
Approssmazon per Dat Raggruppat Supponamo un set d dat contenga valor m 1, m 2,..., k, che occorrono con frequenze f 1, f 2,... f K Per una popolazone d N osservazon la varanza è 2 K 1 f (m ) Per un campone d n osservazon, la varanza è N 2 K 2 1 s f (m n 1 x) 2 Cap. 3-44
La Covaranza Camponara La covaranza msura la forza della relazone lneare tra due varabl La covaranza della popolazone: p 1 Cov (x,y) xy N (x )(y x N ) y La covaranza camponara: n 1 Cov (x,y) s (x Rguarda solo la forza della relazone Non mplca un effetto casuale xy x)(y n 1 y) Cap. 3-45
Interpretazone della Covaranza Covaranza tra due varabl: Cov(x,y) > 0 x e y tendono a muovers nella stessa drezone Cov(x,y) < 0 xeytendonoamuoversndrezonopposte n drezon opposte Cov(x,y) = 0 x e y non mostrano una relazone lneare Cap. 3-46
Coeffcente d Correlazone Msura la forza relatva della relazone lneare tra due varabl Coeffcente d correlazone della popolazone: Cov (x, y) X Y Coeffcente d correlazone camponaro: r Cov (x, y) s s X Y Cap. 3-47
Caratterstche del Coeffcente d Correlazone, r Senza untà d msura Campo d varazone fra 1 e 1 Quanto pù è vcno a 1, tanto pù è forte la relazone lneare negatvaa Quanto pù è vcno a 1, tanto pù è forte la relazone lneare postva Quanto pù è vcno a 0, tanto pù è debole la relazone lneare Cap. 3-48
Dagramm d Dspersone con Var Coeffcent d Correlazone Y Y Y Y X X X r = -1 r = -.6 r = 0 Y Y r = +1 X r = +.3 X r = 0 X Cap. 3-49
Usando Excel per Calcolare l Coeffcente d Correlazone Selezonare Strument/Anals Dat Sceglere Correlazone dal menu a scorrmento Clccare su OK... Cap. 3-50
Usando Excel per Calcolare l Coeffcente d Correlazone (contnuazone) Inserre le celle contenent dat e selezonare le opzon approprate Clccare su OK per ottenere l output Cap. 3-51
Interpretazone de Rsultat r =.733 100 Dagramma a dspersone de vot negl esam Esste una relazone lneare postva relatvamente forte tra vot n esame #1 e vot n esame #2 Voto esame #2 95 90 85 80 75 70 70 75 80 85 90 95 100 Voto esame #1 Student con vot alt nel prmo esame tendono ad avere vot alt nel secondo esame Cap. 3-52
Ottenere Relazon Lnear Un equazone può essere usata per rappresentare la mglore relazone lneare tra due varabl: Y = 0 + 1 X Dove Y è la varable dpendente e X è la varable esplcatva Cap. 3-53
Regressone con l Metodo de Mnm Quadrat Le stme de coeffcent 0 e 1 vengono calcolate mnmzzando la somma de quadrat de resdu La regressone lneare con l metodo de mnm quadrat, basata su valor camponat, è yˆ b b x 0 1 Dove b 1 èla pendenza della retta e b 0 èl ordnata all orgne: b 1 Cov(x,y) s 2 x r s s y x b0 y b1x Cap. 3-54
Replogo del Captolo S sono descrtte le msure d tendenza centrale Meda, medana, moda Illustrate la forma della dstrbuzone Smmetrca, asmmetrca Descrtte le msure d varabltà Campo d varazone, dfferenza nterquartle, varanza e scarto quadratco medo, coeffcente d varazone Dscusse le msure per dat raggruppat Calcolate le msure delle relazon tra varabl Covaranza e coeffcente d correlazone Cap. 3-55