APPUNTI DI TATITICA DECRITTIVA Co applcazo ll ambt statstco R Vrso prlmar agosto 006 Vttoro Colagrad TUDIO DELLE RELAZIONI TRA DUE CARATTERI TATITICI Nll aals d dat s è spsso trssat a studar s tra du carattr X Y, ch s prstao cogutamt sull utà statstch ch formao ua data popolazo, s possa stablr u qualch lgam, l caso, qual sa l grado d tal rlazo. possoo avr cas cu la cooscza d ua dll du varabl o dà alcua formazo sull altra (dpdza) cas d prftta dpdza cu ua dll varabl dtrma ach l altra. tratta ovvamt d cas lmt, lla pratca c s può pù o mo avvcar alla stuazo d dpdza. Il grado d rlazo fra du varabl v msurato co var dc statstc ch, sostaza, soo opportu dstaz tra la stuazo ffttvamt ossrvata qulla rlatva al caso d dpdza. ottgoo così msur d assocazo. l varabl soo tramb quattatv è possbl studar lgam d trdpdza tramt la corrlazo la dpdza d ua dll varabl dall altra co l aals d rgrsso. Nl s trattrà d assocazo; mtr la rgrsso la corrlazo sarao oggtto d 3.. Assocazo tra varabl statstch Esmpo. U collttvo d 9 studt, 9 masch (M) 00 fmm (F), v sottoposto ad u tst atttudal. L atttud prs sam soo: A: dscpl artstch; B: dscpl umastch; C: matr sctfch. I rsultat soo rportat Tab. Tab. Frquz pr ssso dscpl cogtv atttud ssso A B C Tot M 35 40 44 9 F 7 5 00 Tot 57 67 95 9 C s po l problma d studar l assocazo tra ssso atttud. I prma fas s può ossrvar ch l prctual d masch d fmm l collttvo prso sam soo: 9 00 % d M 54 % % d F 46 %. 9 9 c foss dpdza tra ssso atttud s dovrbb rscotrar l stss % d M F pr l atttud A, B C. otto l pots d dpdza, allora, s dovrbb ottr u valor attso o torco d frquza MA pr masch co l atttud A tal ch:
MA Tot d M (Tot d M) (Tot d A) 9 57 MA 30.97. Tot d A Tot Tot 9 I modo aalogo possoo ssr dtrmat l altr 5 frquz torch: 9 67 9 95 MB 36.4 ; MC 5.6 ; 9 9 00 57 00 67 00 95 FA 6.03 ; FB 30.59 ; FC 43.38. 9 9 9 ulla bas d tal rsultat è possbl costrur la Tab sgut. Tab. Tablla d dpdza atttud ssso A B C Tot M 30.97 36.4 5.6 9 F 6.03 30.59 43.38 00 Tot 57 67 95 9 L assocazo tra l du varabl può ssr aalzzata cosdrado ua dstaza tra l frquz ossrvat (Tab. ) qull torch (Tab. ). All uopo s cosdrao l dffrz tra tal frquz, com rportato Tab. 3: Tab. 3 Tablla dll dffrz atttud ssso A B C Tot M 35 30.97 4.03 40 36.4 3.59 44 5.6 7.6 0 F 6.03 4.03 7 30.59 3.59 5 43.38 7.6 0 Tot 0 0 0 0 s troduc l dc ch-quadrato χ com msura d assocazo: χ 4.03 3.59 ( 7.6) ( 4.03) ( 3.59) (7.6) + + + + + 4. 39. () 30.97 36.4 5.6 6.03 30.59 43.38 Com s può ossrvar l dc è costtuto dalla somma d 6 frazo ch prstao a umrator quadrat dll dffrz tra l frquz ossrvat qull torch a domator l frquz torch. Utlzzado l lguaggo R, dat possoo ssr mmorzzat ua matrc: > sssoc("m","f") > atttudc("a","b","c") > datmatrx(c(35,,40,7,44,5),,3,dmamslst(ssso,atttud)) # gra la matrc dll frquz > dat A B C M 35 40 44 F 7 5 > tabas.tabl(dat)
> chsummary(tab)$statstc > ch [] 4.38774. La costruzo dll dc χ è gralzzabl al caso d du carattr X Y, co modaltà x, x, x 3,, x r y, y, y 3, y c, rlvat cotmporaamt su utà statstch. I tal caso la tablla dll frquz ossrvat o j (pr,,,r j,,,c ) assum la forma dlla tablla d cotgza Tab. 4 formata da r rgh c colo: Nlla tablla l quattà Tab. 4 Tablla d cotgza pr X Y Y X y y y c Tot x o o o c x o o o c x r o r o r o rc r Tot c c o j j r j o j soo l frquz margal dlla X, rspttvamt, dlla Y. otto l pots d dpdza d X Y, la frquza torca rlatva alla modaltà x d X alla modaltà y j va dtrmat scodo la: j j. uccssvamt vao calcolat l dffrz tra l frquz ossrvat qull torch o j j, qud, aalogamt alla (), l dc ch-quadrato: (o j j χ. (), j j ossrv ora ch l dc χ dpd dalla umrostà dl collttvo, l suo valor, a partà d assocazo tra du carattr prs sam, aumta all aumtar d. può allora prdr sam l dc d cotgza quadratca mda: Φ χ assumr com msura d assocazo la radc quadrata Φ d tal quattà. Così pr l smpo s ott: 4.39 Φ 0.4. 9 Φ vara tra 0 r c (Appdc ); u valor prossmo a 0 porta ad scludr u assocazo tra du carattr. U valor d Φ par a 0.4 portrbb ad potzzar ua o dpdza tra l sso l Atttud, tuttava la problmatca va samata co pù attzo facdo rfrmto ach ad ultror strumt d aals. ) 3
psso, lla msura d assocazo, s fa rfrmto ach all dc d assocazo oralzzato V d Cramr: Φ V. m {(r ),(c ) } La V vara tra 0 (Appdc ); valor prossm a dotao ua fort assocazo tra l du varabl, ma tuttava o dao dcazo sull modaltà d assocazo. Pr l smpo s ott: V 0.4, valor cocdt, qusto caso, co qullo d Φ quato l mmo v calcolato tra ( ) (3 ). Utlzzado R: > Vsqrt(ch/(sum(dat)m(row(dat)-,col(dat)-))) # ch è l oggtto dfto sopra > V [] 0.45458.. Rgrsso lar smplc Esmpo. I u campo d 5 dvdu soo stat rlvat carattr quattatv tà (ETA ) prsso sstolca (PA). I valor d du carattr soo rportat Tab. 5 grafcat mdat l dagramma d dsprso d Fg.. Tab. 5 Valor d tà prsso sstolca rlvat su 5 dvdu Idvduo ETA (a) PA (mm Hg) 3 8 4 3 67 76 4 47 5 56 45 6 70 57 7 8 7 8 03 9 33 30 0 5 30 47 4 9 3 3 35 4 73 54 5 60 48 PA 50 00 50 00 50 0 0 30 40 50 60 70 80 90 ETÀ Fg. - Dagram ma d dsprso ETA'-PA vuol dvduar ua fuzo ch dscrva, modo sttco, l carattrstch d ua possbl rlazo statstca tra du carattr prs sam. Parlado d rlazo statstca va prcsato ch o s tratta, gral, d trovar ua fuzo matmatca ch prmtta d rcavar sattamt l valor d u carattr fuzo d u altro: o s può psar, ad smpo, ch sa possbl dtrmar sattamt la prsso sstolca d u dvduo ua volta ota l tà!! può comuqu potzzar ua rlazo tra ua varabl statstca Y d ua scoda varabl X dl tpo: Y f (X) + ε, (3) 4
dov f (X) è ua fuzo d X ε rapprsta l sm dgl fftt casual ch altr varabl, o cosdrat ll aals, possoo avr sulla Y. La varabl X è dtta varabl dpdt o splcatva la Y varabl dpdt o rsposta. La fuzo f (X) d (3) sprm u adamto mdo d Y dpdza dlla varabl X: f (X) E(Y X) mda d Y pr og fssato valor d X. Così, rfrmto all smpo, s può supporr ch, pr og valor dlla varabl ETA (X), s possa rlvar ua dstrbuzo d PA (Y) lo studo abba com obttvo qullo d dvduar ua forma fuzoal pr la mda dll prsso sstolch dgl dvdu co fssata tà. La fuzo f (X), gral, prsta alcu paramtr ch, ll aals codotta, vao opportuamt stmat. tal fuzo può ssr scrtta com ua fuzo lar paramtr, ovvro: f (X) a f (X) + a f (X) + a 3 f 3 (X) + + a h f h (X), dov a, a, a 3,, a h dcao paramtr, allora l sprsso (3) dfsc l modllo d rgrsso lar smplc. Ad smpo s possoo avr l sgut fuzo: f (X) a + b X co paramtr a b; f (X) a + b X 3, co paramtr a b; f (X) a log(x), co paramtro a; f (X) a log(x) + b s(x), co paramtr a b. tratta d stmar l modllo ch pù s adatta a dat. La Fg. suggrsc, prma aals, d rcrcar ua fuzo dl tpo: f (X) a + b X (4) quato put sul grafco a dsprso mostrao u adamto approssmatvamt lar. Pù gral, s vuol studar u modllo d rgrsso lar smplc tra du varabl quattatv X Y dl tpo (4), partcolar, stmar l paramtro a, dtto trctta, d l paramtro b, dtto coffct d rgrsso lar. suppoga, allora, ch su ogua dll utà statstch prs sam sa stata rlvata la coppa d valor (x,y ), pr,,3,,, (ll smpo, 5), l prmo d qual è rlatvo alla varabl X d l scodo alla varabl Y. Impodo la proprtà d mmo dlla somma dgl scart quadratc (y f(x )), altr trm facdo rcorso al Mtodo d Mm Quadrat, s prova ch l stm dl coffct d rgrsso lar dll trctta soo fort dall sgut: CODEV(X,Y) xy b a y b x, DEV(X) dov y x soo, rspttvamt, la mda artmtca d Y d X, DEV(X) la dvaza d X CODEV(X,Y) xy (x x) (x x)(y y) è la codvaza d X Y (Appdc ). ossrv ch la dvaza d Y ( ) può ssr dfta mara aaloga a qulla d X. è 5
Nlla Tab. 6 sgut è svluppato u procdmto maual (ma ch può ssr faclmt codotto co l utlzzo d u foglo lttroco) pr l calcolo d du paramtr d rgrsso. Tab 6 Calcolo d md, dvaz codvaz d ETA (X) PA (Y) oggtto ETA (X) PA (Y) X x Y y (X x ) (Y y ) (X x ) (Y y ) 3-6.07-8.47 679.47 7.68 0.70 8 4-0.07-5.47 40.67 648.55 5.03 3 67 76 8.93 36.53 358.47 334.68 69.70 4 47 -.07-8.47.4 80.35 30.36 5 56 45 7.93 5.53 6.94 30.6 43.90 6 70 57.93 7.53 48.07 307.4 384.56 7 8 7 3.93 77.53 084.60 60.4 553.43 8 03-6.07-36.47 679.47 39.8 950.56 9 33 30-5.07-9.47 7.00 89.6 4.63 0 5 30.93-9.47 8.60 89.6-7.77 47 4 -.07.53.4 6.4 -.70 9 3-9.07-6.47 363.54 700.48 504.63 3 35-3.07-8.47 70.74 34.0 4.30 4 73 54 4.93 4.53 6.67. 36.36 5 60 48.93 8.53 4.40 7.8 0.83 omma 7 09 584.93 055.73 6708.53 Mda 48. 39.5 Ossrvato ch la DEV(X), la DEV(Y) la CODEV(X,Y) soo, rspttvamt, l somm rportat ll colo 6, 7 8 d Tab. 6, s ott: CODEV(X, Y) 6708.53 b. 7, a y b x 39.5.7 48. 78.5 DEV(X) 584.93, qud, la rtta d rgrsso ha quazo: Y 78.5 +.7 X. Utlzzado l pacchtto R, dat d ETA PA vgoo mmorzzat du vttor: > tàc(,8,67,47,56,70,8,,33,5,47,9,35,73,60) > pasc(3,4,76,,45,57,7,03,30,30,4,3,,54,48) l coffct d rgrsso l trctta s calcolao co l struzo: > rglm(pas ~ tà) > rg$coff (Itrcpt) tà 78.45305.69370 ottdo l valor dll trctta sotto al trm Itrcpt qullo dl coffct d rgrsso sotto la voc tà. I Fg. vgoo rapprstat, smpr utlzzado R, valor rlvat d tà prsso la rtta d rgrsso. 6
> plot(tà,pas,pch9,col,ylmc(0,50),xlmc(0,90), + xaxpc(0,90,9) sub"fg. 3 - cattr ETA'-PA rtta + d rgrsso",xlab"eta'",ylab"pa") > abl(rg) > txt(70,70,xprsso(y78.5+.7x),cx0.7) > txt(70,40,xprsso(rsquar0.7),cx0.7) Il sgfcato dll dc Rsquar prst lla Fg. vrrà llustrato l paragrafo ch sgu, ma s può dr subto, mara formal, ch sso è u dc dlla botà dl modllo d rgrsso lar pr dat prs sam. Da u puto d vsta statstco l coffct d rgrsso b rapprsta la varazo mda dlla varabl dpdt cosgut ad ua varazo utara dlla varabl dpdt; l paramtro a rapprsta, vc, l valor dlla varabl dpdt corrspodt al valor ullo d qulla dpdt. Nll smpo, ssdo b.7 s può dr ch, mda, la prsso sstolca aumta d crca.3 mmhg pr og ao d tà; l valor dll trctta a 78.5 rapprsta l valor torco dlla PA alla ascta (ma o è corrtto ffttuar strapolazo sulla bas d dat a dsposzo!). Quato aalzzato sopra è rlatvo alla dpdza dlla varabl Y dalla X (rgrsso d Y su X); modo aalogo s può studar la dpdza d X da Y. ottgoo tal caso sgut paramtr d rgrsso: b CODEV(X, Y) DEV(Y) a x b y la rtta d rgrsso d X su Y: X a + b Y. Pr l smpo o ha sso studar la dpdza dll tà dalla prsso sstolca. Tuttava, a ttolo smplcmt smplfcatvo, s rportao l coffct d rgrsso dll ETA sulla PA la rlatva trctta: CODEV(X, Y) 6708.53 b 0. 56 ; a 9.5. DEV(Y) 055.73 C s può chdr, ora, s l approssmazo ottuta col modllo lar è buoa. U mtodo d studo dll adattamto fa rfrmto all Aals d Rsdu. Y è la varabl rsposta co valor ossrvat y, y,, y f(x) a + b X è l modllo rgrssvo co valor prdtt y a + bx, y a + bx,..., y a + bx, s dfsc rsduo rs, pr,,,, lo scarto tra l valor ossrvato y d l corrspodt valor prdtto y : rs y - y, mtr l rsduo rlatvo è dato dal rapporto rs y. l modllo lar è buoo, rsdu rlatv soo pccol. La Tab. 7 rporta valor dlla varabl ETA (varabl splcatva 7
X), dlla prsso PA (varabl dpdt Y), qull stmat co la rtta d rgrsso 78.5 +.7 X, rsdu d rsdu rlatv. Y Tab. 7 Valor d ETA, PA, prdtt dal modllo lar, rsdu rsdu rlatv ETA PA y rs rs /y 3 06,38 4,6 0,88 8 4 3,99 0,0 0,000 3 67 76 63,50,50 0,07 4 47 38, -7, -0,44 5 56 45 49,54-4,54-0,03 6 70 57 67,3-0,3-0,066 7 8 7 8,7 35,73 0,65 8 03 06,38-3,38-0,033 9 33 30 0,34 9,66 0,074 0 5 30 43,9-3,9-0,0 47 4 38, 3,89 0,07 9 3 5,6 -,6-0,00 3 35,88 -,88-0,06 4 73 54 7, -7, -0, 5 60 48 54,6-6,6-0,045 Va codotta ach u aals grafca. La Fg. 3 mostra l dagramma d dsprso d rsdu. l modllo è adguato, l dagramma dovrbb apparr ch valor d ua dll coordat o fluscoo su qull dll altra (dstrbuzo casual d put). dovrbb rscotrar ua vcaza d rsdu al valor 0 d u qua dstrbuzo d rsdu postv rsdu gatv. Ossrvado rsdu rlatv d Tab. 7 d l grafco d rsdu, s può dr ch ll smpo aalzzato l modllo lar è sostazalmt accttabl. Co l comado d R: > plot(rg) vgoo vsualzzat squza quattro grafc, l prmo d qual è qullo d rsdu, pr l aals grafca dl modllo lar. È cssaro putualzzar, comuqu, ch pr cocludr sulla buoa adattabltà dl modllo lar a dat è cssaro utlzzar altr mtodch statstch; quato proposto è smplcmt u aals qualtatva dlla problmatca. 3. Corrlazo lar smplc Ua msura dlla botà dl modllo lar può ssr ottuta studado l trdpdza tra du carattr statstch quattatv X Y. Uo dgl dc molto oto pr ua tal msura è l coffct d corrlazo lar R (d Parso): CODEV(X, Y) xy R. DEV(X) DEV(Y) Tal quattà vara tra (Appdc 3). U valor d R vco a dca ua assocazo strtta o molto strtta tra l du varabl; s parla tal caso d corrlazo lar postva tra X I raltà va cosdrato ach l fatto ch s tratta d dat bomdc. 8
Y: all aumtar d ua varabl aumta ach l altra. U valor d R vco a dota u alta o molto alta corrlazo lar gatva (dscordaza) tra X Y: all aumtar d ua d ss l altra dmusc. U valor d R 0 o prossmo a 0 dca dffrza (dpdza) tra l varabl. La Fg. 4 llustra alcu stuazo rlatv a dagramm d dsprso d du varabl X Y. Va ossrvato ch ll ambto dlla corrlazo s studa l trdpdza tra l du varabl o la dpdza d ua d ss dall altra (com lla rgrsso). Nll smpo dll tà PA (smpo ), utlzzado calcol d Tab. 6, s ha: 6708.53 R 0.84, 584.93 055.73 s rgstra, qud, u apprzzabl grado d corrlazo lar postva tra l tà la prsso sstolca pr dat prs sam. Nl lguaggo R, rcosdrado vttor tà pas, soo suffct sgut comad pr l calcolo dl coffct d corrlazo lar: > cor(tà,pas) [] 0.8404483 Il coffct d corrlazo può ssr calcolato ach utlzzado coffct d rgrsso d Y su X (b) d X su Y (b ): xy xy R ± ± b b'. I rfrmto acora alla rgrsso lar è possbl ffttuar u ultror ossrvazo. La Fg. 5 llustra l dvazo d u grco valor ossrvato dalla rtta d rgrsso stmata. 9
Podo: Dvaza Total TOT ; (y y ) Dvaza Rsdua RE ; (y y) Dvaza d Rgrsso REG. può scrvr (Appdc 4): TOT REG + RE. D altra part rsulta: (y y ) (y y ) (y y) xy R REG TOT L dc R è dtto coffct d dtrmazo; vara tra 0, pr valor prossm ad, dca u buo adattamto d dat al modllo lar. Il coffct d dtrmazo sprm la part d varazo dlla varabl rsposta Y spgata dal modllo rgrssvo Y a + bx o, altr trm, la part d varaza d Y mputabl alla varabltà d X. può calcolar ach la quattà R ch dca la part d varabltà dlla varabl rsposta mputabl ad altr fattor dvrs dall altra varabl. Nl caso dll smpo s ott: R Rsquar 0.7 7% R 9%, duqu, pr dat prs sam, l 7% dll aumto dlla PA è dtrmata dall ETA, mtr pr l 9% tal aumto rscotrato è dovuto ad altr fattor (dvrs dall ETA ). Ua rgola mprca porta a rtr u buo adattamto dl modllo a dat qualora rsult Rsquar > 0.70, allora s può rtr ammssbl pr dat cosdrat ua dpdza lar tra PA d ETA. rbadsc, og caso, ch ua aals adguata cssta d ultror approfodmt. Nl pacchtto R, ua volta dfto l oggtto rg (modllo d rgrsso lar), l comado: > summary(rg) prmtt d ottr l valor Rsquar: > summary(rg)$r.squard [] 0.7063534 ma forsc ach altr formazo sul modllo d rgrsso cssar a f frzal. Tal asptt o soo trattat, tuttava, qust Apput. 4. Esrcz ) Pr vrfcar gl fftt d u atprtsvo, soo stat rclutat 00 prso prts suddvs casualmt du grupp d ugual umrostà. Al Gruppo A v sommstrato l Farmaco, al Gruppo B u Placbo. otto tutt gl asptt dl trattamto du grupp soo stat curat mara dtca. V rlvato u fftto postvo su 75 soggtt dl Gruppo A su 65 dl Gruppo B. Aalzzar l assocazo tra Farmaco rsultato postvo. 0
) suppoga d volr cofrotar l'ffcaca d du dvrs farmac, A B. A tal f vgoo cosdrat 5 soggtt: 68 co l farmaco A 53 co l farmaco B. L'fftto dl trattamto v msurato trm d soggtt mglorat o mglorat. I rsultat soo sprss lla sgut tablla: Mglorat No Mglorat Total Farmaco A 5 6 68 Farmaco B 64 89 53 Total 6 405 5 chd s la frquza d soggtt o mglorat sa la stssa ll ambto d du grupp, coè s la frquza d o mglorat sa la stssa dpdtmt dal trattamto cu soggtt soo stat sottopost. 3) I u gruppo d 80 pazt s soo rscotrat sgut st rfrmto ad u dato trattamto mdco: Guarto No guarto Total Trattato 5 5 30 No trattato 0 30 50 total 35 45 80 C è assocazo tra trattamto guargo? 4) u u gruppo d 50 soggtt vaccat cotro u vrus fluzal, s soo rgstrat 65 cas d fluza; su 0 soggtt o vaccat, vc, 4 hao cotratto la malatta. Cosa s può ossrvar sull assocazo tra vacco fluza? 5) Nl laboratoro d ua clca mdca uvrstara ua coltura d battr v sottoposta a dos dvrs d atbotco pr vrfcar s sst ua rlazo lar tra dvrs dosagg l umro d battr rsdu. I dat sao sgut: Atbotco (dos mglaa) 300 800 00 500 000 3000 Battr (umro mlo) 35 30 5 5 7 Calcolar l coffct d corrlazo lar commtar; dtrmar la rtta d rgrsso, calcolar R commtar l rsultato; dtrmar la coctrazo mma d atbotco ch dovrbb lmar battr. 6) Ad 8 pazt è stato sommstrato u quattatvo d glucoso (gramm) dopo crca 90 mut soo stat rlvat valor d glcma (g/dl). La quattà d glucoso grto valor d glcma soo rportat tablla: Pazt A B C D E F G H Glucoso (g) 40 80 50 35 60 5 0 50 Glcma (g/dl) 90 00 60 6 0 00 80 5 Rapprstar grafcamt dat; calcolar l coffct d corrlazo tra l du varabl; dtrmar la rtta d rgrsso d trprtar coffct. 7) La tablla sgut rporta l dstrbuzo dll tà dlla colstrolma (g/dl) pazt: Pazt 3 4 5 6 7 8 9 0 Età (a) 50 40 60 45 55 50 60 65 45 49 55 Colstrolma (g/dl) 35 45 5 80 60 55 5 300 00 5 80 Calcolar l coffct d corrlazo d Parso qullo d dtrmazo: commtar rsultat ottut.
APPENDICE. Dsuguaglaz pr l dc ch-quadrato I rfrmto alla Tab. 4 dl all dc ch-quadrato dfto dalla (), c s propo d provar ch: (oj ) j a) χ (r c ) ;, j j (o ) χ. j j b) m{ (r );(c ) }, j j ossrv aztutto: (o j ) o o o j j j j χ + j o j +. (A), j j, j j, j, j, j j, j j D altra part, pr,,,r j,,,c, rsulta: o j o j j da cu: o j, j j o j o, j j o j o, j j j j, j j j, j j oj oj d ach r., j j Prtato, co l utlzzo d (A):, j j j, j j j j oj o j r c ; j oj, j j j j j j ; j c χ r c (r c ); χ c (c ); χ r (r ). La prma rlazo è propro la a); la dsuguaglaza b), vc, s ott dalla scoda trza sprsso quato tramb vr: χ m{ (r ); (c )} m{(r ); (c )}.. tma d paramtr d rgrsso Il Mtodo d Mm Quadrat rchd ch la somma dgl scart quadratc [y f(x )] (y a bx ) sa mma. Cosdrata la varabl Y a bx, la sua dvaza può ssr sprssa dalla: DEV(Y a bx) (y a bx ) (y a bx) (y a bx) ;
duqu: DEV(Y a bx) + (y a bx). Ossrvato ch trm dlla somma a scodo mmbro dll uguaglaza appa scrtta soo tramb o gatv, rsulta: MIN MIN(DEV(Y a bx)) + MIN( (y a bx), qud, valor d a b vao rcrcat tra qull ch mmzzao sa l ua ch l altra quattà dlla somma. La scoda: (y a bx) assum mmo quado è ugual a 0, duqu: y a bx 0 a y bx. Pr l aals dlla prma quattà va svluppata la dvaza: DEV(Y a bx) DEV(Y bx) DEV(Y) + DEV(bX) bcodev(x, Y) b DEV(X) bcodev(x, Y) + DEV(Y). Rcordado ch DEV(X), DEV(Y) CODEV(X,Y) xy, rsulta: ) DEV(Y a bx) b bxy +, prtato, l mmo dlla dvaza al varar d b cocd col mmo dlla fuzo: Q (b) b bxy +. (A) D altra part, su u pao cartsao ortogoal co b sull ascss, la Q(b) rapprsta ua parabola co ass paralllo all ass dll ordat cocavtà vrso l alto ( quato >0), duqu, com llustrato fgura a lato, ssa assum l valor mmo corrspodza dl vrtc, la cu ascssa è data da: b xy CODEV(X,Y) DEV(X) (x x)(y (x x) y) può allora cocludr ch stm d coffct dlla rtta d rgrsso soo: b CODEV(X, Y) DEV(X) a y b x. 3
3. Dsuguaglaza d Chauchy-chwartz Cosdrat l varabl statstch X Y dcato co E( ) la mda d ua varabl, rsulta: [E(X Y)] E(X) E(Y) (A3) vrfca l uguaglaza s Y λx, pr qualch valor ral λ. Pr la prova d quato affrmato s cosdr ch, pr λ ral, s ha: d ssdo E((λX Y) ) 0 rsulta: E((λX Y) ) E(λ X λx Y+Y ) λ E(X ) λ E(X Y) + E(Y ) λ E(X ) λ E(X Y) + E(Y ) 0 Affché la forma quadratca a prmo mmbro dll sprsso sopra scrtta sa ovuqu o gatva, l suo dscrmat dv ssr gatvo o ullo: [E(X Y)] E(X ) E(Y ) 0, da qu la dsuguaglaza (A3). 0, s ott E((λX Y) ) 0 pr qualch λ, da cu: Y λ X. Pr provar ch l coffct d rgrsso R è comprso tra, è suffct ossrvar ch: E((X x ) ); E((Y y ) ); xy E((X x ) (Y y )) sosttur lla (A4) cascua varabl co l suo scarto dalla mda, ottdo: xy. 4. composzo dlla Dvaza total I Appdc s è vsto ch la quattà (y y ) (y f(x )) ha valor mmo corrspodza dl mmo dlla fuzo Q(b) dfta dalla (A), ovvro pr l valor dll ordata dl vrtc dlla parabola rapprstata da tal fuzo: 4 4 xy xy (y y ) + 4. Rsulta qud: (y y ) (y y ) + + xy (bx (y y ) bx) + xy (y y ) 4 + (y y ) (y y). + b (x x)