Unverstà dell Clbr FACOLTA DI IGEGERIA Corso d Lure n Ingegner Cvle CORSO DI IDROLOGIA.O. Prof. Psqule Versce Y 6 ( 6, 6 (, e e 6 6 f( 6 (, e SCHEDA DIDATTICA 6 REGRESSIOE E CORRELAZIOE A.A. -
REGRESSIOE E CORRELAZIOE Molto spesso nell prtc s rlev che tr due (o pù vrbl rppresentnt fenomen del mondo rele poss esstere un qulche relone. Per esempo l peso de msch dult dpende n qulche grdo dll loro lte; l crconferen de cerch dpende dl loro rggo. L regressone è l tecnc per ndvdure un equone che descrv n termn mtemtc l legme fr le vrbl, ed n prtcolre tr un o pù vrbl ndpendent ed un vrble dpendente prtre d un cmpone d osservon. Con l termne correlone s ndc, nvece, l grdo d relone esstente tr le vrbl e per meo d ess s cerc d determnre qunto bene un cert equone descrv o spegh tle relone. Qundo s consderno solo due vrbl s prl d regressone e correlone semplce, qundo nvece s consderno pù d due vrbl s prl d regressone e correlone multpl. el seguto verrà consderto solo l cso dell regressone e dell correlone semplce ndcndo con Y l vrble dpendente e con l vrble ndpendente. REGRESSIOE Il prmo psso nell determnone d un legme funonle Yf( che legh le vrbl n esme è l rccolt d dt che mostrno vlor corrspondent delle vrbl consderte. Ad esempo se ed Y ndcno rspettvmente l lte ed l peso d persone dulte, consderndo un cmpone d ndvdu è possble, per cscuno d ess, msurre l copp d vlor (,, con,, che ne rppresentno l lte ed l peso rspettvmente. Il psso seguente consste nel rportre punt determnt dlle coppe d vlor (,, (,,..., (, su un sstem d coordnte crtesne ottenendo l cosddetto dgrmm d dspersone (fg.. e fenomen rel è ltmente mprobble che dt s dspongno perfettmente lungo un curv seguendo un relone estt, è pù corretto qund consderre l espressone Y f( e (
n cu e rppresent un termne d errore (o dsturbo che crtter le dfferene tr vlor d Y osservt e quell che s ottengono nvece dll relone funonle con l. In questo modo Y è un vrble csule rsultnte dll somm d un componente determnstc, f(, e d un componente stocstc e. Obettvo dell nls d regressone è quello d esplctre l form funonle dell componente determnstc ndvdundo l curv che meglo nterpol l relone pott tr ed Y secondo crter specfct nel prgrfo successvo. L nls d regressone consente qund d: vsulre l relone tr due vrbl; effetture operon d nterpolone ed estrpolone per rcvre l vlore dell vrble dpendente n cs non osservt per un fssto vlore dell vrble ndpendente. Spesso è possble ndvdure l tpo d legme n grdo d pprossmre dt prtre dll osservone del dgrmm d dspersone: se dt sono bene nterpolt d un rett s dce che esste un relone lnere ltrment è un relone non-lnere. el seguto consdereremo solo l cso d relone lnere. Y Y b Fgur - Dgrmm dspersone e curve nterpolnt. legme lnere; b legme non-lnere
LA RETTA DI REGRESSIOE CO IL METODO DEI MIIMI QUADRATI Il tpo pù semplce d curv nterpolnte è l rett. In questo cso l legme funonle tr ed Y (trscurndo l errore e h l espressone generle: Y ( n cu ed che costtuscono rspettvmente l ntercett ed l coeffcente ngolre dell rett d regressone. Coeffcente ngolre: nclnone dell rett Esempo Y.75 Intercett: vlore d Y per Fgur Rett d regressone Per determnre vlor de prmetr ed è necessro defnre l crtero d mglore nterpolnte d un determnto nseme d osservon. Sno le coppe (, con,,, l nseme de dt osservt de qul voglmo descrvere l comportmento mednte un funone lnere. ell fgur 3 per un dto vlore, sono stt evdent gl error e, coè le dfferene tr l vlore osservto ed l corrspondente vlore equone: determnto nvece sull rett d (3
Y 6 ( 6, 6 (, e e 6 6 f( 6 (, e Fgur 3 Rppresentone grfc del modello d regressone lnere Un msur dell bontà dell nterpolone effettut per meo dell rett è fornt propro dll somm de qudrt degl error, e e e : qunto pù tle somm è pccol, tnto pù l nterpolone è buon. Tr tutte le rette nterpolnt un dto nseme d punt quell vente l propretà d mnmre l somm S de qudrt degl error S e ( vene defnt come mglore nterpolnte o rett de mnm qudrt. I prmetr ed dell rett de mnm qudrt devono essere tl che: ( ( [ ] mn S (5 S è mnmo qundo le dervte prl d S rspetto d ed vlgono ero. Allor mponendo le condon: S ( (4 (6 S ( (7 e semplfcndo s ottene un sstem d due equon lner nelle due ncognte ed. Le equon precedent semplfcte sono usulmente ndcte come equon norml dell rett de mnm qudrt:
(8 (9 Le due equon precedent costtuscono un sstem, lnere che può essere rppresentto n form mtrcle come A Y, dove: A :vettore con prmetr dell rett che rppresentno le ncognte; : mtrce de coeffcent Y : vettore de termn not Uno de mod possbl d rsolvere l problem è l seguente: e Rsolvendo s h: ( ( ( ( ( ( ( ( ( ( ( L rett de mnm qudrt è unc e pss ttrverso l punto determnto dll copp d vlor (, costtut dlle mede delle osservon ed.
e Inoltre, l rett de mnm qudrt è tle per cu (tle propretà dscende dll equone (6. Le equon norml, nfne, possono essere rscrtte n modo d determnre prmetr n mner opertvmente pù semplce: ( ( ( ( (3 Le precedent equon (-3 sono stte dervte per l cso n cu è l vrble ndpendente ed Y è l vrble dpendente. In mner del tutto nlog nel cso n cu s consdert vrble dpendente s possono ottenere le relon vlde per l stm de prmetr dell rett d regressone d su Y b b Y (4 In tl cso vengono consderte le devon orontl nvece che vertcl.
CORRELAZIOE LIEARE Consdermo due vrbl ed Y le cu osservon rportte n un dgrmm dspersone sembrno dspors ntorno d un rett: n tl cs s è vsto come per gl scop dell regressone s pproprto consderre un relone lnere; n questo cso s prl, qund, d correlone lnere. E possble determnre n modo qulttvo l bontà dell ccostmento dell rett d regressone per meo dell osservone drett del dgrmm dspersone. Se Y tende crescere l crescere d l correlone è dett postv (fg. 4, se Y tende decrescere l crescere d l correlone è dett negtv o nvers (fg. 4b. Se tutt punt del dgrmm s dspongono propro su un rett vuol dre che le vrbl soddsfno esttmente un equone dcmo che le vrbl sono perfettmente correlte ovvero che tr loro esste un correlone perfett (fg. 4c: d esempo l crconferen C ed l rggo r d ogn cercho sono perfettmente correlt dl momento che Cπr. Se nvece non c è lcun relone tr le vrbl s dce che non c è correlone tr esse coè sono ncorrelte (fg. 4d. b c d Fgur 4 correlone lnere postv; b correlone lnere negtv; c correlone perfett; d vrbl ncorrelte.
Per vere un vlutone quntttv dell bontà dell ccostmento è però opportuno fre rfermento d ndc sntetc. MISURE DI CORRELAZIOE Devn spegt e resdu S consder l denttà, vld per,,,, llustrt nell fgur 5, ( ( ( e ( (5 Y ( ( ( Fgur 5 L denttà precedente elevt l qudrto e sommt per,,,, dvent: ( ( ( ( ( (6 nell qule è possble defnre: ( ( ( Il doppo prodotto ( ( Dftt: devn totle d Y devn resdu devn spegt nell precedente espressone è nullo.
( ( (7 e qund: ( ( ( ( ( ( ( e (8 per le equon (6-7 rcvte n preceden. Il clcolo dell devn totle d Y, qund, può essere rcondotto ll seguente espressone: ( ( ( (9 ovvero devn totle devn resdu devn spegt. Tle decomposone fferm che l vrbltà totle del fenomeno Y che s cerc d spegre trmte un relone lnere con l fenomeno, è sempre n prte ttrbuble ll rett d regressone (devn spegt ed n prte è dovut gl error e (devn resdu. Tnto mggore srà l contrbuto dell devn spegt tnto pù l relone lnere pott ruscrà spegre l vrbltà d Y (rett pù vcn vlor cmponr. Coeffcente d determnone Un ndce dell bontà d ccostmento dell rett d regressone dt cmponr può essere defnto ttrverso l rpporto tr l devn spegt e devn totle, ndcto come coeffcente d determnone. ( ( devntotle devnspegt r ( Il coeffcente d determnone è un grnde dmensonle e può vrre tr ero ed uno. Se l devn spegt vle ero, coè vlor stmt sono tutt costnt e pr ll med de vlor osservt, tle coeffcente vle ero. Il coeffcente è, nvece, pr d uno qundo l devn resdu vle ero, coè vlor osservt e stmt concdono. e cs rel nturlmente s h un stuone ntermed che ndc l percentule d vrbltà totle spegt dll rett d regressone.
Y Y r r Fgur 6- Estrem d vrone dell ndce r Coeffcente d correlone L rdce qudrt del coeffcente d determnone vene ndct come coeffcente d correlone che ssume vlor compres tr ed. devnspegt r ± ( devntotle Il segno o (d determnre n bse d un nls del dgrmm dspersone ndc rspettvmente l cso d correlone lnere postv o negtv. Il coeffcente d correlone può essere clcolto nche ttrverso l seguente espressone, ndct come formul de moment mst: r ( ( ( ( ( In tl cso d r vene utomtcmente ssocto l segno corretto. Le propretà del coeffcente d correlone sono le seguent smmetr r(,y r(y, se ed Y sono ndpendent r(,y 3 r(,y ± Y ± coè tr ed Y esste un perfetto legme lnere. Rscho dell nterpretone on necessrmente un cert correlone mplc un rpporto d cus ed effetto tr le vrbl. Ad esempo c può essere un lt correlone tr l numero d omcd ed l
numero d scerdot n un comuntà. In tl cso s prl d rpporto d correlone spuro. Sgrette Urbnone Cncro Rpporto cus-effetto scerdot omcd Correlone spur ESEMPIO (SCHAUM L tbell rport pes ed Y d un cmpone d pdr e de loro rspettv fgl prmogent. Costrure l dgrmm dspersone; Trovre l rett de mnm qudrt d Y su ; 3 Clcolre l coeffcente d correlone ed l coeffcente d determnone. Rsoluone Il lvoro necessro per clcol può essere orgnto come nell tbell che segue. Dt Elboron Y (- (Y-Y (- (Y-Y 65 68.778.74 -.694 63 66 3.444.57 5.86 67 68..74.39 64 65 7. 6.674 6.889 68 69.778.7.889 6 66.778.57 7.389 7 68..74.389 66 65.444 6.674.7 68 7.778.674 4.556 67 67..34 -.94 69 68 5.444.74.97 7 7 8.778 5.84.47 somm 8 8 84.667 38.97 4.333 med 66.667 67.583 Il dgrmm dspersone s ottene rportndo punt (,Y su un sstem d coordnte crtesne (fg.7.
L rett d regressone d Y su è dt d Y dove ed vengono ottenut prtre dlle equon norml. ( ( ( 4.333 84.667.476 67.583.476 66.667 35.8 L rett h pertnto equone Y 35.8.476 (fg.7. (, Fgur 7 3 Il clcolo del coeffcente d correlone lnere può essere effettuto ttrverso l formul de moment mst: r ( ( ( ( 4.333 84.667 38.97.7 L correlone è postv, nftt, l stm d Y con l rett d regressone ument ll umentre d. Il coeffcente d determnone pertnto rsult: r.494
APPEDICE A. el cso n cu l curv nterpolnte s un prbol d espressone: Y (3 s consderno le coppe (, con,,, e corrspondent vlor teorc : (4 e s defnsce, come nel cso dell regressone lnere, l funone obettvo S come: ( e S (5 I prmetr, ed dell prbol de mnm qudrt devono essere tl che: ( ( [ ] mn S (6 S è mnmo qundo le dervte prl rspetto d, ed vlgono ero. Allor mponendo le condon: ( S (7 ( S (8 ( S (9 s ottene l seguente sstem lnere d rsolvere nelle ncognte, ed : 4 3 3
che può essere rscrtto n form mtrcle nel modo seguente: B A M con M 4 3 3 A B A. el cso d regressone lnere multpl con vrbl ndpendent e Y e con l vrble dpendente Z, s h l seguente espressone teorc: Z Y (3 S consderno le terne (,, con,,, e corrspondent vlor teorc : (3 S defnsce l funone obettvo S come: ( e S (3 I prmetr, ed devono essere tl che: ( ( [ ] mn S (33 S è mnmo qundo le dervte prl rspetto d, ed vlgono ero. Allor mponendo le condon: ( S (34 ( S (35 ( S (36
s ottene l seguente sstem lnere d rsolvere nelle ncognte, ed : (37 che può essere rscrtto n form mtrcle nel modo seguente: B A M (38 con M A B A.3 el cso d regressone semplce non lnere n cu s utl un legge d poten del tpo: Y (39 c s può rcondurre l cso dell regressone semplce lnere pplcndo d mbo membr l logrtmo nturle: ( L A LY Y ln ln ln ln ln ln (4 con ln A, Y LY ln e L ln S consderno dunque le coppe (ln, ln con,,, e s segue l procedur descrtt dlle espresson (-( o (-(3 l fne d stmre A e ; successvmente s porrà A e
A.4 el cso d regressone multpl non lnere n cu s utl un legge d poten del tpo: Z Y (4 c s può rcondurre l cso dell regressone multpl lnere, descrtt nell seone A.3 dell presente ppendce, pplcndo d mbo membr l logrtmo nturle: ln ( Y ln Z ln ln ln lny ln lny LZ A L con A ln, LZ ln Z, L ln e LY lny S consderno dunque le terne (ln, ln, ln con,,, e rsolve un sstem lnere nlogo quello descrtto nell seone A.3 l fne d stmre A, e ; A successvmente s porrà e LY (4