DATA MINING PER IL MARKETING 63 or Mrco R mr@upr.t Sto wb dl corso http://www.r.t/dmm LA REGRESSIONE LINEARE SEMPLICE
LA REGRESSIONE LINEARE Esst u rlzo lr tr X? I cso ffrmtvo: Com vr u vrbl dpdt fuzo dll ltr splctv? Pr covzo: = vrbl dpdt X = vrbl splctv Esmp Rlzo tr comportmt d cqusto crttrstch d cosumtor Rlzo tr umro d sm sostut prm du d corso voto ll mturtà Rlzo tr przzo d vdt quttà vdut d u b
Motv ch spgoo d dottr modll d rgrsso lr Smplctà fcltà d trprtzo d prmtr = + b + =,, dov: + b rpprst u rtt: = ordt ll org trctt b = coff. golr coff. d rgrsso è u trm d rror ccdtl Motv ch spgoo d dottr modll d rgrsso lr Effttv lrtà molt rlzo soo molto vc ll lrtà Trsformzo l rlzo è lr dopo vr trsformto opportumt l dpdt /o l splctv Es. = b log = log + log b = + b 3
Motv ch spgoo d dottr modll d rgrsso lr Lmttzz dll trvllo Motv ch spgoo d dottr modll d rgrsso lr Rgo d tor sttstc: lo studo dll fuzo lr prmtr h u trttzo pù gvol 4
Dgrmm d dsprso = vdt 8 7 6 5 4 3 3 4 X = N. dpdt Com vro l vdt fuzo dl umro d dpdt? MODELLO DI REGRESSIONE = + b + dov: =,, + b rpprst u rtt: = ordt ll org trctt b = coff. golr coff. d rgrsso è u trm d rror ccdtl 5
RETTA DI REGRESSIONE b =,, ŷ = vlor torco vlor stmto d fuzo lr d =,, Rsdu Com s clcolo prmtr b? METODO DEI MINIMI QUADRATI m L cogt soo prmtr dll rtt:, b b 6
7 Com s clcolo prmtr b? METODO DEI MINIMI QUADRATI p. 4 m b m b Sstm d quzo orml p. 5 b b quzo cogt b
8 Dll prm quzo p. 5 b b b Sosttudo l vlor trovto d ll scod quzo b ] [ b b b b
Esprsso ltrtv pr b q. 8.4, 8.5, p. 4 b ESEMPIO 7 suprmrct r =,96 N. dpdt X Ftturto mlo d A,9 B 8 3, C 3, D 8,5 E 3 6, F,8 G 4,3 9
Clcolo d b A,9 3,6 9 B 8 3, 34 9,6 55,8 C 3, 4,4 64 D 8,5 E 3 6, F,8 G 4,3 Tot. 8 77,8 4,6.8 4,6 43, 7.8.35,7 Clcolo d b A,9 3,6 9 B 8 3, 34 9,6 55,8 C 3, 4,4 64 D 8,5 E 3 6, F,8 G 4,3 Tot. 8 77,8 4,6 b 74,6 466, b 7.8.35,98
Itrprtzo d prmtr ESEMPIO 7 suprmrct =,7 ftturto torco qudo N. d dpdt = b =,98 crmto mdo l ftturto qudo l umro d dpdt umt d utà Scttr co rtt d rgrsso 8 7 6 = vdt 5 4 3 3 4 X = N. dpdt Com vro l vdt fuzo dl umro d dpdt?
Itrprtzo d b b= dc l ttà dll vrzo torc dll vrbl dpdt corrspodz d u crmto utro dll vrbl splctv Itrprtzo d b b= dc l ttà dll vrzo torc dll vrbl dpdt corrspodz d u crmto utro dll vrbl splctv
3 BONTA DI ADATTAMENTO Occorr lzzr rsdu IANZA RESIDUA E L dttmto è buoo qudo E è pccol Problm: E crsc ll umtr dl umro d ossrvzo E dpd dll utà d msur dll ord d grdzz d I qulss modllo d rgrsso co o sz trctt è vld l rlzo ch sgu Qust rlzo sfrutt l trz proprtà dll stm d mm qudrt vcolo dll drvt przl rsptto b post ugul
Dmostrzo b L ultmo trm è zro dto ch Esmpo suprmrct cotu =-,7+,98 Vlor torc Rsd u X rsduo Vlor rsdu torc A,9,8,9,89 3.6 3.79.8 B 8 3, 3,4 -,3-5,34 9.6.536.88 C 3, 3,79 -,59 -,86.4 4.386.35 D 8,5,4,9,69.5..7 E 3 6, 5,78,43,75 38.44 33.35.8 F,8,,59 7, 7.84 4.87.35 G 4,3,6 -,3-4,5 5.9 6.779.9 Tot. 77.8 76..79 77.8=76.+.79 4
5 Idc d botà d dttmto modll d rgrsso sz trctt Vr ll trvllo [ ] BONTA DI ADATTAMENTO Rtt d rgrsso: b IANZA TOTALE M IANZA DI REGRESSIONE M IANZA RESIDUA E
6 Scomposzo dll dvz d modll d rgrsso co trctt E Proprtà Qust rlzo sfrutt l Proprtà 3 dll stm d mm qudrt Proprtà 3 Dmostrzo E E
Idc d dtrmzo lr R E = s = s M Esmpo 7 suprmrct cotu -,7,98* Clcolo d R δ A,9,8.8,46 B 8 3, 3,394.88,55 C 3, 3,79.35,64 D 8,5,44.7 E 3 6, 5,77.8 F,8,6.35 G 4,3,6.9 Tot.,79 3, ŷ M = 7,48 =4,8 M = 3 Dv TOT =Dv REGR +Dv RES 4,8 = 3, +,79 3,,79,94 4,8 4,8 7
Fgur 8.4 stuzo strm pr l dc d dtrmzo lr Rlzo tr dc d dtrmzo δ coffct d corrlzo lr r p. 35 E r COV X, VAR X VAR δ = r Nll smpo prcdt 3,,79,94 4,8 4,8 =,965 =,94 8
9 Rlzo tr δ r p. 35 b b vr vr X b b vr vr vr, cov X X X vr vr, cov X X r Pss rssutv dl modllo d rgrsso Stm d prmtr trprtzo Vlutzo botà d dttmto Als d rsdu Prvso strpolzo
Vsulzzzo grfc d rsdu Rsdu.5 -.5 - Grfco d rsdu 3 4 N. dpdt Modllo soddsfct: dstrbuzo csul d rsdu compot rrtc
ESTRAPOLAZIONE S tt d vlutr mr ttdbl l vlor ch ssumrà l vrbl dpdt corrspodz d u vlor oto dll vrbl splctv. CONDIZIONI Vldtà dll rtt d rgrsso prossmo d vlor oto dll vrbl splctv o loto d vlor utlzzt l clcolo dll rtt Vdt, r. d dp. scomposzo d 8 = vdt 7 6 ŷ5 4 3 3 4 X = N. dpdt b
Stmr prmtr dll rtt d rgrsso, trovr vlor stmt, vrfcr vcol dl sstm d quzo orml l botà d dttmto co Ecl Fuzo rgr.l Ord cu vgoo rsttut l sttstch ggutv d rgrsso dll fuzo d Ecl REGR.LIN
Compot ggutvo ls d dt 3