Quale retta? Quale retta? Questa? Oppure questa? Questa certamete o! 0 1 0 1 La retta mglore è quella che pù s avvca all seme de 115 put corrspodet alle coppe d valor (x, y ). Per la stma de parametr s mpega abtualmete l metodo
Metodo de mm quadrat Retta stmata: Ŷ = a+ bx!" ordata teorca corrspodete ad u dato valore d X coeffcete a - tercetta è l ordata all orge della retta coeffcete d regressoe b è l coeffcete agolare della retta retta d regressoe stmata è tato pù adatta a descrvere la relazoe studata quato pù put osservat (Y ) s trovao prossmtà d essa S defscoo resdu campoar: e = Y - Yˆ = Y -a-bx Crtero de mm quadrat (OLS): a e b soo scelt modo da mmzzare la somma de quadrat de resdu campoar 2 = 1 = 1 ( ) 2 = å = å - - f ( a, b) e Y a bx 116
Stma de parametr co metodo de mm quadrat 2 = 1 = 1 ( ) 2 å å = mmo f ( a, b) = e = Y -a -bx f( a, b) f( a, b) = = a b 0 Rsolvedo le due dervate rspetto ad a e b, s ottee: å Y = a + b X = 1 = 1 å a = Y - bx 2 XY = a X+ b X = 1 = 1 = 1 å å å 2 = 1 = 1 b x y x = å å x e y dcao gl scart delle osservazo campoare dal relatvo valore medo 117
Propretà de mm quadrat La somma de valor teorc è uguale alla somma de valor osservat: yˆ y Da cò cosegue che ache la meda de valor teorc e la meda de valor osservat soo ugual e, oltre, che la somma de resdu de mm quadrat è detcamete ulla: 1 1 1 re ( 1 y yˆ ) 0 118
Stma retta d regressoe esempo supermercat V o l u m e 250 200 150 v e d t e 100 50 0 0 50 100 150 200 250 300 350 Spazo espostvo Yˆ = - 10,19 + 0,67 Che dre del valore dell tercetta? X coeffcete d regressoe: ad og cremeto utaro della varable X la varable Y subsce ach essa u cremeto, d testà 0,67 ovvero ad og cremeto d u m 2 ella superfce del supermercato l volume delle vedte settmaal aumeta d 67 euro (0,67 x 100) 119
Botà d adattameto La retta (modello) stmata descrve bee dat osservat? La verfca della valdtà o botà d adattameto della retta d regressoe è dretta a cotrollare che la retta d regressoe sa realmete grado d spegare l adameto delle osservazo 120
Scomposzoe dello scostameto dalla meda d Y e y Retta stmata e x x 121
Scomposzoe della devaza d Y e ) DEV ( Y( Y) ) DEV ( Y( ˆ) Y) DEV ( E( DEV ( Y ) 1 ( y y) 2 devaza totale de valor della varable dpedete Msura la varazoe de valor d Y toro alla loro meda DEV ( Yˆ) 1 ( yˆ y) 2 devaza de valor stmat: devaza d regressoe Varazoe spegata attrbuble alla relazoe fra la X e Y DEV ( E) 1 ( y yˆ 2 ) 1 r 22 e devaza de resdu: devaza resdua Varazoe attrbuble a fattor estrae alla relazoe fra la X e Y 122
Msura della botà d adattameto Ua msura relatva (e ormalzzata) è l dce d determazoe leare che s dca co R 2 (Rsquared) ed è l rapporto tra la devaza d regressoe e la devaza totale: R 2 DEV ( Yˆ) DEV ( Y ) 1 DEV ( E) DEV ( Y ) frazoe d varaza della varable rsposta spegata dal modello L dce R 2, essedo u rapporto d ua parte al tutto, può assumere valor compres tra 0 ed 1: se R 2 = 0 l adattameto è pessmo se R 2 = 1 l adattameto è perfetto 123
Possbl stuazo Esemp d R Y R 2 = 1 Y R 2 = 1 X Relazoe leare perfetta fra X e Y: Il 100% della varabltà d Y è spegata dalla varabltà d X X Y Y X R 2 =0,28 R 2 =0,73 Solo ua parte della varabltà d Y è spegata dalla varabltà d X X 124
Possbl stuazo Y R 2 = 0 Nessua relazoe leare fra X e Y: R 2 = 0 X Il valore d Y o dpede da X. (Nessua varazoe d Y è spegata da X) se la stuazoe è quella dcata dal grafco! 125
Osservazo su R 2 /1 1. R 2 =0 e R 2 =1 rappresetao de cas lmte che pratca o s presetao ma 2. L dce R 2 o msura se c è ua relazoe tra le 2 varabl, ma solo quato dat osservat possao essere approssmat da ua retta: se l dce d determazoe leare s rvela prossmo ad 1, s può dre che la varabltà d Y è spegata msura otevole dalla retta d regressoe. Y Fra X e Y sussste ua relazoe, ma o è d tpo leare: R 2 prossmo allo 0 X 3. No s utlzza l term causata poché u valore d R 2 prossmo ad 1 o mplca ecessaramete u esso causale tra le due varabl. 126
Osservazo su R 2 /2 R 2 : dcazoe globale su botà d adattameto 127
Possbl stuazo stuazoe deale! stuazoe smle ma relazoe pù debole: resdu pù dspers 128 Fote: Chambers et al., 1983
relazoe curvlea: curvatura acora pù evdete de resdu (alto, basso, alto o vceversa) *" u puto preseta u valore x molto dstate dagl altr ma cosstete ( term d y) rspetto alla cofgurazoe leare del resto de put (x = leverage pot) 129 Fote: Chambers et al., 1983
Varabltà de put o è costate al varare d x, acora pù evdete e resdu. Possble alteratva: trasformare le varabl 130 Fote: Chambers et al., 1983
Relazo learzzabl Relazo o lear ma learzzabl medate trasformazo d varabl (a seguto dell spezoe del dagramma d dspersoe): Trasformazo pù comu per teer coto d u adameto curvleo co y che cresce pù velocemete d x 1. Y = α + βx 2 2. Log(Y) = α + βx 3. Log(Y) = α + βlog(x) (Metodo mm quadrat può essere applcato a modell geeral g(y) = α + βh(x)+(errore) co g(y) e h(x) approprate fuzo. Importate è che l modello sa leare e parametr 131