Relazoe fra varabl casual X e Y cogutamete dstrbute Test d potes due popolazo Coeffcete d Correlazoe ρ XY (9.5.3) Regressoe ρ XY rspode alla domada esste u assocazoe leare tra le varabl X e Y? Costrure u modello che cosete d spegare Y dato X e studare le propretà. 1
C occupamo d ua caso molto partcolare: La relazoe che lega Y a X è d tpo leare e coè Y E Y ) ( Noostate sao potes molto semplfcatve, comuque l modello d regressoe leare rmae uo de pù usat elle applcazo, per la sua robustezza, semplctà e versatltà Errore casuale d meda ulla ), ( F Y ) (0, F
Regressoe Leare Regressoe vuol dre arretrameto, questa defzoe fatt vee adoperata per la prma da Fracs Galto a proposto delle legg dell eredtaretà che vevao be rappresetate da ua retta co coeffcete agolare more d 1. Per ua retta d questo tpo s ha fatt che valor molto grad d tedoo a dare rsposte pù pccole e valor molto pccol d tedoo a dare rsposte pù grad, producedo cos ua sorta d «regressoe verso la meda» per valor troppo estrem Padre 60 6 64 65 66 67 68 70 7 74 Fglo 63.6 65. 66 65.5 66.9 67.1 67.4 68.3 70.1 70 Paragrafo 9.4.1.1 3
Fg. 9.6 4
Dato u set d dat, y ),(, y ),...,(, y ) ( 1 1 Step 1- dagramma d dspersoe Step 1- calcolo della retta d regressoe Step 3- valdazoe del modello 5
Step 1- dagramma d dspersoe Padre 60 6 64 65 66 67 68 70 7 74 Fglo 63.6 65. 66 65.5 66.9 67.1 67.4 68.3 70.1 70 6
Step - calcolo della retta d regressoe Usamo le seguet otazo.. 1 1 Y 1 1 Y 7
Step - calcolo della retta d regressoe Lo stmatore B del coeffcete agolare e lo stmatore A della tercetta s ottegoo mmzzado: SS Y A B 1 B S S Y A Y B Per l set d dat delle altezze padre/fglo che stamo aalzzado s ottee: S Y 79.7 S 171.6 Y 67.01 66.8 B 79.7/171.6 0.4646 A 67.01 66.8*0.46 35.9 8
SS R Sum Squared Resduals 9
la pedeza β rappreseta l cambameto medo stmato Y quado vara d u utà. Il suo sego dpede da S XY- l tercetta α rappreseta l valor medo stmato d Y quado assume valore zero (se zero è tra valor assut da X). y y Y β pedeza β 10
Step 3- valdazoe del modello La valdazoe del modello avvee prma d tutto dal puto d vsta grafco E po sotto l potes ulterore che l errore ɛ sa ) Gaussao ) Idpedete ) Varaza costate N(0, ) Rumore BIANCO.. d. S possoo trovare le dstrbuzo degl stmator A,B, SS R duque utlzzarl per codurre de test d potes che valdao maera formale le stme otteute 11
B S S Y Y Y 1 ( ) 1 1 1 Y Y N(, ) dpedet B N, S provamolo.. 1
Y S Y B Y A 1 1 ) ( dpedet N Y ), ( S N A 1, provamolo.. 13
R B A Y SS 1 ) ( 1 ) ( Y SS R provamolo.. 14 co A e B stmator d e
15 S N B, S N A /, 1 SS R m m t m Z / ) ( ) ( ) ( ) ( R R t A SS S t B SS S provamolo
.. co le dstrbuzo delle statstche appea trovate s possoo calcolare stme tervallar oppure fare test d potes per parametr cogt Se, ell esempo che stamo coducedo, volessmo testare l potes H 0 : 1; H1 : 1 Dovremmo: valutare la statstca ( ) S SS R ( B ) e dat a ostra dsposzoe S 171.6 10 1 B 0.46 T 8 16.3 SS R 1.54 16
e valutare po l p-de-dat P( T 8 16.3) 0 L potes che l coeffcete agolare sa maggore o uguale ad 1 è da rfutare ad u qualuque lvello d sgfcatvtà 17
Step 3- valdazoe del modello u altro modo per valdare l modello è attraverso la msura della botà del ft SS R 1 ( y ( A B )) pccolo meglo la retta d regressoe spega dat Ma esso è ua quattà dmesoata dalle utà d msura della Y, allora azché valutare quato resdu soo pccol modo assoluto s vede quato resdu soo pccol relatvamete alla dspersoe totale de dat 18
y y y A B y y A B A B y y 19
y B A B A y y y 0 1 ) ( ) ( ) ( 1 1 1 YY R YY y y B A y y y S SS S R meglo la retta d regressoe spega dat
Il coeffcete è detto coeffcete d DETERMINAZIONE e spega, term percetual, quata della varabltà d Y sa dovuta alla varabltà della : R R Se è prossmo a 1 allora quas tutta la varabltà è spegata dalle e duque la retta d regressoe ha ua buoa adereza a dat, coè resdu pccol R Se è prossmo a 0 allora quas per ete la varabltà è spegata dalle e duque è dovuta a resdu, che c aspettamo essere grad Nell esempo che stamo aalzzado abbamo SS R 1.54 S YY 38.5 R 0.96 Per cu s evce che l 96% della varabltà delle rsposte Y è dovuta alla varabltà degl gress e duque la retta d regressoe è molto aderete a dat 1
Dalle dettà: r SY SSYY e SSR SYY S S S Y R S SS S S S S Segue: YY R Y YY YY r R Duque per valutare s può ache valutare la correlazoe emprca e po elevarla al quadrato. Nell esempo che stamo aalzzado partcolare r 0. 0.98 r 0. 96
y y R 1 Relazoe leare perfetta tra X e Y: 100% della varazoe Y è spegata dalla varazoe X 3
y y 0 R 1 Relazoe leare debole tra X e Y: parte della varazoe d Y è spegata dalla varazoe d X ma o tutta!! 4
y R 0 Nessua relazoe leare tra X e Y: Y è dpedete da X (essua varazoe Y è spegata dalla varazoe d X). 5
Step 3- valdazoe del modello U altro modo per valdare l modello leare è l aals de resdu stadardzzat ( y A B ) ( y SS A B ) R /( ) N(0,1) Scop Valutare l assuzoe d leartà Valutare l assuzoe d varaza costate per tutt valor d X Valutare l assuzoe d ormaltà Aals grafca de resdu Effettuare u plot de resdu versus valor assut da X stogramma per valutare la ormaltà 6
resdu resdu Aals de resdu per la leartà y y No Leare Leare 7
resdu resdu Aals de resdu per la varaza costate y y Varaza o-costate Varaza costate 8
Aals de resdu per la ormaltà 9
Esempo Voglamo esamare la relazoe tra l prezzo d vedta d ua casa e la sua gradezza (msurata m ) Abbamo a dsposzoe u campoe d 10 case Varable dpedete Y = prezzo della casa mglaa d euro Varable dpedete X = metr quadr prezz mglaa d euro (Y) m (X) 45 1400 31 1600 79 1700 308 1875 199 1100 19 1550 405 350 34 450 319 145 55 1700 30
scatter plot e lea d regressoe Pedeza= 0,10977 Itercept= 98,48 prezzo 98,4833 0,10977(m ) 31
Iterpretazoe dell tercept b 0 e della pedeza b 1 prezzo 98,4833 0,10977(m ) b 0 è l valore medo stmato d Y quado l valore d X è zero (se = 0 è fra valor osservat). Qu essua casa ha 0 m, qud b 0 = 98,4833 dca che, per le case osservate, 98.48,33 euro è la porzoe d prezzo della casa o spegata da m. b 1 rappreseta l cambameto medo stmato Y quado X vara d u utà. Qud b 1 = 0,10977 dca che l prezzo medo d ua casa aumeta d 0,10977(mglaa d euro)=109,77 euro per u metro quadro aggutvo. 3
R 18934,9348 3600,5000 0,5808 Ifereza sulla pedeza b 1 : la gradezza della casa metr quadr spega l prezzo? 58.08% della varazoe e prezz delle case è spegata dalla varazoe e metr quadr H H b 0 1 1 : 1 0 : 0 1 0,10977 b 1 s β 1 β 1 ~T ( ) a/=0,05 3,39 s b 1 0,0397 df 8 T 3,39 Rfuto H 0 c è suffcete evdeza che la metratura della casa spegh l prezzo t,8 -,3060 t,8,3060 33
Itervallo d cofdeza per la pedeza b t s 1 / b 1 Co u grado d fduca del 95%, l tervallo d cofdeza per la pedeza è (0,0337, 0,1858) Samo cofdet al 95% che l mpatto medo sul prezzo d vedta sa fra 33,70 euro e 185,80 euro per metro quadro Nota Bee Tale tervallo d cofdeza o clude 0!! Coclusoe: c è ua relazoe sgfcatva tra prezz delle case e la metratura co u grado d fduca del 95%!! 34
Route d Matlab per la regressoe [r,beta,alpha]=regresso(,y) 35
Eserczo peso kg (Y) altezza cm (X) Cosdero la seguete tabella che forsce dat d peso e altezza relatv ad u campoe d 13 dvdu d sesso femmle. Voglamo studare la relazoe esstete. 37.3 15 6.8 110 55.3 160 69.3 178 43.8 150 73.1 180 69.8 166 70. 175 58.8 16 56.4 17 64.4 180 6.6 100 4.8 115 36