IL MODELLO DI REGRESSIONE LINEARE MULTIPLA

Documenti analoghi
Lezione 4. La Variabilità. Lezione 4 1

DI IDROLOGIA TECNICA PARTE II

ESERCIZI SU DISTRIBUZIONI CAMPIONARIE

Matematica elementare art.1 di Raimondo Valeri

La classe che mostra la distribuzione più elevata è quella 60-90, che corrisponde a un uso elevato dell automobile. f i fr (= f i/n) fr% (=fr*100)

Stim e puntuali. Vocabolario. Cambiando campione casuale, cambia l istogramma e cambiano gli indici

FUNZIONI LOGICHE FORME CANONICHE SP E PS

Esercizi su Rappresentazioni di Dati e Statistica

Marco Riani - Analisi delle statistiche di vendita 1

Dimostrazione della Formula per la determinazione del numero di divisori-test di primalità, di Giorgio Lamberti

COMPLEMENTI DI STATISTICA. L. Greco, S. Naddeo

frazione 1 n dell ammontare complessivo del carattere A x

SIMULAZIONE DI ESAME ESERCIZI. Cattedra di Statistica Medica-Università degli Studi di Bari-Prof.ssa G. Serio 1

STATISTICA DESCRITTIVA - SCHEDA N. 4 VARIABILI QUANTITATIVE Trasformazioni lineari Indici di covarianza e correlazione

TRATTAMENTO STATISTICO DEI DATI ANALITICI

Design of experiments (DOE) e Analisi statistica

Indici di Posizione. Gli indici si posizione sono misure sintetiche ( valori caratteristici ) che descrivono la tendenza centrale di un fenomeno

ARGOMENTO: MISURA DELLA RESISTENZA ELETTRICA CON IL METODO VOLT-AMPEROMETRICO.

Elementi di Statistica descrittiva Parte II

Incertezza di misura

Modello dinamico nello spazio dei giunti: relazione tra le coppie di attuazione ai giunti ed il moto della struttura

ALCUNI ELEMENTI DI TEORIA DELLA STIMA

STATISTICA DESCRITTIVA

UNI CEI ENV (GUIDA ALL ESPRESSIONE DELL INCERTEZZA DI MISURA)

Capitolo 2 APPROSSIMAZIONI DI DATI E FUNZIONI CON MATHCAD

Prof.ssa Paola Vicard

La volatilità storica, le misure di rischio asimmetrico e la tracking error volatility

STUDIO DEL LANCIO DI 3 DADI

Lezione 1. I numeri complessi

Attualizzazione. Attualizzazione

Corso TFA - A048 Matematica applicata. Didattica della matematica applicata all economia e alla finanza

Transcript:

Captolo 9 - Il modello d regressoe leare multpla 9 - IL MODELLO DI REGRESSIONE LINEARE MULTIPLA 9 9. Itroduzoe 9. Il modello d regressoe leare multpla 9.3 Il modello d regressoe leare multpla forma matrcale 9.4 Stma putuale de parametr 9.5 La decomposzoe della varaza totale e l coeffcete d determazoe multplo 9.6 Ifereza su parametr del modello d regressoe 9.7 Il test F per selezoare l modello d regressoe 9.8 Ifereza per la rsposta meda e per la prevsoe 9.9 La multcolleartà 9. Itroduzoe Nel captolo 6 abbamo llustrato l modello d regressoe leare semplce dove ua varable rsposta Y è supposta dpedere soltato da ua varable esplcatva. Nella maggor parte de cas tuttava questa assuzoe o è adeguata poché Y potrebbe essere fluezata da pù d ua varable dcamo k co k. I cocett d relazoe fuzoale e relazoe statstca devoo essere estes a questa stuazoe. Dremo che esste ua relazoe fuzoale tra Y e k se e solo se u valore d Y corrspode a ua data combazoe de valor delle varabl esplcatve. Per esempo se e dcao la lughezza de due lat adacet d u rettagolo e Y è l suo permetro allora vale la seguete relazoe fuzoale leare. Y. I geerale ua relazoe fuzoale d tpo leare può essere espressa come: Y k k dove k soo coeffcet. I partcolare è detto tercetta coè l valore d Y quado k ; metre j (per j k ) esprme l cremeto d Y corrspodete a u cremeto utaro d j avedo fssato le restat varabl. Come abbamo gà vsto per la regressoe leare semplce egl stud emprc la relazoe che può essere osservata tra le varabl Y e k o è ma ua relazoe matematca esatta: fatt ad ua determata combazoe d valor delle varabl esplcatve possoo corrspodere pù valor d Y. I tal crcostaze dremo che tra la varable rsposta e le varabl esplcatve sussste ua relazoe statstca. Ad esempo: se Y è la spesa auale per cosum è l prodotto tero lordo (PIL) è la Popolazoe e 3 è tasso d dsoccupazoe può accadere che per a cu s osservo gl stess valor del PIL della Popolazoe e del Tasso d dsoccupazoe possao corrspodere valor dvers d spesa Y ; se Y è l salaro d mpego soo gl a d mpego el lavoro attuale è S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9 - l ultmo ttolo d studo coseguto 3 è l umero d compoet della famgla a mpegat co gl stess valor delle varabl esplcatve possoo corrspodere dvers valor del salaro. Come abbamo gà vsto el cap.6 per descrvere e aalzzare feome emprc è opportuo trodurre ua relazoe pù complessa d quella fuzoale che prede l ome d relazoe statstca. Ua relazoe statstca può essere descrtta dalla seguete equazoe: Y f ( k ) (9..) cu f ( k ) è la fuzoe d regressoe che esprme l cotrbuto delle varabl esplcatve al valore della varable rsposta Y metre rappreseta l cotrbuto d tutt gl altr fattor o osservat grado d fluezare la rsposta ed è qud ua varable casuale. I aaloga co quato gà detto per la regressoe leare semplce el prossmo paragrafo trodurremo alcue assuzo. Per mostrare grafcamete la relazoe che tercorre tra due o pù varabl esplcatve e la varable rsposta può essere utlzzata ua matrce d dagramm a dspersoe. Questa cosste ua sere d dagramm d dspersoe che descrvoo tutte le possbl coppe d varabl selezoate da ( Y k ). I tal modo è possble vsualzzare la relazoe tra la Y e og sgola varable esplcatva e se ad esempo è d tpo leare o o leare. Tuttava l uso d tale grafco o è doeo a vestgare se e come due o pù varabl esplcatve possoo flure cogutamete sulla varable rsposta. ESEMPIO 9.. Matrce d dagramm d dspersoe La seguete fgura rporta l grafco a matrce d dagramm d dspersoe corrspodete alle varabl Spesa auale per cosum (Y ) Prodotto tero lordo ( ) Popolazoe ( ) e Tasso d dsoccupazoe ( 3 ) osservat egl Stat Ut tra l 959 e l 999 (dataset coteuto el fle PIL). Spesa per cosum PIL Popolazoe Tasso dsoccupazoe Fgura 9.. Matrce d dagramm d dspersoe S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9-3 I og quadrate è presete u dagramma d dspersoe tra la varable dcata ella corrspodete coloa co quella dcata ella corrspodete rga. Dal grafco s può otare che tra e sussste u forte legame. Ifatt all aumetare della Popolazoe aumeta l PIL. Da cò s potrebbe rteere che le due varabl cotegao la stessa formazoe crca la Y e che qud ua delle due potrebbe essere rdodate ello spegare la varable dpedete. Ne successv paragraf sarao trodott cocett prcpal alla base del modello d regressoe leare multpla partcolare l metodo d stma la botà d adattameto l fereza su parametr e la multcolleartà. Rmadamo l lettore a test pù specalstc per quato rguarda l approfodmeto sulla geeralzzazoe del modello a varabl esplcatve o solo quattatve e alla verfca delle assuzo del modello. Dal terzo paragrafo po è rchesta la coosceza degl elemet d base dell algebra matrcale. 9. l modello d regressoe leare multpla Tra tutt possbl modell d regressoe multpla l pù semplce è quello oto come modello d regressoe leare multpla. Le assuzo del modello d regressoe leare multpla s rferscoo al processo che geera le osservazo dspobl composte ogua da k valor k k k e soo le seguet: Assuzoe. Y k k per og osservazoe ; Assuzoe. le soo v.c. dpedet co valore atteso E( ) e varaza costate V( ) per og dpedetemete da valor delle j (co j.. k ); Assuzoe 3. valor j (per j..k... ) delle varabl esplcatve j (per ) soo ot seza errore. La prma assuzoe mplca che tra le possbl fuzo d regressoe f ( k ) che possoo descrvere l legame tra la varable dpedete e le varabl esplcatve s è scelta la fuzoe leare. Og è ua varable casuale poché rappreseta gl scostamet d Y dal suo valore atteso. S assume allora che le v.c. sao tra loro statstcamete dpedet co valore atteso uguale a zero e varaza costate par a teedo fssate le varabl esplcatve. La codzoe d varaza costate del terme d errore corrspode apputo all potes d omoschedastctà. NOTA Per l modello d regressoe è suffcete assumere che le sao tra loro correlate ossa che la covaraza tra e j sa ulla per og j ; tuttava per semplctà d esposzoe qu assumamo l dpedeza tra gl error. Poché è ua varable casuale ache la varable dpedete Y somma d ua combazoe leare d compoet determstche e d ua stocastca è ua varable casuale. Ora per og k k k è ua costate e E( ) (assuzo e 3); da cò dscede che l valore atteso d Y codzoato al valore k k è: S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9-4 E ( Y k k ) k k (9..) La 9.. rappreseta l equazoe d u perpao uo spazo a k dmeso. Tale perpao prede l ome d superfce d regressoe o d rsposta e la sua poszoe ello spazo dpede da valor assut da coeffcet d regressoe. I partcolare è l tercetta e rappreseta l valore della rsposta meda E(Y ) quado k metre j (per j k ) dca l cremeto d E(Y ) corrspodete ad u cremeto utaro d j teedo fsso l valore delle altre varabl esplcatve. ESEMPIO 9.. Superfce d regressoe S cosder u modello co due varabl esplcatve ( k ) e 5 e. I questo caso s ottee come superfce d regressoe u pao d equazoe E(Y ) 5 collocato uo spazo trdmesoale. Il pao è mostrato ella seguete fgura. E Y Fgura 9.. Superfce d regressoe Quado l valore d E (Y ) è par a 5. Ioltre E (Y ) decresce d quado cremeta d e è teuta costate; smlmete E (Y ) cremeta d corrspodeza d u cremeto utaro d teuta costate. S può osservare che per l -esma osservazoe la dffereza tra l valore della varable dpedete e l suo valore atteso E(Y ) 5 rappreseta l terme d errore. Per quato detto fora le Y essedo fuzo delle varabl casual hao valore atteso par a E ( Y ) k k e varaza par a V(Y ) V( ). Pertato u modo equvalete d formulare l modello d regressoe leare multpla che tee coto delle assuzo -3 è dato da: S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9-5 Le osservazo atteso soo realzzazo d varabl casual dpedet co valore k e varaza comue k. Le procedure ferezal su parametr del modello d regressoe leare semplce rchedoo come abbamo gà vsto el captolo 6 l troduzoe dell assuzoe d ormaltà delle varabl casual ossa che: Assuzoe 4. ~ N per.... Teedo coto d questa ulterore assuzoe l modello d regressoe leare multpla può essere defto el modo seguete: Le osservazo soo realzzazo d varabl casual Normal co valore atteso e varaza k Y k ossa k k ~ N per.... L assuzoe d Normaltà del terme d errore o rsulta geeralmete troppo restrttva el seso che vale almeo approssmatvamete molt feome real. NOTA Tra le assuzoe fatte per l modello la prma potrebbe sembrare troppo restrttva per l applcabltà del modello gacché presuppoe che la superfce d rsposta sa u perpao. Tuttava s deve otare che l modello mpoe solamete la leartà de suo parametr rededolo molto pù flessble d quato possa apparre. S può fatt faclmete dmostrare che l modello d regressoe polomale e l modello che preseta uo o pù term d terazoe soo sostaza acora modell d regressoe leare. Per esempo cosderamo l modello: Y 3 4 che clude ua varable elevata al quadrato e l prodotto tra due varabl per teer coto d u possble effetto d terazoe tra queste due. Questo modello è acora u modello d regressoe leare multpla. Ifatt operado le sosttuzo modo: Y 3 3 4 4. 3 e 4 s può rscrvere el seguete Spesso ache quado la fuzoe d regressoe o è leare e parametr s può rcodurla al caso leare attraverso u approprata trasformazoe. Per esempo Y s può rcodurre a u modello leare e parametr attraverso la log Y trasformazoe logartmca fatt: Y. log log log log e poedo Y log log log e log s ottee l modello leare Y 9.3 Il modello d regressoe leare multpla forma matrcale Il modello d regressoe leare multpla può essere rformulato utlzzado l algebra matrcale. L uso dell algebra matrcale permette d stetzzare pù faclmete rsultat. Idchamo co Y β ε seguet vettor coloa corrspodet a valor della varable rsposta a parametr del modello e a term d errore S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9-6 e sa la matrce: Y β k ε k k k dove della secoda coloa po soo rportat valor delle varabl esplcatve osservat sulle utà statstche. Le assuzo del modello possoo essere rscrtte el seguete modo: Assuzoe. Assuzoe. Assuzoe 3. Y β ε ; ε è u vettore casuale d compoet dpedet co valore atteso E ( ε) e matrce d varaza-covaraza V ( ε) I (dove I dca la matrce dettà d dmesoe ); è ua matrce d costat e possede rago peo. Poché è ua matrce d dmesoe k e β è u vettore coloa d dmesoe k allora β è u vettore coloa d dmesoe dove l -esmo elemeto è par a k j j j e duque la prma assuzoe corrspode a quella gà vsta el paragrafo precedete. Osservamo che E ( ε) è equvalete a scrvere E( ) per og... e che la matrce d varaza-covaraza V ( ε) I è equvalete a V ε I ossa che V( ) per og... e che Cov( j ) per og... co j e coè che term d errore soo correlat. L ultma assuzoe è equvalete a quella del paragrafo precedete solo che è messa forma matrcale. L assuzoe sul rago peo della matrce è ecessara per otteere la stma del vettore de parametr β che rchede l calcolo della matrce che può essere effettuato solo se la possede rago peo. I cosegueza a quato llustrato rsultat sulle varabl aleatore espress forma matrcale: Y possoo essere Il vettore aleatoro Y possede valore atteso e matrce d varaza-covaraza par a: E Y β ; Y V ε I V (9.3.) S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9-7 Alle tre precedet assuzo s può aggugere l assuzoe sulla ormaltà degl error Assuzoe 4. ε s dstrbusce come ua Normale multvarata co vettore de valor attes par a μ e matrce d varazacovaraza par a Σ I. NOTA La dstrbuzoe Normale multvarata è ua geeralzzazoe della dstrbuzoe Normale al caso d due o pù varabl. Idchamo co z ~ Nμ Σ u vettore aleatoro z che s dstrbusce come ua Normale multvarata co μ vettore de valor attes e Σ matrce d varaza-covaraza cu elemet costtuscoo parametr della dstrbuzoe. Dall assuzoe 4. segue che l vettore aleatoro Y ~ N β I e cò mplca l dpedeza delle Y e che Y s dstrbusce come k Y ~ N j j per =. j 9.4 Stma putuale de parametr Il metodo d stma de mm quadrat descrtto el paragrafo 6.4 può essere applcato ache questo caso pù geerale. Il metodo de mm quadrat rchede la mmzzazoe rspetto al vettore de parametr β della fuzoe d perdta k k G β (9.4.) G β è sempre o egatva ed è uguale a zero solamete quado per og La fuzoe osservazoe l valore stmato ŷ uguagla l valore osservato crescere della dstaza tra valor osservat e valor stmat e pertato ell dvduare l mglor modello s mmzza tale dstaza rspetto al vettore d parametr β. S dmostra che. La fuzoe aumeta al la stma de mm quadrat ordar d β se esste b è data da (9.4.) NOTA La stma de mm quadrat ordar è spesso deotata co OLS abbrevazoe del terme glese Ordar Least Squares per dfferezarla dal metodo de mm quadrat poderat (WLS Wheghted Least Squares) utlzzato el caso cu o valga l assuzoe d omoschedastctà del terme d errore. Per meglo compredere la formula 9.4. cosderamo dettaglo l caso pù semplce cu s cosdera ua sola varable esplcatva ossa l caso d u modello d regressoe leare semplce. Cosderamo le seguet matrc zal: S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9-8 S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l. k β allora s ha b b Y Y b rcordado che e Y. Pertato s ottegoo le stesse stme della 6.4.. ESEMPIO 9.4. Calcolo matrcale della stma de parametr d u modello d regressoe leare semplce Rpredamo dat dell esempo 6..3 e la stma de parametr del modello d regressoe leare semplce rportat ell esempo 6.4.. Possamo rformulare l problema term matrcal: 6 5 9 3 5 39 3 36 7 38 45 8 46 3 63 3 56 43 5 4 48 3 4 3 54 4 44 9 4 54 6 36 9 7 8 47 9 66 4 4 7 48 47 5 6 59 53 79 74 5 55 4 54 58 7 6 4 63 54 5 8 7 4 4 33 63 e duque 99 43 9 89 9 89 69 376 376 48 8 569 3 3 558 59486 8 569 3 3 69 376 376 48 b I calcol matrcal possoo essere esegut ad esempo attraverso le fuzoe del software Ecel. I partcolare le fuzo MATR.PRODOTTO(.) e MATR.INVERSA(.) cosetoo rspettvamete d

Captolo 9 - Il modello d regressoe leare multpla 9-9 calcolare l prodotto tra due matrc e l versa d ua matrce. Come s può osservare gl elemet del vettore de parametr b corrspodoo esattamete a valor delle stme d e trovat ell esempo 6.4.. I calcol matrcal per la stma de parametr del modello soo effettuat automatcamete dal software statstco utlzzato per aalzzare dat. ESEMPIO 9.4. Stma de parametr d u modello d regressoe leare multpla Cosderamo l fle d dat Impegat che cotee le determazo del Sesso degl A d struzoe della Categora lavoratva dello Stpedo attuale e d quello zale de Mes trascors dall assuzoe e del Logartmo dello stpedo attuale relatvamete a 474 dpedet. Cosderado l modello d regressoe leare multpla cu s assume l Logartmo dello stpedo attuale come varable dpedete (Y) e gl A d struzoe ( ) e Mes trascors dall assuzoe ( ) come varabl esplcatve s ottegoo le stme rportate ella seguete tabella: Stma de coeffcet Coeffcete Errore stadard t p-value Costate 8877 73797 96 5 43 798 78 Il modello d regressoe stmato è: ŷ 8 877 96. Cò sgfca ad esempo che l valore atteso del Logartmo dello stpedo attuale aumeta d 96 aumetado d u ao gl A d struzoe teuto costate l umero d Mes trascors dall assuzoe. Per dvduare valor d e che redoo mma la fuzoe d perdta G ( ) occorre calcolare le dervate parzal d tale fuzoe rspetto a e e porle ugual a zero. Dopo alcu passagg e semplfcazo s ottegoo le stme de coeffcet d regressoe. Lo stmatore de mm quadrat ordar de coeffcet d regressoe che per semplctà verrà dcato allo stesso modo del vettore delle stme b è ache lo stmatore d massma verosmglaza sotto l assuzoe che l terme d errore è dstrbuto ormalmete. Come per l modello d regressoe leare semplce dove gl stmator de coeffcet d regressoe B e B soo fuzo lear delle Y ache lo stmatore b è fuzoe leare del vettore casuale Y gacché s può vedere come fuzoe leare del tpo b AY co A. Possamo pertato eucare le seguet propretà: Propretà degl stmator de mm quadrat ordar. b è uo stmatore corretto d β ossa E b β.. La matrce d varaza-covaraza dello stmatore b è 3. Nella classe degl stmator corrett d j (per V b. j k ) che soo fuzo lear delle Y gl stmator de mm quadrat ordar soo pù effcet coè soo quell che hao mma varaza per qualsas valore de parametr (Teorema d Gauss-Markov). NOTA S deot co c l elemeto della matrce j coloa k. La propretà. mplca che la varaza d b j per posto all tersezoe della rga h co la j k è V b j c jj S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9 - metre la covaraza tra del parametro b h e b j per h j k co j h è Covbh bj chj. Il valore geere o è oto e duque o è oto eppure l valore d V b pertato sarà ecessaro stmare l parametro come verrà llustrato seguto. Cosderado la rformulazoe forma matrcale del modello d regressoe leare semplce s può vedere faclmete che gl elemet della matrce V b portao agl stess rsultat dat el paragrafo 6.6. Cosderamo ora ua stma del parametro basata su resdu ê ŷ. Lo stmatore corretto della varaza de resdu è dato da: s ê k (9.4.3) Sosttuedo co s possamo stmare la varaza degl stmator de mm quadrat ordar. La radce quadrata della stma della varaza d b j s b j è detta errore stadard d b j. Questa quattà msura la dspersoe meda dello stmatore toro al suo valore atteso ed è ua quattà fodametale per l fereza su coeffcet d regressoe. ESEMPIO 9.4.3 Error stadard delle stme de coeffcet d regressoe Rprededo l fle d dat cosderato ell esempo 9.4. le seguet tabelle rportao l output otteuto tramte l software Ecel. Statstca della regressoe R multplo 699 R al quadrato 489 R al quadrato corretto 487 Errore stadard 85 Osservazo 474 ANALISI VARIANZA gdl SQ MQ F Sgfcatvtà F Regressoe 365 856 53 Resduo 47 386 8 Totale 473 74675 Stma de coeffcet Coeffcete Errore stadard t p-value Costate 8877 73797 96 5 43 798 78 Nella secoda tabella corrspodeza della cella co rquadro rosso è rportata la stma d par a 8; La sua radce quadrata par a 85 è rportata el rquadro rosso della prma tabella e rappreseta ua stma della dstaza meda tra l valore osservato e la stma del suo valore atteso. I valor degl error stadard de coeffcet d regressoe soo rportat ell ultma tabella. S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9-9.5 La decomposzoe della varaza totale e l coeffcete d determazoe multplo Come abbamo gà vsto per l modello d regressoe leare semplce ache questo caso vale la propretà della decomposzoe della varaza totale dove la somma totale de quadrat (SQT s può scomporre ella somma de quadrat della regressoe SQRe ella somma de quadrat degl error SQE : ŷ ê A partre da tale relazoe s può costrure come gà vsto el paragrafo 6.5 ua msura d botà d adattameto ota come coeffcete d determazoe multplo e dato da: R SQR SQT SQE SQT (9.5.) Questo dce è u estesoe del coeffcete d determazoe al caso d due o pù varabl esplcatve e vara tra e dcado la proporzoe d varabltà d Y spegata dalle varabl esplcatve attraverso l modello d regressoe. Assume l valore mmo quado SQR vale a dre asseza d relazoe statstca d tpo leare tra le osservazo; vale quado SQR SQT ossa el caso d perfetta dpedeza leare. Quado alle varabl esplcatve del modello d regressoe s agguge ua uova varable la somma de quadrat degl error SQE o aumeta e ormalmete valor stmat ŷ rsultao essere pù vc a valor osservat. Pertato l valore d R co l troduzoe d ua uova varable esplcatva el modello o può ma decrescere. Ne cosegue che u modello che dffersce da u altro solamete per possedere ua varable pù rspetto all altro mostrerà sempre u valore maggore o uguale d R. Per poter cofrotare la capactà d adattameto d dvers modell eutralzzado l effetto dovuto al dverso umero d varabl esplcatve possamo predere cosderazoe l seguete dce. Il coeffcete d determazoe multplo corretto è dato da: SQE k R c (9.5.) SQT Questo dce tee coto del umero d varabl esplcatve cluse el modello. Ifatt SQE è dvso per k e qud aggugedo ua uova varable el modello k aumeta d u utà e R c potrebbe aumetare o dmure a secoda d quato s è rdotto l SQE. Ife l coeffcete d correlazoe multplo è dato dalla radce quadrata del coeffcete d determazoe multplo R R e msura la correlazoe leare tra valor osservat e corrspodet valor stmat ŷ. S ot che questo dce a dffereza del coeffcete d correlazoe leare può assumere solo valor o egatv. S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9 - ESEMPIO 9.5. Botà d adattameto del modello d regressoe leare multpla Rprededo l esempo 9.4.3 la secoda tabella rporta la decomposzoe della varaza totale dove SQT 74675 SQR 36 5 e SQE 38 6. La prma tabella vece rporta l valore d R SQR SQT 36 5 74 675 489 che rsulta o troppo elevato deotado u adattameto moderato. Il valore del coeffcete d determazoe multplo corretto è 38 6 47 74 675 473. R c 487 Il coeffcete d correlazoe multplo è R 489 699. 9.6 Ifereza su parametr del modello d regressoe Come abbamo gà vsto sotto le prme tre assuzo gl stmator de mm quadrat ordar o d massma verosmglaza deft dagl elemet d b soo corrett ossa E b β e possedoo matrce d varaza-covaraza par a V b. Tuttava per poter fare fereza su coeffcet d regressoe s deve cooscere la dstrbuzoe d oguo de k stmator. Per dervare questa dstrbuzoe è rchesta l assuzoe d ormaltà de term d errore (assuzoe 4). Sotto l assuzoe 4 lo stmatore de mm quadrat b d β ha dstrbuzoe Normale multvarata co vettore de valor attes par a E b β e matrce d varaza-covaraza V b ossa b ~ N β. (9.6.) Pertato og elemeto d b ha dstrbuzoe Normale b ~ N c j k. Qud la statstca b j j ~ N. c jj Tuttava solo raramete s è a coosceza del valore del parametro vee stmato attraverso lo stmatore ottee la statstca j per j jj e l pù delle volte s dato dalla 9.4.3; qud sosttuedo tale valore s b j s k b j j ~ t (9.6.) che s dstrbusce come ua varable casuale t Studet co k grad d lbertà. Il deomatore della 9.6. è dato dall errore stadard dello stmatore b j. Dalla 9.6. possamo rcavare gl tervall d cofdeza per parametr del modello e le statstche test da utlzzare ella verfca d potes. Itervall d cofdeza Gl tervall d cofdeza per parametr d regressoe β a u lvello d cofdeza soo dat da: S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9-3 b j t s b j (9.6.3) dove t dca quel valore per cu la probabltà d osservare valor della t Studet co k grad d lbertà superor o ugual a t è par a. ESEMPIO 9.6. Itervallo d cofdeza per parametr del modello Cosderamo l fle d dat Demograf che cotee le determazo del Numero d crm della Popolazoe ( mglaa) della % d popolazoe co 65 a e pù della % d popolazoe co dploma superore e della Forza lavoro ( mglaa) osservate su 4 aree metropoltae degl Stat Ut el 977. Cosderamo l modello d regressoe leare che poe l Numero d crm fuzoe delle altre varabl. Le stme de coeffcet d regressoe degl error stadard e de lmt feror e superor degl tervall d cofdeza al 95% d cofdeza soo rportat ella seguete tabella: Stma de coeffcet Itervallo d cofdeza Coeffcet Errore stadard Iferore 95% Superore 95% Costate -9596 3984-565596 -56557 Popolazoe (mglaa) 7644 76 46 6 % popolazoe d 65 e pù a 688 65344-43 4639 % co dploma superore 38849 83-344 84 Forza lavoro (mglaa) - 384-985 5374 Verfca d potes Dalla formula 9.6. possamo ache rcavare le statstche test per la verfca d potes su coeffcet d regressoe. D orma s è teressat a verfcare l potes ulla H : j per qualche j k cotro l potes alteratva H : j. Ifatt se H o è rfutata s può affermare che j o è utle alla prevsoe della Y. Pù geerale l sstema d potes può essere formulato come H : j j cotro H : j j dove j è l valore dato al parametro sotto l potes ulla. Sotto l potes ulla s ha che la statstca test: b j j ~ tk s b j s dstrbusce come ua varable casuale t Studet co k grad d lbertà. Se s vuole verfcare l sstema d potes bdrezoale a u lvello d sgfcatvtà la regoe d rfuto sarà data da valor della statstca test superor valore assoluto a t. Percò Regoe d Rfuto d H : t I corrspodeza del valore osservato della statstca test possamo calcolare l p-value che come sappamo è ua msura del grado d dsaccordo rspetto all potes ulla: quato pù è pccolo l p-value tato maggore è l evdeza cotro l potes ulla. t NOTA Se per alcue varabl coeffcet o rsultao sgfcatvamete dvers da zero o è corretto elmare dal modello pù d ua varable alla volta. Ifatt ad esempo l elmazoe S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9-4 cotemporaea d due varabl dal modello corrspode ad accettare l potes ulla H : j ma a u lvello d superore a quello utlzzato per due sgol test. Come s vedrà seguto ua tale verfca può essere svolta attraverso l test F. ESEMPIO 9.6. Verfca d potes per parametr del modello Rprededo dat dell esempo 9.6. elle seguet tabelle soo rportat rsultat della regressoe. I partcolare ell ultma tabella soo mostrat valor della statstca test t e de corrspodet p-value (l potes ulla poe l valore del coeffcete d regressoe par a ): Statstca della regressoe R multplo 978 R al quadrato 956 R al quadrato aggustato 954 Errore stadard 869463 Osservazo 4 ANALISI VARIANZA gdl SQ MQ F Sgfcatvtà F Regressoe 4 6e+ 56695e+ 7347357 Resduo 36 47544654 34937783 Totale 4 743e+ Stma de coeffcet Coeffcet Errore stadard Stat t p-value Costate -9596 3984 -.9 38 Popolazoe (mglaa) 7644 76 434 % popolazoe d 65 a e pù 688 65344 57 797 % co dploma superore 38849 83 865 64 Forza lavoro (mglaa) - 384-578 564 Per u lvello d sgfcatvtà par a solo la Costate e le varabl Popolazoe e % d popolazoe co dploma superore rsultao avere u valore del coeffcete sgfcatvamete dverso da zero. 9.7 Il test F per selezoare l modello d regressoe Il test F è ua procedura per verfcare potes rguardat uo o pù coeffcet d regressoe. Essa è mpegata soprattutto per verfcare l potes che due o pù parametr sao cogutamete par a zero. Tale potes sotttede che le varabl esplcatve corrspodet a parametr suppost ull o soo utl a spegare la relazoe leare co la varable dpedete Y e che pertato possoo essere escluse dal modello d regressoe. I geerale s suppoga d voler verfcare l potes ulla: H : h h k per qualche h k cotro l potes alteratva H : almeo u' uguaglaza o è vera H L potes ulla afferma che almeo k h varabl h h k o soo utl per spegare la relazoe leare co la varable dpedete. Sotto l potes ulla vale S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9-5 pertato l seguete modello: Y h h U tale modello è detto modello rdotto cotrapposzoe al modello completo basato su tutte le varabl esplcatve: Y k k Il modello rdotto è adato all tero del modello completo ossa l prmo è u caso partcolare del secodo quado è vera l potes ulla. Ovvamete l adattameto a dat osservat del modello completo gacché cosdera pù varabl esplcatve è sempre mglore d quello rdotto. Utlzzado la otazoe trodotta el paragrafo 7.3 rguardate l Aals della Varaza dchamo co SQE la somma de quadrat degl error del modello completo e co SQE quella del modello rdotto. Qud s ha che SQE SQE e se la dffereza SQE SQE è grade H dovrebbe essere rfutata poché gl ultm k h parametr aumetao cosderevolmete l adattameto del modello; se la dffereza SQE SQE è pccola H o dovrebbe essere rfutata poché l adattameto del modello o aumeta modo cosderevole. Per stablre se la dffereza statstca test: SQE SQE è grade o pccola s può utlzzare la seguete SQE SQE k h SQE k F (9.7.) Sotto l potes ulla questa statstca s dstrbusce come ua varable casuale F Fsher co k h e k grad d lbertà (s veda paragrafo 9.8.5). S ot che l deomatore della 9.7. è la stma del parametro otteuta dal modello completo. Quato pù l valore d F è grade tato pù l potes H sarà rfutata a favore dell potes H. Stablto l lvello d sgfcatvtà del test la regoe d rfuto è data da Regoe d Rfuto d H : F F dove F dca quel valore per cu la probabltà d osservare valor della F Fsher co k h e k grad d lbertà superor o ugual a F è par ad. Quado F F l potes ulla o può essere rfutata e qud le k h varabl esplcatve possoo essere escluse dal modello d regressoe. NOTA Come gà otato el paragrafo 7.3 quado h k l test F verfca l potes ulla H : e porta alle stesse cocluso del test t descrtto el paragrafo 9.6. Quado h j l potes ulla dveta H : e corrspode a verfcare la valdtà del modello d k S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9-6 regressoe el suo complesso. I questo caso s può dmostrare che la statstca test F è ua R k fuzoe del coeffcete d determazoe multplo: F. R k ESEMPIO 9.7. Test F per l modello d regressoe Rprededo l esempo 9.6. s era vsto che coeffcet d regressoe trovat per le varabl esplcatve % d popolazo d 65 a e pù e Forza lavoro o erao sgfcatvamete dvers da zero ( valor del p-value soo rspettvamete par a 797 e 564). Per decdere se etrambe le varabl possoo essere rmosse dal modello s deve utlzzare l test F. Bsoga pertato comparare l modello completo quello mostrato ella tabella dell esempo 9.6. co l modello rdotto cu soo state elmate le suddette varabl esplcatve. D seguto soo presetate le tabelle rassutve otteute co Ecel della stma del modello rdotto. Statstca della regressoe R multplo 978 R al quadrato 956 R al quadrato aggustato 955 Errore stadard 858848 Osservazo 4 ANALISI VARIANZA gdl SQ MQ F Sgfcatvtà F Regressoe 7e+ 537e+ 485593 Resduo 38 476866985 3455949 Totale 4 743e+ Stma de coeffcet Coeffcet Errore stadard Stat t p-value Costate -534593 9554-34 Popolazoe (mglaa) 663 546 % co dploma superore 3498 99 756 8 La somma de quadrat degl error del modello completo è SQE 47544654 metre quella del modello rdotto è SQE 476866985. Qud 476866985 47544654 F 4. 47544654 36 Comparamo l valore della statstca test co l valore sogla per u 5 otteuto da ua F Fsher co e 36 grad d lbertà e par a F 5 3 63. Poché 5<363 o può essere rfutata l potes ulla. Cò sgfca che per aalzzare l Numero d Crm l modello rdotto è preferble al modello completo. Cò è cofermato ache dal fatto che due modell hao pratcamete lo stesso valore del coeffcete d determazoe multplo e che l valore d quello corretto el modello rdotto è ache se d poco superore a quello del modello completo. Dalla tabella dell Aals della Varaza s può verfcare l caso d h attraverso l valore della statstca test F (par a 485593) e l corrspodete valore del p-value (par a ) che questo caso coducoo a rfutare l potes ulla che l modello el suo complesso o è utle a spegare la varable dpedete. S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9-7 9.8 Ifereza per la rsposta meda e per la prevsoe Cosderado la fuzoe d regressoe stmata Ŷ b b b k k per ua data combazoe d valor delle varabl esplcatve k la stma del valore atteso della varable dpedete è ŷ b b bk k che può essere rscrtta forma matrcale come b. ŷ co La stma d EY k ossa geerado la varable casuale stmatore della rsposta meda Ŷ. k ŷ varerà a secoda del campoe estratto Propretà dello stmatore della rsposta meda. Ŷ è uo stmatore corretto d EY. La varaza d k. Ŷ è data da V Ŷ Assumedo l potes d ormaltà de term d errore la qud: Ŷ E Y Sosttuedo la varaza del terme d errore casuale Ŷ EY t s k Ŷ s dstrbusce ormalmete e ~ N co lo stmatore k ~ t k che s dstrbusce come ua v.c. t Studet co k grad d lbertà. s s ottee la varable Idcado co sŷ s l errore stadard d Ŷ s ottee l espressoe dell tervallo d cofdeza per la rsposta meda a u lvello d cofdeza Ŷ t s Ŷ (9.8.) Per la prevsoe del sgolo valore della Y corrspodeza d ua uova osservazoe che preseta valor delle varabl dpedet ugual a quell d s utlzza lo stesso stmatore utlzzato per stmare la rsposta meda. Tuttava come abbamo gà vsto el paragrafo 7.4 lo stmatore per sgol valor Y ha u errore stadard pù grade dato da s Y Ŷ s. Percò l tervallo d cofdeza per la prevsoe d u sgolo valore cofdeza è dato da: Y a u lvello d S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9-8 Ŷ t s Y Ŷ (9.8.) ESEMPIO 9.8. Itervallo d cofdeza per la rsposta meda e la prevsoe Rprededo l esempo 9.7. cu l Numero d crm vee messo relazoe co la Popolazoe e la % d persoe co dploma superore suppoamo d cosderare u area co ua Popolazoe d 9 (mglaa) d dvdu d cu l 64% co dploma superore. Sosttuedo tal valor al modello stmato s ottee la stma del Numero d crm par a 893566. Cosderado l tervallo d cofdeza a lvello del 95% s ottee: per la rsposta meda l tervallo [8774 ; 95947] metre per l valore prevsto l tervallo pù ampo [565 ; 66966]. 9.9 La multcolleartà I molte stuazo le varabl esplcatve possoo essere tra loro molto correlate e questo caso dremo che c trovamo ua stuazoe d multcolleartà. Cò accade spesso elle dag d tpo soco-ecoomco dove la maggor parte delle varabl cosderate o possoo essere teute completamete sotto cotrollo. L effetto prcpale dovuto alla multcolleartà è quello d aumetare cosderevolmete la varaza degl stmator de mm quadrat de coeffcet d regressoe. Cosderamo l caso d due varabl esplcatve e e per semplctà suppoamo che sao stadardzzate (ossa co meda ulla e varaza utara). I questo caso s può dmostrare che dove è l coeffcete d correlazoe tra e. Pertato la varaza degl stmator de mm quadrat d e V b V b ed è charo che tato è maggore è l valore d tato pù grade è l valore della varaza degl stmator. Quado ossa le due varabl soo correlate le varaze assumoo l valore mmo. Pù geerale la varaza degl stmator de mm quadrat b j aumeta al crescere della dpedeza leare della varable j dalle altre varabl esplcatve. L aumeto della varaza dovuto alla multcolleartà ha degl effett egatv sull fereza de coeffcet d regressoe. I partcolare come s può vedere dalla 9.6.3 l aumeto d s porta all aumeto dell ampezza dell tervallo d cofdeza. Ioltre dalla 9.6. b j l aumeto dell errore stadard fa dmure l valore assoluto della statstca test portado pù faclmete a o rfutare l potes ulla ache se questa o è vera ossa a commettere co maggore probabltà u errore del secodo tpo. U dce utlzzato per msurare l lvello d multcolleartà della varable varabl esplcatve è l Varace flacto factor dato da j co le altre VIF j (9.9.) R j S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9-9 dove R j è l coeffcete d determazoe multplo del modello d regressoe el quale la varable j dpede dalle altre k varabl esplcatve. Il valore mmo del VIF j è e dca che la varable j è correlata dalle altre. I geere u valore superore a dca gà u lvello suffcetemete alto d multcolleartà. La preseza d elevata multcolleartà comporta l cambameto e valor delle stme de coeffcet d regressoe cosegueza a lev modfcazo de valor osservat a elmazoe o agguta d qualche varable esplcatva all agguta d uove osservazo. Tuttava la multcolleartà o altera la botà d adattameto del modello e la sua capactà prevsva rspetto alla varable rsposta. ESEMPIO 9.9. Verfca delle multcolleartà Rprededo l dataset Demograf dell esempo 9.6. s ottegoo corrspodeza del modello stmato seguet valor del VIF : Varabl VIF Popolazoe (mglaa) 5957 % co dploma superore 87 % popolazoe d 65 e pù a 89 Forza lavoro (mglaa) 65 Come s può vedere la varable Popolazoe e Forza Lavoro presetao u valore molto elevato del VIF dcado preseza d multcolleartà. S può verfcare ad esempo che RForza Lavoro 995. Nel modello rdotto rportato ell esempo 7.7. o v è multcolleartà come s può osservare da valor rportat ella seguete tabella. Varabl VIF Popolazoe (mglaa) 5 % co dploma superore 5 S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9 - Appedce A.9. Stma de coeffcet d regressoe Il problema cosste el mmzzare G k k β β matrcale possamo scrvere β β β ) s trova β β β ββ β rspetto a β. I forma G ed espadedo l espressoe (rcordado che G. Notado che β ha dmesoe ( )( k )(k ) darà lo stesso valore della sua trasposta β. Pertato s trova che G β β ββ. Dfferezado la fuzoe rspetto al vettore d parametr e uguagladola a zero s ottee: Gβ β β da cu poedo b al posto d β e dvdedo per s ottee l seguete sstema ormale: b Per otteere la stma de coeffcet d regressoe dal sstema ormale s deve premoltplcare etramb membr dell equazoe per la matrce versa d (assumedo che essta) b e poché I e Ib b b s ottee A.9. Correttezza degl stmator de mm quadrat Pochè b s può rscrvere come fuzoe leare del tpo AY costate possamo faclmete dmostrare che b è uo stmatore corretto d β. b co A E. Ifatt dato che I s ha b EAY AEY Aβ β Iβ β matrce A.9.3 Varaza e covaraza degl stmator de mm quadrat Dalle propretà delle matrc sappamo che dato u vettore W AY co A matrce costate allora V W V AY AV YA. Pertato V b V AY AV YA. Rcordado che Y I A s ha V b I I. V e A.9.4 Propretà dello stmatore della rsposta meda Lo stmatore è corretto fatt E La varaza dello stmatore è data da Ŷ k E b Eb β EY k b V Ŷ V V b. S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9 - Idcare se le seguet affermazo soo vere o false. (Le rsposte esatte soo fodo a questo documeto) 9. - Y log( ) 9. - 9.3 - V F è u modello d regressoe leare multpla. Aggugedo al modello ua varable esplcatva l coeffcete d determazoe multplo o può ma rdurs. Il coeffcete d determazoe multplo corretto cresce sempre all aumetare delle varabl esplcatve cluse el modello. 9.4 - Il coeffcete d correlazoe multplo può essere egatvo. 9.5-9.6-9.7-9.8-9.9-9. - Nel modello d regressoe s assume che le osservazo della varable rsposta sao correlate. Gl stmator d massma verosmglaza per coeffcet d regressoe soo gl stess de mm quadrat ordar. La fuzoe d regressoe descrve l adameto del valore atteso della varable dpedete al varare del valore delle varabl esplcatve. Se dal test t rsulta che due varabl esplcatve hao coeffcet d regressoe o sgfcatvamete dvers da zero allora possamo drettamete elmarle dal modello. Il modello completo dffersce dal modello rdotto perché clude ua sola varable esplcatva pù. Il coeffcete d determazoe multplo dca la proporzoe d varabltà totale dovuta all errore. La varabltà degl stmator de mm quadrat per coeffcet d regressoe 9. - 9. - 9.3-9.4-9.5-9.6 - dpede dalla matrce. Pù le varabl esplcatve soo correlate fra loro e maggore è la varabltà dello stmatore b. I preseza d multcolleartà l modello d regressoe peggora la sua capactà d prevsoe. Lo stmatore b d β ha mma varabltà quado le varabl esplcatve soo fra loro massmamete correlate. Il coeffcete d determazoe corretto tee coto del umero d varabl esplcatve cluse el modello. L tervallo d cofdeza per la rsposta meda o è ma pù grade d quello per l valore prevsto. 9.7 - Se R Rc R allora la fuzoe d regressoe s adatta perfettamete a dat osservat. 9.8-9.9 - VERIFICA Per fare fereza su parametr del modello d regressoe è ecessara l assuzoe d ormaltà del terme d errore. La ormaltà del terme d errore o mplca la ormaltà degl stmator de mm quadrat de coeffcet d regressoe. 9. - Se ε I V allora term d errore soo tra loro correlat. S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9 - ESERCIZI (le soluzo soo dspobl sul sto WEB) Gl esercz propost prevedoo l utlzzazoe d fle d dat formato JMP SPSS o ECEL. 9. Costrure la matrce e l vettore β per oguo de seguet modell d regressoe multpla (s assume 4 ): a. Y b. log Y c. Y 3 d. Y 3 9. Per oguo de seguet modell d regressoe dre se s tratta d u modello d regressoe leare multpla. Se o lo è dre se medate u opportua trasformazoe è possble esprmerlo ella forma dell Assuzoe. a. Y log 3 b. Y ep c. Y log d. Y ep 9.3 S cosder l fle-dat Cellulare (.jmp.sav o.ls) coteete la meda mesle mut d utlzzo del cellulare (Mut) l costo medo mesle delle telefoate (Bolletta) la percetuale per uso uffco (Lavoro) e l reddto famglare (Reddto) d 5 dvdu. Stmado l modello d regressoe leare multpla che fa dpedere la varable meda mesle mut d utlzzo del cellulare dalle restat varabl s ottegoo le seguet tabelle d output: Statstca della regressoe R multplo 54 R al quadrato 9 R al quadrato corretto 83 Errore stadard 3944 Osservazo 5 ANALISI VARIANZA gdl SQ MQ F Sgfcatvtà F Regressoe 3 576957 5565 338 4493E-8 Resduo 46 38347 5543 Totale 49 54364 Coeffcet Errore stadard Stat t p-value Iferore 95% Itercetta 965 553 9 57-9 66 Superore 95% VIF BOLLETTA 885 47 66 595 75 36 LAVORO 536 33 66 98-99 7 37 REDDITO 956 33 4 498 44 7 a. Aumetado d u euro l costo medo della bolletta d quato aumeta la meda mesle d utlzzo del cellulare (teedo costate l valore delle altre varabl)? S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9-3 b. Cosderado u lvello d sgfcatvtà par a dcare qual soo le varabl esplcatve che presetao u coeffcete d regressoe sgfcatvamete dverso da zero. c. Cosderado u lvello d cofdeza par a 95 l coeffcete d regressoe della varable Bolletta può essere par a? d. La botà d adattameto del modello d regressoe leare è molto elevata? e. S può rfutare l potes ulla che coeffcet d regresso soo tutt ugual a zero per u 5? f. Possamo dre che c è multcolleartà tra le varabl esplcatve? 9.4 S cosder l fle d dat Auto (.jmp.sav o.ls) dell eserczo 8.. Stmado l modello d regressoe leare multpla che fa dpedere la varable Cosumo dell automoble dalla Cldrata (MOTORE) da Cavall (CV) dal Peso e dall Accelerazoe s ottegoo le seguet tabelle d output: Statstca della regressoe R multplo 839 R al quadrato 74 R al quadrato corretto 7 Errore stadard 454 Osservazo 39 ANALISI VARIANZA gdl SQ MQ F Sgfcatvtà F Regressoe 4 659 4483 9 49E- Resduo 386 69853 8 Totale 39 35774 Coeffcet Errore stadard Stat t p-value Iferore 95% Itercetta 4847 97 7784 3633 45363 Superore 95% VIF MOTORE -7 7-4 99-6 875 CV -5 7-365 -85-8 939 PESO -5-67 - - 8 ACCEL - 7-953 34-37 9 686 a. Cosderado u lvello d sgfcatvtà par a 5 dcare qual soo le varabl esplcatve che presetao u coeffcete d regressoe sgfcatvamete dverso da zero. b. Cosderado u lvello d cofdeza par a 95 l coeffcete d regressoe della varable Peso può essere d sego postvo? c. La botà d adattameto del modello d regressoe leare è suffcetemete elevata? d. S può accettare l potes ulla che coeffcet d regresso soo tutt ugual a zero per u? e. Possamo dre che c è multcolleartà tra le varabl esplcatve? 9.5 S cosder l fle d dat Auto (.jmp.sav o.ls). Stmado l modello d regressoe leare multpla che fa dpedere la varable Cosumo dell automoble da Cavall (CV) e dal Peso s ottee la seguete tabella d output: Statstca della regressoe R multplo 838 R al quadrato 7 R al quadrato corretto 7 Errore stadard 45 Osservazo 39 S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.

Captolo 9 - Il modello d regressoe leare multpla 9-4 ANALISI VARIANZA gdl SQ MQ F Sgfcatvtà F Regressoe 6566 888 45796 75E-3 Resduo 388 758 8 Totale 39 35774 a. Sulla base del valore del coeffcete d determazoe multplo e d quello corretto s può affermare che l modello suddetto s adatta meo bee d quello dell eserczo 9.4 che clude tutte le varabl esplcatve? b. Sulla base del test F possamo accettare l modello rdotto (l valore della F 3 9 )? 5 9.6 S cosder l fle d dat PIL (.jmp.sav o.ls) dell esempo 9... Stmado l modello d regressoe leare multpla che fa dpedere la varable Spesa auale per cosum dalla Popolazoe e dal Tasso d dsoccupazoe osservat egl Stat Ut tra l 959 e l 999 s ottegoo le seguet tabelle d output: Statstca della regressoe R multplo 968 R al quadrato 937 R al quadrato corretto 934 Errore stadard 46889 Osservazo 4 Coeffcet Errore stadard Stat t p-value Iferore 95% Superore 95% Itercetta -4789 638-7989 -7769-875 Popolazoe (mglaa) 65 3 3786 59 7 Tasso % d dsoccupazoe -684 55-38 3-65343 -5685 a. Dalla stma del coeffcete d regressoe s può dre che la Spesa per cosum è legata versamete al Tasso d dsoccupazoe? b. Le due varabl esplcatve soo sgfcatve a u lvello? c. L adattameto del modello a dat s può rteere molto elevato? d. Sapedo che el 99 la Popolazoe è d 49973 mglaa e l Tasso % d dsoccupazoe è d 56 qual è l valore atteso della Spesa auale per cosum prevsta dal modello? e. Voledo verfcare l potes ulla H : quato vale la statstca test F? f. Sapedo che l p-value della statstca test F calcolata el precedete puto è par a s può rfutare l potes ulla? Cosa possamo cocludere? g. Cosderado valor del VIF per la Popolazoe e l Tasso d dsoccupazoe par rspettvamete a 38 e 38 cosa possamo cocludere crca la multcolleartà delle varabl? S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.