IL MODELLO DI REGRESSIONE LINEARE MULTIPLA
|
|
|
- Bernardo Palmieri
- 9 anni fa
- Visualizzazioni
Transcript
1 Captolo 9 - Il modello d regressoe leare multpla 9 - IL MODELLO DI REGRESSIONE LINEARE MULTIPLA 9 9. Itroduzoe 9. Il modello d regressoe leare multpla 9.3 Il modello d regressoe leare multpla forma matrcale 9.4 Stma putuale de parametr 9.5 La decomposzoe della varaza totale e l coeffcete d determazoe multplo 9.6 Ifereza su parametr del modello d regressoe 9.7 Il test F per selezoare l modello d regressoe 9.8 Ifereza per la rsposta meda e per la prevsoe 9.9 La multcolleartà 9. Itroduzoe Nel captolo 6 abbamo llustrato l modello d regressoe leare semplce dove ua varable rsposta Y è supposta dpedere soltato da ua varable esplcatva. Nella maggor parte de cas tuttava questa assuzoe o è adeguata poché Y potrebbe essere fluezata da pù d ua varable dcamo k co k. I cocett d relazoe fuzoale e relazoe statstca devoo essere estes a questa stuazoe. Dremo che esste ua relazoe fuzoale tra Y e k se e solo se u valore d Y corrspode a ua data combazoe de valor delle varabl esplcatve. Per esempo se e dcao la lughezza de due lat adacet d u rettagolo e Y è l suo permetro allora vale la seguete relazoe fuzoale leare. Y. I geerale ua relazoe fuzoale d tpo leare può essere espressa come: Y k k dove k soo coeffcet. I partcolare è detto tercetta coè l valore d Y quado k ; metre j (per j k ) esprme l cremeto d Y corrspodete a u cremeto utaro d j avedo fssato le restat varabl. Come abbamo gà vsto per la regressoe leare semplce egl stud emprc la relazoe che può essere osservata tra le varabl Y e k o è ma ua relazoe matematca esatta: fatt ad ua determata combazoe d valor delle varabl esplcatve possoo corrspodere pù valor d Y. I tal crcostaze dremo che tra la varable rsposta e le varabl esplcatve sussste ua relazoe statstca. Ad esempo: se Y è la spesa auale per cosum è l prodotto tero lordo (PIL) è la Popolazoe e 3 è tasso d dsoccupazoe può accadere che per a cu s osservo gl stess valor del PIL della Popolazoe e del Tasso d dsoccupazoe possao corrspodere valor dvers d spesa Y ; se Y è l salaro d mpego soo gl a d mpego el lavoro attuale è S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
2 Captolo 9 - Il modello d regressoe leare multpla 9 - l ultmo ttolo d studo coseguto 3 è l umero d compoet della famgla a mpegat co gl stess valor delle varabl esplcatve possoo corrspodere dvers valor del salaro. Come abbamo gà vsto el cap.6 per descrvere e aalzzare feome emprc è opportuo trodurre ua relazoe pù complessa d quella fuzoale che prede l ome d relazoe statstca. Ua relazoe statstca può essere descrtta dalla seguete equazoe: Y f ( k ) (9..) cu f ( k ) è la fuzoe d regressoe che esprme l cotrbuto delle varabl esplcatve al valore della varable rsposta Y metre rappreseta l cotrbuto d tutt gl altr fattor o osservat grado d fluezare la rsposta ed è qud ua varable casuale. I aaloga co quato gà detto per la regressoe leare semplce el prossmo paragrafo trodurremo alcue assuzo. Per mostrare grafcamete la relazoe che tercorre tra due o pù varabl esplcatve e la varable rsposta può essere utlzzata ua matrce d dagramm a dspersoe. Questa cosste ua sere d dagramm d dspersoe che descrvoo tutte le possbl coppe d varabl selezoate da ( Y k ). I tal modo è possble vsualzzare la relazoe tra la Y e og sgola varable esplcatva e se ad esempo è d tpo leare o o leare. Tuttava l uso d tale grafco o è doeo a vestgare se e come due o pù varabl esplcatve possoo flure cogutamete sulla varable rsposta. ESEMPIO 9.. Matrce d dagramm d dspersoe La seguete fgura rporta l grafco a matrce d dagramm d dspersoe corrspodete alle varabl Spesa auale per cosum (Y ) Prodotto tero lordo ( ) Popolazoe ( ) e Tasso d dsoccupazoe ( 3 ) osservat egl Stat Ut tra l 959 e l 999 (dataset coteuto el fle PIL). Spesa per cosum PIL Popolazoe Tasso dsoccupazoe Fgura 9.. Matrce d dagramm d dspersoe S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
3 Captolo 9 - Il modello d regressoe leare multpla 9-3 I og quadrate è presete u dagramma d dspersoe tra la varable dcata ella corrspodete coloa co quella dcata ella corrspodete rga. Dal grafco s può otare che tra e sussste u forte legame. Ifatt all aumetare della Popolazoe aumeta l PIL. Da cò s potrebbe rteere che le due varabl cotegao la stessa formazoe crca la Y e che qud ua delle due potrebbe essere rdodate ello spegare la varable dpedete. Ne successv paragraf sarao trodott cocett prcpal alla base del modello d regressoe leare multpla partcolare l metodo d stma la botà d adattameto l fereza su parametr e la multcolleartà. Rmadamo l lettore a test pù specalstc per quato rguarda l approfodmeto sulla geeralzzazoe del modello a varabl esplcatve o solo quattatve e alla verfca delle assuzo del modello. Dal terzo paragrafo po è rchesta la coosceza degl elemet d base dell algebra matrcale. 9. l modello d regressoe leare multpla Tra tutt possbl modell d regressoe multpla l pù semplce è quello oto come modello d regressoe leare multpla. Le assuzo del modello d regressoe leare multpla s rferscoo al processo che geera le osservazo dspobl composte ogua da k valor k k k e soo le seguet: Assuzoe. Y k k per og osservazoe ; Assuzoe. le soo v.c. dpedet co valore atteso E( ) e varaza costate V( ) per og dpedetemete da valor delle j (co j.. k ); Assuzoe 3. valor j (per j..k... ) delle varabl esplcatve j (per ) soo ot seza errore. La prma assuzoe mplca che tra le possbl fuzo d regressoe f ( k ) che possoo descrvere l legame tra la varable dpedete e le varabl esplcatve s è scelta la fuzoe leare. Og è ua varable casuale poché rappreseta gl scostamet d Y dal suo valore atteso. S assume allora che le v.c. sao tra loro statstcamete dpedet co valore atteso uguale a zero e varaza costate par a teedo fssate le varabl esplcatve. La codzoe d varaza costate del terme d errore corrspode apputo all potes d omoschedastctà. NOTA Per l modello d regressoe è suffcete assumere che le sao tra loro correlate ossa che la covaraza tra e j sa ulla per og j ; tuttava per semplctà d esposzoe qu assumamo l dpedeza tra gl error. Poché è ua varable casuale ache la varable dpedete Y somma d ua combazoe leare d compoet determstche e d ua stocastca è ua varable casuale. Ora per og k k k è ua costate e E( ) (assuzo e 3); da cò dscede che l valore atteso d Y codzoato al valore k k è: S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
4 Captolo 9 - Il modello d regressoe leare multpla 9-4 E ( Y k k ) k k (9..) La 9.. rappreseta l equazoe d u perpao uo spazo a k dmeso. Tale perpao prede l ome d superfce d regressoe o d rsposta e la sua poszoe ello spazo dpede da valor assut da coeffcet d regressoe. I partcolare è l tercetta e rappreseta l valore della rsposta meda E(Y ) quado k metre j (per j k ) dca l cremeto d E(Y ) corrspodete ad u cremeto utaro d j teedo fsso l valore delle altre varabl esplcatve. ESEMPIO 9.. Superfce d regressoe S cosder u modello co due varabl esplcatve ( k ) e 5 e. I questo caso s ottee come superfce d regressoe u pao d equazoe E(Y ) 5 collocato uo spazo trdmesoale. Il pao è mostrato ella seguete fgura. E Y Fgura 9.. Superfce d regressoe Quado l valore d E (Y ) è par a 5. Ioltre E (Y ) decresce d quado cremeta d e è teuta costate; smlmete E (Y ) cremeta d corrspodeza d u cremeto utaro d teuta costate. S può osservare che per l -esma osservazoe la dffereza tra l valore della varable dpedete e l suo valore atteso E(Y ) 5 rappreseta l terme d errore. Per quato detto fora le Y essedo fuzo delle varabl casual hao valore atteso par a E ( Y ) k k e varaza par a V(Y ) V( ). Pertato u modo equvalete d formulare l modello d regressoe leare multpla che tee coto delle assuzo -3 è dato da: S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
5 Captolo 9 - Il modello d regressoe leare multpla 9-5 Le osservazo atteso soo realzzazo d varabl casual dpedet co valore k e varaza comue k. Le procedure ferezal su parametr del modello d regressoe leare semplce rchedoo come abbamo gà vsto el captolo 6 l troduzoe dell assuzoe d ormaltà delle varabl casual ossa che: Assuzoe 4. ~ N per.... Teedo coto d questa ulterore assuzoe l modello d regressoe leare multpla può essere defto el modo seguete: Le osservazo soo realzzazo d varabl casual Normal co valore atteso e varaza k Y k ossa k k ~ N per.... L assuzoe d Normaltà del terme d errore o rsulta geeralmete troppo restrttva el seso che vale almeo approssmatvamete molt feome real. NOTA Tra le assuzoe fatte per l modello la prma potrebbe sembrare troppo restrttva per l applcabltà del modello gacché presuppoe che la superfce d rsposta sa u perpao. Tuttava s deve otare che l modello mpoe solamete la leartà de suo parametr rededolo molto pù flessble d quato possa apparre. S può fatt faclmete dmostrare che l modello d regressoe polomale e l modello che preseta uo o pù term d terazoe soo sostaza acora modell d regressoe leare. Per esempo cosderamo l modello: Y 3 4 che clude ua varable elevata al quadrato e l prodotto tra due varabl per teer coto d u possble effetto d terazoe tra queste due. Questo modello è acora u modello d regressoe leare multpla. Ifatt operado le sosttuzo modo: Y e 4 s può rscrvere el seguete Spesso ache quado la fuzoe d regressoe o è leare e parametr s può rcodurla al caso leare attraverso u approprata trasformazoe. Per esempo Y s può rcodurre a u modello leare e parametr attraverso la log Y trasformazoe logartmca fatt: Y. log log log log e poedo Y log log log e log s ottee l modello leare Y 9.3 Il modello d regressoe leare multpla forma matrcale Il modello d regressoe leare multpla può essere rformulato utlzzado l algebra matrcale. L uso dell algebra matrcale permette d stetzzare pù faclmete rsultat. Idchamo co Y β ε seguet vettor coloa corrspodet a valor della varable rsposta a parametr del modello e a term d errore S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
6 Captolo 9 - Il modello d regressoe leare multpla 9-6 e sa la matrce: Y β k ε k k k dove della secoda coloa po soo rportat valor delle varabl esplcatve osservat sulle utà statstche. Le assuzo del modello possoo essere rscrtte el seguete modo: Assuzoe. Assuzoe. Assuzoe 3. Y β ε ; ε è u vettore casuale d compoet dpedet co valore atteso E ( ε) e matrce d varaza-covaraza V ( ε) I (dove I dca la matrce dettà d dmesoe ); è ua matrce d costat e possede rago peo. Poché è ua matrce d dmesoe k e β è u vettore coloa d dmesoe k allora β è u vettore coloa d dmesoe dove l -esmo elemeto è par a k j j j e duque la prma assuzoe corrspode a quella gà vsta el paragrafo precedete. Osservamo che E ( ε) è equvalete a scrvere E( ) per og... e che la matrce d varaza-covaraza V ( ε) I è equvalete a V ε I ossa che V( ) per og... e che Cov( j ) per og... co j e coè che term d errore soo correlat. L ultma assuzoe è equvalete a quella del paragrafo precedete solo che è messa forma matrcale. L assuzoe sul rago peo della matrce è ecessara per otteere la stma del vettore de parametr β che rchede l calcolo della matrce che può essere effettuato solo se la possede rago peo. I cosegueza a quato llustrato rsultat sulle varabl aleatore espress forma matrcale: Y possoo essere Il vettore aleatoro Y possede valore atteso e matrce d varaza-covaraza par a: E Y β ; Y V ε I V (9.3.) S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
7 Captolo 9 - Il modello d regressoe leare multpla 9-7 Alle tre precedet assuzo s può aggugere l assuzoe sulla ormaltà degl error Assuzoe 4. ε s dstrbusce come ua Normale multvarata co vettore de valor attes par a μ e matrce d varazacovaraza par a Σ I. NOTA La dstrbuzoe Normale multvarata è ua geeralzzazoe della dstrbuzoe Normale al caso d due o pù varabl. Idchamo co z ~ Nμ Σ u vettore aleatoro z che s dstrbusce come ua Normale multvarata co μ vettore de valor attes e Σ matrce d varaza-covaraza cu elemet costtuscoo parametr della dstrbuzoe. Dall assuzoe 4. segue che l vettore aleatoro Y ~ N β I e cò mplca l dpedeza delle Y e che Y s dstrbusce come k Y ~ N j j per =. j 9.4 Stma putuale de parametr Il metodo d stma de mm quadrat descrtto el paragrafo 6.4 può essere applcato ache questo caso pù geerale. Il metodo de mm quadrat rchede la mmzzazoe rspetto al vettore de parametr β della fuzoe d perdta k k G β (9.4.) G β è sempre o egatva ed è uguale a zero solamete quado per og La fuzoe osservazoe l valore stmato ŷ uguagla l valore osservato crescere della dstaza tra valor osservat e valor stmat e pertato ell dvduare l mglor modello s mmzza tale dstaza rspetto al vettore d parametr β. S dmostra che. La fuzoe aumeta al la stma de mm quadrat ordar d β se esste b è data da (9.4.) NOTA La stma de mm quadrat ordar è spesso deotata co OLS abbrevazoe del terme glese Ordar Least Squares per dfferezarla dal metodo de mm quadrat poderat (WLS Wheghted Least Squares) utlzzato el caso cu o valga l assuzoe d omoschedastctà del terme d errore. Per meglo compredere la formula 9.4. cosderamo dettaglo l caso pù semplce cu s cosdera ua sola varable esplcatva ossa l caso d u modello d regressoe leare semplce. Cosderamo le seguet matrc zal: S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
8 Captolo 9 - Il modello d regressoe leare multpla 9-8 S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l. k β allora s ha b b Y Y b rcordado che e Y. Pertato s ottegoo le stesse stme della ESEMPIO 9.4. Calcolo matrcale della stma de parametr d u modello d regressoe leare semplce Rpredamo dat dell esempo 6..3 e la stma de parametr del modello d regressoe leare semplce rportat ell esempo Possamo rformulare l problema term matrcal: e duque b I calcol matrcal possoo essere esegut ad esempo attraverso le fuzoe del software Ecel. I partcolare le fuzo MATR.PRODOTTO(.) e MATR.INVERSA(.) cosetoo rspettvamete d
9 Captolo 9 - Il modello d regressoe leare multpla 9-9 calcolare l prodotto tra due matrc e l versa d ua matrce. Come s può osservare gl elemet del vettore de parametr b corrspodoo esattamete a valor delle stme d e trovat ell esempo I calcol matrcal per la stma de parametr del modello soo effettuat automatcamete dal software statstco utlzzato per aalzzare dat. ESEMPIO 9.4. Stma de parametr d u modello d regressoe leare multpla Cosderamo l fle d dat Impegat che cotee le determazo del Sesso degl A d struzoe della Categora lavoratva dello Stpedo attuale e d quello zale de Mes trascors dall assuzoe e del Logartmo dello stpedo attuale relatvamete a 474 dpedet. Cosderado l modello d regressoe leare multpla cu s assume l Logartmo dello stpedo attuale come varable dpedete (Y) e gl A d struzoe ( ) e Mes trascors dall assuzoe ( ) come varabl esplcatve s ottegoo le stme rportate ella seguete tabella: Stma de coeffcet Coeffcete Errore stadard t p-value Costate Il modello d regressoe stmato è: ŷ Cò sgfca ad esempo che l valore atteso del Logartmo dello stpedo attuale aumeta d 96 aumetado d u ao gl A d struzoe teuto costate l umero d Mes trascors dall assuzoe. Per dvduare valor d e che redoo mma la fuzoe d perdta G ( ) occorre calcolare le dervate parzal d tale fuzoe rspetto a e e porle ugual a zero. Dopo alcu passagg e semplfcazo s ottegoo le stme de coeffcet d regressoe. Lo stmatore de mm quadrat ordar de coeffcet d regressoe che per semplctà verrà dcato allo stesso modo del vettore delle stme b è ache lo stmatore d massma verosmglaza sotto l assuzoe che l terme d errore è dstrbuto ormalmete. Come per l modello d regressoe leare semplce dove gl stmator de coeffcet d regressoe B e B soo fuzo lear delle Y ache lo stmatore b è fuzoe leare del vettore casuale Y gacché s può vedere come fuzoe leare del tpo b AY co A. Possamo pertato eucare le seguet propretà: Propretà degl stmator de mm quadrat ordar. b è uo stmatore corretto d β ossa E b β.. La matrce d varaza-covaraza dello stmatore b è 3. Nella classe degl stmator corrett d j (per V b. j k ) che soo fuzo lear delle Y gl stmator de mm quadrat ordar soo pù effcet coè soo quell che hao mma varaza per qualsas valore de parametr (Teorema d Gauss-Markov). NOTA S deot co c l elemeto della matrce j coloa k. La propretà. mplca che la varaza d b j per posto all tersezoe della rga h co la j k è V b j c jj S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
10 Captolo 9 - Il modello d regressoe leare multpla 9 - metre la covaraza tra del parametro b h e b j per h j k co j h è Covbh bj chj. Il valore geere o è oto e duque o è oto eppure l valore d V b pertato sarà ecessaro stmare l parametro come verrà llustrato seguto. Cosderado la rformulazoe forma matrcale del modello d regressoe leare semplce s può vedere faclmete che gl elemet della matrce V b portao agl stess rsultat dat el paragrafo 6.6. Cosderamo ora ua stma del parametro basata su resdu ê ŷ. Lo stmatore corretto della varaza de resdu è dato da: s ê k (9.4.3) Sosttuedo co s possamo stmare la varaza degl stmator de mm quadrat ordar. La radce quadrata della stma della varaza d b j s b j è detta errore stadard d b j. Questa quattà msura la dspersoe meda dello stmatore toro al suo valore atteso ed è ua quattà fodametale per l fereza su coeffcet d regressoe. ESEMPIO Error stadard delle stme de coeffcet d regressoe Rprededo l fle d dat cosderato ell esempo 9.4. le seguet tabelle rportao l output otteuto tramte l software Ecel. Statstca della regressoe R multplo 699 R al quadrato 489 R al quadrato corretto 487 Errore stadard 85 Osservazo 474 ANALISI VARIANZA gdl SQ MQ F Sgfcatvtà F Regressoe Resduo Totale Stma de coeffcet Coeffcete Errore stadard t p-value Costate Nella secoda tabella corrspodeza della cella co rquadro rosso è rportata la stma d par a 8; La sua radce quadrata par a 85 è rportata el rquadro rosso della prma tabella e rappreseta ua stma della dstaza meda tra l valore osservato e la stma del suo valore atteso. I valor degl error stadard de coeffcet d regressoe soo rportat ell ultma tabella. S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
11 Captolo 9 - Il modello d regressoe leare multpla La decomposzoe della varaza totale e l coeffcete d determazoe multplo Come abbamo gà vsto per l modello d regressoe leare semplce ache questo caso vale la propretà della decomposzoe della varaza totale dove la somma totale de quadrat (SQT s può scomporre ella somma de quadrat della regressoe SQRe ella somma de quadrat degl error SQE : ŷ ê A partre da tale relazoe s può costrure come gà vsto el paragrafo 6.5 ua msura d botà d adattameto ota come coeffcete d determazoe multplo e dato da: R SQR SQT SQE SQT (9.5.) Questo dce è u estesoe del coeffcete d determazoe al caso d due o pù varabl esplcatve e vara tra e dcado la proporzoe d varabltà d Y spegata dalle varabl esplcatve attraverso l modello d regressoe. Assume l valore mmo quado SQR vale a dre asseza d relazoe statstca d tpo leare tra le osservazo; vale quado SQR SQT ossa el caso d perfetta dpedeza leare. Quado alle varabl esplcatve del modello d regressoe s agguge ua uova varable la somma de quadrat degl error SQE o aumeta e ormalmete valor stmat ŷ rsultao essere pù vc a valor osservat. Pertato l valore d R co l troduzoe d ua uova varable esplcatva el modello o può ma decrescere. Ne cosegue che u modello che dffersce da u altro solamete per possedere ua varable pù rspetto all altro mostrerà sempre u valore maggore o uguale d R. Per poter cofrotare la capactà d adattameto d dvers modell eutralzzado l effetto dovuto al dverso umero d varabl esplcatve possamo predere cosderazoe l seguete dce. Il coeffcete d determazoe multplo corretto è dato da: SQE k R c (9.5.) SQT Questo dce tee coto del umero d varabl esplcatve cluse el modello. Ifatt SQE è dvso per k e qud aggugedo ua uova varable el modello k aumeta d u utà e R c potrebbe aumetare o dmure a secoda d quato s è rdotto l SQE. Ife l coeffcete d correlazoe multplo è dato dalla radce quadrata del coeffcete d determazoe multplo R R e msura la correlazoe leare tra valor osservat e corrspodet valor stmat ŷ. S ot che questo dce a dffereza del coeffcete d correlazoe leare può assumere solo valor o egatv. S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
12 Captolo 9 - Il modello d regressoe leare multpla 9 - ESEMPIO 9.5. Botà d adattameto del modello d regressoe leare multpla Rprededo l esempo la secoda tabella rporta la decomposzoe della varaza totale dove SQT SQR 36 5 e SQE La prma tabella vece rporta l valore d R SQR SQT che rsulta o troppo elevato deotado u adattameto moderato. Il valore del coeffcete d determazoe multplo corretto è R c 487 Il coeffcete d correlazoe multplo è R Ifereza su parametr del modello d regressoe Come abbamo gà vsto sotto le prme tre assuzo gl stmator de mm quadrat ordar o d massma verosmglaza deft dagl elemet d b soo corrett ossa E b β e possedoo matrce d varaza-covaraza par a V b. Tuttava per poter fare fereza su coeffcet d regressoe s deve cooscere la dstrbuzoe d oguo de k stmator. Per dervare questa dstrbuzoe è rchesta l assuzoe d ormaltà de term d errore (assuzoe 4). Sotto l assuzoe 4 lo stmatore de mm quadrat b d β ha dstrbuzoe Normale multvarata co vettore de valor attes par a E b β e matrce d varaza-covaraza V b ossa b ~ N β. (9.6.) Pertato og elemeto d b ha dstrbuzoe Normale b ~ N c j k. Qud la statstca b j j ~ N. c jj Tuttava solo raramete s è a coosceza del valore del parametro vee stmato attraverso lo stmatore ottee la statstca j per j jj e l pù delle volte s dato dalla 9.4.3; qud sosttuedo tale valore s b j s k b j j ~ t (9.6.) che s dstrbusce come ua varable casuale t Studet co k grad d lbertà. Il deomatore della 9.6. è dato dall errore stadard dello stmatore b j. Dalla 9.6. possamo rcavare gl tervall d cofdeza per parametr del modello e le statstche test da utlzzare ella verfca d potes. Itervall d cofdeza Gl tervall d cofdeza per parametr d regressoe β a u lvello d cofdeza soo dat da: S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
13 Captolo 9 - Il modello d regressoe leare multpla 9-3 b j t s b j (9.6.3) dove t dca quel valore per cu la probabltà d osservare valor della t Studet co k grad d lbertà superor o ugual a t è par a. ESEMPIO 9.6. Itervallo d cofdeza per parametr del modello Cosderamo l fle d dat Demograf che cotee le determazo del Numero d crm della Popolazoe ( mglaa) della % d popolazoe co 65 a e pù della % d popolazoe co dploma superore e della Forza lavoro ( mglaa) osservate su 4 aree metropoltae degl Stat Ut el 977. Cosderamo l modello d regressoe leare che poe l Numero d crm fuzoe delle altre varabl. Le stme de coeffcet d regressoe degl error stadard e de lmt feror e superor degl tervall d cofdeza al 95% d cofdeza soo rportat ella seguete tabella: Stma de coeffcet Itervallo d cofdeza Coeffcet Errore stadard Iferore 95% Superore 95% Costate Popolazoe (mglaa) % popolazoe d 65 e pù a % co dploma superore Forza lavoro (mglaa) Verfca d potes Dalla formula 9.6. possamo ache rcavare le statstche test per la verfca d potes su coeffcet d regressoe. D orma s è teressat a verfcare l potes ulla H : j per qualche j k cotro l potes alteratva H : j. Ifatt se H o è rfutata s può affermare che j o è utle alla prevsoe della Y. Pù geerale l sstema d potes può essere formulato come H : j j cotro H : j j dove j è l valore dato al parametro sotto l potes ulla. Sotto l potes ulla s ha che la statstca test: b j j ~ tk s b j s dstrbusce come ua varable casuale t Studet co k grad d lbertà. Se s vuole verfcare l sstema d potes bdrezoale a u lvello d sgfcatvtà la regoe d rfuto sarà data da valor della statstca test superor valore assoluto a t. Percò Regoe d Rfuto d H : t I corrspodeza del valore osservato della statstca test possamo calcolare l p-value che come sappamo è ua msura del grado d dsaccordo rspetto all potes ulla: quato pù è pccolo l p-value tato maggore è l evdeza cotro l potes ulla. t NOTA Se per alcue varabl coeffcet o rsultao sgfcatvamete dvers da zero o è corretto elmare dal modello pù d ua varable alla volta. Ifatt ad esempo l elmazoe S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
14 Captolo 9 - Il modello d regressoe leare multpla 9-4 cotemporaea d due varabl dal modello corrspode ad accettare l potes ulla H : j ma a u lvello d superore a quello utlzzato per due sgol test. Come s vedrà seguto ua tale verfca può essere svolta attraverso l test F. ESEMPIO 9.6. Verfca d potes per parametr del modello Rprededo dat dell esempo 9.6. elle seguet tabelle soo rportat rsultat della regressoe. I partcolare ell ultma tabella soo mostrat valor della statstca test t e de corrspodet p-value (l potes ulla poe l valore del coeffcete d regressoe par a ): Statstca della regressoe R multplo 978 R al quadrato 956 R al quadrato aggustato 954 Errore stadard Osservazo 4 ANALISI VARIANZA gdl SQ MQ F Sgfcatvtà F Regressoe 4 6e e Resduo Totale 4 743e+ Stma de coeffcet Coeffcet Errore stadard Stat t p-value Costate Popolazoe (mglaa) % popolazoe d 65 a e pù % co dploma superore Forza lavoro (mglaa) Per u lvello d sgfcatvtà par a solo la Costate e le varabl Popolazoe e % d popolazoe co dploma superore rsultao avere u valore del coeffcete sgfcatvamete dverso da zero. 9.7 Il test F per selezoare l modello d regressoe Il test F è ua procedura per verfcare potes rguardat uo o pù coeffcet d regressoe. Essa è mpegata soprattutto per verfcare l potes che due o pù parametr sao cogutamete par a zero. Tale potes sotttede che le varabl esplcatve corrspodet a parametr suppost ull o soo utl a spegare la relazoe leare co la varable dpedete Y e che pertato possoo essere escluse dal modello d regressoe. I geerale s suppoga d voler verfcare l potes ulla: H : h h k per qualche h k cotro l potes alteratva H : almeo u' uguaglaza o è vera H L potes ulla afferma che almeo k h varabl h h k o soo utl per spegare la relazoe leare co la varable dpedete. Sotto l potes ulla vale S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
15 Captolo 9 - Il modello d regressoe leare multpla 9-5 pertato l seguete modello: Y h h U tale modello è detto modello rdotto cotrapposzoe al modello completo basato su tutte le varabl esplcatve: Y k k Il modello rdotto è adato all tero del modello completo ossa l prmo è u caso partcolare del secodo quado è vera l potes ulla. Ovvamete l adattameto a dat osservat del modello completo gacché cosdera pù varabl esplcatve è sempre mglore d quello rdotto. Utlzzado la otazoe trodotta el paragrafo 7.3 rguardate l Aals della Varaza dchamo co SQE la somma de quadrat degl error del modello completo e co SQE quella del modello rdotto. Qud s ha che SQE SQE e se la dffereza SQE SQE è grade H dovrebbe essere rfutata poché gl ultm k h parametr aumetao cosderevolmete l adattameto del modello; se la dffereza SQE SQE è pccola H o dovrebbe essere rfutata poché l adattameto del modello o aumeta modo cosderevole. Per stablre se la dffereza statstca test: SQE SQE è grade o pccola s può utlzzare la seguete SQE SQE k h SQE k F (9.7.) Sotto l potes ulla questa statstca s dstrbusce come ua varable casuale F Fsher co k h e k grad d lbertà (s veda paragrafo 9.8.5). S ot che l deomatore della 9.7. è la stma del parametro otteuta dal modello completo. Quato pù l valore d F è grade tato pù l potes H sarà rfutata a favore dell potes H. Stablto l lvello d sgfcatvtà del test la regoe d rfuto è data da Regoe d Rfuto d H : F F dove F dca quel valore per cu la probabltà d osservare valor della F Fsher co k h e k grad d lbertà superor o ugual a F è par ad. Quado F F l potes ulla o può essere rfutata e qud le k h varabl esplcatve possoo essere escluse dal modello d regressoe. NOTA Come gà otato el paragrafo 7.3 quado h k l test F verfca l potes ulla H : e porta alle stesse cocluso del test t descrtto el paragrafo 9.6. Quado h j l potes ulla dveta H : e corrspode a verfcare la valdtà del modello d k S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
16 Captolo 9 - Il modello d regressoe leare multpla 9-6 regressoe el suo complesso. I questo caso s può dmostrare che la statstca test F è ua R k fuzoe del coeffcete d determazoe multplo: F. R k ESEMPIO 9.7. Test F per l modello d regressoe Rprededo l esempo 9.6. s era vsto che coeffcet d regressoe trovat per le varabl esplcatve % d popolazo d 65 a e pù e Forza lavoro o erao sgfcatvamete dvers da zero ( valor del p-value soo rspettvamete par a 797 e 564). Per decdere se etrambe le varabl possoo essere rmosse dal modello s deve utlzzare l test F. Bsoga pertato comparare l modello completo quello mostrato ella tabella dell esempo 9.6. co l modello rdotto cu soo state elmate le suddette varabl esplcatve. D seguto soo presetate le tabelle rassutve otteute co Ecel della stma del modello rdotto. Statstca della regressoe R multplo 978 R al quadrato 956 R al quadrato aggustato 955 Errore stadard Osservazo 4 ANALISI VARIANZA gdl SQ MQ F Sgfcatvtà F Regressoe 7e+ 537e Resduo Totale 4 743e+ Stma de coeffcet Coeffcet Errore stadard Stat t p-value Costate Popolazoe (mglaa) % co dploma superore La somma de quadrat degl error del modello completo è SQE metre quella del modello rdotto è SQE Qud F Comparamo l valore della statstca test co l valore sogla per u 5 otteuto da ua F Fsher co e 36 grad d lbertà e par a F Poché 5<363 o può essere rfutata l potes ulla. Cò sgfca che per aalzzare l Numero d Crm l modello rdotto è preferble al modello completo. Cò è cofermato ache dal fatto che due modell hao pratcamete lo stesso valore del coeffcete d determazoe multplo e che l valore d quello corretto el modello rdotto è ache se d poco superore a quello del modello completo. Dalla tabella dell Aals della Varaza s può verfcare l caso d h attraverso l valore della statstca test F (par a ) e l corrspodete valore del p-value (par a ) che questo caso coducoo a rfutare l potes ulla che l modello el suo complesso o è utle a spegare la varable dpedete. S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
17 Captolo 9 - Il modello d regressoe leare multpla Ifereza per la rsposta meda e per la prevsoe Cosderado la fuzoe d regressoe stmata Ŷ b b b k k per ua data combazoe d valor delle varabl esplcatve k la stma del valore atteso della varable dpedete è ŷ b b bk k che può essere rscrtta forma matrcale come b. ŷ co La stma d EY k ossa geerado la varable casuale stmatore della rsposta meda Ŷ. k ŷ varerà a secoda del campoe estratto Propretà dello stmatore della rsposta meda. Ŷ è uo stmatore corretto d EY. La varaza d k. Ŷ è data da V Ŷ Assumedo l potes d ormaltà de term d errore la qud: Ŷ E Y Sosttuedo la varaza del terme d errore casuale Ŷ EY t s k Ŷ s dstrbusce ormalmete e ~ N co lo stmatore k ~ t k che s dstrbusce come ua v.c. t Studet co k grad d lbertà. s s ottee la varable Idcado co sŷ s l errore stadard d Ŷ s ottee l espressoe dell tervallo d cofdeza per la rsposta meda a u lvello d cofdeza Ŷ t s Ŷ (9.8.) Per la prevsoe del sgolo valore della Y corrspodeza d ua uova osservazoe che preseta valor delle varabl dpedet ugual a quell d s utlzza lo stesso stmatore utlzzato per stmare la rsposta meda. Tuttava come abbamo gà vsto el paragrafo 7.4 lo stmatore per sgol valor Y ha u errore stadard pù grade dato da s Y Ŷ s. Percò l tervallo d cofdeza per la prevsoe d u sgolo valore cofdeza è dato da: Y a u lvello d S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
18 Captolo 9 - Il modello d regressoe leare multpla 9-8 Ŷ t s Y Ŷ (9.8.) ESEMPIO 9.8. Itervallo d cofdeza per la rsposta meda e la prevsoe Rprededo l esempo 9.7. cu l Numero d crm vee messo relazoe co la Popolazoe e la % d persoe co dploma superore suppoamo d cosderare u area co ua Popolazoe d 9 (mglaa) d dvdu d cu l 64% co dploma superore. Sosttuedo tal valor al modello stmato s ottee la stma del Numero d crm par a Cosderado l tervallo d cofdeza a lvello del 95% s ottee: per la rsposta meda l tervallo [8774 ; 95947] metre per l valore prevsto l tervallo pù ampo [565 ; 66966]. 9.9 La multcolleartà I molte stuazo le varabl esplcatve possoo essere tra loro molto correlate e questo caso dremo che c trovamo ua stuazoe d multcolleartà. Cò accade spesso elle dag d tpo soco-ecoomco dove la maggor parte delle varabl cosderate o possoo essere teute completamete sotto cotrollo. L effetto prcpale dovuto alla multcolleartà è quello d aumetare cosderevolmete la varaza degl stmator de mm quadrat de coeffcet d regressoe. Cosderamo l caso d due varabl esplcatve e e per semplctà suppoamo che sao stadardzzate (ossa co meda ulla e varaza utara). I questo caso s può dmostrare che dove è l coeffcete d correlazoe tra e. Pertato la varaza degl stmator de mm quadrat d e V b V b ed è charo che tato è maggore è l valore d tato pù grade è l valore della varaza degl stmator. Quado ossa le due varabl soo correlate le varaze assumoo l valore mmo. Pù geerale la varaza degl stmator de mm quadrat b j aumeta al crescere della dpedeza leare della varable j dalle altre varabl esplcatve. L aumeto della varaza dovuto alla multcolleartà ha degl effett egatv sull fereza de coeffcet d regressoe. I partcolare come s può vedere dalla l aumeto d s porta all aumeto dell ampezza dell tervallo d cofdeza. Ioltre dalla 9.6. b j l aumeto dell errore stadard fa dmure l valore assoluto della statstca test portado pù faclmete a o rfutare l potes ulla ache se questa o è vera ossa a commettere co maggore probabltà u errore del secodo tpo. U dce utlzzato per msurare l lvello d multcolleartà della varable varabl esplcatve è l Varace flacto factor dato da j co le altre VIF j (9.9.) R j S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
19 Captolo 9 - Il modello d regressoe leare multpla 9-9 dove R j è l coeffcete d determazoe multplo del modello d regressoe el quale la varable j dpede dalle altre k varabl esplcatve. Il valore mmo del VIF j è e dca che la varable j è correlata dalle altre. I geere u valore superore a dca gà u lvello suffcetemete alto d multcolleartà. La preseza d elevata multcolleartà comporta l cambameto e valor delle stme de coeffcet d regressoe cosegueza a lev modfcazo de valor osservat a elmazoe o agguta d qualche varable esplcatva all agguta d uove osservazo. Tuttava la multcolleartà o altera la botà d adattameto del modello e la sua capactà prevsva rspetto alla varable rsposta. ESEMPIO 9.9. Verfca delle multcolleartà Rprededo l dataset Demograf dell esempo 9.6. s ottegoo corrspodeza del modello stmato seguet valor del VIF : Varabl VIF Popolazoe (mglaa) 5957 % co dploma superore 87 % popolazoe d 65 e pù a 89 Forza lavoro (mglaa) 65 Come s può vedere la varable Popolazoe e Forza Lavoro presetao u valore molto elevato del VIF dcado preseza d multcolleartà. S può verfcare ad esempo che RForza Lavoro 995. Nel modello rdotto rportato ell esempo 7.7. o v è multcolleartà come s può osservare da valor rportat ella seguete tabella. Varabl VIF Popolazoe (mglaa) 5 % co dploma superore 5 S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
20 Captolo 9 - Il modello d regressoe leare multpla 9 - Appedce A.9. Stma de coeffcet d regressoe Il problema cosste el mmzzare G k k β β matrcale possamo scrvere β β β ) s trova β β β ββ β rspetto a β. I forma G ed espadedo l espressoe (rcordado che G. Notado che β ha dmesoe ( )( k )(k ) darà lo stesso valore della sua trasposta β. Pertato s trova che G β β ββ. Dfferezado la fuzoe rspetto al vettore d parametr e uguagladola a zero s ottee: Gβ β β da cu poedo b al posto d β e dvdedo per s ottee l seguete sstema ormale: b Per otteere la stma de coeffcet d regressoe dal sstema ormale s deve premoltplcare etramb membr dell equazoe per la matrce versa d (assumedo che essta) b e poché I e Ib b b s ottee A.9. Correttezza degl stmator de mm quadrat Pochè b s può rscrvere come fuzoe leare del tpo AY costate possamo faclmete dmostrare che b è uo stmatore corretto d β. b co A E. Ifatt dato che I s ha b EAY AEY Aβ β Iβ β matrce A.9.3 Varaza e covaraza degl stmator de mm quadrat Dalle propretà delle matrc sappamo che dato u vettore W AY co A matrce costate allora V W V AY AV YA. Pertato V b V AY AV YA. Rcordado che Y I A s ha V b I I. V e A.9.4 Propretà dello stmatore della rsposta meda Lo stmatore è corretto fatt E La varaza dello stmatore è data da Ŷ k E b Eb β EY k b V Ŷ V V b. S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
21 Captolo 9 - Il modello d regressoe leare multpla 9 - Idcare se le seguet affermazo soo vere o false. (Le rsposte esatte soo fodo a questo documeto) 9. - Y log( ) V F è u modello d regressoe leare multpla. Aggugedo al modello ua varable esplcatva l coeffcete d determazoe multplo o può ma rdurs. Il coeffcete d determazoe multplo corretto cresce sempre all aumetare delle varabl esplcatve cluse el modello Il coeffcete d correlazoe multplo può essere egatvo Nel modello d regressoe s assume che le osservazo della varable rsposta sao correlate. Gl stmator d massma verosmglaza per coeffcet d regressoe soo gl stess de mm quadrat ordar. La fuzoe d regressoe descrve l adameto del valore atteso della varable dpedete al varare del valore delle varabl esplcatve. Se dal test t rsulta che due varabl esplcatve hao coeffcet d regressoe o sgfcatvamete dvers da zero allora possamo drettamete elmarle dal modello. Il modello completo dffersce dal modello rdotto perché clude ua sola varable esplcatva pù. Il coeffcete d determazoe multplo dca la proporzoe d varabltà totale dovuta all errore. La varabltà degl stmator de mm quadrat per coeffcet d regressoe dpede dalla matrce. Pù le varabl esplcatve soo correlate fra loro e maggore è la varabltà dello stmatore b. I preseza d multcolleartà l modello d regressoe peggora la sua capactà d prevsoe. Lo stmatore b d β ha mma varabltà quado le varabl esplcatve soo fra loro massmamete correlate. Il coeffcete d determazoe corretto tee coto del umero d varabl esplcatve cluse el modello. L tervallo d cofdeza per la rsposta meda o è ma pù grade d quello per l valore prevsto Se R Rc R allora la fuzoe d regressoe s adatta perfettamete a dat osservat VERIFICA Per fare fereza su parametr del modello d regressoe è ecessara l assuzoe d ormaltà del terme d errore. La ormaltà del terme d errore o mplca la ormaltà degl stmator de mm quadrat de coeffcet d regressoe Se ε I V allora term d errore soo tra loro correlat. S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
22 Captolo 9 - Il modello d regressoe leare multpla 9 - ESERCIZI (le soluzo soo dspobl sul sto WEB) Gl esercz propost prevedoo l utlzzazoe d fle d dat formato JMP SPSS o ECEL. 9. Costrure la matrce e l vettore β per oguo de seguet modell d regressoe multpla (s assume 4 ): a. Y b. log Y c. Y 3 d. Y 3 9. Per oguo de seguet modell d regressoe dre se s tratta d u modello d regressoe leare multpla. Se o lo è dre se medate u opportua trasformazoe è possble esprmerlo ella forma dell Assuzoe. a. Y log 3 b. Y ep c. Y log d. Y ep 9.3 S cosder l fle-dat Cellulare (.jmp.sav o.ls) coteete la meda mesle mut d utlzzo del cellulare (Mut) l costo medo mesle delle telefoate (Bolletta) la percetuale per uso uffco (Lavoro) e l reddto famglare (Reddto) d 5 dvdu. Stmado l modello d regressoe leare multpla che fa dpedere la varable meda mesle mut d utlzzo del cellulare dalle restat varabl s ottegoo le seguet tabelle d output: Statstca della regressoe R multplo 54 R al quadrato 9 R al quadrato corretto 83 Errore stadard 3944 Osservazo 5 ANALISI VARIANZA gdl SQ MQ F Sgfcatvtà F Regressoe E-8 Resduo Totale Coeffcet Errore stadard Stat t p-value Iferore 95% Itercetta Superore 95% VIF BOLLETTA LAVORO REDDITO a. Aumetado d u euro l costo medo della bolletta d quato aumeta la meda mesle d utlzzo del cellulare (teedo costate l valore delle altre varabl)? S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
23 Captolo 9 - Il modello d regressoe leare multpla 9-3 b. Cosderado u lvello d sgfcatvtà par a dcare qual soo le varabl esplcatve che presetao u coeffcete d regressoe sgfcatvamete dverso da zero. c. Cosderado u lvello d cofdeza par a 95 l coeffcete d regressoe della varable Bolletta può essere par a? d. La botà d adattameto del modello d regressoe leare è molto elevata? e. S può rfutare l potes ulla che coeffcet d regresso soo tutt ugual a zero per u 5? f. Possamo dre che c è multcolleartà tra le varabl esplcatve? 9.4 S cosder l fle d dat Auto (.jmp.sav o.ls) dell eserczo 8.. Stmado l modello d regressoe leare multpla che fa dpedere la varable Cosumo dell automoble dalla Cldrata (MOTORE) da Cavall (CV) dal Peso e dall Accelerazoe s ottegoo le seguet tabelle d output: Statstca della regressoe R multplo 839 R al quadrato 74 R al quadrato corretto 7 Errore stadard 454 Osservazo 39 ANALISI VARIANZA gdl SQ MQ F Sgfcatvtà F Regressoe E- Resduo Totale Coeffcet Errore stadard Stat t p-value Iferore 95% Itercetta Superore 95% VIF MOTORE CV PESO ACCEL a. Cosderado u lvello d sgfcatvtà par a 5 dcare qual soo le varabl esplcatve che presetao u coeffcete d regressoe sgfcatvamete dverso da zero. b. Cosderado u lvello d cofdeza par a 95 l coeffcete d regressoe della varable Peso può essere d sego postvo? c. La botà d adattameto del modello d regressoe leare è suffcetemete elevata? d. S può accettare l potes ulla che coeffcet d regresso soo tutt ugual a zero per u? e. Possamo dre che c è multcolleartà tra le varabl esplcatve? 9.5 S cosder l fle d dat Auto (.jmp.sav o.ls). Stmado l modello d regressoe leare multpla che fa dpedere la varable Cosumo dell automoble da Cavall (CV) e dal Peso s ottee la seguete tabella d output: Statstca della regressoe R multplo 838 R al quadrato 7 R al quadrato corretto 7 Errore stadard 45 Osservazo 39 S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
24 Captolo 9 - Il modello d regressoe leare multpla 9-4 ANALISI VARIANZA gdl SQ MQ F Sgfcatvtà F Regressoe E-3 Resduo Totale a. Sulla base del valore del coeffcete d determazoe multplo e d quello corretto s può affermare che l modello suddetto s adatta meo bee d quello dell eserczo 9.4 che clude tutte le varabl esplcatve? b. Sulla base del test F possamo accettare l modello rdotto (l valore della F 3 9 )? S cosder l fle d dat PIL (.jmp.sav o.ls) dell esempo 9... Stmado l modello d regressoe leare multpla che fa dpedere la varable Spesa auale per cosum dalla Popolazoe e dal Tasso d dsoccupazoe osservat egl Stat Ut tra l 959 e l 999 s ottegoo le seguet tabelle d output: Statstca della regressoe R multplo 968 R al quadrato 937 R al quadrato corretto 934 Errore stadard Osservazo 4 Coeffcet Errore stadard Stat t p-value Iferore 95% Superore 95% Itercetta Popolazoe (mglaa) Tasso % d dsoccupazoe a. Dalla stma del coeffcete d regressoe s può dre che la Spesa per cosum è legata versamete al Tasso d dsoccupazoe? b. Le due varabl esplcatve soo sgfcatve a u lvello? c. L adattameto del modello a dat s può rteere molto elevato? d. Sapedo che el 99 la Popolazoe è d mglaa e l Tasso % d dsoccupazoe è d 56 qual è l valore atteso della Spesa auale per cosum prevsta dal modello? e. Voledo verfcare l potes ulla H : quato vale la statstca test F? f. Sapedo che l p-value della statstca test F calcolata el precedete puto è par a s può rfutare l potes ulla? Cosa possamo cocludere? g. Cosderado valor del VIF per la Popolazoe e l Tasso d dsoccupazoe par rspettvamete a 38 e 38 cosa possamo cocludere crca la multcolleartà delle varabl? S. Borra A. D Cacco Statstca metodologe per le sceze ecoomche e socal 3e Coprght 4 McGraw Hll Educato (Ital) S.r.l.
Lezione 4. La Variabilità. Lezione 4 1
Lezoe 4 La Varabltà Lezoe 4 1 Defzoe U valore medo, comuque calcolato, o è suffcete a rappresetare l seme delle osservazo effettuate (o l seme de valor assut dalla varable statstca); è ecessaro qud affacare
DI IDROLOGIA TECNICA PARTE II
FACOLTA DI INGEGNERIA Laurea Specalstca Igegera Cvle NO Guseppe T Aroca CORSO DI IDROLOGIA TECNICA PARTE II Aals e prevsoe statstca delle varabl drologche Lezoe X: Scelta d u modello probablstco Aals e
ESERCIZI SU DISTRIBUZIONI CAMPIONARIE
Corso d Ifereza Statstca Eserctazo A.A. 009/0 ESERCIZI SU DISTRIBUZIONI CAMPIONARIE Eserczo I cosumator d marmellata ua data popolazoe soo l 40%. Determare la probabltà che, per u campoe beroullao d =
Matematica elementare art.1 di Raimondo Valeri
Matematca elemetare art. d Ramodo Valer I questo artcolo voglamo provare che esste ua formula per calcolare l umero de dvsor d u dato umero aturale seza cooscere la scomposzoe fattor prm del umero stesso.
La classe che mostra la distribuzione più elevata è quella 60-90, che corrisponde a un uso elevato dell automobile. f i fr (= f i/n) fr% (=fr*100)
ESERCIZIO Il Moblty Maager d u azeda ha rlevato l umero d chlometr percors settmaalmete da 60 mpegat. I dat soo rportat ello schema successvo. 67 4 93 58 66 87 5 53 86 8 7 47 56 70 54 86 48 43 60 58 5
Stim e puntuali. Vocabolario. Cambiando campione casuale, cambia l istogramma e cambiano gli indici
Stm e putual Probabltà e Statstca I - a.a. 04/05 - Stmator Vocabolaro Popolazoe: u seme d oggett sul quale s desdera avere Iformazo. Parametro: ua caratterstca umerca della popolazoe. E u Numero fssato,
FUNZIONI LOGICHE FORME CANONICHE SP E PS
FUNZIONI LOGICHE FORME CANONICHE SP E PS Ua fuzoe logca può essere espressa quattro forme: 1. attraverso ua proposzoe logca; 2. attraverso ua tabella della vertà; 3. attraverso u espressoe algebrca; 4.
Esercizi su Rappresentazioni di Dati e Statistica
Esercz su Rappresetazo d Dat e Statstca Eserczo Esprmete forma percetuale e traducete u aerogramma dat della seguete tabella: Nord Cetro Sud Isole Totale 5 58 866 0 95 36 4 35 30 6 79 56 57 399 08 Soluzoe
Marco Riani - Analisi delle statistiche di vendita 1
ORARIO LEZIONI ANALISI DELLE STATISTICHE DI VENDITA Marco Ra [email protected] http://www.ra.t Mercoledì 3 aula Lauree Mercoledì 4 6 aula Lauree Govedì 3 Eserctazoe Semar? LIBRI DI TESTO Teora Ra M., Laur F. 8,
Dimostrazione della Formula per la determinazione del numero di divisori-test di primalità, di Giorgio Lamberti
Gorgo Lambert Pag. Dmostrazoe della Formula per la determazoe del umero d dvsor-test d prmaltà, d Gorgo Lambert Eugeo Amtrao aveva proposto l'dea d ua formula per calcolare l umero d dvsor d u umero, da
COMPLEMENTI DI STATISTICA. L. Greco, S. Naddeo
COMPLEMENTI DI STATISTICA L. Greco, S. Naddeo INDICE. GENERALITA SULLA VERIFICA DI IPOTESI. Itroduzoe 4. I test d sgfcatvtà 5.3 Gl tervall d cofdeza 7.4 Le potes alteratve.5 La poteza del test 5.6 Il test
frazione 1 n dell ammontare complessivo del carattere A x
La Cocetrazoe Il cocetto d cocetrazoe rguarda l modo cu l ammotare totale d u carattere quattatvo trasferble s rpartsce tra utà statstche. Tato pù tale ammotare è addesato u sottoseme d utà, tato pù s
SIMULAZIONE DI ESAME ESERCIZI. Cattedra di Statistica Medica-Università degli Studi di Bari-Prof.ssa G. Serio 1
SIMULAZIONE DI ESAME ESERCIZI Cattedra d Statstca MedcaUverstà degl Stud d BarProf.ssa G. Sero ESERCIZIO. Alcu autor hao studato se la depressoe possa essere assocata a dc serologc d process autommutar
STATISTICA DESCRITTIVA - SCHEDA N. 4 VARIABILI QUANTITATIVE Trasformazioni lineari Indici di covarianza e correlazione
Matematca e statstca: da dat a modell alle scelte www.dma.uge/pls_statstca Resposabl scetfc M.P. Rogat e E. Sasso (Dpartmeto d Matematca Uverstà d Geova) STATISTICA DESCRITTIVA - SCHEDA N. 4 VARIABILI
TRATTAMENTO STATISTICO DEI DATI ANALITICI
TRATTAMENTO STATISTICO DEI DATI ANALITICI Nell aals chmca u aalsta effettua u umero lmtato d prove e cosdera la meda de rsultat otteut per poter arrvare a determare o l valore VERO d ua determata gradezza
Design of experiments (DOE) e Analisi statistica
Desg of epermets (DOE) e Aals statstca L utlzzo fodametale della metodologa Desg of Epermets è approfodre la coosceza del sstema esame Determare le varabl pù sgfcatve; Determare l campo d varazoe delle
Indici di Posizione. Gli indici si posizione sono misure sintetiche ( valori caratteristici ) che descrivono la tendenza centrale di un fenomeno
Idc d Poszoe Gl dc s poszoe soo msure stetche ( valor caratterstc ) che descrvoo la tedeza cetrale d u feomeo La tedeza cetrale è, prma approssmazoe, la modaltà della varable verso la quale cas tedoo a
ARGOMENTO: MISURA DELLA RESISTENZA ELETTRICA CON IL METODO VOLT-AMPEROMETRICO.
elazoe d laboratoro d Fsca corso M-Z Laboratoro d Fsca del Dpartmeto d Fsca e Astrooma dell Uverstà degl Stud d Cataa. Scala Stefaa. AGOMENTO: MSUA DELLA ESSTENZA ELETTCA CON L METODO OLT-AMPEOMETCO. NTODUZONE:
Elementi di Statistica descrittiva Parte II
Elemet d Statstca descrttva Parte II Nella prma parte d queste ote s soo llustrate le tecche utlzzate per rappresetare dat, maera stetca, medate tabelle e grafc Tal tecche soo applcabl sa a caratter quattatv
Incertezza di misura
Icertezza d msura Itroduzoe e rcham Come gà detto rsultat umerc ottebl dalle msurazo soo trsecamete caratterzzat da aleatoretà è duque sempre ecessaro stmare ua fasca d valor attrbubl come msura al msurado;
Modello dinamico nello spazio dei giunti: relazione tra le coppie di attuazione ai giunti ed il moto della struttura
Damca Modello damco ello spazo de gut: relazoe tra le coppe d attuazoe a gut ed l moto della struttura smulazoe del moto aals e progettazoe delle traettore progettazoe del sstema d cotrollo progetto de
ALCUNI ELEMENTI DI TEORIA DELLA STIMA
ALCUNI ELEMENTI DI TEORIA DELLA STIMA Quado s vuole valutare u parametro θ ad esempo: meda, varaza, proporzoe, oeffete d regressoe leare, oeffete d orrelazoe leare, e) d ua popolazoe medate u ampoe asuale,
STATISTICA DESCRITTIVA
STATISTICA DESCRITTIVA Le msure d tedeza cetrale OBIETTIVO Idvduare u dce che rappreset sgfcatvamete u seme d dat statstc. Esempo Nella tabella seguete soo rportat valor del tasso glcemco rlevat su 0 pazet:
UNI CEI ENV 13005 (GUIDA ALL ESPRESSIONE DELL INCERTEZZA DI MISURA)
UI CEI EV 3005 (GUIDA ALL ESPRESSIOE DELL ICERTEZZA DI MISURA Uverstà degl Stud d Bresca Corso d Fodamet della Msurazoe A.A. 00-03 Apput a cura d Gorgo Cor 3835 UI CEI EV 3005 0. ITRODUZIOE 0. COCETTO
Capitolo 2 APPROSSIMAZIONI DI DATI E FUNZIONI CON MATHCAD
Captolo APPROSSIMAZIONI DI DATI E FUNZIONI CON MATHCAD A. M. Ferrar - Apput d LPCAC SOMMARIO. APPROSSIMAZIONE DI DATI E FUNZIONI... 3. Itroduzoe... 3. I crter d scelta... 4.. Osservazo... 5. LE CURVE DI
Prof.ssa Paola Vicard
Excel o ha ua fuzoe per calcolare automatcamete gl dc d cocetrazoe e per costrure la curva d Lorez. Tuttava è possble calcolare tal dc e costrure tale grafco co alcue procedure. La cocetrazoe può essere
La volatilità storica, le misure di rischio asimmetrico e la tracking error volatility
Ecooma degl termedar fazar Lors Nadott, Claudo Porzo, Daele Prevat Copyrght 00 The McGraw-Hll Compaes srl Approfodmeto 4.3w La msurazoe del rscho (a cura d Atoo Meles Uverstà Partheope) La volatltà storca,
STUDIO DEL LANCIO DI 3 DADI
Leoardo Latella STUDIO DEL LANCIO DI 3 DADI Il calcolo delle probabilità studia gli eveti casuali probabili, cioè quegli eveti che possoo o o possoo verificarsi e che dipedoo uicamete dal caso. Tale studio
Lezione 1. I numeri complessi
Lezoe Prerequst: Numer real: assom ed operazo. Pao cartesao. Fuzo trgoometrche. I umer compless Nell'attuale teora de umer compless cofluscoo due fodametal dee, ua artmetca, l'altra geometrca. La prma,
Attualizzazione. Attualizzazione
Attualzzazoe Il problema erso alla captalzzazoe prede l ome d attualzzazoe Abbamo ua operazoe fazara elemetare e dato l motate M dobbamo determare l corrspodete captale zale C L'attualzzazoe è la operazoe
2014-2015 Corso TFA - A048 Matematica applicata. Didattica della matematica applicata all economia e alla finanza
Uverstà degl Stud d Ferrara 2014-2015 Corso TFA - A048 Matematca applcata Ddattca della matematca applcata all ecooma e alla faza 11 marzo 2015 Apput d ddattca della Matematca fazara Redte, ammortamet
