Principali tecniche di regressione con R
|
|
- Gabriele Colella
- 8 anni fa
- Visualizzazioni
Transcript
1 Prncpal tecnche d regressone con R Versone settembre 2006 Vto Rcc vto_rcc@yahoo.com E garantto l permesso d copare, dstrbure e/o modfcare questo documento seguendo termn della Lcenza per Documentazone Lbera GNU, Versone 1.1 o ogn versone successva pubblcata dalla Free Software Foundaton. La Lcenza per Documentazone Lbera GNU è consultable su Internet: orgnale n nglese: traduzone n talano: La creazone e la dstrbuzone d cope fedel d questo artcolo è concessa a patto che la nota d copyrght e questo permesso stesso vengano dstrbut con ogn copa. Cope modfcate d questo artcolo possono essere copate e dstrbute alle stesse condzon delle cope fedel, a patto che l lavoro rsultante venga dstrbuto con la medesma concessone. Copyrght (R) 2006 Vto Rcc 1
2 Indce 1.0 Premessa 2.0 Introduzone 3.0 Il modello lneare 3.1 Rcham 3.2 Stma de parametr del modello 3.3 Test d specfcazone 3.4 Intervall d confdenza per coeffcent d regressone 3.5 Verfca d potes 3.6 Intervall d confdenza per valor stmat della varable rsposta e ntervall d prevsone 3.7 Selezone delle varabl e aggornamento del modello d regressone 3.8 Confronto tra modell 3.9 Dagnostca Rcham d teora Anals grafca de resdu Outler, leverage, nfluence 3.10 Trasformazon d varabl Trasformazon della varable rsposta Trasformazon delle varabl esplcatve 3.11 Regressone polnomale 3.12 Segmented regresson 3.13 Dummy varables 3.14 Correlazone parzale 3.15 Splnes regresson 3.16 Stma smultanea d pù modell d regressone 4.0 Multcollnertà, prncpal component regresson (PCR) e rdge regresson 5.0 Autocorrelazone de resdu e stme GLS 6.0 Eteroschedastctà e stme WLS 7.0 Structural Equaton Models (SEM) 8.0 Regressone non lneare e non lnear least squares (NLS) 9.0 Regressone ortogonale 10.0 Regressone robusta 11.0 Regressone quantlca 12.0 Regressone non parametrca 13.0 Anals della sopravvvenza e regressone d Cox 14.0 Regressone Tobt 15.0 Modell lnear generalzzat (Generalzed Lnear Models GLM) 15.1 Regressone logstca e probt 15.2 Regressone d Posson 16.0 Modell multvel (mxed effect models) 17.0 Generalzed Addtve Models (GAM) 18.0 Concluson Rferment 2
3 1.0 Premessa L anals della regressone, nelle sue vare e multform sfaccettature, è una delle tecnche statstche maggormente utlzzate. Il presente lavoro, senza avere alcuna pretesa d esaustvtà, vuole fornre una trattazone soprattutto pratca d questa metodologa, anche se alcun rferment e accenn alla teora non mancheranno, attraverso l mpego del software statstco R 1. S cercheranno d affrontare le prncpal tpologe d regresson (pareccha attenzone verrà data alla regressone lneare multpla), metod d stma (OLS, GLS, WLS, TSLS), la dagnostca, la verfca de requst per l applcazone del modello. S affronterà la generalzzazone del modello lneare (GLM, generalzed lnear model) per la trattazone d varabl dcotomche e d conteggo (regressone logstca e regressone d Posson), così come la regressone non lneare, la regressone robusta (resstant e robust regresson), la rdge reggreson, la regressone quantlca (quantle regresson), modell lnear con effett mst (lnear mxed effects model), la regressone d Cox, la regressone Tobt. Verranno presentat degl esemp concret con la trattazone de comand e de packages d R utl a rsolvere problem d calcolo relatv alle vare tecnche rchamate n precedenza. A fn della comprensone del presente lavoro s rchede la conoscenza d tecnche statstche abbastanza avanzate e una buona padronanza e conoscenza del software R. 2.0 Introduzone L anals della regressone è usata per spegare la relazone esstente tra una varable Y (contnua) detta varable rsposta, oppure output o varable dpendente, e una o pù varabl dette covarate, varabl esplcatve, ndpendent, oppure repressor, predttor o varabl d nput (X 1, X 2, X k ). In termn d funzone abbamo: Y=f(X 1, X 2, X k )+ε che ndca l esstenza d un legame funzonale n meda tra la varable dpendente e regressor, rappresentato dalla componente f(x 1, X 2, X k ) e alla quale suole dare l nome d componente sstematca. A questa componente va ad aggungers un altra denomnata accdentale, casuale, erronea. Mentre la prma rappresenta la parte della varable rsposta spegata da predttor, la seconda componente rappresenta quella parte d varabltà della rsposta che non può rcondurs a fattor sstematc oppure faclmente ndvduabl, ma dovut al caso e, pù n generale, a cause dverse non prese n consderazone nel modello regressvo. Il legame funzonale teorcamente può essere d qualsas tpo, tuttava nella pratca s prefersce utlzzare una funzone d tpo lneare e pertanto s parla regressone lneare multpla o modello lneare che assume la seguente formulazone: Y β + β X β + ε = k X k ove β 0 è detto termne noto, mentre β 1,..., β k sono dett coeffcent d regressone e, nseme alla varanza dell errore, sono parametr del modello da stmare sulla base delle osservazon camponare. Dvers modell, n apparenza non lnear, possono essere lnearzzat tramte opportune trasformazon d varabl. Ad esempo, l modello moltplcatvo: β1 Y = β X βk X k può essere faclmente trasformato nel modello lneare prendendo logartm d ambo membr. S parla d regressone polnomale quando regressor nel modello fgurano non solo con grado par ad uno, ma anche con grado maggore. Tuttava l modello contnua a rmanere lneare ne parametr. Quello che segue è un modello d regressone parabolca con due sol regressor: ε Y = β β1x 1 + β12 X 1 + β13 X 1X 2 + β 2 X 2 β 21X 2 1 R Development Core Team (2006). R: A language and envronment for statstcal computng. R Foundaton for Statstcal Computng, Venna, Austra. ISBN , URL 3
4 che fgurano con l prmo e l secondo grado; s è preso n consderazone anche l fattore d nterazone tra le varabl esplcatve ( X X 1 2 ). S parla d regressone non lneare quando parametr rsultano comparre n forma dversa da quella lneare. Quando la varable rsposta non è d tpo contnuo s ha una generalzzazone del modello lneare (GLM) del quale c occuperemo d seguto che prende n esame l caso d rsposte d tpo dcotomco (regressone logstca) o d conteggo (regressone d Posson). 3.0 Il modello lneare 3.1 Rcham Nel modello d regressone lneare multpla la varable dpendente Y è spegata da k regressor 2. Per cascuna d queste varabl sono dsponbl n osservazon: y 1 = β 0 + β1x βk x1k + ε1 y = β + β x β x + ε y n = β + β x β x + ε 0 1 n1 k k k nk n Se utlzzamo la forma matrcale: β0 y1 ε1 β 1 y =... β = ε = y n β ε n k X 1 x =... 1 x 11 n1... x 1k... x nk l modello lneare può esprmers compattamente: y = Xβ + ε D solto s fanno delle potes d base relatvamente agl error (ε) che sntetzzamo d seguto: 2 ε ~ Nn (0, σ ) E ( ε) = 0 E( εε ') = σ 2 I n ossa la dstrbuzone degl error è d tpo normale multvarata, con meda nulla e varanza costante (omoscedastctà); noltre gl error sono ncorrelat a due a due. Queste potes vanno opportunamente verfcate tramte test statstc (test d specfcazone del modello). Da queste potes derva che: E( y) = Xβ Cov( y) = σ 2 I n Per la stma de parametr s scegle l metodo de mnm quadrat (OLS, Ordnary Least Squares) mnmzzando la somma de quadrat degl error: ε' ε = ( y Xβ )'( y Xβ ) 2 S veda F. DEL VECCHIO, Anals statstca d dat multdmensonal, 1992, pag. 167 e segg. e A.POLLICE, Dspense d statstca multvarata, 2005, cap. 4, pag. 41 e segg. 4
5 da cu s rcava: ˆ 1 b = β = ( X ' X ) X ' y che è uno stmatore BLUE (best, lnear, umbased, estmator) d β. Sntetcamente s rportano altr rsultat utl a fn della nostra trattazone: 2 1 V ( b) = σ ( X ' X ) (matrce delle varanze e covaranze degl stmator) H = X ( X ' X ) 1 X ' (matrce d proezone) e = ( In H ) y (resdu) n n ) 1 2 RSS = e' e = = e = y'( I H y (devanza resdua) 2 ˆ σ = RSS n k (stma della varanza dell errore) n 2 = ( y y)'( y y) = ( y ) = 1 (devanza della varable rsposta) Dev( Y ) y 2 R = 1 RSS Dev( Y ) (ndce d determnazone) 2 RSS /( n k) R adj = 1 (ndce d determnazone aggustato) Dev( Y ) /( n 1) y ˆ = Hy (valor stmato con l modello) 3.2 Stma de parametr del modello Fatta questa necessara premessa d alcun rchamat teorc, la stma de parametr d un modello d regressone multpla con l software R avvene con l comando lm() 3 : lm(formula, data, subset, weghts, na.acton,method = "qr", model = TRUE, x = FALSE, y = FALSE, qr = TRUE, sngular.ok = TRUE, contrasts = NULL, offset,...) nella quale prncpal argoment sono formula che rappresenta la descrzone smbolca del modello da stmare e data che ndca l nome del dataframe opzonale nel quale sono present le varabl che fgurano nel modello. Per spegare l argomento formula supponamo che y è una varable numerca rsposta e x 1, x 2,...x n sono repressor. Le seguent formule specfcano alcun modell statstc mettendo n relazone la rsposta (nella parte snstra) con le varabl esplcatve (nella parte destra): y~x 1 +x x n y~1+x 1 +x x n entramb ndcano un modello d regressone lneare multpla d y su x 1, x 2,...x n ; l prmo ha l termne noto (ntercetta) mplcto, nel secondo, nvece, questo è esplctato; y~0+x 1 +x x n y~-1+x 1 +x x n y~x 1 +x x n -1 modello d regressone lneare multpla d y su x 1, x 2,...x n con termne noto (ntercetta) uguale a zero; log(y)~x 1 +x x n regressone lneare multpla della trasformata logartmca d y su x 1, x 2,...x n ; y~poly(x 1,2) 3 S può segure anche la va del calcolo matrcale e per questa soluzone s rnva a J. J. FARAWAY, Practcal Regresson and Anova usng R, 2002, pag. 23 e segg. 5
6 y~1 + x 1 + I(x 1^2) regressone polnomale d secondo grado; con l espressone poly(x,n)s possono stmare regresson polnomal d grado n; y~i(1/x 1 ) modello d regressone d y sul recproco d x 1 ; pù n generale nell operatore I()s può specfcare una qualsas trasformata delle varabl dpendent. y~x 1 +x x n + x 1 :x 2 modello d regressone lneare multpla d y su x 1, x 2,...x n che tene conto anche del termne d nterazone tra x 1 e x 2 ; y~x 1 *x 2 *...*x n modello d regressone lneare multpla completo d y su x 1, x 2,...x n che tene conto d tutte le possbl nterazon tra regressor; Oltre a regressor d tpo quanttatvo, s possono ntrodurre anche varabl esplcatve d tpo qualtatvo (fattor) e possono effettuars anals della varanza (ANOVA) e della covaranza (ANCOVA). Come applcazone utlzzamo l seguente esempo: mortalta mortal Calore HS popphys popnurs Afghanstan Algera Zamba Zmbabwe nel quale s vuole studare l legame tra la varable rsposta mortal ed alcune varabl esplcatve. stmamo l modello lneare con lm() fm<-lm(mortal~ Calore+ HS+ popphys+ popnurs, data=mortalta) e vsualzzamo l rsultato della regressone multpla con summary(): summary(fm) Call: lm(formula = mortal ~ Calore + HS + popphys + popnurs, data = mortalta) Resduals: Mn 1Q Medan 3Q Max Coeffcents: Estmate Std. Error t value Pr(> t ) (Intercept) 1.891e e e-15 *** Calore e e ** HS e e e-07 *** popphys 6.022e e ** popnurs 1.293e e * --- Sgnf. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 6
7 Resdual standard error: on 94 degrees of freedom Multple R-Squared: , Adjusted R-squared: F-statstc: on 4 and 94 DF, p-value: < 2.2e-16 per ottenere la lsta degl attrbut dell oggetto: attrbutes(fm) $names [1] "coeffcents" "resduals" "effects" "rank" [5] "ftted.values" "assgn" "qr" "df.resdual" [9] "xlevels" "call" "terms" "model" $class [1] "lm" Dall oggetto d classe lm, che abbamo chamato fm (che sta per ftted model), contente prncpal rsultat della regressone stmata (coeffcent e standard error, test t e p-value, R 2, test F e p-value) possamo estrarre sngol valor avvalendoc d alcune funzon: coef(fm) ## vettore de coeffcent d regressone fm$coef ## stesso rsultato (Intercept) Calore HS popphys popnurs devance(fm) ## devanza de resdu [1] formula(fm) ## formula del modello mortal ~ Calore + HS + popphys + popnurs plot(fm) ## tracca quattro grafc utl per la dagnostca resduals(fm) ## vettore de resdu del modello fm$resduals ## ftted(fm)## valor della rsposta stmat dal modello fm$ftted ## stesso rsultato X<-model.matrx(fm) ## matrce X del modello d regressone X (Intercept) Calore HS popphys popnurs Afghanstan Algera Yugoslava Zamba Zmbabwe attr(,"assgn") [1] summary(fm, correlaton=t)$correlaton ## correlazon tra coeffcent d regressone (Intercept) Calore HS popphys popnurs (Intercept) Calore
8 HS popphys popnurs vcov(fm)## matrce delle varanze e covaranze de coeffcent d regressone (Intercept) Calore HS popphys (Intercept) e e e-03 Calore e e e-07 HS e e e-06 popphys e e e-08 popnurs e e e-08 popnurs (Intercept) e-03 Calore e-08 HS e-05 popphys e-08 popnurs e-07 La maggor parte d quest comand o metod è applcable, come vedremo d seguto, anche ad oggett d altre class ottenut come stma d modell d regressone dvers da quella lneare (GLM, regressone quantlca, PLS, etc.). 3.3 Test d specfcazone Dopo aver stmato l modello d regressone è necessaro verfcare che sano valde le potes d base che abbamo esposto n precedenza tramte opportun test statstc. In prmo luogo verfchamo che la meda degl error non sa sgnfcatvamente dversa da zero attuando l test t d Student: resdu<-resduals(fm) ##vettore de resdu t.test(resdu) One Sample t-test data: resdu t = 0, df = 98, p-value = 1 alternatve hypothess: true mean s not equal to 0 95 percent confdence nterval: sample estmates: mean of x e-16 Successvamente verfchamo la normaltà della dstrbuzone degl error con l test d Shapro-Wlk 4 : shapro<-shapro.test(resdu) shapro Shapro-Wlk normalty test 4 Per ulteror test d normaltà s veda l package nortest: e V. RICCI, Rappresentazone analtca delle dstrbuzon statstche, 2005, pagg
9 data: resdu W = , p-value = grafcamente s può usare l QQ-plot con l comando qqnorm() applcato a resdu standardzzat: (Fg. 1): qqnorm(scale(resdu)) ablne(0,1) Proseguamo con l verfcare l omoschedastctà de resdu utlzzando l test d Breusch-Pagan e l assenza d correlazone serale tramte l test d Durbn-Watson. Entramb test sono largamente mpegat nelle anals econometrche. Occorre carcare l package lmtest 5 che contene comand bptest()e dwtest(): lbrary(lmtest) modello<-formula(fm)## memorzzamo la formula del modello n un oggetto per facltà d manpolazone testbp<-bptest(modello,data=mortalta) )## test d Breusch-Pagan testbp studentzed Breusch-Pagan test data: modello BP = , df = 4, p-value = dw<-dwtest(modello,data=mortalta) ## test d Durbn-Watson dw Durbn-Watson test data: modello DW = , p-value = alternatve hypothess: true autocorrelaton s greater than 0 come s può vedere per effettuare due test è necessaro specfcare la formula del modello d regressone e l dataframe n cu sono content dat. Tutt test d specfcazone del modello hanno dato esto postvo, possamo affermare che le potes alla base del modello d regressone OLS sono valde. Se anche uno solo de test dà esto negatvo (non normaltà de resdu, eteroschedastctà, correlazone serale) l metodo d stma OLS non va pù bene e bsogna optare per altre soluzon che affronteremo ne prossm paragraf
10 Fg. 1 QQ-plot de resdu standardzzat 3.4 Intervall d confdenza per coeffcent d regressone Per costrure degl ntervall d confdenza s utlzza l comando confnt(): occorre specfcare come argoment l oggetto d classe lm che contene l modello d regressone stmato e l lvello d confdenza (per default vengono fornt gl ntervall con confdenza par al 95%). confnt(fm) ## ntervall d confdenza al 95% 2.5 % 97.5 % (Intercept) e e+02 Calore e e-02 HS e e-01 popphys e e-04 popnurs e e-03 confnt(fm, level=0.99) ## ntervall d confdenza al 99% 0.5 % 99.5 % (Intercept) e Calore e HS e popphys e popnurs e
11 3.5 Verfca d potes La verfca dell potes che coeffcent d regressone sano sgnfcatvamente dvers da zero, ovvero che essta una relazone lneare tra la varable rsposta e l repressore dovuta a fattor sstematc e non casual, è ottenuta nel momento che vene stmato l modello e s manda n stampa la sntes. Infatt: summary(fm) Call: lm(formula = mortal ~ Calore + HS + popphys + popnurs, data = mortalta) Resduals: Mn 1Q Medan 3Q Max Coeffcents: Estmate Std. Error t value Pr(> t ) (Intercept) 1.891e e e-15 *** Calore e e ** HS e e e-07 *** popphys 6.022e e ** popnurs 1.293e e * --- Sgnf. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Resdual standard error: on 94 degrees of freedom Multple R-Squared: , Adjusted R-squared: F-statstc: on 4 and 94 DF, p-value: < 2.2e-16 ˆ β Per cascun coeffcente d regressone vene fornto l valore del test d Student t = (sotto l potes se( ˆ β ) β=0), l relatvo p-value e l grado d sgnfcatvtà espresso dal numero degl astersch. Analogo rsultato s ottene con l comando coeftest() del package lmtest: lbrary(lmtest) coeftest(fm) t test of coeffcents of "lm" object 'fm': Estmate Std. Error t value Pr(> t ) (Intercept) e e e-15 *** Calore e e ** HS e e e-07 *** popphys e e ** popnurs e e * --- Sgnf. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 2 R n Della regressone stmata vene fornta la statstca F =, grad d lbertà e relatvo p- 2 (1 R ) ( n k 1) value che esprmono una valutazone della sgnfcatvtà complessva del modello d regressone. Se voglamo effettuare la verfca d potes generca su coeffcent d regressone abbamo: H : β = β H 0 1 : β β
12 ˆ β β0 con l relatvo test t = se( ˆ β ) b<-coef(fm)[2:5]## vettore delle stme de coeff. d regressone b Calore HS popphys popnurs b0<-c(0.03, -1.30, 0.01, 0.01) ## vettore beta potes nulla b0 [1] sdb<-summary(fm)$coeffcents[,2] ## vettore standard error delle stme de coeff. d regressone sdb (Intercept) Calore HS popphys popnurs e e e e e-04 tstat<-(b-b0)/sdb[2:5] ## vettore test t tstat Calore HS popphys popnurs pval<-2*pt(tstat, 94) ## vettore de p-value pval Calore HS popphys popnurs e e e e-26 Per verfche d potes su restrzon lnear 6 d coeffcent d regressone s può usare l comando lnear.hypothess()contenuto nel package car 7 : lbrary(car) a<-c(1,-1,0,0,1) lnear.hypothess(fm, hypothess.matrx=matrx(a,1,5),rsh=1) Lnear hypothess test Model 1: mortal ~ Calore + HS + popphys + popnurs Model 2: restrcted model Res.Df RSS Df Sum of Sq F Pr(>F) e-15 *** --- Sgnf. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' Intervall d confdenza per valor stmat della varable rsposta e ntervall d prevsone Per ottenere degl ntervall d confdenza per valor stmat della varable dpendente oppure degl ntervall d prevsone s può usare l comando predct() specfcando l oggetto d classe lm e come argoment prncpal l tpo d ntervallo (nterval = "confdence" oppure "predcton")e l lvello d confdenza (level = 0.95 per default). Se s voglono ottenere degl ntervall d prevson per nuove osservazon delle varabl dpendent (non compres ne dat usat per la stma de coeffcent d 6 S veda, L. SERLENGA, Dspense d econometra, a.a , pag. 3 e segg
13 regressone) occorre anche specfcare l nuovo dataframe (argomento newdata) che contene queste nuove osservazon. Nel caso d ntervall d confdenza abbamo la seguente formula per l ntervallo: yˆ ˆ 1 0 ± tα 2; n kσ x0'( X ' X ) x 0 conf<-predct(fm, level=0.99, nterval="confdence") conf ft lwr upr per cascuna osservazone stmata della varable dpendente abbamo l estremo nferore (lwr) e quello superore (upr) dell ntervallo d confdenza. Il dataframe newdat contene una nuova osservazone con tutte le varabl dpendent newdata Country Calore HS popphys popnurs 1 Pakstan per ottenere l ntervallo d prevsone ( yˆ 0 ± t ˆ α 2; n kσ 1+ x0'( X ' X ) x0 ) abbamo: pred<-predct(fm, newdata=newdata, nterval="predcton") pred ft lwr upr [1,] Selezone delle varabl e aggornamento del modello d regressone Uno de problem che spesso lo statstco deve affrontare quando effettua l anals della regressone è quello della scelta de regressor 8 da nserre nel modello per descrvere l fenomeno oggetto d studo. S tratta d un problema abbastanza delcato n quanto bsognerebbe ncludere nel modello solo quelle varabl esplcatve la cu varazone apporta un contrbuto reale alla varazone della varable rsposta. In genere ncrementando l numero de regressor nsert nel modello la devanza de resdu tende ad dmnure. Dobbamo anche consderare che alcune varabl esplcatve potrebbero rsultare statstcamente sgnfcatve, e qund venre ncluse nel modello, uncamente per fattor dovut al caso. Vceversa varabl esplcatve logcamente fondamental potrebbero rsultare statstcamente non sgnfcatve ed essere così escluse dal modello. D conseguenza, appare charo come sa dffcle gungere ad un modello ottmo n generale. È pù opportuno consderare un certo numero d modell all ncrca ugualmente sgnfcatv dal punto d vsta statstco: tra quest l rcercatore può sceglere quello che rtene pù doneo, anche sulla base d consderazon legate all nterpretazone del fenomeno oggetto d anals. La stratega complessva della scelta d varabl s può artcolare nelle seguent fas: decdere qual sono le varabl che costtuscono l nseme pù ampo de k repressor; trovare uno o pù sottonsem d varabl (p) che spegano bene la varable d rsposta; applcare una regola d arresto per decdere quante varabl esplcatve utlzzare; stmare coeffcent d regressone saggare la bontà del modello ottenuto. 8 S veda F. DEL VECCHIO, op. ct., pagg e A.POLLICE, op. ct., cap. 4, pagg
14 Il problema della scelta della regola d arresto vene rsolto con l ndce C p d Mallows -basato sull ndce d determnazone- oppure con l Akake Informaton Crteron (AIC) e l Bayes Informaton Crteron (BIC) - entramb basat su logartm delle verosmglanza: 9 RSS p C p = + 2 p n σˆ 2 AIC = nlog( RSS / n) + 2 p BIC = nlog( RSS / n) + p log n Tra gl algortm d scelta delle varabl abbamo: 1) Backward elmnaton: s parte consderando l modello che nclude tutte le varabl a dsposzone. S fssa un lvello d sgnfcatvtà. La varable con l coeffcente d regressone meno sgnfcatvo n base al test t vene elmnata, qund s calcolano d nuovo le stme de coeffcent delle varabl rmaste e s rpete l procedmento sno a quando non v sono pù covarate che rsultano non sgnfcatve al lvello prefssato. 2) Forward selecton: s parte con una sola covarata, quella con la maggore correlazone sgnfcatva (test t) con la varable rsposta. S fssa un lvello d sgnfcatvtà. La seconda varable da nserre è quella che presenta l coeffcente d correlazone parzale pù elevato e sgnfcatvo, s prosegue s nserendo una successva varable dpendente. Il procedmento ha fne quando l coeffcente d correlazone parzale dell ultma varable nserta non è pù sgnfcatva rspetto al lvello prefssato; l modello defntvo è quello ottenuto al penultmo passo. 3) Stepwse regresson: è una combnazone de due crter precedent. La selezone delle covarate da ncludere nel modello avvene come nella forward selecton. Aggungendo successvamente una nuova varable, coeffcent d regressone delle varabl gà ncluse potrebbero rsultare sngolarmente non sgnfcatv a causa della forte correlazone con la nuova varable. Pertanto dopo l nsermento d cascuna varable l modello vene rconsderato per verfcare se v è qualche varable da elmnare (come nella backward elmnaton). Illustramo ora come procedere nella scelta delle varabl nell ambente R ntroducendo un nuovo esempo nel quale s pone n relazone l lvello d nqunamento (CO2) n 116 paes con alcune varabl come l utlzzo d energa, le esportazon, l reddto pro capte, l tasso d crescta del PIL e quello della popolazone. Fssamo l lvello d sgnfcatva d arresto a I dat sono contenut nel dataframe nqunamento. nqunamento CO2 energy export GDPgrowth popgrowth GNI Albana Algera Angola Vetnam Yemen, Rep Zamba Nella scelta delle varabl usamo prma la procedura della backward elmnaton, stmando da prncpo l modello con tutt repressor: fm<-lm(formula = CO2 ~ energy + export + GDPgrowth + popgrowth + GNI, data = nqunamento) summary(fm) 9 S veda J. J. FARAWAY, op. ct., par
15 Call: lm(formula = CO2 ~ energy + export + GDPgrowth + popgrowth + GNI, data = nqunamento) Resduals: Mn 1Q Medan 3Q Max Coeffcents: Estmate Std. Error t value Pr(> t ) (Intercept) e e energy 2.263e e <2e-16 *** export 1.881e e GDPgrowth 1.197e e popgrowth e e GNI e e * --- Sgnf. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Resdual standard error: on 110 degrees of freedom Multple R-Squared: , Adjusted R-squared: F-statstc: on 5 and 110 DF, p-value: < 2.2e-16 La varable meno sgnfcatva rsulta GDPgrowth e qund la elmnamo aggornando l modello con l comando update(): fm1<-update(fm,. ~.-GDPgrowth) summary(fm1) Call: lm(formula = CO2 ~ energy + export + popgrowth + GNI, data = nqunamento) Resduals: Mn 1Q Medan 3Q Max Coeffcents: Estmate Std. Error t value Pr(> t ) (Intercept) e e energy 2.265e e <2e-16 *** export 1.936e e * popgrowth e e GNI e e * --- Sgnf. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Resdual standard error: on 111 degrees of freedom Multple R-Squared: , Adjusted R-squared: F-statstc: on 4 and 111 DF, p-value: < 2.2e-16 la varable meno sgnfcatva ora rsulta popgrowth e qund la elmnamo aggornando nuovamente l modello: fm2<-update(fm1,.~.-popgrowth) summary(fm2) 15
16 Call: lm(formula = CO2 ~ energy + export + GNI, data = nqunamento) Resduals: Mn 1Q Medan 3Q Max Coeffcents: Estmate Std. Error t value Pr(> t ) (Intercept) e e energy 2.266e e <2e-16 *** export 1.945e e * GNI e e * --- Sgnf. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Resdual standard error: on 112 degrees of freedom Multple R-Squared: , Adjusted R-squared: 0.8 F-statstc: on 3 and 112 DF, p-value: < 2.2e-16 A questo punto regressor rmast rsultano tutt sgnfcatvamente dvers da zero avendo un p-value nferore al lvello d sgnfcatvtà fssato. Il comando update() vene usato per aggornare e stmare nuovamente l modello. Volendo utlzzare crter basat su C p o su AIC s possono usare comand drop1() e add1() per elmnare o aggungere varabl, l comando step() e l comando leaps() presente nell omonmo package. drop1(fm, test="f") Sngle term deletons Model: CO2 ~ energy + export + GDPgrowth + popgrowth + GNI Df Sum of Sq RSS AIC F value Pr(F) <none> energy < 2e-16 *** export GDPgrowth popgrowth GNI * --- Sgnf. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Il comando step()consente d effettuare una stepwse regresson basata sul crtero AIC, nell argomento drecton s può ndcare se usare una procedura backward (drecton= backward ), forward (drecton= forward ), oppure entrambe (drecton= both ). backsel<-step(fm, drecton="backward") ## procedura backward Start: AIC= CO2 ~ energy + export + GDPgrowth + popgrowth + GNI Df Sum of Sq RSS AIC - GDPgrowth popgrowth <none> export
17 - GNI energy Step: AIC= CO2 ~ energy + export + popgrowth + GNI Df Sum of Sq RSS AIC - popgrowth <none> export GNI energy Step: AIC= CO2 ~ energy + export + GNI Df Sum of Sq RSS AIC <none> export GNI energy step(fm3, scope=formula(fm), drecton="forward") ## procedura forward ## nell argomento scope s è specfcato l modello con tutte le varabl Start: AIC= CO2 ~ energy Df Sum of Sq RSS AIC + GNI export <none> GDPgrowth popgrowth Step: AIC= CO2 ~ energy + GNI Df Sum of Sq RSS AIC + export <none> GDPgrowth popgrowth Step: AIC= CO2 ~ energy + GNI + export Df Sum of Sq RSS AIC <none> popgrowth GDPgrowth Call: lm(formula = CO2 ~ energy + GNI + export, data = nqunamento) Coeffcents: 17
18 (Intercept) energy GNI export e e e e-02 stepsel<-step(fm, drecton="both") ## procedura stepwse Start: AIC= CO2 ~ energy + export + GDPgrowth + popgrowth + GNI Df Sum of Sq RSS AIC - GDPgrowth popgrowth <none> export GNI energy Step: AIC= CO2 ~ energy + export + popgrowth + GNI Df Sum of Sq RSS AIC - popgrowth <none> GDPgrowth export GNI energy Step: AIC= CO2 ~ energy + export + GNI Df Sum of Sq RSS AIC <none> popgrowth GDPgrowth export GNI energy Il comando leaps()consente d ottenere l mglore subsest d regressor da usare nel modello prendendo n consderazone per la scelta delle varabl alcun algortm basat su C p, R 2 e adjusted R 2 : occorre sceglere l tpo d ndcatore nell argomento method=c("cp", "adjr2", "r2") e specfcare la varable dpendente (y) e la matrce de predttor (x). lbrary(leaps) ##carcamento package leaps y<-nqunamento$co2 x<-model.matrx(fm)[,-1] leapcp<-leaps(x,y, method="cp") lbrary(faraway)## carcamento package faraway Cpplot(leapcp) Osservando l Cpplot (Fg. 2) traccato con l comando omonmo compreso nel package faraway 10 s vede che l valore mnmo per l ndce d Mallow è n corrspondenza della combnazone d numer 125, corrspondente al subset d varabl dpendent (energy, export, GNI)
19 Fg. 2 Cp plot Analogamente s può procedere usando come ndcatore R 2 adjusted pervenendo al medesmo rsultato: leapadjr<-leaps(x,y, method="adjr") maxadjr(leapadjr,8) 1,2,5 1,2,4,5 1,2,3,5 1,2,3,4,5 1,5 1,3,5 1,2 1,4, Confronto tra modell Per confrontare due o pù modell d regressone che dfferscono per l numero d varabl esplcatve nserte s usa l comando anova()che mette n evdenza se le varabl n pù o n meno d un modello rspetto all altro apportano oppure no un contrbuto sgnfcatvo nello spegare la varable rsposta verfcato tramte l test F: anova(fm3,fm2) Analyss of Varance Table Model 1: CO2 ~ energy Model 2: CO2 ~ energy + export + GNI Res.Df RSS Df Sum of Sq F Pr(>F) ** --- Sgnf. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 anova(fm,fm2) Analyss of Varance Table 19
20 Model 1: CO2 ~ energy + export + GDPgrowth + popgrowth + GNI Model 2: CO2 ~ energy + export + GNI Res.Df RSS Df Sum of Sq F Pr(>F) Come s evnce faclmente nel prmo caso l aggunta delle due varabl apporta un contrbuto sgnfcatvo nello spegare la varable CO2, mentre non è così nel secondo esempo. Un altro uso del comando anova() è quello d verfcare de modell n sequenza, partendo da quello nullo (ossa senza repressor), e calcolando la devanza spegata da ogn varable agguntva. anova(fm) Analyss of Varance Table Response: CO2 Df Sum Sq Mean Sq F value Pr(>F) energy < 2e-16 *** export * GDPgrowth popgrowth GNI * Resduals Sgnf. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Smle ad anova()è l comando Anova() del package car che consente d effettuare anals della varanza d II e III tpo. 3.9 Dagnostca Occorre specfcare che la maggor parte de comand d R usat nella dagnostca possono essere applcat anche nel caso d modell lnear generalzzat. Rprendamo l esempo della regressone su dat della mortaltà ga esamnato n precedenza. Andremo ad effettuale la dagnostca della regressone su questo modello dopo aver fatto un anals grafca de resdu Rcham d teora Faccamo d seguto alcun rapd rcham d teora utl nel proseguo: e = ( I H ) y è l vettore de resdu, la matrce H è la matrce d proezone var( e) σ 2 = ( I H ) è la matrce delle varanze e covaranze de resdu, da cu: var( e σ 2 ) = (1 h ) dove h =H sono valor d leva (leverage) e sono gl element della dagonale prncpale d H; per valor d leva s ha che n =1 h = p (numero d parametr da stmare nel modello d regressone), da prendere n esame valor d leverage h 2 p / n, poché potenzalmente anomal; resdu standardzzat= resdu studentzzat= 2 ˆ ( ) ˆ σ e ( 1 h ) e ; (1 h ) h < 1, mentre sono n σ è la stma della varanza de resdu ottenuta elmnando dal dataset l.esma osservazone, mentre β( ) è la stma de coeffcent d regressone ottenuta escludendo l.esma osservazone; ˆ 20
21 resdu studentzzat jacknfe= ˆ σ ( ) e ; 1 h una delle msure utlzzata nell ndvduazone de punt nfluent è la dstanza d Cook: ( ˆ β ˆ β ˆ ˆ ( ) )'( X ' X )( β β( ) ) D = ; 2 p ˆ σ DFFITS = yˆ yˆ ˆ σ ( ) ( ) h ( ) ˆ ˆ 1 e dfbeta = β β( ) = X ( ) ( X ' X ) ( ) dove X () è la matrce de dat ne qual è stata soppressa 1 h l.esma osservazone Anals grafca de resdu Un anals prelmnare che può essere effettuata a fn della dagnostca è quella della verfca degl assunt d base del modello della regressone lneare 11 e coè: lneartà ( la funzone che lega la varable dpendente alle varabl ndpendent è lneare) normaltà ( la dstrbuzone de resdu è d tpo gaussano) omoscedastctà ( la varanza de resdu è costante) ndpendenza ( resdu sono tra loro ndpendent) utlzzando l metodo grafco. Per verfcare la lneartà occorre traccate l grafco de resdu (ordnata) verso valor prevst (ascssa) come n Fg. 3. I punt dovrebbero essere dstrbut n modo smmetrco ntorno ad una lnea orzzontale con ntercetta uguale a zero. Andament d tpo dverso ndcano la presenza d non lneartà. resdu<-fm$res yft<-ftted(fm) plot(yft, resdu, ylab="resdu", xlab="ftted", man="resdu vs ftted") ablne(h=0) Traccando l grafco de resdu (ordnata) verso cascun regressor (ascssa) s può verfcare se è adatta la relazone lneare tra la varable rsposta e cascuna varable esplcatva (Fg. 4). La dsposzone de resdu dovrebbe essere casuale. par(mfrow=c(2,2), mar=c(4,4,1,1)) for ( n 2:5) plot(mortalta[,],resdu,xlab=names(mortalta)[]) Come s può vedere dal Fg. 4, la lneartà sembra non andare bene per la relazone con le varabl popnur e popphys. Traccamo l plot tra questa varabl prese sngolarmente e la varable rsposta (Fg. 5) per averne conferma: par(mfcol=c(1,2)) for ( n 4:5) plot(mortalta[,], mortalta$mortal, xlab=names(mortalta)[], ylab= mortal ) Pù n generale usamo l comando pars()per traccare l plot tra tutte le varabl present nel dataframe (Fg. 5/bs): pars(mortalta) 11 R. MICCIOLO, Dspense d Econometra ed applcazon a servz santar,
22 Per verfcare la normaltà s rcorre al QQ-plot de resdu standardzzat (Fg. 6), noltre è opportuno verfcare la normaltà anche con un test statstco approprato (s veda l paragrafo 3.3). Se gl error seguono una dstrbuzone gaussana, punt del grafco dovrebbero concentrars ntorno ad una retta a 45 : qqnorm(scale(resdu)) ablne(0,1) Fg. 3 22
23 Fg. 4 Fg. 5 23
24 Fg. 5/bs Per verfcare l omoscedastctà occorre traccare l grafco de resdu n valore assoluto (ordnata) verso valor stmat con l modello: la dspersone vertcale dovrebbe essere approssmatvamente costante (Fg. 7). Anche n questo caso è opportuno rcorre ad un test statstco per verfcare l omoscedastctà (s veda l paragrafo 3.3). plot(yft, abs(resdu), ylab="resdu", xlab="ftted", man="resdu n valore assoluto vs ftted") Un altro metodo per verfcare l omoscedastctà consste nello stmare un modello regressvo con valor assolut de resdu come varable dpendente e valor prevst come varable ndpendente; se v è omoscedastctà la pendenza della retta dovrebbe essere uguale a zero. Infatt abbamo: g<-lm(abs(resdu)~ yft) summary(g) Call: lm(formula = abs(resdu) ~ yft) Resduals: Mn 1Q Medan 3Q Max Coeffcents: 24
25 Estmate Std. Error t value Pr(> t ) (Intercept) e-06 *** yft Sgnf. codes: 0 '***' '**' 0.01 '*' 0.05 '.' 0.1 ' ' 1 Resdual standard error: on 97 degrees of freedom Multple R-Squared: , Adjusted R-squared: F-statstc: on 1 and 97 DF, p-value: Fg. 6 Anche questa prova conferma la costanza della varabltà de resdu. Per verfcare l assenza d correlazone serale, oltre al test d Durbn-Watson (paragrafo 3.3) s può traccare l grafco de resdu (ordnata) verso resdu precedent (ascssa) che non dovrebbe rvelare alcun pattern evdente (Fg. 8): n<-length(resdu) plot(resdu[-n], resdu[-1]) 25
26 Fg Outler, leverage, nfluence Un outler è un punto che non è ben nterpolato dal modello stmato. Se l resduo jacknfe assocato al punto è grande, allora l punto è un outler. L.esmo resduo jacknfe dovrebbe segure una dstrbuzone t d Student con ( n - p - 1) grad d lbertà. Calcolamo resdu standardzzat, quell studentzzat e quell jacknfe: rstand<-rstandard(fm) rstand<-rstandard(fm)## resdu standardzzat rstand Afghanstan Algera Angola Yugoslava Zamba Zmbabwe traccamo l grafco de resdu standardzzat (Fg. 9): plot(rstand, man="resdu standardzzat") ablne(h=2) ablne(h=-2) 26
27 country<-names(rjack) Fg. 8 Fg. 9 27
28 mettamo n evdenza valor de resdu standardzzat estern alla band confdenza della dstrbuzone normale standardzzat al 95% (-2, 2) che possono rteners anomal: rstand[abs(rstand)>2] Botswana Hong Kong Madagascar Mongola Serra Leone Calcolamo resdu studentzzat jacknfe e l relatvo grafco (Fg. 10): rjack<-rstudent(fm) rjack Afghanstan Algera Angola Yugoslava Zamba Zmbabwe plot(rjack, man="resdu jacknfe") ablne(h=-2) ablne(h=2) country<-names(rjack) dentfy(1:length(rjack),rjack, country) Il commando dentfy()consente, clccando con l mouse sul grafco, d aggungere le etchette con l nome della nazone. Fg
29 Possamo calcolare l p-value (con la correzone d Bonferron) assocato ad ogn resduo jacknfe: n<-length(rjack) p<-fm$rank pv<- 2*pt(abs(rjack),n-p-1,lower.tal= F) Guardamo resdu jacknfe a cu è assocato un p-value nferore, per esempo, al 5%: rjack[pv<0.05] rjack[pv<0.05] Botswana Hong Kong Madagascar Mongola Rwanda Serra Leone sono resdu estern alla banda d confdenza e vanno consderat come valor outlers. Nel package car trovamo l comando outler.test()che consente d effettuare l test per ndvduare valor outler fornendo l Bonferron p-value per l valore outler pù estremo: lbrary(car) outler.test(fm) max rstudent = , degrees of freedom = 93, unadjusted p = , Bonferron p = Observaton: Mongola Talvolta, può essere utle rcorrere al partal resdual plot 12. Infatt, quando s stma un modello d regressone semplce, lo scatter plot tra la varable rsposta e la varable esplcatva fornsce una buona ndcazone crca la natura della relazone tra le due varabl. Quando, nvece, regressor sono pù d uno, la relazone tra un dato regressore e la varable rsposta può essere nfluenzata da restant regressor. Il partal resdual plot consente d mostrare la relazone tra una data varable esplcatva e la varable rsposta al netto dell nfluenza degl altr repressor del modello. In R s possono usare l comando cr.plots()del package car (Fgg. 11 e 12) oppure l comando prplot() del package faraway (Fg. 13): cr.plots(fm) Selezone: 2 Selezone:
30 Fg. 11 Fg
31 lbrary(faraway) prplot(fm, 3) Fg. 13 Una generalzzazone del Component+Resdual plot è l CERES plot che può essere ottenuto con l comando ceres.plot() dsponble nel package car, nell argomento varable va specfcato l repressore (Fg. 14): lbrary(car) ceres.plots(fm, varable="hs") 31
32 Fg. 14 Il package car mette a dsposzone anche l comando av.plot()che permette d traccare partal regresson plots (Fg. 15): av.plots(fm, varable="calore") Fg. 15 S veda anche l comando termplot() nel package stats. Gl element h sulla dagonale prncpale della matrce H (hat) s chamano leverages (punt d leva) Poché var( y ˆ ) = σ h è la precsone con cu l valore è stmato relatvamente a σ 2. Qund, valor pccol h 13 G. M. MARCHETTI, Dspense d Statstca 3, 2003, pagg
33 d h ndcano che lo stmatore d y è basato sul contrbuto d molte osservazon. Invece, valor grand d h ossa molto vcn a 1, mplcano che var( y ˆ ) (1 ) 2 y = h σ 0 e che ŷ tende a essere vcno a y e che ŷ è determnato n modo predomnante dalla sngola osservazone y che qund ha un effetto d leva mportante. Un punto con alto leverage ha un resduo con varanza pccola (coè la retta deve passare vcno a questo punto). Un punto con alto leverage è un punto dstante. Hoagln e Wesh suggerscono d segnalare come punt con un elevato effetto d leva que punt per cu h > 2p/n. Per calcolare punt d leverage n R possamo usare comand hat()e hatvalues(): lev<-hat(model.matrx(fm))## oppure lev<-hatvalues(fm) Traccamo l grafco degl hat values (Fg. 16): n<-length(lev) p<-sum(lev) plot(lev, man="punt d leva") ablne(h=2*p/n) dentfy(1: length(lev), lev, country) Fg. 16 hatvalues(fm) Afghanstan Algera Angola Argentna Australa Austra Yugoslava Zamba Zmbabwe
34 ottenamo punt leverage superor al valore sogla: lev[lev>2*p/n] Afghanstan Burkna Faso Chad Ethopa Japan Malaw Mongola Nger Rwanda Swtzerland Un altro strumento per la dagnostca è l partal leverage plots 14. Quando le varabl esplcatve sono pù d una, la relazone tra resdu e una varable esplcatva può essere nfluenzato per effetto degl altr regressor. Il partal leverage plots mette n evdenza queste relazon. Sull asse delle ascsse sono rappresentat resdu della regressone della.esma varable esplcatva su rmanent k-1 regressor; sull asse delle ordnate sono rappresentat resdu della regressone della varable rsposta su tutt regressor escludento l.esmo. Il partal leverage plots è usato per msurare l contrbuto della varable ndpendente al leverage d cascuna osservazone, msura, coè, come varano gl hat values quando s aggunge un regressore al modello (Graff. 17, 18 e 19) lbrary(car) leverage.plots(fm) 1: (Intercept) 2: Calore 3: HS 4: popphys 5: popnurs Selezone: Fg
35 Fg. 18 Fg.19 35
36 Un punto nfluente (nfluence) è un punto che, se rmosso, produce un notevole cambamento nella stma del modello. Un punto nfluente può o non può essere un outler e può o non può avere un leverage elevato, ma, n generale ha almeno una d queste due caratterstche. Msure d nfluence sono date da resdu jacknfe, da cambament nelle stme de coeffcent d regressone (Dfbetas) e della varanza resdua che s ottengono escludendo un punto dal stma e dalla dstanza d Cook. Per la dstanza d Cook possamo usare comand cooks.dstance() nel package stats oppure cookd() del package car: cook<-cooks.dstance(fm) lbrary(car) cookd(fm) cook... Afghanstan Algera Angola e e e-02 Argentna Australa Austra e e e-05 Yugoslava Zamba Zmbabwe e e e-03 Per ottenere l grafco delle dstanze d Cook d tutte le osservazon (Fg. 20): plot(cook, man="dstanza d Cook") dentfy(1:length(cook), cook, country) Fg. 20 Il comando nfluence.measures()fornsce delle msure d nfluence: dfbeta, dfft, covrato, dstanza d Cook e punt d leverage d tutte le osservazon, mentre summary(nf) resttusce le nformazon sulle osservazon potenzalmente punt d nfluenza: 36
37 nf<- nfluence.measures(fm) summary(nf) Potentally nfluental observatons of lm(formula = mortal ~ Calore + HS + popphys + popnurs, data = mortalta) : dfb.1_ dfb.calr dfb.hs dfb.ppph dfb.ppnr dfft cov.r cook.d Afghanstan _* Burkna Faso _* 0.00 Chad _* 0.00 Ethopa _* 0.02 Hong Kong _* 0.01 Japan _* 0.00 Madagascar _* 0.05 Malaw _* 0.01 Mongola _* _* 0.78_* 0.23 Nger _* 0.00 Rwanda _* Serra Leone _* 0.02 hat Afghanstan 0.20_* Burkna Faso 0.16_* Chad 0.16_* Ethopa 0.13 Hong Kong 0.02 Japan 0.15 Madagascar 0.03 Malaw 0.55_* Mongola 0.13 Nger 0.11 Rwanda 0.14 Serra Leone 0.02 L astersco ndca valor superor alle sogle a cu s fa d solto rfermento. nf2<-lm.nfluence(fm) attrbutes(nf2) $names [1] "hat" "coeffcents" "sgma" "wt.res" fornsce alcun ndcator utl per la dagnostca della regressone: hat: vettore de punt leverage (hat values) coeffcents: una matrce che nella rga.esma contene l cambamento nella stma de coeffcent che s ottene quando la.esma osservazone è esclusa dalla regressone sgma: vettore nel quale l.esmo elemento contene la stma della devazone standard de resdu ottenuta quando l.esma osservazone è esclusa dalla regressone wt.res: vettore d resdu ponderat nf2$coeffcents Afghanstan Algera Angola Argentna Afghanstan Algera Angola (Intercept) Calore HS popphys e e e e e e e e e e e e-07 popnurs e e e-05 37
38 Argentna... Yugoslava Zamba Zmbabwe Yugoslava Zamba Zmbabwe e e e e e e e e e e e e e-05 Analogo rsultato s ottene con l comando dfbeta() nf2$sgma... Afghanstan Algera Angola Argentna Australa Austra Yugoslava Zamba Zmbabwe plot(nf2$sgma, man="valor d sgma", ylab="sgma") dentfy(1:length(nf2$sgma), nf2$sgma, country) con questo grafco (Fg. 21) s mettono n evdenza le osservazon che nfluscono maggormente nella stma d della devazone standard de resdu. Fg. 21 La statstca Covrato msura la varazone nel determnante della matrce delle covaranze delle stme quando s elmna la.esma osservazone. COVRATIO = [( det ( 2-1 σˆ ()(X ' X ) ) )/( det ( σˆ () () 2 (X' X) -1 ) )] 38
39 Belsley, Kuh e Welsch 15 suggerscono d tenere sotto controllo le osservazon per le qual s verfca: 3p cov rato 1 n cvrat<-covrato(fm) cvrat Afghanstan Algera Angola Yugoslava Zamba Zmbabwe cvr<-abs(cvrat-1) cvr[cvr>=3*p/n] Burkna Faso Chad Ethopa Hong Kong Japan Madagascar Malaw Mongola Nger Serra Leone Anche Dffts è una msura d nfluence: osservazon con valor alt d dffts sono da consderars punt d nfluence; come valore sogla Belsley, Kuh e Welsch suggerscono 2 p / n DFFITS = yˆ yˆ ˆ σ ( ) ( ) dfts<-dffts(fm) dfts[dfts>2*sqrt(p/n)] h Afghanstan Madagascar Mongola Nel Fg. 22 sono rappresentat grafcamente dffts d tutte le osservazon con l ndcazone de valor superor alla sogla. plot(dfts, man="valor dffts") ablne(h=2*sqrt(p/n)) dentfy(1: length(dfts), dfts, country) 15 D. A. BELSLEY, E. KUH, R. E. WELSCH, Regresson Dagnostcs: Identfyng Influental Data and Sources of Collnearty,
Relazioni tra variabili: Correlazione e regressione lineare
Dott. Raffaele Casa - Dpartmento d Produzone Vegetale Modulo d Metodologa Spermentale Febbrao 003 Relazon tra varabl: Correlazone e regressone lneare Anals d relazon tra varabl 6 Produzone d granella (kg
DettagliRelazione funzionale e statistica tra due variabili Modello di regressione lineare semplice Stima puntuale dei coefficienti di regressione
1 La Regressone Lneare (Semplce) Relazone funzonale e statstca tra due varabl Modello d regressone lneare semplce Stma puntuale de coeffcent d regressone Decomposzone della varanza Coeffcente d determnazone
DettagliSTATISTICA DESCRITTIVA - SCHEDA N. 5 REGRESSIONE LINEARE
Matematca e statstca: da dat a modell alle scelte www.dma.unge/pls_statstca Responsabl scentfc M.P. Rogantn e E. Sasso (Dpartmento d Matematca Unverstà d Genova) STATISTICA DESCRITTIVA - SCHEDA N. REGRESSIONE
DettagliMinistero della Salute D.G. della programmazione sanitaria --- GLI ACC - L ANALISI DELLA VARIABILITÀ METODOLOGIA
Mnstero della Salute D.G. della programmazone santara --- GLI ACC - L ANALISI DELLA VARIABILITÀ METODOLOGIA La valutazone del coeffcente d varabltà dell mpatto economco consente d ndvduare gl ACC e DRG
DettagliLa regressione. La Regressione. La Regressione. min. min. Var X. X Variabile indipendente (data) Y Variabile dipendente
Unverstà d Macerata Facoltà d Scenze Poltche - Anno accademco - La Regressone Varable ndpendente (data) Varable dpendente Dpendenza funzonale (o determnstca): f ; Da un punto d vsta analtco, valor della
DettagliNOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA
NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA IL PROBLEMA Supponamo d voler studare l effetto d 4 dverse dete su un campone casuale d 4
DettagliRegressione Multipla e Regressione Logistica: concetti introduttivi ed esempi
Regressone Multpla e Regressone Logstca: concett ntroduttv ed esemp I Edzone ottobre 014 Vncenzo Paolo Senese vncenzopaolo.senese@unna.t Indce Note prelmnar alla I edzone 1 Regressone semplce e multpla
DettagliPROCEDURA INFORMATIZZATA PER LA COMPENSAZIONE DELLE RETI DI LIVELLAZIONE. (Metodo delle Osservazioni Indirette) - 1 -
PROCEDURA INFORMATIZZATA PER LA COMPENSAZIONE DELLE RETI DI LIVELLAZIONE (Metodo delle Osservazon Indrette) - - SPECIFICHE DI CALCOLO Procedura software per la compensazone d una rete d lvellazone collegata
DettagliLA COMPATIBILITA tra due misure:
LA COMPATIBILITA tra due msure: 0.4 Due msure, supposte affette da error casual, s dcono tra loro compatbl quando la loro dfferenza può essere rcondotta ad una pura fluttuazone statstca attorno al valore
DettagliMetodi e Modelli per l Ottimizzazione Combinatoria Progetto: Metodo di soluzione basato su generazione di colonne
Metod e Modell per l Ottmzzazone Combnatora Progetto: Metodo d soluzone basato su generazone d colonne Lug De Govann Vene presentato un modello alternatvo per l problema della turnazone delle farmace che
DettagliStatistica e calcolo delle Probabilità. Allievi INF
Statstca e calcolo delle Probabltà. Allev INF Proff. L. Ladell e G. Posta 06.09.10 I drtt d autore sono rservat. Ogn sfruttamento commercale non autorzzato sarà perseguto. Cognome e Nome: Matrcola: Docente:
DettagliTITOLO: L INCERTEZZA DI TARATURA DELLE MACCHINE PROVA MATERIALI (MPM)
Identfcazone: SIT/Tec-012/05 Revsone: 0 Data 2005-06-06 Pagna 1 d 7 Annotazon: Il presente documento fornsce comment e lnee guda sull applcazone della ISO 7500-1 COPIA CONTROLLATA N CONSEGNATA A: COPIA
DettagliREGRESSIONE LINEARE. È caratterizzata da semplicità: i modelli utilizzati sono basati essenzialmente su funzioni lineari
REGRESSIONE LINEARE Ha un obettvo mportante: nvestgare sulle relazon emprche tra varabl allo scopo d analzzare le cause che possono spegare un determnato fenomeno È caratterzzata da semplctà: modell utlzzat
DettagliIntroduzione al Machine Learning
Introduzone al Machne Learnng Note dal corso d Machne Learnng Corso d Laurea Magstrale n Informatca aa 2010-2011 Prof Gorgo Gambos Unverstà degl Stud d Roma Tor Vergata 2 Queste note dervano da una selezone
DettagliCapitolo 3 Covarianza, correlazione, bestfit lineari e non lineari
Captolo 3 Covaranza, correlazone, bestft lnear e non lnear ) Covaranza e correlazone Ad un problema s assoca spesso pù d una varable quanttatva (es.: d una persona possamo determnare peso e altezza, oppure
DettagliPIANIFICAZIONE DEI TRASPORTI
Unverstà d Caglar DICAAR Dpartmento d Ingegnera Cvle, Ambentale e archtettura Sezone Trasport PIANIFICAZIONE DEI TRASPORTI Eserctazone su modell d generazone A.A. 2016-2017 Ing. Francesco Pras Ing. Govann
Dettagli* * * Nota inerente il calcolo della concentrazione rappresentativa della sorgente. Aprile 2006 RL/SUO-TEC 166/2006 1
APAT Agenza per la Protezone dell Ambente e per Servz Tecnc Dpartmento Dfesa del Suolo / Servzo Geologco D Itala Servzo Tecnologe del sto e St Contamnat * * * Nota nerente l calcolo della concentrazone
DettagliNOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI
NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI METODI PER LO STUDIO DEL LEGAME TRA VARIABILI IN UN RAPPORTO DI CAUSA ED EFFETTO I MODELLI DI REGRESSIONE Prof.ssa G. Sero, Prof. P. Trerotol, Cattedra
DettagliLa verifica delle ipotesi
La verfca delle potes In molte crcostanze l rcercatore s trova a dover decdere quale, tra le dverse stuazon possbl rferbl alla popolazone, è quella meglo sostenuta dalle evdenze emprche. Ipotes statstca:
DettagliTECNICHE DI ANALISI DEI DATI MODELLI LINEARI
TECNICHE DI ANALISI DEI DATI AA 017/018 PROF. V.P. SENESE Quest materal sono dsponbl per tutt gl student al seguente ndrzzo: https://goo.gl/hxl9zg Unverstà della Campana Lug Vanvtell Dpartmento d Pscologa
DettagliTECNICHE DI ANALISI DEI DATI MODELLI LINEARI
TECNICHE DI ANALISI DEI DATI AA 16/17 PROF. V.P. SENESE Quest materal sono dsponbl per tutt gl student al seguente ndrzzo: https://goo.gl/rwabbd Seconda Unverstà d Napol (SUN) Dpartmento d Pscologa TECNICHE
DettagliStudio grafico-analitico di una funzioni reale in una variabile reale
Studo grafco-analtco d una funzon reale n una varable reale f : R R a = f ( ) n Sequenza de pass In pratca 1 Stablre l tpo d funzone da studare es. f ( ) Determnare l domno D (o campo d esstenza) della
DettagliSTATISTICA DESCRITTIVA CON EXCEL
STATISTICA DESCRITTIVA CON EXCEL Corso d CPS - II parte: Statstca Laurea n Informatca Sstem e Ret 2004-2005 1 Obettv della lezone Introduzone all uso d EXCEL Statstca descrttva Utlzzo dello strumento:
DettagliLezione 10. L equilibrio del mercato finanziario: la struttura dei tassi d interesse
Lezone 1. L equlbro del mercato fnanzaro: la struttura de tass d nteresse Ttol con scadenza dversa hanno prezz (e tass d nteresse) dfferent. Due ttol d durata dversa emess dallo stesso soggetto (stesso
DettagliCorrelazione lineare
Correlazone lneare Varable dpendente Mortaltà per crros 50 45 40 35 30 5 0 15 10 5 0 0 5 10 15 0 5 30 Consumo d alcool Varable ndpendente Metodologa per l anals de dat spermental L anals d stud con varabl
Dettaglia) Individuare l intervallo di confidenza al 90% per la media di popolazione;
Eserczo Il responsable marketng d una catena d negoz vuole analzzare l volume delle vendte mensl d un determnato bene d largo consumo. Una socetà che conduce rcerche d mercato è ncarcata d effettuare un
DettagliVariabili statistiche - Sommario
Varabl statstche - Sommaro Defnzon prelmnar Statstca descrttva Msure della tendenza centrale e della dspersone d un campone Introduzone La varable statstca rappresenta rsultat d un anals effettuata su
DettagliCapitolo 3. Cap. 3-1
Statstca Captolo 3 Descrzone Numerca de Dat Cap. 3-1 Obettv del Captolo Dopo aver completato l captolo, sarete n grado d: Calcolare ed nterpretare la meda, la medana e la moda d un set tdd dat Trovare
DettagliNorma UNI CEI ENV 13005: Guida all'espressione dell'incertezza di misura
orma UI CEI EV 3005: Guda all'espressone dell'ncertezza d msura L obettvo d una msurazone è quello d determnare l valore del msurando, n altre parole della grandezza da msurare. In generale, però, l rsultato
DettagliOltre la regressione lineare
Oltre la regressone lneare Modello d regressone lneare (semplce o multpla: - varabl esplcatve X quanttatve e qualtatve (nserte tramte uso d varabl dummy - varable dpendente Y è quanttatva Y = b + b X +
DettagliContenuti: o Specificazione del modello. o Ipotesi del modello classico. o Stima dei parametri. Regressione semplice Roberta Siciliano 2
Corso d STATISTICA Prof. Roberta Sclano Ordnaro d Statstca, Unverstà d Napol Federco II Professore supplente, Unverstà della Baslcata a.a. 0/0 Contenut: o Specfcazone del modello o Ipotes del modello classco
DettagliConcetti principale della lezione precedente
Corso d Statstca medca e applcata 6 a Lezone Dott.ssa Donatella Cocca Concett prncpale della lezone precedente I concett prncpal che sono stat presentat sono: I fenomen probablstc RR OR ROC-curve Varabl
DettagliCorso di. Dott.ssa Donatella Cocca
Corso d Statstca medca e applcata 3 a Lezone Dott.ssa Donatella Cocca Concett prncpale della lezone I concett prncpal che sono stat presentat sono: Mede forme o analtche (Meda artmetca semplce, Meda artmetca
DettagliStrutture deformabili torsionalmente: analisi in FaTA-E
Strutture deformabl torsonalmente: anals n FaTA-E Il comportamento dsspatvo deale è negatvamente nfluenzato nel caso d strutture deformabl torsonalmente. Nelle Norme Tecnche cò vene consderato rducendo
DettagliCampo di applicazione
Unverstà del Pemonte Orentale Corso d Laurea n Botecnologa Corso d Statstca Medca Correlazone Regressone Lneare Corso d laurea n botecnologa - Statstca Medca Correlazone e Regressone lneare semplce Campo
DettagliAnalisi ammortizzata. Illustriamo il metodo con due esempi. operazioni su di una pila Sia P una pila di interi con le solite operazioni:
Anals ammortzzata Anals ammortzzata S consdera l tempo rchesto per esegure, nel caso pessmo, una ntera sequenza d operazon. Se le operazon costose sono relatvamente meno frequent allora l costo rchesto
DettagliFisica Generale I Misure di grandezze fisiche e incertezze di misura Lezione 3 Facoltà di Ingegneria Livio Lanceri
Fsca Generale I Msure d grandezze fsche e ncertezze d msura Lezone 3 Facoltà d Ingegnera Lvo Lancer Indce Abbamo mparato: Orgne e classfcazone delle ncertezze (error) d msura Rappresentazone delle ncertezze
DettagliSTATISTICA SOCIALE Corso di laurea in Scienze Turistiche, a.a. 2007/2008 Esercizi 16 novembre2007
STATISTICA SOCIALE Corso d laurea n Scenze Turstche, a.a. 07/08 Esercz 6 novembre07 Eserczo La Tabella contene alcun dat relatv a 6 lavorator delle azende Alfa e Beta. Tabella Lavorator delle azende Alfa
DettagliMODELLI STOCASTICI DELLA CLASSE GLM
MODELLI STOCASTICI DELLA CLASSE GLM S possono consderare GLM con dstrbuzone specfcata o modell con quas-verosmglanza, quest ultm sono modell d tpo semparametrco. Illustramo l loro uso come: strumento d
DettagliAnalisi di mercurio in matrici solide mediante spettrometria di assorbimento atomico a vapori freddi
ESEMPIO N. Anals d mercuro n matrc solde medante spettrometra d assorbmento atomco a vapor fredd 0 Introduzone La determnazone del mercuro n matrc solde è effettuata medante trattamento termco del campone
DettagliFisica Generale I Misure di grandezze fisiche e incertezze di misura Lezione 3 Facoltà di Ingegneria Livio Lanceri
Fsca Generale I Msure d grandezze fsche e ncertezze d msura Lezone 3 Facoltà d Ingegnera Lvo Lancer Indce Abbamo mparato: Orgne e classfcazone delle ncertezze (error) d msura Rappresentazone delle ncertezze
DettagliMacchine. 5 Esercitazione 5
ESERCITAZIONE 5 Lavoro nterno d una turbomacchna. Il lavoro nterno massco d una turbomacchna può essere determnato not trangol d veloctà che s realzzano all'ngresso e all'uscta della macchna stessa. Infatt
DettagliTest delle ipotesi Parte 2
Test delle potes arte Test delle potes sulla dstrbuzone: Introduzone Test χ sulla dstrbuzone b Test χ sulla dstrbuzone: Eserczo Test delle potes sulla dstrbuzone Molte concluson tratte nell nferenza parametrca
DettagliPrincipi di ingegneria elettrica. Lezione 6 a. Analisi delle reti resistive
Prncp d ngegnera elettrca Lezone 6 a Anals delle ret resste Anals delle ret resste L anals d una rete elettrca (rsoluzone della rete) consste nel determnare tutte le corrent ncognte ne ram e tutt potenzal
DettagliLezioni di Statistica (25 marzo 2013) Docente: Massimo Cristallo
UNIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECONOMIA Corso d laurea n Economa Azendale Lezon d Statstca (25 marzo 2013) Docente: Massmo Crstallo QUARTILI Dvdono la dstrbuzone n quattro part d uguale
DettagliStatistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statstca - metodologe per le scenze economche e socal /e S Borra, A D Cacco - McGraw Hll Es Soluzone degl esercz del captolo 7 In base agl arrotondament effettuat ne calcol, s possono rscontrare pccole
DettagliUniversità degli Studi di Urbino Facoltà di Economia
Unverstà degl Stud d Urbno Facoltà d Economa Lezon d Statstca Descrttva svolte durante la prma parte del corso d corso d Statstca / Statstca I A.A. 004/05 a cura d: F. Bartolucc Lez. 8/0/04 Statstca descrttva
DettagliStatistica Descrittiva
Statstca Descrttva Corso d Davd Vettur Dat osservat Sano note le seguent msure dello spessore d una lastra d materale polmerco espresse n mllmetr 3.71 3.83 3.85 3.96 3.84 3.8 3.94 3.55 3.76 3.63 3.88 3.86
DettagliPREVEDONO: Capitolo 17 del libro di testo. Copyright 2005 The McGraw-Hill Companies srl
Le Inferenze sul modello d regressone PREVEDONO: Assunzone d normaltà degl error e nferenza su parametr Anals della Varanza Inferenza per la rsposta meda e la prevsone Anals de resdu Valor anomal Captolo
DettagliEsercitazioni del corso di Relazioni tra variabili. Giancarlo Manzi Facoltà di Sociologia Università degli Studi di Milano-Bicocca
Eserctazon del corso d Relazon tra varabl Gancarlo Manz Facoltà d Socologa Unverstà degl Stud d Mlano-Bcocca e-mal: gancarlo.manz@statstca.unmb.t Terza eserctazone Mlano, 8 febbrao 7 SOMMARIO TERZA ESERCITAZIONE
DettagliANALISI STATISTICA DELLE INCERTEZZE CASUALI
AALISI STATISTICA DELLE ICERTEZZE CASUALI Consderamo l caso della msura d una grandezza fsca che sa affetta da error casual. Per ottenere maggor nformazone sul valore vero della grandezza rpetamo pù volte
DettagliLeggere i dati da file
Esempo %soluzon d una equazone d secondo grado dsp('soluzon d a^+b+c') anput('damm l coeffcente a '); bnput('damm l coeffcente b '); cnput('damm l coeffcente c '); deltab^-4*a*c; f delta0 dsp('soluzon
DettagliAdattamento di una relazione funzionale ai dati sperimentali
Adattamento d una relazone 1 funzonale a dat spermental Sno ad ora abbamo vsto come può essere stmato, con un certo lvello d confdenza, l valore vero d una grandezza fsca (dretta o dervata) con l suo ntervallo
DettagliDipartimento di Statistica Università di Bologna. Matematica finanziaria aa 2012-2013 lezione 13: 24 aprile 2013
Dpartmento d Statstca Unverstà d Bologna Matematca fnanzara aa 2012-2013 lezone 13: 24 aprle 2013 professor Danele Rtell www.unbo.t/docent/danele.rtell 1/23? reammortamento uò accadere che, dopo l erogazone
DettagliSTATISTICA A K (63 ore) Marco Riani
STATISTICA A K (63 ore) Marco Ran mran@unpr.t http://www.ran.t Rcham sulla regressone MODELLO DI REGRESSIONE y a + b + e dove: 1,, n a + b rappresenta una retta: a ordnata all orgne ntercetta b coeff.
DettagliCAPITOLO 3 Incertezza di misura Pagina 26
CAPITOLO 3 Incertezza d msura Pagna 6 CAPITOLO 3 INCERTEZZA DI MISURA Le operazon d msurazone sono tutte nevtablmente affette da ncertezza e coè da un grado d ndetermnazone con l quale l processo d msurazone
Dettagli1) Le medie e le varianze calcolate su n osservazioni relative alle variabili quantitative X ed Y sono tali che. σ x
TEORIA 1) Le mede e le varanze calcolate su n osservazon relatve alle varabl quanttatve X ed Y sono tal che 1 e. Consderando le corrspondent varabl standardzzate delle seguent affermazon rsulta vera 1
DettagliS O L U Z I O N I. 1. Effettua uno studio qualitativo della funzione. con particolare riferimento ai seguenti aspetti:
S O L U Z I O N I 1 Effettua uno studo qualtatvo della funzone con partcolare rfermento a seguent aspett: f ( ) ln( ) a) trova l domno della funzone b) ndca qual sono gl ntervall n cu f() rsulta postva
DettagliLEZIONE 2 e 3. La teoria della selezione di portafoglio di Markowitz
LEZIONE e 3 La teora della selezone d portafoglo d Markowtz Unverstà degl Stud d Bergamo Premessa Unverstà degl Stud d Bergamo Premessa () È puttosto frequente osservare come gl nvesttor tendano a non
DettagliMACROECONOMIA A.A. 2014/2015
MACROECONOMIA A.A. 2014/2015 ESERCITAZIONE 2 MERCATO MONETARIO E MODELLO /LM ESERCIZIO 1 A) Un economa sta attraversando un perodo d profonda crs economca. Le banche decdono d aumentare la quota d depost
DettagliTrigger di Schmitt. e +V t
CORSO DI LABORATORIO DI OTTICA ED ELETTRONICA Scopo dell esperenza è valutare l ampezza dell steres d un trgger d Schmtt al varare della frequenza e dell ampezza del segnale d ngresso e confrontarla con
DettagliCapitolo 7. La «sintesi neoclassica» e il modello IS-LM. 2. La curva IS
Captolo 7 1. Il modello IS-LM La «sntes neoclassca» e l modello IS-LM Defnzone: ndvdua tutte le combnazon d reddto e saggo d nteresse per le qual l mercato de ben (curva IS) e l mercato della moneta (curva
DettagliRegression analysis. Statistica per la Ricerca Sociale Rocco Micciolo. Es. Table 9.1 Variabili quantitative Response variables Explanatory variables
Statstca per la Rcerca Socale Rocco Mccolo A. Agrest, B. Fnlay. Statstcal Methods for the Socal Scences, 4th edton, Pearson Prentce Hall, 009. Captol: 8 5 http://www.stat.ufl.edu/~aa/ http://www.economa.untn.t/mccolo/srs/srs.htm
DettagliPRIMA PROVA INTERMEDIA DI STATISTICA (COD /6045/5047/4038/371/377) 26 ottobre 2015 COMPITO D
FIRMA DELLO STUDENTE Cognome PRIMA PROVA INTERMEDIA DI STATISTICA (COD. 3000/6045/5047/4038/37/377) 26 ottobre 20 Nome Numero d matrcola Corso d Laurea Cod. corso COMPITO D A fn della valutazone s terrà
Dettaglimateriale didattico I incontro
Pano Nazonale Lauree Scentfche (PLS 2016-2017) Statstca Laboratoro d Statstca Le relazon tra varabl prof.ssa Angela Mara D'Uggento angelamara.duggento@unba.t materale ddattco I ncontro Dall anals statstca
DettagliDipartimento di Statistica Università di Bologna. Matematica Finanziaria aa 2012-2013 Esercitazione: 4 aprile 2013
Dpartmento d Statstca Unverstà d Bologna Matematca Fnanzara aa 2012-2013 Eserctazone: 4 aprle 2013 professor Danele Rtell www.unbo.t/docent/danele.rtell 1/41? Aula "Ranzan B" 255 post 1 2 3 4 5 6 7 8 9
DettagliLaboratorio 2B A.A. 2012/2013. Elaborazione Dati. Lab 2B CdL Fisica
Laboratoro B A.A. 01/013 Elaborazone Dat Lab B CdL Fsca Lab B CdL Fsca Elaborazone dat spermental Prncpo della massma verosmglanza Quando eseguamo una sere d msure relatve ad una data grandezza fsca, quanto
DettagliRegressioni con variabili strumentali
Regresson con varabl strumental 3 mportant mnacce alla valdtà nterna del modello: Bas dovuta alle varabl omesse, varabl correlate con X ma non osservate e che per questo non possono essere ncluse nella
DettagliL ANALISI MONOVARIATA: Variabilità e mutabilità. Prof. Maria Carella
L AALISI MOOVARIATA: Varabltà e mutabltà Prof. Mara Carella Varabltà Le msure d tendenza centrale non sono suffcent alla comprensone de fenomen. Una sntes approprata deve tener conto del modo n cu s dstrbuscono
DettagliSoluzione esercizi seconda settimana
Soluzone esercz seconda settmana Es. 7 famgle Spesa per manfestazo n cultural (Z) A 00,9 B 40 4,0 C 50,5 D 70,6 E 80, F 300,8 G 00,5 Reddto mensle del capofamgla (x 000 Euro) (Y) Costrure l dagramma d
DettagliMcGraw-Hill. Tutti i diritti riservati. Caso 11
Caso Copyrght 2005 The Companes srl Stma d un area fabbrcable n zona ndustrale nella cttà d Ferrara. La stma è effettuata con crter della comparazone e quello del valore d trasformazone. Indce Confermento
DettagliMetodi Quantitativi per Economia, Finanza e Management
Metod Quanttatv per Economa, Fnanza e Management Lezone n 10 Regressone Logstca: Le potes del modello, la stma del modello, l nterpretazone del del modello L mpostazone del problema Reddtvtà = rcav - cost
DettagliLA STATISTICA: OBIETTIVI; RACCOLTA DATI; LE FREQUENZE (EXCEL) ASSOLUTE E RELATIVE
Lezone 6 - La statstca: obettv; raccolta dat; le frequenze (EXCEL) assolute e relatve 1 LA STATISTICA: OBIETTIVI; RACCOLTA DATI; LE FREQUENZE (EXCEL) ASSOLUTE E RELATIVE GRUPPO MAT06 Dp. Matematca, Unverstà
DettagliStrada B. Classe Velocità valore frequenza Frequ. ass Frequ. % hi Freq. Cum
Eserczo SINTESI S supponga d avere eseguto 70 msure della veloctà stantanea de vecol che transtano nelle sezon d due strade A e B. S supponga che tal msure sano state eseguta n corrspondenza d valor modest
Dettaglilxmi.mi.infn.it/~camera/silsis/laboratorio-1/2-statistica.ppt http://www2.dm.unito.it/paginepersonali/zucca/index.htm Misura:
Elaborazone de dat geochmc e cenn d statstca lm.m.nfn.t/~camera/slss/laboratoro-1/-statstca.ppt http://www.dm.unto.t/pagnepersonal/zucca/nde.htm Msura: Espressone quanttatva del rapporto fra una grandezza
DettagliCircuiti di ingresso differenziali
rcut d ngresso dfferenzal - rcut d ngresso dfferenzal - Il rfermento per potenzal Gl stad sngle-ended e dfferenzal I segnal elettrc prodott da trasduttor, oppure preleat da un crcuto o da un apparato elettrco,
DettagliLa Regressione X Variabile indipendente o esplicativa. La regressione. La Regressione. Y Variabile dipendente
Unverstà d Macerata Dpartmento d Scenze Poltche, della Comuncazone e delle Relaz. Internazonal La Regressone Varable ndpendente o esplcatva Prezzo n () () 1 1 Varable dpendente 15 1 1 1 5 5 6 6 61 6 1
DettagliCalcolo della caduta di tensione con il metodo vettoriale
Calcolo della caduta d tensone con l metodo vettorale Esempo d rete squlbrata ed effett del neutro nel calcolo. In Ampère le cadute d tensone sono calcolate vettoralmente. Per ogn utenza s calcola la caduta
DettagliEsercitazioni del corso: STATISTICA
A. A. 0-0 Eserctazon del corso: STATISTICA Sommaro Eserctazone : Moda Medana Meda Artmetca Varabltà: Varanza, Devazone Standard, Coefcente d Varazone ESERCIZIO : UNIVERSITÀ DEGLI STUDI DI MILANO BICOCCA
DettagliModelli con varabili binarie (o qualitative)
Modell con varabl bnare (o qualtatve E( Y X α + βx + ε quando Y è una varable benoullana Y 1 0 s ha l modello lneare d probabltà Pr( Y 1 X α + βx + ε dove valor stmat della Y assumono l sgnfcato d probabltà.
DettagliTutti gli strumenti vanno tarati
L'INCERTEZZA DI MISURA Anta Calcatell I.N.RI.M S eseguono e producono msure per prendere delle decson sulla base del rsultato ottenuto, come per esempo se bloccare l traffco n funzone d msure d lvello
DettagliSistemi Intelligenti Relazione tra ottimizzazione e statistica - IV Alberto Borghese
Sstem Intellgent Relazone tra ottmzzazone e statstca - IV Alberto Borghese Unverstà degl Stud d Mlano Laboratory of Appled Intellgent Systems (AIS-Lab) Dpartmento d Informatca borghese@dunmt Anals dell
DettagliProva di verifica n.0 Elettronica I (26/2/2015)
Proa d erfca n.0 lettronca I (26/2/2015) OUT he hfe + L OUT - Fgura 1 Con rfermento alla rete elettrca d Fg.1, determnare: OUT / OUT / la resstenza sta dal generatore ( V ) la resstenza sta dall uscta
Dettagli3. Esercitazioni di Teoria delle code
3. Eserctazon d Teora delle code Poltecnco d Torno Pagna d 33 Prevsone degl effett d una decsone S ndvduano due tpologe d problem: statc: l problema non vara nel breve perodo dnamc: l problema vara Come
DettagliIl pendolo di torsione
Unverstà degl Stud d Catana Facoltà d Scenze MM.FF.NN. Corso d aurea n FISICA esna d ABORAORIO DI FISICA I Il pendolo d torsone (sezone costante) Moreno Bonaventura Anno Accademco 005/06 Introduzone. I
DettagliL analisi di studi con variabili di risposta multiple
X1 X X 3 Quando un confronto venga effettuato per tre lvell d un fattore, sembrerebbe ntutvo effettuare l confronto con l test t d Student a pù lvell: X X X 1 1 vs vs vs X X X 3 3 Metodologa per l anals
DettagliAppunti di Econometria
Appunt d Econometra ARGOMENTO [4]: VARIABILI DIPENDENTI BINARIE Mara Lusa Mancus Unverstà Boccon Novembre 200 Introduzone Ne modell econometrc studat fno ad ora la varable dpendente, y, è sempre stata
DettagliLa taratura degli strumenti di misura
La taratura degl strument d msura L mportanza dell operazone d taratura nasce dall esgenza d rendere l rsultato d una msura rferble a campon nazonal od nternazonal del msurando n questone affnché pù msure
DettagliCalibrazione. Lo strumento idealizzato
Calbrazone Come possamo fdarc d uno strumento? Abbamo bsogno d dentfcare l suo funzonamento n condzon controllate. L dentfcazone deve essere razonalmente organzzata e condvsa n termn procedural: s tratta
DettagliCorsi di Laurea in Farmacia e CTF Prova di Matematica
Cors d Laurea n Farmaca e CTF Prova d Matematca S O L U Z I O N I Effettua uno studo qualtatvo della funzone 4 f + con partcolare rfermento a seguent aspett: a trova l domno della funzone b trova gl ntervall
DettagliEconomia del Settore Pubblico 97. Economia del Settore Pubblico 99. Quale indice di diseguaglianza usare? il rapporto interdecilico PROBLEMA:
Economa del Settore Pubblco Laura Vc laura.vc@unbo.t www.dse.unbo.t/lvc/edsp_.htm LEZIONE 4 Rmn, 9 aprle 008 Economa del Settore Pubblco 96 I prncpal ndc d dseguaglanza: ndc d entropa generalzzata Isprata
DettagliPREVEDERE IL CHURN: UN APPROCCIO LONGITUDINALE
UNIVERSITÀ DEGLI STUDI DI PADOVA FACOLTÀ DI SCIENZE STATISTICHE CORSO DI LAUREA SPECIALISTICA IN SCIENZE STATISTICHE, ECONOMICHE, FINANZIARIE E AZIENDALI PREVEDERE IL CHURN: UN APPROCCIO LONGITUDINALE
DettagliRichiami di modelli di utilità aleatoria
Corso d LOGISTICA TERRITORIALE www.unroma.t/ddattca/lt DOCENTE prof. ng. Agostno Nuzzolo Rcham d modell d utltà aleatora prof. ng. Agostno Nuzzolo - Corso d Logstca Terrtorale Modell d domanda e utltà
DettagliPARENTELA e CONSANGUINEITÀ di Dario Ravarro
Introduzone PARENTELA e CONSANGUINEITÀ d Daro Ravarro 1 gennao 2010 Lo studo della genealoga d un ndvduo è necessaro al fne d valutare la consangunetà dell ndvduo stesso e la sua parentela con altr ndvdu
DettagliAnalisi degli errori. Introduzione J. R. Taylor, Introduzione all analisi degli errori, Zanichelli, Bo 1986
Anals degl error Introduzone J. R. Taylor, Introduzone all anals degl error, Zanchell, Bo 1986 Sstem d untà d msura, rappresentazone numerca delle quanttà fsche e cfre sgnfcatve Resnck, Hallday e Krane
DettagliLA VARIABILITA. IV lezione di Statistica Medica
LA VARIABILITA IV lezone d Statstca Medca Sntes della lezone Il concetto d varabltà Campo d varazone Dfferenza nterquartle La varanza La devazone standard Scostament med Il concetto d varabltà S defnsce
DettagliEsame di Statistica Corso di Laurea in Economia
Esame d Statstca Corso d Laurea n Economa 9 Gennao 0 Cognome Nome atr. Teora S dmostr la propretà d lneartà della meda artmetca. Eserczo Una casa edtrce è nteressata a valutare se tra lettor d lbr esste
DettagliMisure Ripetute ed Indipendenti
Msure Rpetute ed Indpendent Una delle metodologe pù semplc per valutare l affdabltà d una msura consste nel rpeterla dverse volte, nelle medesme condzon, ed esamnare dvers valor ottenut. Ovvamente, una
DettagliA. AUMENTO DELLA SPESA PUBBLICA FINANZIATO ESCLUSIVAMENTE TRAMITE INDEBITAMENTO
4. SCHMI ALTRNATIVI DI FINANZIAMNTO DLLA SPSA PUBBLICA. Se l Governo decde d aumentare la Spesa Pubblca G (o Trasferment TR), allora deve anche reperre fond necessar per fnanzare questa sua maggore spesa.
Dettagli