Cenni di regressione non-parametrica
|
|
- Giuliana Arcuri
- 7 anni fa
- Visualizzazioni
Transcript
1 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, 0 Cenn d regressone non-parametrca funzone non-lneare non-lneartà ne parametr o nelle varabl overfttng funzon lnearzzabl funzone addtva bas-varance tradeoff funzon parametrche e nonparametrche smoother kernel e bn smoother kernel smoother gaussano k-nearest neghbors cross-valdaton 10-fold cross-valdaton smoother multdmensonale curse of dmensonalty GAM PPR MARS 0.1 Funzon non-lnear e msura dell adattamento 0. - La contrapposzone tra dstorsone e varabltà Funzon non-parametrche - smoother Smoother per due o pù varabl esplcatve 0.1 Funzon non-lnear e msura dell adattamento Nell approcco classco alla regressone lneare semplce e multpla s potzza che la relazone tra la varable dpendente e le varabl esplcatve possa essere sntetzzata attraverso una funzone lneare ne parametr. Generalmente vengono comunque adottat modell d regressone che sono lnear anche rspetto alle varabl. In alcun cas, tal assunzon d lneartà rappresentano una eccessva semplfcazone. ESEMPIO Relazon non-lnear S pens alla relazone tra l Età (X) d un ndvduo e l suo Tasso d crescta nella statura (Y). È evdente che la relazone tra queste due varabl nel prmo anno d vta è molto dversa da quella che s ha quando l ndvduo è adulto. In generale, s è osservato che la relazone tra queste due varabl può essere espressa pù correttamente attraverso una funzone esponenzale negatva, ossa f X = exp bx. consderando come componente determnstca la funzone non-lneare ( ) ( ) Poché le determnazon delle varabl sono note (anche n questo captolo consdereremo varabl esplcatve non-stocastche) mentre parametr sono ncognt, è evdente che potes d non-lneartà su parametr sono pù dffcl da trattare matematcamente. In effett, se la non-lneartà rguarda le varabl esplcatve e non parametr abbamo una stuazone relatvamente semplce: n tutt cas n cu la funzone adottata è fssata, l procedmento d calcolo de parametr medante l metodo d nterpolazone de mnm quadrat è del tutto smle a quello vsto per la regressone lneare semplce e multpla (s veda l esempo 0.1.). Se nvece s consdera una funzone non-lneare ne parametr, l calcolo de parametr rsulta assa complesso e necessta spesso d procedure computazonal teratve. S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0-1
2 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, ESEMPIO 0.1. Esemp d funzon lnear ne parametr e non-lnear nelle varabl Esemp d funzon non-lnear nelle varabl e lnear ne parametr: ( X ) =a + bx+cx 4 f ( X,X ) =a bx + c log( ) f oppure X. S not che parametr present (a, b, c) sono tutt lnear d prmo grado. Se conoscamo valor assunt dalla X allora conoscamo anche valor X, X 4 e log(x). Se per esempo ponamo Z = X e sosttuamo nella prma funzone ottenamo f ( ) X =a + bx+cz, poché valor d Z sono not allora la funzone è lneare ne parametr e nelle varabl (s veda anche l ultma nota del par. 19.). Come mostrato nell esempo 0.1., se abbamo una funzone lneare ne parametr ma non nelle varabl, possamo faclmente trasformarla n una funzone lneare sa nelle varabl che ne parametr. Tale caso non ntroduce qund nulla d nuovo dal punto d vsta della stma de parametr, rspetto a quanto gà detto ne captol 16, 17 e 19. D altra parte s possono porre de nuov problem che n precedenza non avevamo ma consderato, cò è charto meglo dal successvo esempo. ESEMPIO Adattamento d funzon non-lnear nelle varabl Consderamo l seguente grafco d dspersone, relatvo alla varable dpendente Y e alla varable esplcatva X, n cu abbamo anche traccato la retta d regressone stmata Y Y X Fgura X Fgura 0.1. L equazone della retta d regressone stmata, rappresentata nella fgura 0.1.1, è data da: Y = -337, ,8 X Non è però dffcle notare nel grafco che la relazone tra le due varabl potrebbe essere meglo descrtta da una funzone non-lneare. Se consderamo la seguente polnomale d grado 3 3 Y = , X - 1,3 X + 0, X ottenamo l grafco d fgura Tale funzone sembra coglere n manera soddsfacente le caratterstche della relazone tra la Y e la X. D altra parte potremmo consderare una funzone ancora pù complessa per ottenere un adattamento ancora maggore a dat osservat. S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0 -
3 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Y Y X Fgura X Fgura Nella fgura abbamo rappresentato la polnomale d grado 4: 3 4 Y = -3,1 + 54,1 X -8,6 X + 0,45 X + 0,03 X mentre nella fgura abbamo consderato la polnomale d grado 5: 3 4 Y = -63,4 + 8,9 X -5,4 X + 1, X + 0,01 X - 0,00 X 5 Nell esempo precedente possamo osservare che, anche consderando una sola varable esplcatva, s può sceglere un modello lneare ne parametr (ma non nelle varabl), n grado d sntetzzare una complessa relazone non-lneare tra la varable dpendente e quella esplcatva. In alcun cas, anche le funzon che sono non lnear ne parametr s possono rcondurre, dopo una opportuna trasformazone delle varabl, a essere lnear ne parametr, come gà mostrato nell ultma nota del par. 19., anche se questa operazone ha delle mplcazon mportant sulla dstrbuzone dell errore. Ad esempo, la funzone: ( X ) = exp( bx ) faclmente resa lneare applcando l logartmo n base naturale: [ exp( bx )] = bx f apparentemente non lneare può essere ln.. Aumentando la complesstà del modello (nell esempo 0.1.3, l grado della polnomale) s aumenta l adattamento della funzone a dat. Questo però non è necessaramente un vantaggo, anche se alla luce d quanto detto ne precedent captol questa affermazone può apparre alquanto strana: n fondo, nel trattare la regressone lneare, c eravamo sempre post come obettvo fondamentale quello d aumentare l pù possble l adattamento della funzone d regressone a dat. Occorre a questo punto ntrodurre una nozone nuova: l eccessvo adattamento della funzone a dat, detto anche overfttng. Se osservamo la fgura 0.1.4, possamo n effett notare nella parte nzale della curva, un maggore adattamento a prm due punt del grafco (quell con ascssa pù bassa). L andamento della curva sembrerebbe però suggerre che per valor molto bass della X c s debba aspettare una rapda, quanto mprobable, crescta della Y. In effett, le polnomal d grado elevato tendono ad avvcnars molto a punt del grafco d dspersone ma n questo modo tendono anche ad amplfcare l errore presente ne dat. E l problema noto come bas-varance tradeoff che descrvamo n dettaglo nel paragrafo successvo. La funzone che cerchamo deve nvece coglere solo gl aspett fondamental della relazone tra le due varabl, trascurando gl aspett meno sgnfcatv o accdental: solo n questo modo s può ottenere una funzone generalzzable, ossa una funzone che dovrebbe mantenere un buon adattamento anche consderando un altro campone d dat o tutta la popolazone. S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0-3
4 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Tale problema non s era ma posto ne precedent captol, perché avevamo sempre utlzzato delle funzon talmente rgde da mpedre qualsas forma d overfttng: n tale stuazone potevamo porc come obettvo semplcemente l ndvduazone della funzone lneare che presentava l massmo adattamento. Nel momento n cu ntroducamo funzon pù duttl occorre rconsderare seramente questo aspetto, tenendo conto che l nostro obettvo non può pù essere solo quello d rcercare la funzone con l massmo adattamento. Sappamo nfatt che aumentando la complesstà della funzone utlzzata s ottene un maggore adattamento a dat osservat ma al contempo s può ottenere un modello d dffcle nterpretazone e che potrebbe avere scarsa capactà prevsva. Nota In realtà anche nel captolo 19 abbamo n qualche modo gà affrontato questa problematca: abbamo nfatt vsto che aumentando l numero delle varabl tende ad aumentare anche l adattamento del modello a dat (msurato attraverso l coeffcente d determnazone multplo) ma che questo può non essere convenente. Il coeffcente d determnazone multplo corretto (19.5.) è stato ntrodotto propro per tener conto del numero d varabl utlzzate, con l assunzone mplcta che un modello pù semplce è preferble ad uno pù complesso se cò non porta ad una sgnfcatva rduzone dell adattamento. Occorre anche consderare che la complesstà d un modello dpende da dvers fattor, ad esempo un modello addtvo è meno complesso d un modello non-addtvo. Charamo l senso d quest termn. Se abbamo due o pù varabl esplcatve e nell espressone del modello le varabl compaono come sngol termn, non v sono coè termn moltplcatv o d nterazone tra due o pù varabl esplcatve, la somma degl effett delle sngole varabl esplcatve c fornsce l valor medo della varable dpendente Y. Una espressone generale d funzone addtva è data da f(x ( ) J 1, X, X3..., XJ) = a + β jfj Xj j= 1 n cu f 1, f, f 3 ecc. sono funzon delle J varabl esplcatve. Un modello n cu la componente determnstca è una funzone addtva delle varabl esplcatve, vene detto addtvo (nelle varabl). Le funzon f j possono essere note a pror, come nel modello d regressone lneare dove sono poste tutte ugual a funzon denttà f j ( X j ) = X j, oppure non note, come vedremo nel paragrafo 0.4. Una funzone lneare ne parametr ma non addtva è ad esempo la funzone Y = a + bx1 + cx + dx1x. Funzon che sono non-addtve e non-lnear nelle varabl possono essere estremamente flessbl, come mostrato nella fgura n cu abbamo grafczzato la funzone Y = 5X X 0. 1X X. 1 1 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0-4
5 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Fgura Grafco d una funzone non-addtva, con due varabl esplcatve Se consderamo tutte le possbl funzon lnear ne parametr o lnearzzabl abbamo n effett a dsposzone una grandssma varetà d funzon, tra cu è probable che essta una funzone che s adatt n modo soddsfacente a dat osservat e che potrebbe essere adeguata a descrvere la relazone tra la varable dpendente e quelle esplcatve. Se la funzone pù adatta non è lneare e non è lnearzzable, ma è nota, è comunque possble applcare degl opportun metod d calcolo per la stma de parametr. D altra parte se le conoscenze del fenomeno non sono suffcent ad ndvduare un precso schema nterpretatvo, non v è una metodologa effcace n grado d ndvduare, tra tutte le possbl funzon (lnear o lnearzzabl), quella che meglo s adatta a nostr dat. Oltre a cò, occorre consderare che alcune funzon, come ad esempo le polnomal, possono adattars molto bene a dat ma al prezzo d una forte nstabltà e d una complessa nterpretabltà del modello. Questo mplca che pccole varazon ne dat possono generare polnomal completamente dverse. S confrontno, a questo proposto, coeffcent delle polnomal dell esempo La contrapposzone tra dstorsone e varabltà Ipotzzamo che l fenomeno n esame sa descrtto n manera adeguata dal modello: Y = f( X) + ε n cu per semplctà stamo consderando una sola varable esplcatva e supponamo noltre che sa E ( ε ) = 0. Supponamo noltre d avere a dsposzone un campone d n osservazon: {( x, y ),( x, y ),...,( x )} D =, 1 1 n y n S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0-5
6 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Dato l campone D, l nostro scopo è quello d approssmare la funzone orgnara ncognta f tramte una funzone approssmante g: Y ˆ = g( X) Per valutare quanto la funzone g sa vcna alla vera funzone f, s utlzza, n analoga a quanto vsto per gl stmator d parametr della popolazone (s veda l par. 11.4), l errore quadratco medo, che n questo contesto ndcheremo con la sgla EQM. L errore quadratco medo nel nostro campone sarà qund 1 EQM = n n ( y g( x )) = ( y ŷ ) = 1 1 Per valutare la bontà della funzone approssmante g, quello che c nteressa non è l EQM corrspondente al sngolo rsultato camponaro, bensì l suo valore atteso nell unverso de campon d dmensone n: Dove l valore atteso { EQM} n n n 1 1 E { EQM} = E ( y yˆ ) = E( y yˆ ) (0..1) n = 1 n = 1 n = 1 E s rfersce alla meda de dvers rsultat dell EQM ottenut da tutt campon D che compongono l unverso camponaro. D altra parte s ha che: E + {( y yˆ ) } = E ( y f( x ) + f( x ) yˆ ) E{ ( y f( x ))( f( x ) yˆ )} { } = E ( y f( x )) Poché l doppo prodotto è nullo, alla fne ottenamo: E {( y ŷ ) } = E{ ε } + E ( f( x ) ŷ ) { } { } + E ( f( x ) yˆ ) { } Qund, consderando valor attes, l errore quadratco medo può essere scomposto come la Var ε = E ε E ε = E ε poché per potes E () ε = 0 ) varanza dell errore (nfatt, () { } [ ()] { } pù l errore quadratco medo tra valor med della Y, f ( ) Questo ultmo termne s può scomporre n modo smle: E {( f( x ) yˆ ) } = E ( f( x ) E{ yˆ } + E{ yˆ } yˆ ) E{ ( f( x ) E{ yˆ })( E{ yˆ } y )} ˆ x, e quell predett dal modello. { } = E{ ( f( x ) E{ yˆ } ) } + E{ ( E{ yˆ } yˆ ) } Consderando che l doppo prodotto è nullo, l espressone dventa: E {( f(x ) ŷ ) } = B( ŷ ) + Var { ŷ } dove B ( ŷ ) è la dstorsone o bas tra la vera funzone e quella stmata. Qund ottenamo che {( y ŷ ) } = Var {} ε + B( ŷ ) Var { ŷ } E + (0..) Per mnmzzare la (0..1), ossa l valore atteso dell EQM, dobbamo mnmzzare l espressone precedente per ogn, tenendo conto che la varanza dell errore è un dato esogeno, e pertanto non può essere rdotto. + + S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0-6
7 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Qund s tratta d mnmzzare contemporaneamente la dstorsone e la varanza, ma cò non è affatto semplce. In effett, per mnmzzare la varanza basta sceglere una funzone approssmante costante yˆ = c, dove c è una costante qualsas, n tal modo la varanza sarà necessaramente uguale a zero mentre la dstorsone sarà necessaramente molto alta. D altra parte se l nostro modello nterpola perfettamente dat del campone (cò è possble se non v sono valor ugual delle x ) allora avremo che { } = 0 E { ŷ } = f ( x ) e qund B( ŷ ) = E ( f ( x ) E{ ŷ }) Mentre la Var{ ˆ } dvene uguale alla Var {} ε elevata. y, che può essere n alcun cas puttosto Tale problema vene defnto nella letteratura nglese bas-varance tradeoff: mnmzzare eccessvamente l bas può far aumentare troppo la varanza e vceversa. Come s può vedere dalla fgura 0..1, l uso d modell troppo compless (overfttng) produrrà una bassa dstorsone ed una elevata varanza, mentre l utlzzo d modell troppo semplc (underfttng) produrrà una elevata dstorsone e una bassa varanza. Avendo a dsposzone solo un campone, non s può conoscere la soluzone ottmale; soluzon accettabl possono essere ndvduate tramte metodologe qual ad esempo la cross-valdaton, d cu damo cenno nel paragrafo successvo. EQM E{ EQM } EQM nel campone underfttng modello mglore overfttng complesstà Fgura 0..1 Confronto tra l valore atteso dell EQM e l valore calcolato nel campone, al varare della complesstà del modello. S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0-7
8 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Funzon non-parametrche - smoother Consderamo nnanztutto una applcazone dell approcco parametrco classco a de dat real. ESEMPIO Indagne sul dabete mellto In un ndagne sul dabete mellto s vuole ndagare la dpendenza del lvello del sero C-peptde da altre varabl, tra cu l età e l defct basco. Il logartmo della concentrazone del C-peptde è la varable dpendente (per maggor dettagl cfr. Haste e Tbshran 1990). Nel grafco d dspersone d Fgura abbamo consderato come varable esplcatva l età rportando sa la retta d regressone d equazone: f(x) = 1, ,019 X sa la polnomale d equazone: f(x) = 1,05 + 0,170 X + 0,017 X + 0,001 X 3. S può notare un evdente mgloramento nell adattamento a dat utlzzando la polnomale; questo modello mette n luce una relazone tra l età e l logartmo della concentrazone C-peptde crescente sno a crca 7 ann e po pressoché costante.,00 1,90 1,80 1,70 retta d regressone 1,60 Y 1,50 1,40 1,30 1,0 Polnomale 1,10 1, X Fgura Grafco d dspersone e funzon parametrche Ne captol precedent, per descrvere l tpo d relazone esstente tra la varable dpendente e le varabl esplcatve, s è nnanztutto potzzata una generca funzone parametrca, qund s sono determnat valor de suo parametr medante l metodo de mnm quadrat n modo da trovare la funzone che s accosta meglo a dat. In sostanza, la scelta della funzone da adottare avvene necessaramente nel momento nzale, prma del calcolo de parametr. ESEMPIO 0.3. Funzone parametrca Se assumamo che la relazone tra la Y e la X può essere espressa da una funzone esponenzale negatva f(x) = exp(bx) allora l problema dventa la determnazone del parametro b n modo che la funzone s accost l pù possble a dat osservat. S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0-8
9 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Un dverso approcco d anals è quello che prende l nome d regressone nonparametrca. Questa tecnca utlzza n genere opportune funzon smooth (lsce, regolar) dette smoother, e s basa sull asserto che devono essere dat a mostrarc la forma funzonale pù approprata. In sostanza, non s defnsce a pror la funzone adatta a descrvere la relazone, utlzzando dat solo per la determnazone de parametr, bensì s adotta una metodologa che sfrutt le osservazon anche per la defnzone stessa della funzone da utlzzare. Per descrvere tal metodologe è necessaro però nnanztutto ntrodurre l concetto d smoother. Data una varable dpendente Y e K varabl esplcatve X 1, X,..., X K, chameremo smoother una funzone s(x 1, X,..., X K ) che rproduca l andamento della varable Y al varare delle varabl esplcatve, con una varabltà nferore a quella osservata. Una caratterstca comune a quas tutt gl smoother è la natura non-parametrca: non s assume coè una forma funzonale rgda. Per semplctà soffermamoc nzalmente al caso d una sola varable esplcatva X e consderamo l corrspondente dagramma d dspersone. Se la varable X è dscreta e per cascun valore della X abbamo una dstrbuzone d valor d Y, allora un possble smoother è la spezzata d regressone, che assoca ad ogn x la meda della Y nelle untà che presentano x, ossa M a (Y / X = x ). Tale funzone è stata gà consderata nel paragrafo 6.8. Se la varable X è contnua, allora generalmente ogn x non verrà osservato pù d una volta e qund non s ha a dsposzone una dstrbuzone della Y per ogn x. In tale stuazone per costrure uno smoother s può determnare per ogn valore osservato x un ntervallo (o ntorno) che lo contenga e qund calcolare la meda de valor osservat della Y n tale ntervallo. Naturalmente s possono determnare dvers smoother a seconda d come vene calcolata la meda delle Y per ogn ntervallo e d come vengono defnt gl ntervall. Il metodo pù semplce, ma anche pù grossolano, consste nel suddvdere l carattere X n class d uguale ampezza, qund all nterno d cascuna classe calcolare l valore medo d Y. Data una suddvsone della varable X n K class, I 1, I,..., I K, s defnsce bn smoother : s(x) = meda(y ) per x I j. (0.3.1) I j Lo smoother che s ottene è una funzone a scaln d scarsa flessbltà, come llustrato nella Fgura Il dfetto prncpale d tale approcco derva essenzalmente dalla suddvsone del campo d varazone della varable n un numero fssato d ntervall non sovrappost. Se voglamo rendere pù flessble tale approcco, potremmo defnre un ntorno [ x h; x + h] per cascun valore x, qund defnre s(x) come meda d Y per tutt punt corrspondent a tale ntorno. La funzone rsultante sarà tanto pù smooth quanto pù grande sarà l ntorno, ossa quanto maggore sarà l valore d h. Un approcco pù soddsfacente consste nel calcolare, all nterno d ogn ntorno, una meda ponderata d Y, con pes decrescent va va che c s allontana dal valore d rfermento d X. S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0-9
10 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Nadaraya-Watson smoother. Data una funzone g(t) decrescente n t, per ogn x 0 nterno al campo d varazone d X, un kernel smoother può essere defnto: 1 n x x n x x s(x) = g y con c = g = 0 (0.3.) c 1 = λ 1 0 λ n cu c 0 è una costante d normalzzazone, mentre λ è un parametro fssato a pror, chamato bandwdth o parametro d smoothng, che, n sostanza, defnsce l ampezza dell ntervallo ntorno a x. Un altro tpo d kernel smoother è l seguente. Gasser-Müller smoother. Data una funzone g(t) decrescente n t, per ogn x 0 nterno al campo d varazone d X, un kernel smoother può essere defnto: 1 n s x u s(x) = y g du = λ 1 s 1 λ n cu s = ( x + x ) ; s 0; s / 0 = n = La funzone g defnsce l kernel, ossa l sstema de pes adottato nella meda ponderata della Y. Ambedue gl smoother possono nfatt essere scrtt come: s(x) = n ω ( x) y = 1,n Questo mplca che è necessaro sceglere g n modo che sa verfcata la condzone: n ω, ( x ) = 1 = 1 n È possble sceglere tra numerose funzon, tra le qual vene spesso utlzzata la funzone d denstà della dstrbuzone Normale standardzzata, con meda nulla e varanza untara. In partcolare g 1 z ( z) = exp π NOTA Il parametro λ defnsce la sem-ampezza dell ntervallo centrato nel punto x 0 n cu s vuole stmare la funzone. Ad esempo, prendamo la funzone Kernel trangolare: 1 u 1 u + 1 g( u) = 0 altrove che attrbusce pes decrescent va va che c s allontana dal punto da stmare e dove n questo caso u = ( x x ) λ. S vogla stmare la funzone nel punto x 0 = 3 e sa λ =. Allora pes 3 x 1 sono non null per tutt valor osservat x all nterno dell ntervallo 1 x 5 che è centrato nel punto x 0 = 3 e d sem-ampezza par a = λ. S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0-10
11 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Ad ogn modo s dmostra che non è tanto la scelta della funzone g a determnare la qualtà dell approssmazone, quanto l valore del parametro d smoothng λ che, n sostanza, regola l ampezza del kernel. E anche nteressante osservare che, sotto opportune condzon, kernel smoother sono degl stmator consstent della vera funzone f(x). Poché quest stmator sono delle somme ponderate d v.c., s può applcare l teorema del lmte centrale e s può assumere che tal stmator abbano una dstrbuzone Normale. Per questa ed altre propretà s veda Härdle (1994). ESEMPIO Kernel smoother e bn smoother Nella Fgura 0.3. è rportato l grafco d dspersone del logartmo della concentrazone del C- peptde (Y) e dell età (X) relatv ad un collettvo d ndvdu e l corrspondente Kernel smoother e l Bn smoother. Entrambe le funzon evdenzano tra due caratter una relazone prma crescente e po costante. Fgura Kernel e Bn smoothers,0 1,9 1,8 1,7 1,6 Kernel smoother Y 1,5 1,4 1,3 1, 1,1 Bn smoother 1, X Per comprendere meglo la logca del kernel smoother, concentramoc sul valore x e determnamo l corrspondente valore s(x ). S not che per ogn x calcolamo un nuovo * valore y = s(x) che s ottene come meda ponderata della Y nell ntorno d x. Nella fgura abbamo messo n evdenza la logca d funzonamento dello smoother n rfermento al solo punto x. S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0-11
12 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Fgura Kernel smoother gaussano Quando pes, rappresentat dalla denstà della Normale, sono vcn allo zero, allora corrspondent valor d X non hanno peso nel calcolo d s(x ). Nel grafco abbamo potzzato come sstema d pes, una funzone d denstà normale. Tale scelta corrsponde ad un kernel smoother gaussano. S not che aumentando λ, l parametro dello smoother, è come se s aumentasse la varanza della Normale che defnsce pes e, qund, aumenta l numero d punt che entrano nel calcolo d s(x ) con un peso sgnfcatvo, ottenendo uno smoother d forma pù regolare. La stma Kernel della Y è stata qund defnta come una meda ponderata della Y n un ntorno d grandezza fssata della X. Il k-nearest neghbor smoother (k-nn) segue una logca leggermente dversa n quanto non è fssato l ntorno, bensì l numero (k) d untà vcne da consderare. In pratca, dato l valore x s calcola la meda de valor della Y corrspondent a k valor d X pù vcn a x. V sono comunque molt altr tp d smoother, non-parametrc o sem-parametrc, tra cu rvestono partcolare nteresse quell basat sulle splne che godono d numerose utl propretà. Una splne è una polnomale a tratt costruta n tale modo che è smooth n corrspondenza a punt d gunzone (nod) tra le polnomal. Le splne sono estremamente flessbl e possono essere utlzzate per approssmare qualsas tpo d funzone, provvsto un adeguato numero d nod. In partcolare, possamo utlzzare come funzone approssmante g una funzone splne cubca, ossa una splne con le seguent caratterstche: ha un nodo n corrspondenza ad ogn valore osservato della X è una polnomale cubca n cascun ntervallo [ x 1 ; x ] ha due dervate contnue Il problema che s pone è quello d evtare l overfttng e qund mporre un certo grado d regolartà a tale funzone. S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0-1
13 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, 1, 1,0 0,8 Y 0,6 0,4 0, 0,0 1, 0,0 0, 0,4 0,6 0,8 1,0 X 1,0 0,8 Y 0,6 0,4 0, 0,0 1, 0,0 0, 0,4 0,6 0,8 1,0 X 1,0 0,8 Y 0,6 0,4 0, 0,0 0,0 0, 0,4 0,6 0,8 1,0 Fgura Bas-varance trade-off. La funzone rossa tratteggata è quella vera, lo smoother (blu) è stato consderato con: a) un λ molto pccolo (n alto, lo smoother passa per tutt punt), b) un λ ntermedo (al centro, s ottene una buona approssmazone), c) un λ molto grande (n basso, lo smoother ha una varabltà molto bassa ma una forte dstorsone). X S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0-13
14 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Tale obettvo s può ottenere ntroducendo una penalzzazone alla eccessva rregolartà della curva: n termn computazonal, per una funzone g che sa almeno due volte dfferenzable, una quanttà che presenta alcun vantagg come penalzzazone è ( g ) dx. In tal caso s defnsce somma de quadrat de resdu penalzzata la quanttà: P λ n ( g) = { y g( x )} + λ ( g ) = 1 S cercherà qund la funzone splne g che mnmzza ( g). Il parametro λ determna l trade-off tra adattamento e regolartà della curva, s consderno cas estrem: se λ = 0 allora la funzone g non ha vncol e passa per tutt punt (se non v sono valor ugual d X), se λ = allora la funzone g è una retta. Per una ntroduzone all argomento s veda Green & Slverman(1994). La suddvsone del campone è un metodo spesso effcace per la scelta del lvello d smoothng e per la valutazone complessva del modello. Il metodo consste essenzalmente nella suddvsone (eventualmente rpetuta) del campone d dat a dsposzone, n due part: l sottocampone d tranng e l sottocampone d test. Il sottocampone d tranng vene utlzzato per stmare l modello, l sottocampone d test vene utlzzato per verfcare la bontà d adattamento del modello a de dat non utlzzat nella stma e qund ottenere una stma pù affdable dell EQM. P λ dx EQM bas elevato varanza bassa bas basso varanza alta EQM nel test EQM nel tranng underfttng modello mglore overfttng complesstà Fgura Confronto tra l EQM nel Test set e l EQM nel Tranng set, al varare della complesstà del modello. Nella fgura possamo vedere l valore dell errore quadratco medo calcolato nel sottocampone d tranng e nel sottocampone d test. S può notare che all aumentare della complesstà del modello l EQM calcolato nel sottocampone d tranng tenda sempre a S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0-14
15 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, dmnure, mentre cò non avvene per l sottocampone d test. S confront tale fgura con la fgura In effett, l uso degl stess dat per ottenere sa la stma sa la valutazone del modello, porta generalmente ad una valutazone eccessvamente ottmstca: se non abbamo duplcazon per valor della X e s scegle un lvello d smoothng molto basso, s può ottenere un adattamento pressoché perfetto (s veda quanto detto nel paragrafo precedente). Il rsultato sarebbe qund una scelta sbaglata del parametro d smoothng ed una valutazone errata del modello. Nella 10-fold cross-valdaton, l campone vene nnanztutto suddvso n 10 sottonsem che chameremo A1, A, A3,, A10, s applca qund la seguente procedura: - Tranng su (A1 A... A7 A8 A9), test su (A10) - Tranng su (A1 A... A7 A8 A10), test su (A9) - Tranng su (A1 A... A7 A9 A10), test su (A8) Tranng su (A... A7 A8 A9 A10), test su (A1) Al termne della procedura abbamo 10 stme del modello, utlzzando dat (almeno n parte) dvers; noltre tutt dat entrano n una procedura d test, che comunque non utlzza ma dat gà usat nel corrspondente tranng. La valutazone fnale della performance del modello s può ottenere qund come una semplce meda delle 10 valutazon effettuate su dat d test. A1 A A3 A4 A5 A6 A7 A8 A9 A10 campone Inseme d tranng Inseme d test Prmo passo Stma del modello Valutazone Fgura Illustrazone del prmo passo della procedura 10-fold crossvaldaton S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0-15
16 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, 0.4 Smoother per due o pù varabl esplcatve L esposzone precedente s può estendere al caso d due o pù varabl esplcatve seguendo due dvers approcc. Una prma possbltà rchede la defnzone d uno smoother multdmensonale, ad esempo nel caso d due varabl esplcatve f ( X1,X ) = a + bs( X1,X ) Una seconda possbltà, molto pù restrttva, consste nel supporre l addtvtà della funzone f(.) e qund l utlzzo de sol smoother unvarat: f ( X1,X ) = a + bs1( X1) + cs ( X ) Ambedue tal approcc portano, per due varabl esplcatve, all ndvduazone d una superfce d regressone, d cu mostramo un esempo, con due sole varabl esplcatve, nella fgura Fgura Esempo d Kernel smoother bdmensonale Il prmo approcco, che nclude le nterazon tra le varabl, è spesso dffcle da applcare n quanto rchede un numero molto elevato d osservazon all aumentare del numero d varabl esplcatve. E l problema denomnato the curse of dmensonalty. Per curse of dmensonalty s ntende l rapdo ncremento d volume che s ha aggungendo ulteror dmenson allo spazo d rfermento. S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0-16
17 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Per meglo descrvere l fenomeno, potzzamo d avere a dsposzone 100 osservazon relatve ad una varable quanttatva contnua. Se dvdamo l range della varable n 10 ntervalln, samo n grado d analzzare la dstrbuzone della varable abbastanza bene, tramte ad esempo un stogramma. Ogn ntervallno avrà due ntervalln vcn, che conterranno presumblmente qualche osservazone. Se le osservazon s rferscono nvece a 10 varabl, ed effettuamo la stessa suddvsone n ntervalln per cascuna varable, ottenamo celle nello spazo a 10 dmenson e ogn cella avrà = celle vcne: le osservazon dventano qund de punt solat n un ampo spazo d celle vuote. Per ottenere una stuazone equvalente a quella che avevamo nel caso undmensonale, sarebbero ora necessare ben 10 0 osservazon. L aumento delle dmenson provoca n defntva un ncremento generalzzato delle dstanze tra punt che tendono qund a dvenre lontan ed equspazat. Per ovvare a tale problema sono stat propost modell qual ad esempo PPR, MARS o l modello addtvo generalzzato (GAM), (s veda Haste, Tbshran & Fredman, 001). Il modello GAM è una varante del modello addtvo gà vsto nel paragrafo 0.1. e s basa sulla somma d J funzon, n questo caso non-parametrche e non note, delle J varabl X j (pù l ntercetta). La dfferenza sta essenzalmente nell aggunta della funzone lnk parametrca che collega la somma delle funzon alla varable dpendente: J E( Y X ) = f(x = + ( ) 1, X, X3..., XJ ) G a s j X j j= 1 L addtvtà del modello permette un procedmento d stma abbastanza agevole n quanto le funzon sono tutte unvarate. Occorre però consderare che le funzon non-parametrche s j sono ncognte e qund è rchesta una procedura d stma teratva. La Projecton Pursut Regresson utlzza trasformazon d proezon ottme de dat orgnal n sottospaz d dmensone rdotta. Pù precsamente, la varable dpendente è legata ad un nseme d J varabl esplcatve, tramte una combnazone d M funzon smooth undmensonal d combnazon lnear delle varabl esplcatve: M 1 3 J m m1 1 m mjxj m= 1 ( Y X ) f(x, X, X..., X ) = s ( α X + α X + α ) E = + Quando l numero d varabl esplcatve è alto e tra esse sussste un elevato grado d collneartà, questo modello è pù parsmonoso rspetto al GAM e può consderare (anche se non esplctamente) nterazon d varabl esplcatve. MARS (multvarate adaptve regresson splnes) può essere vsto come una generalzzazone del Recursve Partton Regresson method. Questo metodo utlzza una espansone d prodott d funzon base (ad es. splne cubche) per costrure funzon splne multvarate ed una procedura stepwse per ottenere una selezone automatca d questa base d funzon. E possble scrvere l modello MARS n forma addtva, raggruppando le funzon n questo modo: E ( Y X ) = f(x, X, X..., X ) = α + g ( X ) + g ( X, X ) + g ( X, X, ) 1 3 J 0 h h hk h Xk Km= 1 Km= Km= 3 In cu la prma sommatora rguarda tutte le funzon che s rferscono ad una sola varable esplcatva; la seconda sommatora rguarda tutte le funzon che s rferscono a due varabl esplcatve, e così va. Occorre fssare a pror alcun parametr: l numero d funzon base, l massmo grado d nterazone ed l grado delle splne. Tramte quest parametr s può determnare l grado desderato d complesstà del modello. S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0-17
18 S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Bblografa del captolo Green, P., Slverman, B. (1994) Nonparametrc Regresson and Generalzed Lnear models: A Roughness Penalty Approach, Chapman and Hall, London. Härdle, W. (1994) Appled Nonparametrc Regresson, Cambrdge Unversty Press. Hart, J. D. (1997) Nonparametrc Smoothng and Lack-of Ft Tests. Sprnger Verlag New York. Haste, T., Tbshran, R. & Fredman, J. (001) The elements of statstcal learnng, Sprnger Verlag New York. S. Borra, A. D Cacco Statstca, metodologe per le scenze economche e socal, Cap. 0-18
Relazione funzionale e statistica tra due variabili Modello di regressione lineare semplice Stima puntuale dei coefficienti di regressione
1 La Regressone Lneare (Semplce) Relazone funzonale e statstca tra due varabl Modello d regressone lneare semplce Stma puntuale de coeffcent d regressone Decomposzone della varanza Coeffcente d determnazone
DettagliLaboratorio 2B A.A. 2012/2013. Elaborazione Dati. Lab 2B CdL Fisica
Laboratoro B A.A. 01/013 Elaborazone Dat Lab B CdL Fsca Lab B CdL Fsca Elaborazone dat spermental Prncpo della massma verosmglanza Quando eseguamo una sere d msure relatve ad una data grandezza fsca, quanto
DettagliLE FREQUENZE CUMULATE
LE FREQUENZE CUMULATE Dott.ssa P. Vcard Introducamo questo argomento con l seguente Esempo: consderamo la seguente dstrbuzone d un campone d 70 sttut d credto numero flal present nel terrtoro del comune
DettagliCorso di. Dott.ssa Donatella Cocca
Corso d Statstca medca e applcata 3 a Lezone Dott.ssa Donatella Cocca Concett prncpale della lezone I concett prncpal che sono stat presentat sono: Mede forme o analtche (Meda artmetca semplce, Meda artmetca
DettagliSTATISTICA DESCRITTIVA - SCHEDA N. 5 REGRESSIONE LINEARE
Matematca e statstca: da dat a modell alle scelte www.dma.unge/pls_statstca Responsabl scentfc M.P. Rogantn e E. Sasso (Dpartmento d Matematca Unverstà d Genova) STATISTICA DESCRITTIVA - SCHEDA N. REGRESSIONE
DettagliLa Regressione X Variabile indipendente o esplicativa. La regressione. La Regressione. Y Variabile dipendente
Unverstà d Macerata Dpartmento d Scenze Poltche, della Comuncazone e delle Relaz. Internazonal La Regressone Varable ndpendente o esplcatva Prezzo n () () 1 1 Varable dpendente 15 1 1 1 5 5 6 6 61 6 1
DettagliCampo di applicazione
Unverstà del Pemonte Orentale Corso d Laurea n Botecnologa Corso d Statstca Medca Correlazone Regressone Lneare Corso d laurea n botecnologa - Statstca Medca Correlazone e Regressone lneare semplce Campo
DettagliIntroduzione al Machine Learning
Introduzone al Machne Learnng Note dal corso d Machne Learnng Corso d Laurea Magstrale n Informatca aa 2010-2011 Prof Gorgo Gambos Unverstà degl Stud d Roma Tor Vergata 2 Queste note dervano da una selezone
DettagliPREVEDONO: Capitolo 17 del libro di testo. Copyright 2005 The McGraw-Hill Companies srl
Le Inferenze sul modello d regressone PREVEDONO: Assunzone d normaltà degl error e nferenza su parametr Anals della Varanza Inferenza per la rsposta meda e la prevsone Anals de resdu Valor anomal Captolo
DettagliVariabili statistiche - Sommario
Varabl statstche - Sommaro Defnzon prelmnar Statstca descrttva Msure della tendenza centrale e della dspersone d un campone Introduzone La varable statstca rappresenta rsultat d un anals effettuata su
DettagliCapitolo 3. Cap. 3-1
Statstca Captolo 3 Descrzone Numerca de Dat Cap. 3-1 Obettv del Captolo Dopo aver completato l captolo, sarete n grado d: Calcolare ed nterpretare la meda, la medana e la moda d un set tdd dat Trovare
DettagliLa t di Student. Per piccoli campioni si definisce la variabile casuale. = s N. detta t di Student.
Pccol campon I parametr della dstrbuzone d una popolazone sono n generale ncognt devono essere stmat dal campone de dat spermental per pccol campon (N N < 30) z = (x µ)/ )/σ non ha pù una dstrbuzone gaussana
DettagliESERCIZIO 4.1 Si consideri una popolazione consistente delle quattro misurazioni 0, 3, 12 e 20 descritta dalla seguente distribuzione di probabilità:
ESERCIZIO. S consder una popolazone consstente delle quattro msurazon,, e descrtta dalla seguente dstrbuzone d probabltà: X P(X) ¼ ¼ ¼ ¼ S estrae casualmente usando uno schema d camponamento senza rpetzone
Dettagli* PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE *
* PROBABILITÀ - SCHEDA N. LE VARIABILI ALEATORIE *. Le varabl aleatore Nella scheda precedente abbamo defnto lo spazo camponaro come la totaltà degl est possbl d un espermento casuale; abbamo vsto che
DettagliElementi di statistica
Element d statstca Popolazone statstca e campone casuale S chama popolazone statstca l nseme d tutt gl element che s voglono studare (ndvdu, anmal, vegetal, cellule, caratterstche delle collettvtà..) e
DettagliRelazioni tra variabili: Correlazione e regressione lineare
Dott. Raffaele Casa - Dpartmento d Produzone Vegetale Modulo d Metodologa Spermentale Febbrao 003 Relazon tra varabl: Correlazone e regressone lneare Anals d relazon tra varabl 6 Produzone d granella (kg
DettagliIntegrazione numerica dell equazione del moto per un sistema lineare viscoso a un grado di libertà. Prof. Adolfo Santini - Dinamica delle Strutture 1
Integrazone numerca dell equazone del moto per un sstema lneare vscoso a un grado d lbertà Prof. Adolfo Santn - Dnamca delle Strutture 1 Introduzone 1/2 L equazone del moto d un sstema vscoso a un grado
DettagliIl logaritmo discreto in Z p Il gruppo moltiplicativo Z p delle classi resto modulo un primo p è un gruppo ciclico.
Il logartmo dscreto n Z p Il gruppo moltplcatvo Z p delle class resto modulo un prmo p è un gruppo cclco. Defnzone (Logartmo dscreto). Sa p un numero prmo e sa ā una radce prmtva n Z p. Sa ȳ Z p. Il logartmo
DettagliStatistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill
Statstca - metodologe per le scenze economche e socal /e S Borra, A D Cacco - McGraw Hll Es Soluzone degl esercz del captolo 7 In base agl arrotondament effettuat ne calcol, s possono rscontrare pccole
DettagliLezioni di Statistica (25 marzo 2013) Docente: Massimo Cristallo
UNIVERSITA DEGLI STUDI DI BASILICATA FACOLTA DI ECONOMIA Corso d laurea n Economa Azendale Lezon d Statstca (25 marzo 2013) Docente: Massmo Crstallo QUARTILI Dvdono la dstrbuzone n quattro part d uguale
DettagliProbabilità cumulata empirica
Probabltà cumulata emprca Se s effettua un certo numero d camponament da una popolazone con dstrbuzone cumulata F(y), s avranno allora n campon y, y,, y n. E possble consderarne la statstca d ordne, coè
DettagliLaboratorio 2B A.A. 2013/2014. Elaborazione Dati. Lab 2B CdL Fisica
Laboratoro B A.A. 013/014 Elaborazone Dat Lab B CdL Fsca Elaborazone dat spermental Come rassumere un nseme d dat spermental? Una statstca è propro un numero calcolato a partre da dat stess. La Statstca
DettagliPROBLEMA DI SCELTA FRA DUE REGIMI DI
PROBLEMA DI SCELTA FRA DUE REGIMI DI CAPITALIZZAZIONE Prerequst: legge d captalzzazone semplce legge d captalzzazone composta logartm e loro propretà dervate d una funzone pendenza d una curva n un punto
DettagliIntorduzione alla teoria delle Catene di Markov
Intorduzone alla teora delle Catene d Markov Mchele Ganfelce a.a. 2014/2015 Defnzone 1 Sa ( Ω, F, {F n } n 0, P uno spazo d probabltà fltrato. Una successone d v.a. {ξ n } n 0 defnta su ( Ω, F, {F n }
DettagliLA CALIBRAZIONE NELL ANALISI STRUMENTALE
LA CALIBRAZIONE NELL ANALISI STRUMENTALE La maggor parte delle anals chmche sono ogg condotte medante metod strumental (spettrometra d assorbmento ed emssone a dverse λ, metod elettrochmc, spettrometra
DettagliStrada B. Classe Velocità valore frequenza Frequ. ass Frequ. % hi Freq. Cum
Eserczo SINTESI S supponga d avere eseguto 70 msure della veloctà stantanea de vecol che transtano nelle sezon d due strade A e B. S supponga che tal msure sano state eseguta n corrspondenza d valor modest
DettagliCorrelazione lineare
Correlazone lneare Varable dpendente Mortaltà per crros 50 45 40 35 30 5 0 15 10 5 0 0 5 10 15 0 5 30 Consumo d alcool Varable ndpendente Metodologa per l anals de dat spermental L anals d stud con varabl
DettagliCARATTERISTICHE DEI SEGNALI RANDOM
CARATTERISTICHE DEI SEGNALI RANDOM I segnal random o stocastc rvestono una notevole mportanza poché sono present, pù che segnal determnstc, nella maggor parte de process fsc real. Esempo d segnale random:
DettagliPIANIFICAZIONE DEI TRASPORTI
Unverstà d Caglar DICAAR Dpartmento d Ingegnera Cvle, Ambentale e archtettura Sezone Trasport PIANIFICAZIONE DEI TRASPORTI Eserctazone su modell d generazone A.A. 2016-2017 Ing. Francesco Pras Ing. Govann
DettagliLa soluzione delle equazioni differenziali con il metodo di Galerkin
Il metodo de resdu pesat per gl element fnt a soluzone delle equazon dfferenzal con l metodo d Galerkn Tra le procedure generalmente adottate per formulare e rsolvere le equazon dfferenzal con un metodo
Dettagli{ 1, 2,..., n} Elementi di teoria dei giochi. Giovanni Di Bartolomeo Università degli Studi di Teramo
Element d teora de goch Govann D Bartolomeo Unverstà degl Stud d Teramo 1. Descrzone d un goco Un generco goco, Γ, che s svolge n un unco perodo, può essere descrtto da una Γ= NSP,,. Ess sono: trpla d
DettagliLezione 2 a - Statistica descrittiva per variabili quantitative
Lezone 2 a - Statstca descrttva per varabl quanttatve Esempo 5. Nella tabella seguente sono rportat valor del tasso glcemco rlevat su 10 pazent: Pazente Glcema (mg/100cc) 1 x 1 =103 2 x 2 =97 3 x 3 =90
DettagliINTERPOLAZIONE MEDIANTE CURVE SPLINE. '' ( b ) = 0
INTERPOLAZIONE EDIANTE CURVE SPLINE Defnzone del problema Sovente, nelle applcazon grafche (CAD Computer Aed Desgn), s ha la necesstà d traccare, dat alcun punt, una lnea che l raccord e che sa suffcentemente
DettagliLA VARIABILITA. Nella metodologia statistica si distinguono due aspetti della variabilità:
LA VARIABILITA LA VARIABILITA E L ATTITUDINE DEL FENOMENO QUANTITATIVO AD ASSUMERE DIVERSE MODALITA, O MEGLIO LA TENDENZA DI OGNI SINGOLA OSSERVAZIONE AD ASSUMERE VALORI DIFFERENTI RISPETTO AL VALORE MEDIO.
DettagliCapitolo 3 Covarianza, correlazione, bestfit lineari e non lineari
Captolo 3 Covaranza, correlazone, bestft lnear e non lnear ) Covaranza e correlazone Ad un problema s assoca spesso pù d una varable quanttatva (es.: d una persona possamo determnare peso e altezza, oppure
DettagliMetodi e Modelli per l Ottimizzazione Combinatoria Progetto: Metodo di soluzione basato su generazione di colonne
Metod e Modell per l Ottmzzazone Combnatora Progetto: Metodo d soluzone basato su generazone d colonne Lug De Govann Vene presentato un modello alternatvo per l problema della turnazone delle farmace che
DettagliFACOLTÀ DI SOCIOLOGIA CdL in SCIENZE DELL ORGANIZZAZIONE ESAME di STATISTICA 17/09/2012
CdL n SCIENZE DELL ORGANIZZAZIONE ESAME d STATISTICA ESERCIZIO 1 (+.5+.5+3) La tabella seguente rporta la dstrbuzone d frequenza del peso X n gramm d una partta d mele provenent da un certo frutteto. X=peso
DettagliStatistica e calcolo delle Probabilità. Allievi INF
Statstca e calcolo delle Probabltà. Allev INF Proff. L. Ladell e G. Posta 06.09.10 I drtt d autore sono rservat. Ogn sfruttamento commercale non autorzzato sarà perseguto. Cognome e Nome: Matrcola: Docente:
DettagliLa regressione. La Regressione. La Regressione. min. min. Var X. X Variabile indipendente (data) Y Variabile dipendente
Unverstà d Macerata Facoltà d Scenze Poltche - Anno accademco - La Regressone Varable ndpendente (data) Varable dpendente Dpendenza funzonale (o determnstca): f ; Da un punto d vsta analtco, valor della
Dettagli1 La domanda di moneta
La domanda d moneta Eserczo.4 (a) Keynes elenca tre motv per detenere moneta: Scopo transattvo Scopo precauzonale Scopo speculatvo Il modello d domanda d moneta a scopo speculatvo d Keynes consdera la
DettagliSommario. Obiettivo. Quando studiarla? La concentrazione. X: carattere quantitativo tra le unità statistiche. Quando studiarla?
Corso d Statstca a.a. 9- uando studarla? Obettvo Dagramma d Lorenz Rapporto d concentrazone rea d concentrazone Esemp Sommaro La concentrazone uando studarla? Obettvo X: carattere quanttatvo tra le untà
Dettagli3 (solo esame 6 cfu) Elementi di Analisi Numerica, Probabilità e Statistica, modulo 2: Elementi di Probabilità e Statistica (3 cfu)
lement d Anals Numerca, Probabltà e Statstca, modulo 2: lement d Probabltà e Statstca ( cfu) Probabltà e Statstca (6 cfu) Scrtto del 06 febbrao 205. Secondo Appello Id: A Nome e Cognome: same da 6 cfu
DettagliMinistero della Salute D.G. della programmazione sanitaria --- GLI ACC - L ANALISI DELLA VARIABILITÀ METODOLOGIA
Mnstero della Salute D.G. della programmazone santara --- GLI ACC - L ANALISI DELLA VARIABILITÀ METODOLOGIA La valutazone del coeffcente d varabltà dell mpatto economco consente d ndvduare gl ACC e DRG
DettagliRAPPRESENTAZIONE DI MISURE. carta millimetrata
carta mllmetrata carta mllmetrata non è necessaro rportare sul foglo la tabella (ma auta; l mportante è che sta da qualche parte) carta mllmetrata 8 7 6 5 4 3 smbolo della grandezza con untà d msura!!!
DettagliMatematica II: Calcolo delle Probabilità e Statistica Matematica
Matematca II: Calcolo delle Probabltà e Statstca Matematca ELT A-Z Docente: dott. F. Zucca Eserctazone # 8 Gl esercz contrassegnat con (*) sono tratt da Eserc. 2002-2003- Prof. Secch # 0 - Statstca Matematca
DettagliConcetti principale della lezione precedente
Corso d Statstca medca e applcata 6 a Lezone Dott.ssa Donatella Cocca Concett prncpale della lezone precedente I concett prncpal che sono stat presentat sono: I fenomen probablstc RR OR ROC-curve Varabl
Dettagli= = = = = 0.16 NOTA: X P(X) Evento Acquisto PC Intel Acquisto PC Celeron P(X)
ESERCIZIO 3.1 Una dtta vende computer utlzzando on-lne, utlzzando sa processor Celeron che processor Intel. Dat storc mostrano che l 80% de clent preferscono acqustare un PC con processore Intel. a) Sa
Dettagli1. La domanda di moneta
1. La domanda d moneta Esercz svolt Eserczo 1.1 (a) S consder l modello della domanda d moneta a scopo speculatvo d Keynes. Un ndvduo può sceglere d allocare la propra rcchezza sottoscrvendo un ttolo rredmble
DettagliAppunti di Econometria
Appunt d Econometra ARGOMENTO [4]: VARIABILI DIPENDENTI BINARIE Mara Lusa Mancus Unverstà Boccon Novembre 200 Introduzone Ne modell econometrc studat fno ad ora la varable dpendente, y, è sempre stata
DettagliEsercizi sulle reti elettriche in corrente continua (parte 2)
Esercz sulle ret elettrche n corrente contnua (parte ) Eserczo 3: etermnare gl equvalent d Thevenn e d Norton del bpolo complementare al resstore R 5 nel crcuto n fgura e calcolare la corrente che crcola
DettagliLa ripartizione trasversale dei carichi
La rpartzone trasversale de carch La dsposzone de carch da consderare ne calcol della struttura deve essere quella pù gravosa, ossa quella che determna massm valor delle sollectazon. Tale aspetto nveste
DettagliMetodi variazionali. ed agiscono sulla FORMA DEBOLE DEL PROBLEMA
Metod varazonal OBIETTIVO: determnare funzon ncognte, chamate varabl dpendent, che soddsfano un certo nseme d equazon dfferenzal n un determnato domno e condzon al contorno STRUMETO: Metod varazonal: servono
DettagliIl modello markoviano per la rappresentazione del Sistema Bonus Malus. Prof. Cerchiara Rocco Roberto. Materiale e Riferimenti
Il modello marovano per la rappresentazone del Sstema Bonus Malus rof. Cercara Rocco Roberto Materale e Rferment. Lucd dstrbut n aula. Lemare 995 (pag.6- e pag. 74-78 3. Galatoto G. 4 (tt del VI Congresso
DettagliCAPITOLO 3 Incertezza di misura Pagina 26
CAPITOLO 3 Incertezza d msura Pagna 6 CAPITOLO 3 INCERTEZZA DI MISURA Le operazon d msurazone sono tutte nevtablmente affette da ncertezza e coè da un grado d ndetermnazone con l quale l processo d msurazone
DettagliL'Analisi in Componenti Principali. Luigi D Ambra Dipartimento di Matematica e Statistica Università di Napoli Federico II
L'Anals n Component Prncpal Lug D Ambra Dpartmento d Matematca e Statstca Unverstà d Napol Federco II ANALISI MULTIDIMENSIONALE DEI DATI (AMD) L Anals Multdmensonale de Dat (AMD) è una famgla d tecnche
DettagliEsercitazioni del corso di Relazioni tra variabili. Giancarlo Manzi Facoltà di Sociologia Università degli Studi di Milano-Bicocca
Eserctazon del corso d Relazon tra varabl Gancarlo Manz Facoltà d Socologa Unverstà degl Stud d Mlano-Bcocca e-mal: gancarlo.manz@statstca.unmb.t Terza eserctazone Mlano, 8 febbrao 7 SOMMARIO TERZA ESERCITAZIONE
DettagliProgetto di travi in c.a.p isostatiche Il tracciato del cavi e il cavo risultante
Unverstà degl Stud d Roma Tre - Facoltà d Ingegnera Laurea magstrale n Ingegnera Cvle n Protezone Corso d Cemento Armato Precompresso A/A 2015-16 Progetto d trav n c.a.p sostatche Il traccato del cav e
DettagliUna semplice applicazione del metodo delle caratteristiche: la propagazione di un onda di marea all interno di un canale a sezione rettangolare.
Una semplce applcazone del metodo delle caratterstche: la propagazone d un onda d marea all nterno d un canale a sezone rettangolare. In generale la propagazone d un onda monodmensonale n una corrente
DettagliUniversità degli Studi di Urbino Facoltà di Economia
Unverstà degl Stud d Urbno Facoltà d Economa Lezon d Statstca Descrttva svolte durante la prma parte del corso d corso d Statstca / Statstca I A.A. 004/05 a cura d: F. Bartolucc Lez. 8/0/04 Statstca descrttva
DettagliNOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA
NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI CONFRONTO DI PIU MEDIE IL METODO DI ANALISI DELLA VARIANZA IL PROBLEMA Supponamo d voler studare l effetto d 4 dverse dete su un campone casuale d 4
DettagliEsame di Statistica tema A Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011
Esame d Statstca tema A Corso d Laurea n Economa Prof.ssa Gordano Appello del /07/0 Cognome Nome atr. Teora Dmostrare che la somma degl scart dalla meda artmetca è zero. Eserczo L accesso al credto è sempre
DettagliAlgebra 2. 6 4. Sia A un anello commutativo. Si ricorda che in un anello commutativo vale il teorema binomiale, cioè. (a + b) n = a i b n i i.
Testo Fac-smle 2 Durata prova: 2 ore 8 1. Un gruppo G s dce semplce se suo unc sottogrupp normal sono 1 e G stesso. Sa G un gruppo d ordne pq con p e q numer prm tal che p < q. (a) Il gruppo G può essere
DettagliAnalisi di mercurio in matrici solide mediante spettrometria di assorbimento atomico a vapori freddi
ESEMPIO N. Anals d mercuro n matrc solde medante spettrometra d assorbmento atomco a vapor fredd 0 Introduzone La determnazone del mercuro n matrc solde è effettuata medante trattamento termco del campone
DettagliSoluzioni 3.1. n(n 1) (n k + 1) z n k! k + 1 n k. lim k
(1) La sere bnomale è B n (z) = k=0 Con l metodo del rapporto s ottene R = lm k Soluzon 3.1 n(n 1) (n k + 1) z n k! c k c k+1 = lm k k + 1 n k lm k c k z k. k=0 1 + 1 k 1 n k = 1 (2) La multfunzone f(z)
DettagliLezione 10. L equilibrio del mercato finanziario: la struttura dei tassi d interesse
Lezone 1. L equlbro del mercato fnanzaro: la struttura de tass d nteresse Ttol con scadenza dversa hanno prezz (e tass d nteresse) dfferent. Due ttol d durata dversa emess dallo stesso soggetto (stesso
Dettagli* * * Nota inerente il calcolo della concentrazione rappresentativa della sorgente. Aprile 2006 RL/SUO-TEC 166/2006 1
APAT Agenza per la Protezone dell Ambente e per Servz Tecnc Dpartmento Dfesa del Suolo / Servzo Geologco D Itala Servzo Tecnologe del sto e St Contamnat * * * Nota nerente l calcolo della concentrazone
DettagliAdattamento di una relazione funzionale ai dati sperimentali
Adattamento d una relazone 1 funzonale a dat spermental Sno ad ora abbamo vsto come può essere stmato, con un certo lvello d confdenza, l valore vero d una grandezza fsca (dretta o dervata) con l suo ntervallo
DettagliTeoria dei Giochi. Dr. Giuseppe Rose Università degli Studi della Calabria Corso di Laurea Magistrale in Economia Applicata a.a 2011/2012 Handout 4
Teora de Goch Dr. Guseppe Rose Unverstà degl Stud della Calabra Corso d Laurea Magstrale n Economa Applcata a.a 011/01 Handout 4 1 L equlbro d Bertrand Nel modello d Bertrand, abbamo un duopolo esattamente
DettagliEsame di Statistica tema B Corso di Laurea in Economia Prof.ssa Giordano Appello del 15/07/2011
Esame d Statstca tema B Corso d Laurea n Economa Prof.ssa Gordano Appello del 15/07/011 Cognome Nome Matr. Teora Dmostrare la propretà assocatva della meda artmetca. Eserczo 1 L accesso al credto è sempre
DettagliRegressione lineare con un singolo regressore
Regressone lneare con un sngolo regressore Eduardo Ross 2 2 Unverstà d Pava (Italy) Marzo 2013 Ross Regressone lneare semplce Econometra - 2013 1 / 45 Outlne 1 Introduzone 2 Lo stmatore OLS 3 Esempo 4
DettagliRicerca Operativa e Logistica Dott. F.Carrabs e Dott.ssa M.Gentili. Modelli per la Logistica: Single Flow One Level Model Multi Flow Two Level Model
Rcerca Operatva e Logstca Dott. F.Carrabs e Dott.ssa M.Gentl Modell per la Logstca: Sngle Flow One Level Model Mult Flow Two Level Model Modell d localzzazone nel dscreto Modell a Prodotto Sngolo e a Un
Dettagli4.6 Dualità in Programmazione Lineare
4.6 Dualtà n Programmazone Lneare Ad ogn PL n forma d mn (max) s assoca un PL n forma d max (mn) Spaz e funzon obettvo dvers ma n genere stesso valore ottmo! Esempo: l valore massmo d un flusso ammssble
DettagliModelli descrittivi, statistica e simulazione
Modell descrttv, statstca e smulazone Master per Smart Logstcs specalst Roberto Cordone (roberto.cordone@unm.t) Statstca descrttva Cernusco S.N., govedì 28 gennao 2016 (9.00/13.00) 1 / 15 Indc d poszone
DettagliScienze Geologiche. Corso di Probabilità e Statistica. Prove di esame con soluzioni
Scenze Geologche Corso d Probabltà e Statstca Prove d esame con soluzon 004-005 1 Corso d laurea n Scenze Geologche - Probabltà e Statstca Appello del 1 gugno 005 - Soluzon 1. (Punt 3) In una certa zona,
DettagliCorso di Statistica (canale P-Z) A.A. 2009/10 Prof.ssa P. Vicard
Corso d Statstca (canale P-Z) A.A. 2009/0 Prof.ssa P. Vcard VALORI MEDI Introduzone Con le dstrbuzon e le rappresentazon grafche abbamo effettuato le prme sntes de dat. E propro osservando degl stogramm
DettagliLa teoria microeconomica del consumo
Isttuzon d Economa Matematca La teora mcroeconomca del consumo Il problema del consumatore 2 a parte. Maro Sportell Dpartmento d Matematca Unverstà degl Stud d Bar Va E. Orabona, 4 I 70125 Bar (Italy)
DettagliPrecisione e Cifre Significative
Precsone e Cfre Sgnfcatve Un numero (una msura) è una nformazone! E necessaro conoscere la precsone e l accuratezza dell nformazone. La precsone d una msura è contenuta nel numero d cfre sgnfcatve fornte
DettagliAlgoritmi di Classificazione Non Lineari
Algortm d Classfcazone Non Lnear Eserctazon per l corso d Logca ed Intellgenza Artfcale a.a. 2015 16 Jessca Rosat Regressone Logstca Superfce d separazone lneare Modell Lnear Generalzzat (GLMs) ϕ (x) =x
DettagliPropagazione degli errori statistici. Test del χ 2 per la bontà di adattamento. Metodo dei minimi quadrati.
Propagazone degl error statstc. Test del χ per la bontà d adattamento. Metodo de mnm quadrat. Eserctazone 14 gennao 004 1 Propagazone degl error casual Sano B 1,..., B delle varabl casual con valor attes
DettagliPotenzialità degli impianti
Unverstà degl Stud d Treste a.a. 2009-2010 Impant ndustral Potenzaltà degl mpant Impant ndustral Potenzaltà degl mpant 1 Unverstà degl Stud d Treste a.a. 2009-2010 Impant ndustral Defnzone della potenzaltà
DettagliSOLUZIONE ESERCIZI: STRUTTURA DI MERCATO. ECONOMIA INDUSTRIALE Università degli Studi di Milano-Bicocca. Christian Garavaglia
SOLUZIONE ESERCIZI: STRUTTURA DI MERCATO ECONOMIA INDUSTRIALE Unverstà degl Stud d Mlano-Bcocca Chrstan Garavagla Soluzone 7 a) L ndce d concentrazone C (o CR k ) è la somma delle uote d mercato (o share)
DettagliNorma UNI CEI ENV 13005: Guida all'espressione dell'incertezza di misura
orma UI CEI EV 3005: Guda all'espressone dell'ncertezza d msura L obettvo d una msurazone è quello d determnare l valore del msurando, n altre parole della grandezza da msurare. In generale, però, l rsultato
DettagliAllenamenti di matematica: Teoria dei numeri e algebra modulare Soluzioni esercizi
Allenament d matematca: Teora de numer e algebra modulare Soluzon esercz 29 novembre 2013 1. Canguro salterno. Un canguro salterno s trova a ped d una scala nfnta che ntende salre nel seguente modo: Salta
DettagliRegressione lineare: definizione delle incertezze dei coefficienti (calibrazione e regressione generica)
Regressone lneare: defnzone delle ncertezze de coeffcent (calbrazone e regressone generca) Argoment: regressone lneare affetta da ncertezza; ncertezza del coeffcente angolare della retta d regressone;
DettagliModelli con varabili binarie (o qualitative)
Modell con varabl bnare (o qualtatve E( Y X α + βx + ε quando Y è una varable benoullana Y 1 0 s ha l modello lneare d probabltà Pr( Y 1 X α + βx + ε dove valor stmat della Y assumono l sgnfcato d probabltà.
Dettagli1. Fissato un conveniente sistema di riferimento cartesiano Oxy si studino le funzioni f e g e se ne disegnino i rispettivi grafici G, G.
Problema 1 S consderno le funzon f e g defnte, per tutt gl x real, da: f ( x) = x 3 4 x, g( x) = sn( π x) 1. Fssato un convenente sstema d rfermento cartesano Oxy s studno le funzon f e g e se ne dsegnno
DettagliCPM: Calcolo del Cammino Critico
Supponamo d conoscere per ogn attvtà A = (,j) la sua durata t j t j j Calcolamo l tempo al pù presto n cu può nzare o fnre una attvtà. Supponamo d dover calcolare l tempo al pù presto n cu s possono nzare
DettagliGli errori nelle misure
Appunt d Msure Elettrche Gl error nelle msure Classfcazone degl error... Error sstematc...4 Accuratezza e precsone...5 Errore stmato...7 Meda, devazone meda, devazone standard e varanza d un campone d
DettagliEsercitazione sulle Basi di di Definizione
Eserctazone sulle as d d Defnzone ESERIZIO Un bpolo ressto (dodo) ha la seguente equazone: = k [ 0 + 00] con k 0 nella quale ed sono descrtt dalla conenzone degl utlzzator come n fgura. Stablre se l bpolo
DettagliRappresentazione dei numeri PH. 3.1, 3.2, 3.3
Rappresentazone de numer PH. 3.1, 3.2, 3.3 1 Tp d numer Numer nter, senza segno calcolo degl ndrzz numer che possono essere solo non negatv Numer con segno postv negatv Numer n vrgola moble calcol numerc
DettagliLA COMPATIBILITA tra due misure:
LA COMPATIBILITA tra due msure: 0.4 Due msure, supposte affette da error casual, s dcono tra loro compatbl quando la loro dfferenza può essere rcondotta ad una pura fluttuazone statstca attorno al valore
DettagliValutazione dei Benefici interni
Corso d Trasport Terrtoro prof. ng. Agostno Nuzzolo Valutazone de Benefc ntern Valutazone degl ntervent Indvduazone degl effett rlevant La defnzone degl effett rlevant per un ntervento sul sstema d trasporto
DettagliStatistica descrittiva
Statstca descrttva. Indc d poszone. Per ndc d poszone d un nseme d dat, ordnat secondo la loro randezza, s ntendono alcun valor che cadono all nterno dell nseme. Gl ndc pù usat sono: I. eda. II. edana.
DettagliESERCIZI DI MATEMATICA FINANZIARIA DIPARTIMENTO DI ECONOMIA E MANAGEMENT UNIFE A.A. 2016/2017. Esercizi 3
ESERCIZI DI MATEMATICA FINANZIARIA DIPARTIMENTO DI ECONOMIA E MANAGEMENT UNIFE A.A. 2016/2017 Esercz 3 Pan d ammortamento Eserczo 1. Un prestto d 12000e vene rmborsato n 10 ann con rate mensl e pano all
DettagliLe obbligazioni: misure di rendimento e rischio La curva dei rendimenti per scadenze
Le obblgazon: msure d rendmento e rscho La curva de rendment per scadenze Economa del Mercato Moblare A.A. 2017-2018 La curva de rendment (yeld curve) (1) Il rendmento d un ttolo obblgazonaro dpende da
Dettagli6. Catene di Markov a tempo continuo (CMTC)
6. Catene d Markov a tempo contnuo (CMTC) Defnzone Una CMTC è un processo stocastco defnto come segue: lo spazo d stato è dscreto: X{x,x 2, }. L nseme X può essere sa fnto sa nfnto numerable. L nseme de
DettagliUNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II FACOLTÀ DI INGEGNERIA
UNIVERSITÀ DEGLI STUDI DI NAPOLI FEDERICO II FACOLTÀ DI INGEGNERIA CORSO DI LAUREA IN INGEGNERIA PER L AMBIENTE E IL TERRITORIO METODI DI LOCALIZZAZIONE DEL RISALTO IDRAULICO RELATORE Ch.mo Prof. Ing.
DettagliLa retroazione negli amplificatori
La retroazone negl amplfcator P etroazonare un amplfcatore () sgnfca sottrarre (o sommare) al segnale d ngresso (S ) l segnale d retroazone (S r ) ottenuto dal segnale d uscta (S u ) medante un quadrpolo
DettagliCAPITOLO 3 CIRCUITI DI RESISTORI
CAPITOLO 3 CIRCUITI DI RESISTORI Pagna 3. Introduzone 70 3. Connessone n sere e connessone n parallelo 70 3.. Bpol resstv n sere 7 3.. Bpol resstv n parallel 77 3.3 Crcut resstv lnear e sovrapposzone degl
Dettagli1) Dato un carattere X il rapporto tra devianza entro e devianza totale è 0.25 e la devianza totale è 40. La devianza tra vale: a) 10 b) 20 c) 30
1) Dato un carattere X l rapporto tra devanza entro e devanza totale è 0.25 e la devanza totale è 40. La devanza tra vale: a) 10 b) 20 c) 30 2) Data una popolazone normalmente dstrbuta con meda 10 e varanza
Dettagli