Modellazone sasca a fn prevsv Inroduzone Daa una varable casuale y, d qualsas naura (ossa sa d po qualavo che quanavo), uno de prncpal obev d un rcercaore è quello d poer prevedere valor che essa porebbe assumere n un arco emporale o n un coneso spazale dverso da quello che è sao osservao araverso l esrazone d un campone. Se è saa osservaa una sere d n osservazon, ( y, y, y ),, n, y, y può ndcare l valore che la varable y assume al empo ed n queso caso s parla d anals emporale o d sere sorche, oppure l valore assuno dall esma unà osservaa, ed n queso caso s parla d anals d po crosssecon; è pure possble consderare un campone d osservazon sulle sesse n unà camponare per T perod emporal, n al caso s avranno le osservazon { y } j, con =,,,n e j=,, T, dove l ndce ndca l unà camponara d osservazone e l ndce j ndca l perodo emporale d osservazon: s parla n queso caso d anals longudnale. Daa la sere { } n y =, emporale o d po cross-secon, l rcercaore vuole qund essere n grado d poer valuare y n un unà (emporale o spazale) dversa da quelle osservae. Per raggungere queso obevo è necessaro cosrure un modello sasco maemaco, nel quale sa espressa la relazone che lega la varable d neresse y ad un nseme d alre varabl, dee esplcave o predor. Un modello n cu una varable è espressa n funzone d alre, ossa n cu un nseme d varabl esplcave nfluenzano la
deermnazone della varable d neresse, per cu da un puno d vsa logco-deduvo ale varable è conseguene alle alre, è deo modello d po regressvo; se nvece nel modello non c è un nseme d varabl che spega un alra varable, ma ue le varabl s nfluenzano fra d loro, allora l modello è deo correlavo. Per ruscre a fare prevsone su una sngola varable bsogna consderare un modello d po regressvo. In un ale modello, le varabl esplcave, ndcae con l veore d- dmensonale ossa = (, ), non deermnano la varable y, ma,, d la nfluenzano; ossa ad un valore ben precso del veore non è assocao un unco valore della varable y, n modo deermnsco: s parla nfa d modellazone socasca e non deermnsca. La modellazone deermnsca è una modellazone che va bene nelle scenze esae, ma non è applcable nelle scenze soco-economche, caraerzzae da fenomen alamene varabl ed nrnsecamene socasc. Un modello regressvo d po socasco ena d modellare n manera ssemaca l valore aeso della varable y condzonaamene al veore d esplcave, ossa s cerca d rovare una funzone f che soddsf la seguene relazone: ( y ) f ( ) E =. La funzone f che lega l veore e la varable y, non è però noa al rcercaore (ranne cas parcolar), per cu cò che l rcercaore deve fare è deermnare una funzone fˆ che approssm bene la funzone gnoa f. Per fare cò s possono due segure due approcc dvers; un prmo approcco è quello paramerco, nel quale l rcercaore defnsce a pror una forma per la funzone f, che dpende da un veore d paramer θ (olre che da ), per cu la relazone precedene vene rscra nel seguene modo: [ y ] f ( ;θ ) E =
con f compleamene esplcaa e θ veore d paramer che dovrà essere smao per mezzo d un campone d osservazon {( )} n, y ; l alro = approcco, che vene defno non paramerco, non fa nessuna assunzone a pror sulla funzone f e non consdera nessun po d paramer θ da smare, ma sma dreamene la funzone f araverso una meda ponderaa locale delle y presen n un norno muldmensonale d ; alcun approcc enano d combnare due approcc consderando la funzone f come somma d due funzon: una defna a pror e specfcaa da un veore d paramer e l alra non specfcaa, ma smaa araverso mede ponderae local. Consderando un approcco d po paramerco nel quale, come gà affermao, occorre defnre a pror una funzone ben specfcaa f, la merca della varable y goca un ruolo chave nella scela del po d funzone f da consderare. Cò perché l codomno della funzone f, relavamene all nseme D ossa lo spazo de predor, deve concdere con lo spazo a cu apparene l valore aeso E [ y ] ; s consder, ad esempo, una varable y d po bernoullano, per cu l suo valore aeso condzonao [ y ] E, che ndca la probablà d successo condzonaamene a, gace nell nervallo (,) ed un veore d esplcave ale che D R d, n queso caso bsogna sceglere una funzone f l cu codomno, relavamene all nseme D, sa l nervallo (,), per cu appare ovvo che una funzone d po lneare f ( ) = θ non è ammssble, n quano l codomno d f relavamene a D è l nseme de numer real R, ossa f ( D) = R (,) ; n una smle suazone s scelgono, e = + e ad esempo, funzon d po logsco f ( ; θ ) che soddsfano la condzone rchesa. θ θ 3
In generale occorre dsnguere modell relav a varabl d po quanavo, da modell per varabl qualave: nel prmo caso s parla d regressone, menre nel secondo caso s parla d classfcazone. Regressone Ne modell d po regressvo, alla componene deermnsca del modello, ossa [ y ] f ( ) E =, raandos d modellazone d po socasco, s aggunge una componene casuale, per cu l modello vene rscro n ermn d y e s consdera: (,ε ) y = f ; mpegando un approcco d po paramerco, occorre aggungere l veore de paramer θ come argomeno della funzone f ; usualmene s pozza che l nfluenza della varable casuale ε sulla varable d neresse y sa d po addvo, per cu, aggungendo l veore de paramer come argomeno, l modello vene scro nel seguene modo: ( ) ε y = f ;θ +. S no che cò che è mporane è la merca della varable y, menre la merca della varable, che comunque ha una sua mporanza, non enra dreamene nella scela del po d funzone f. Infa, è sempre possble rasformare una varable qualava n una varable d po numerco, araverso l ulzzo d ndcaor, senza modfcare l nformazone presene ne da. S pozz ad esempo che la varable (con d=, per poes) sa qualava e che abba 3 possbl modalà, per rasformare ale varable n numerca occorre consderare un veore rdmensonale nel quale ogn sngola componene è assocaa ad una modalà qualava, che avrà (relavamene ad ogn osservazone) un valore par ad uno per la 4
componene assocaa alla modalà osservaa e zero per le alre due modalà; per cu se un unà camponara presena un valore par alla seconda modalà qualava, allora l veore numerco assocao sarà (,,). Con ale operazone è conservaa ua l nformazone presene ne da: la possblà d poer raare come numerca una varable qualava, ha l unco svanaggo d complcare la raazone del modello, ma daa la poenza degl aual elaboraor cò non cosusce pù un problema. La rasformazone d una varable quanava n qualava è pure possble, araverso una caegorzzazone n class, ma n queso caso s ha una noevole perda d nformazone, per cu non è consglable effeuare ale rasformazone, ranne ne cas n cu non neressa ua l nformazone presene nella varable, ma solano un nformazone pù rdoa. Seguendo un approcco d po paramerco, occorre defnre la forma funzonale della funzone f e fare una sere d assunzon plausbl, pù o meno for, sulla varable casuale ε. Defno compleamene l modello e le poes soosan, s passa alla sma del modello, che n un approcco paramerco corrsponde a smare l veore paramerco θ ; meod d sma sono dvers e dpendono dalle nformazon dsponbl e dalle poes fae sull errore casuale ε. I prncpal meod d sma sono: - della massma verosmglanza, qualora s renga d conoscere la dsrbuzone del campone d osservazon y = ( y y, ), ossa p ( y;θ );,, - de mnm quadra ordnar, se s pozza che l veore d error = ( ε ε ) abba una marce d varanza e covaranze V del ε,,, ε n y n po V = σ I (dove I è la marce denà), ossa gl error sano 5
omoschedasc (coè abbano la sessa varanza σ = σ e non correla Cov(,ε ) = j ε ; j =,,, ) n - de mnm quadra pondera, se l veore degl error ε ha una marce d varanze e covaranze V dagonale, del po: V = dag (, σ,, σ ) n σ = σ σ σ n ossa gl error sono eeroschedasc (coè con varanze dverse), ma ncorrela; - de mnm quadra generalzza, per V qualsas. Sma paramer del modello ed oenuo l veore d smaor θˆ, occorre verfcare se l modello smao f ( ;θˆ ) fornsce rsula soddsfacen; per ale ragone s mplemenano una sere d es sasc per verfcare che le assunzon fae sano plausbl con da e qund per verfcare la plausblà del modello smao. Uno srumeno ndspensable per verfcare l aendblà d un modello è l anals de resdu, dove resdu { r } n = sono defn come la dfferenza fra valor y osserva e calcola per mezzo del modello ossa r ( y f ( ;θˆ ) =. Dopo aver verfcao la valdà del modello, lo sesso può essere ulzzao per var scop, prncpal sono: - descrv; - prevsv; - smulav. Il modello consene, qund, d poer fornre una spegazone logca a fenomen e qund d descrverne la dnamca. Per ale scopo è però necessaro mplemenare un modello d facle leura, che consena qund 6
d capre con charezza l ruolo che ogn varable esplcava goca nell nfluenzare le deermnazon d y, cò corrsponde a defnre una funzone f non roppo complessa e ale che consena d arbure un sgnfcao specfco a paramer θ che la specfcano. Se nvece l ulzzo prncpale del modello è per scop prevsv, allora non mpora assoluamene l po d funzone f che lega ed y, ma neressa cosrure semplcemene un meccansmo che dao un nseme d npu sa n grado d fornre una prevsone accuraa dell oupu assocao. Per ale movo, n un coneso prevsvo, sanno avendo una connua dffusone modell defn black bo, ne qual l rcercaore non conosce esaamene qual è la funzone maemaca che lega npu ed oupu; l modello defnsce un meccansmo araverso l quale al varabl sono legae, araverso una sere d osservazon, n manera adava. Per evare che al modell s adano compleamene a da osserva, coè che s cre una funzone per cu resdu d ale modello sano u null, vengono consdera ermn d penalzzazone alla funzone d errore da mnmzzare per smare l modello, la quale msura la dsanza fra da osserva e da calcola medane l modello da adaare. Un esempo d modello a scaola nera è quello degl algorm a ree neurale, dove npu ed oupu sono lega da una funzone complessa, che l rcercaore non conosce esaamene. Lo scopo della prevsone, come gà accennao all nzo del lavoro, è quello d conoscere l valore d y n unà (emporal o spazal) non osservae; per cu se l modello adaao per l -esma unà è yˆ ( ; θ ) + ε = f ˆ, l rcercaore porà prevedere l valore d y n corrspondenza d una cera confgurazone del veore d varabl esplcave. 7
In un modello d sere sorche con d rard, coè n cu le esplcave sano valor aneceden della varable d neresse, ossa = ( y ), y,, y d e le n osservazon sono rfere ad n osservazon n perod dvers, allora l rcercaore porebbe voler prevedere l valore y n+, ossa l valore successvo all ulma osservazone emporale, e mpegando l modello adaao prevedrà y n+ nel seguene modo: ( y, y,, y ;θˆ ) ˆ n+ = f n n n d + y. Facendo assunzone pù for sugl error { ε }, sarà possble rcavare un nervallo d prevsone per y, ma affnché cò sa possble è necessaro conoscere la dsrbuzone d probablà della varable casuale ŷ, che dpenderà dalla dsrbuzone conguna degl error, dalla dsrbuzone conguna degl smaor e dalla funzone f che esprme la dpendenza. A queso puno sorge un grosso problema: per scop prevsv s ulzzano spesso funzon molo complesse, che speghno bene l comporameno d y n funzone d, ma se f è molo complessa allora è pracamene mpossble rcavare la dsrbuzone esaa o asnoca della varable aleaora ŷ, per cu sembrerebbe mpossble ruscre a fornre un nervallo d prevsone (a,b) al 95%, coè ale che sa: { yˆ b}, 95 Pr a =. Per rsolvere ale problema s possono mpegare ecnche smulave d po Mone Carlo, che ovvamene non c danno una rsposa esaa al problema, ma fornscono rspose molo soddsfacen. Per mplemenare al procedure è necessaro dsporre d un poene elaboraore e qund smulare la generazone d pseudo-campon dalle dsrbuzon d probablà consderae; pù precsamene, la procedura da segure può essere la seguene: 8
- s genera un elevao numero d campon d error accdenal { ε j }, provenen dalla dsrbuzone eorca pozzaa p ( ε ), con l ndce che ndca l unà camponara e l ndce j che ndca l campone esrao; - s fssa l veore paramerco θ (la procedura dovrà essere effeuaa per vare confgurazon d ale paramero); - s generano campon { y j } dalla dsrbuzone eorca ( y;θ ) p ; - s generano campon per le varabl esplcave, oppure s fssano confgurazon a pror del po { j }; - per ogn campone j, s sma l veore de paramer araverso l meodo d sma scelo e s avrà θˆ j ; - s calcolano valor eorc per ogn campone e per ogn unà, ossa: yˆ j j ( ; θ j ) + ε j = f ˆ - s deermna la dsrbuzone d probablà emprca d ŷ che rappresena una sma della vera dsrbuzone d probablà; per cu è possble smare un nervallo d prevsone sulla base d ale funzone. È comprensble che generando un numero elevao d osservazon, s avrà una dsrbuzone emprca che sarà pracamene smle alla vera dsrbuzone eorca ncogna, per cu l problema nconrao n precedenza è rsolvble rcorrendo a queso approcco. Sebbene sano aualmene dsponbl elaboraor molo poen, non sempre è possble segure ale va; s consder nfa l caso d modell molo compless, la cu sma rchede eleva emp d elaborazone (come avvene ad esempo per modell a scaola nera), è mpensable n ale suazone generare un elevao numero d campon e per ognuno d ques smare l modello consderao, al fne d rcavare la dsrbuzone emprca 9
d ŷ : se per un cero modello, ad esempo, emp d elaborazone rches per la sma sono d ora, generando. campon, l empo necessaro per poer smare. vole l modello è d. ore, ossa par a crca ann! In alcun cas è possble collegare n parallelo alcun compuer e generare un cero numero d campon e smarne l relavo modello su ognuno d ess, qund raccoglere le nformazon ndpenden forne da var compuer al fne d rcavare la dsrbuzone emprca d ŷ. Un ulzzo de modell molo analogo a quello prevsvo è quello smulavo: l rcercaore è neressao a capre quale dnamca avrebbe la y n funzone d una cera confgurazone delle esplcave. Poso n ques ermn, l problema sembra analogo a quello della prevsone; formalmene, ossa da un puno d vsa algormco, le due procedure s equvalogono, poché bsogna sempre verfcare cosa accade alla y facendo cere poes sulla. La dfferenza sosanzale fra due approcc è d po conceuale: n ambo prevsvo l rcercaore consdera una confgurazone d effeva, coè, per esempo, consderando un anals d sere sorche con = ( y y,, y ), l rcercaore,, d + conosce esaamene l valore che le esplcave assumono al empo, n quano al da sono presen nel campone d osservazon d cu dspone e che ha ulzzao per smare l modello; n ambo smulavo, nvece, l rcercaore fa un poes d lavoro, ossa s chede cosa accadrebbe alla y qualora capasse che la sa par a un valore fssao, ma non è deo che l valore s verfch; ad esempo, nell anals delle sere sorche, l rcercaore porebbe assumere che ad un cero perodo fuuro (+j ) s possa verfcare una cera confgurazone delle y aneceden ale perodo, ma conseguen l perodo auale n e cheders, qund, che valore assumerebbe
y +, daa l poes d lavoro ( y y,, y ) j + j = + j, + j + j d e pozzando che l modello smao al empo n sa valdo anche per l perodo fuuro oggeo d anals (problema della sablà). Il rcercaore, anche n queso caso, rcaverà l valore ndagao allo sesso modo, coè: ˆ ( ;θˆ ) y + j = f + j ma menre n ambo prevsvo l rcercaore avrebbe effeuao (j-) prevson, mpegando l modello smao, al fne d avere un veore d prevson ( yˆ, yˆ,, y ) ˆ + j = ˆ + j + j + j d, n ambo smulavo l rcercaore fa una forzaura ponendo l modello. j + j + = (con + j ˆ + j n generale) e ulzza 3 Classfcazone Se la varable y è d naura qualava, la ecnca regressva che consene d modellare la dpendenza d y dal veore esplcavo vene defna classfcazone ed l modello generale è del po: [ y ] f ( ) E =. Anche n queso caso è possble segure un approcco d po paramerco oppure non paramerco; se l approcco è paramerco, allora la funzone f vene defna a pror e compleamene specfcaa da un veore d paramer θ, per cu l modello vene scro nel seguene modo: [ y ] f ( ;θ ) E =. Nell approcco non paramerco, nvece, la funzone f non vene defna a pror, ma vene smaa a lvello locale, ossa s consderano var norn d
e n ogn norno s sma f medane una meda armeca ponderaa delle osservazon y assocae all norno consderao. Le vare ecnche non paramerche (kernel, splne, k-nn, regressogram, ecc.) dfferscono fra loro per l modo n cu ponderano al valor e per l modo n cu vene selezonao l norno sul quale verrà operaa la medazone. Nel caso d varabl qualave, molo spesso è noa la dsrbuzone d probablà d y condzonaamene ad, ad esempo per una varable bnara s consdera una dsrbuzone bernoullana con valore aeso E ( y ) f ( ) = π =, per cu la sua dsrbuzone sarà: P y ( ) ( ) ( y = π y) π ; se nvece supponamo che la varable y sa d po caegorale con J modalà, e che C = {,,..., J} sa l nseme delle possbl echee che essa può assumere, allora la sua dsrbuzone condzonaa, consderao { y = j} l eveno che un osservazone y sa par alla j-esma modalà avrà una dsrbuzone mulnomale defna dal veore paramerco π con: dove P{ y j } = π ( ) π π π = π J ( ) ( ) ( ) =, con l vncolo che : J j= j ( ) = π. ℵ Se nvece y è una varable con C { }, ndcane l numero d even che s verfcano n un prefssao domno emporale o spazale, allora la sua dsrbuzone condzonaa ad segue una dsrbuzone d Posson d paramero E( y ) f ( ) = λ =, per cu la sua dsrbuzone sarà:
P ( y ) y λ e λ =. y! Da quano sopra affermao, s comprende che n al suazon è preferble segure un approcco d po paramerco: noa la dsrbuzone d y, assumendo che le osservazon { y } n = sano fra d loro ndpenden, allora la dsrbuzone conguna del campone è par al prodoo delle sngole dsrbuzon margnal, per cu s ha: P n ( y ; θ ) = P( y, y,..., yn ) ; θ ) = P( y ; θ ) noa quesa dsrbuzone è allora possble applcare l meodo d sma paramerco della massma verosmglanza, araverso l quale s cerca l veore θ che massmzza ale funzone, osservandola però come funzone de paramer, dae le osservazon. Per mplemenare ale meodo, però, è spesso necessaro rcorrere a procedure erave, che deermnano ale veore per va numerca araverso procedure a pass. Dopo aver defno e smao l modello, anche per varabl qualave occorre verfcare la valdà dello sesso: s procede, dunque, all mplemenazone d una sere d es sasc, che verfcano la valdà delle assunzone fae, e n un coneso paramerco endono a saggare la sgnfcavà de paramer nclus nel modello sesso. Una vola oenuo la versone fnale del modello è possble ulzzarlo a fn prevsv; anche n queso caso è molo ule la conoscenza della dsrbuzone d y condzonaamene a valor d. Per cu assuno che n un cero arco emporale o domno spazale sa =, l valore y prevso dal modello è quel valore d y che massmzza la funzone ( y ) P, ossa è: y ( j ) = arg ma P. j = 3
La conoscenza della dsrbuzone ( y ) P non è ndspensable, n generale basa dsporre d una regola d decsone che consene d arbure un echea j relavamene alla varable y n corrspondenza d una specfcaa confgurazone del veore d esplcave. Ovvamene ale regola è n realà basaa su ale dsrbuzone d probablà e comunque la conoscenza d essa c consene d sapere con quale probablà samo prevedendo un cero valore, n quano se s ha che ( y = j ) p P = cò vuol dre che l rcercaore può sosenere che qualora sa =, allora con una probablà par a p c s deve aspeare che y sa par alla j-esma modalà. Uno srumeno ule al fne d gudcare la valdà del modello è la marce d confusone. Smao l modello paramerco f ( ;θˆ ) è possble valuare l veore de da eorc { ˆ } n dove l generco elemeno ŷ = è dao da: y y ˆ = arg ma P j ( j ;θˆ ) ossa rappresena l valore della varable y, deermnao dal modello smao, n corrspondenza della confgurazone del veore nell -esma unà camponara. È qund ule confronare valor osserva { y } n = modello, ossa { } n yˆ = con quell prevs dal. Enra n goco, dunque, la marce d confusone A, ossa una marce d dmensone ( J J ), se J sono le possbl modalà d y, l cu generco elemeno A hk ndca l numero d osservazon, fra le n, per le qual l valore osservao è par all h-esma modalà, menre l valore calcolao è par alla k-esma modalà, ossa: A hk = # {,,..., n} : ( y = h) ( yˆ = k). 4
Dove la funzone # esprme l coneggo delle unà che soddsfano requs dell argomeno poso fra parenes. I valor { A hh} della marce, ossa valor pos sulla dagonale prncpale d A, ndcano l numero d unà n cu da osserva e quell eorc calcola per mezzo del modello sono ugual, relavamene all h-esma modalà d y. Sommando al valor s oene, qund, l numero d osservazon classfcae n manera correa, ossa: unà classfcae correamene = J A hh h= Consderando dvers modell s sceglerà qund quello che classfcherà correamene l maggor numero d unà. Operando n al modo, s pozza mplcamene, che la perda oenua classfcando n modo non correo le unà delle vare modalà è la medesma, a prescndere dagl ndc consdera; n alcune suazon, però, classfcare nella generca h-esma modalà un unà della j-esma classe, può avere un peso dverso n base alle modalà consderae, s rende perano necessaro l nroduzone d un ssema d pes { C }, dove l generco elemeno esprme la perda suba nel classfcare un unà dell h-esma classe nella k-esma modalà. Inrodo al pes, s consdera una funzone, assocaa al modello,da massmzzare, precsamene:. hk E = J h= A hh C hh h k A hk C hk 5
4 Prncpal modell per varabl qualave bnare S consder l caso n cu la varable y possa assumere esclusvamene due valor, precsamene zero ed uno, dove un valore par ad uno ndca la presenza d un cero eveno, deo anche successo, menre l valore zero ndca l non presenars d un eveno, spesso deo nsuccesso. Se s assume che la probablà che l eveno n quesone s verfch è nfluenzaa da un cero nseme d varabl esplcave, allora è leco modellare ale fenomeno n funzone d quese varabl. Per modellare queso fenomeno, occorre qund specfcare una funzone f che lega l valore aeso d y condzonaamene a, a valor medesm e che dpenda da un se d paramer gno θ. In una suazone come quesa un modello paramerco molo mpegao è quello che va soo l nome d regressone logsca, dove la funzone f mpegaa è una funzone a forma d S allungaa, con l codomno par all nervallo (,), corrspondene allo spazo n cu vara l valore aeso condzonao d y, essendo una probablà. Precsamene l modello logsco è del po: Assumendo che fra due veor P θ e ( y = ; θ ) = f ( ; θ ) = = θ θ. + e + e d d R e che θ Θ R D, segue che l prodoo nerno θ è una varable reale, per cu poso η = θ, s ha che : ed nolre: - lm ( η) = η f ; f η e = + e ( η) η 6
- lm ( η) = η + f ; - f ( ) = puno d flesso della funzone. La funzone f è una funzone smmerca, ed ha una forma spccaamene non lneare alle code, ossa per valor eleva d η n valore assoluo, menre ha un andameno molo lneare norno a valor null d η. La fgura seguene mosra l andameno della funzone logsca f, n funzone della varable η. Fg. Funzone logsca Defno l modello logsco, s procede come specfcao nella sezone precedene, per cu la dsrbuzone del campone y = ( y, ), è l prodoo d n dsrbuzon bernoullane ndpenden, ossa: P n ( y ; θ ) f ( ; θ ) f ( ; θ ) = = y ( ) ( y ) per semplcà s passa al logarmo della funzone precedene e s oene la log-verosmglanza: log L n ( θ ) = [ y log( f ( ; θ ) + ( y ) log( f ( ; θ )] =, y n 7
. s deermnano, qund, le sme d massma verosmglanza de paramer, massmzzando ale funzone, al smaor non s oengono n forma chusa, ma araverso un procedmeno eravo e sono valor θˆ che soddsfano l ssema d equazon: log L =. θ Sma paramer che defnscono l modello, s eseguono dvers es sasc per saggare la sgnfcavà de paramer. Le dsrbuzon delle sasche es mpegae non sono noe per qualsas ampezza camponara, ma consderando che le sme sono quelle d massma verosmglanza è possble effeuare es basa sul rapporo delle verosmglanze, la cu dsrbuzone asnoca, come è noo, è d po χ con gl opporun grad d lberà; pù precsamene se θ = ( θ θ, ),, sono paramer del modello, è possble saggare l poes che un soonseme d ques sano null, per cu, ad esempo, s porebbe saggare l poes: H : θ = = θ k = La sasca es mpegaa, basaa sul rapporo delle verosmglanze, è : ( log L( θˆ ) log L( ˆ ) T = θ dove log L ( θˆ ) è la logverosmglanza calcolaa soo l poes del modello con d paramer, ossa l modello compleo d parenza, menre log L ( θˆ ) è la logverosmglanza calcolaa n relazone agl smaor d massma verosmglanza del modello rdoo, ossa quello n cu prm k paramer sono null, coè l modello valdo soo l poes nulla. Tale sasca es segue una dsrbuzone asnoca d po χ, soo l poes nulla, con k grad d lberà (n queso esempo). θ d 8
Deermnaa la versone fnale del modello, è qund possble fare prevsone araverso l procedmeno descro nella sezone precedene. Un modello paramerco alernavo a quello logsco è quello che va soo l nome d prob. In ale modello anzché consderare la funzone f logsca, s ulzza la funzone Φ, ossa la funzone d rparzone d una dsrbuzone normale d meda zero e varanza uno. Dove ale funzone d rparzone è defna come: Φ η ( η) = e π u du. Precsamene l modello è defno nel modo seguene: E [ y ] f ( θ ) = Φ( θ ) = ;. Anche n queso caso s segurà la procedura esegua n precedenza, poché è noa la dsrbuzone d y condzonaamene ad, ma rspeo l caso logsco camba l paramero π, ossa la probablà d successo. Il modello logsco ed l modello prob, sono cas parcolar d una vasa famgla d modell, applcabl anche a varabl rsposa connue, che prende l nome d modell lnear generalzza, espress con un acronmo GLM. Tal modell consderano una combnazone lneare de paramer, deo predore lneare, precsamene: η = θ qund modellano l valore aeso condzonao d y, araverso ale predore lneare, precsamene consderano una funzone g nverble che lega l predore lneare con l valore aeso condzonao, ossa: g ( E[ y ] ) = η per cu, essendo nverble la funzone g, s può scrvere: [ y ] g ( η) f ( η) E = =. 9
Sosanzalmene, qund, modell GLM sono modell dove la funzone f che lega ed l valore aeso d y è una funzone d e θ, araverso l loro prodoo nerno, che per comodà s ndca con η. Varando la funzone g vara l modello adaao, ma se s fa quesa poes (d lnearà generalzzaa) l modello renra comunque n quesa vasa famgla. Bblografa - Chod M. (997), Tecnche elemenar d smulazone n sasca. Appun del corso d sasca compuazonale, Palermo. - Davdan M., Glnan D.M, Nonlnear Models for Repeaed Measuremen Daa. Chapman & Hall - Ryan T. P., Modern Regresson Mehods, Wley - Granger C.W., Terasvra T. (99), Modellng nonlnear economc relaonshps. Oford Unversy Press - Smonoff J.S. Smoohng Mehods n Sascs. Sprnger - Bowman, Azzaln Appled smoohng echnques for daa analyss. Oford Scence Publcaons - Har P.E., Non paramerc smoohng and lack of f. Sprnger - Green P.J., Slverman B.W. (994), Non paramerc regresson and generalzed lnear models. Chapman & Hall - Sone C.J. (977), Conssen nonparamerc regresson. The Annals of Sascs, Vol.5, No.4, 595-645
- Slverman B.W.(985), Some Aspecs of he Splne Smoohng Approach o Non-paramerc Regresson Curve Fng. Royal Sascal Socey B 47, No., -5 - Hardle W. (989), Appled nonparamerc regresson. Cambrdge Unversy Press - Agres A. (99), Caegorcal Daa Analyss. John Wley & Sons. - Bshop C.M. (995), Neural Neworks for Paern Recognon. Clarendon Press, Oford. - Rpley B.D. (996), Paern Recognon and Neural Neworks. Cambrdge, Unversy Press. - Johnson J. (996), Economerca. Franco Angel - Corbea P. (99), Meod d anals mulvaraa per le scenze socal. Il Mulno. - Pccolo D. (994), Inroduzone all anals delle sere sorche. La Nuova Iala Scenfca.