Modellazione statistica a fini previsivi

Documenti analoghi
Ministero dell Istruzione, dell Università e della Ricerca

NOTA METODOLOGICA INDICI SINTETICI PER CONFRONTI TEMPORALI: UN INDICE STATICO E UNO DINAMICO

ESPONENTI DI LIAPUNOV

C = Consideriamo ora un circuito RC aperto, cioè tale in cui non circoli corrente(pertanto la carica presente sulle armature è nulla).

Elementi di matematica finanziaria

Bayes. stati del mondo

MATEMATICA FINANZIARIA 2 PROVA SCRITTA DEL 11 SETTEMBRE 2007 ECONOMIA AZIENDALE

CAPITOLO PRIMO LEGGI E REGIMI FINANZIARI 1. LEGGI FINANZIARIE

Condensatore + - Volt

Metodi quantitativi per la stima del rischio di mercato. Aldo Nassigh. 16 Ottobre 2007

Problema. Integrazione scorte e distribuzione. Modello. Modello

Equazioni dei componenti

Indice. Previsioni. Previsioni. Introduzione

Introduzione ai Modelli di Durata: Alcuni Modelli Parametrici

PROCESSI CASUALI. Segnali deterministici e casuali

PROCESSI CASUALI. Segnali deterministici e casuali

Regimi periodici non sinusoidali

Laboratorio 2B A.A. 2012/2013. Elaborazione Dati. Lab 2B CdL Fisica

Componenti dotati di memoria (dinamici)

Contenuti: o Specificazione del modello. o Ipotesi del modello classico. o Stima dei parametri. Regressione semplice Roberta Siciliano 2

Definizione della tariffa per l accertamento di conformità degli strumenti di misura

CONDUTTIMETRIA. La conduttanza è l inverso della resistenza e la resistenza Conduttanza C = R

Campo magnetico stazionario

Modulo Foreste: algoritmo di stima

GENERATORE DI IMPULSO CON AMPLIFICATORE OPERAZIONALE

Lezione 11. Polinomi a coefficienti in un campo.

Lezione n. 2 di Controlli Automatici A prof. Aurelio Piazzi Modellistica ed equazioni differenziali lineari

REGRESSIONE LINEARE. È caratterizzata da semplicità: i modelli utilizzati sono basati essenzialmente su funzioni lineari

Controllo predittivo (MPC o MBPC)

Circuiti magnetici. (versione del ) Campo magnetico stazionario o quasi stazionario

Oscillazioni libere e risonanza di un circuito RLC-serie (Trattazione analitica del circuito RLC-serie)

Definizione. Algoritmi di Change Detection - foreground. background

Modelli con varabili binarie (o qualitative)

Richiami di modelli di utilità aleatoria

La Regressione X Variabile indipendente o esplicativa. La regressione. La Regressione. Y Variabile dipendente

Intorduzione alla teoria delle Catene di Markov

Abusi di Mercato. S.A.I.Vi.M.: la procedura probabilistica per l individuazione di Abusi di Mercato. Market Abuse Detection. c.d.

Modelli di utilità aleatoria

1) Le medie e le varianze calcolate su n osservazioni relative alle variabili quantitative X ed Y sono tali che. σ x

Ad esempio, potremmo voler verificare la legge di caduta dei gravi che dice che un corpo cade con velocità uniformemente accellerata: v = v 0 + g t

MODELLI DI UTILITÀ ALEATORIA

CORSO DI POLITICA ECONOMICA AA GLI APPROCCI ALLA DETERMINAZIONE DEL TASSO DI CAMBIO

Relazione funzionale e statistica tra due variabili Modello di regressione lineare semplice Stima puntuale dei coefficienti di regressione

CINQUE CONCETTI CHIAVE

* PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE *

Integrazione numerica dell equazione del moto per un sistema lineare viscoso a un grado di libertà. Prof. Adolfo Santini - Dinamica delle Strutture 1

Legge di Okun: una verifica empirica per gli Stati Uniti,

INDICE. Capitalizzazione Pagina 3 Sconto e valore attuale Pagina 10 Equivalenza finanziaria e operazioni composte Pagina 14 Rendite Pagina 16

Istituzioni di Probabilità Laurea magistrale in Matematica 15 Gennaio 2015

ESERCIZIO 4.1 Si consideri una popolazione consistente delle quattro misurazioni 0, 3, 12 e 20 descritta dalla seguente distribuzione di probabilità:

() t. B = insieme di segnali. M = { s 1 (t),, s i (t),, s m (t) } 1 b 1 (t) = 0 ) 2 b 2 (t) = 0 ) Lo spazio dei segnali. Lo spazio dei segnali

Commessa N. Foglio 1 di 6 Rev B. Titolo commessa. Redatto da AO Data Giugno Verificato da AT Data Ottobre 2002

Propagazione delle incertezze

Meccanica Cinematica del punto materiale

ISTRUZIONE OPERATIVA:

Elementi di teoria bayesiana della decisione Teoria bayesiana della decisione: caratteristiche

Modelli di utilità aleatoria

Capitolo 8. La valutazione ex-post: selezione del gruppo di controllo, modelli di durata

Il procedimento può essere pensato come una ricerca in un insieme ordinato, il peso incognito può essere cercato con il metodo della ricerca binaria.

Analisi delle reti con elementi dinamici

UNIVERSITÀ DEGLI STUDI DI PADOVA

Correlazione, Regressione, Test non parametrici

Modelli di utilità aleatoria

Calcolo delle Probabilità: esercitazione 10

Definizione di campione

Prima prova di gruppo

ANALISI STATISTICA DELLE INCERTEZZE CASUALI

Strada B. Classe Velocità valore frequenza Frequ. ass Frequ. % hi Freq. Cum

26/08/2010. segnali deterministici. segnali casuali o random. stazionario. periodico. Non stazionario. transitorio

Regressione e correlazione

Capitolo 2 Le leggi del decadimento radioattivo

materiale didattico I incontro

PREVEDONO: Capitolo 17 del libro di testo. Copyright 2005 The McGraw-Hill Companies srl

TECNICHE DI ANALISI DEI DATI MODELLI LINEARI

Corso di. Dott.ssa Donatella Cocca

Misure dirette utilizzate per il calcolo della misura indiretta X:

simulazione di storie ed eventi si pone l obbiettivo di calcolare quelle quantità di interesse affidabilistico altrimenti indeterminate.

SOLUZIONE ESERCIZI: STRUTTURA DI MERCATO. ECONOMIA INDUSTRIALE Università degli Studi di Milano-Bicocca. Christian Garavaglia

Matematica Computazionale(6cfu) Ottimizzazione(8cfu)

Corso di Fisica tecnica e ambientale a.a. 2011/ Docente: Prof. Carlo Isetti

Determinare gli insiemi delle soluzioni dei seguenti sistemi lineari non omogenei e scriverli in forma di spazio affine ESERCIZIO 1.3.

{ 1, 2,..., n} Elementi di teoria dei giochi. Giovanni Di Bartolomeo Università degli Studi di Teramo

L INTERDIPENDENZA MONETARIA: IL MODELLO MUNDELL-FLEMING

Modelli di oligopolio. Docente: Matteo Alvisi Corso di Microeconomia Laurea in Scienze Politiche, Sociali e Internazionali

Ragionamento probabilistico: rappresentazione

Manutenibilità e Disponibilità

INCERTEZZA DELLA DOMANDA NELLE CATENE DI SUPPORTO: TECNICHE DI RIDUZIONE DINAMICA DELLO SPAZIO DI RICERCA PER UN MODELLO CP

L ANALISI MONOVARIATA: Variabilità e mutabilità. Prof. Maria Carella

Elementi di statistica

RESISTENZA TERMICA E MECCANISMI COMBINATI

Capitolo 3. Cap. 3-1

UNIVERSITA DEGLI STUDI DI FIRENZE. Facoltà di Ingegneria Corso di Laurea in Ingegneria Informatica! "#$

I modelli per la stima della volatilità

Soluzione di sistemi di equazioni differenziali

Relazioni tra variabili: Correlazione e regressione lineare

Lezioni di Statistica (25 marzo 2013) Docente: Massimo Cristallo

Le quote e q sono incognite. Il sistema è ridondante: 3 equazioni (osservazioni) e 2 incognite.

Osservatorio dinamica prezzi dispositivi medici Assobiomedica - CEr. Presentazione. Assobiomedica Centro Studi

Transcript:

Modellazone sasca a fn prevsv Inroduzone Daa una varable casuale y, d qualsas naura (ossa sa d po qualavo che quanavo), uno de prncpal obev d un rcercaore è quello d poer prevedere valor che essa porebbe assumere n un arco emporale o n un coneso spazale dverso da quello che è sao osservao araverso l esrazone d un campone. Se è saa osservaa una sere d n osservazon, ( y, y, y ),, n, y, y può ndcare l valore che la varable y assume al empo ed n queso caso s parla d anals emporale o d sere sorche, oppure l valore assuno dall esma unà osservaa, ed n queso caso s parla d anals d po crosssecon; è pure possble consderare un campone d osservazon sulle sesse n unà camponare per T perod emporal, n al caso s avranno le osservazon { y } j, con =,,,n e j=,, T, dove l ndce ndca l unà camponara d osservazone e l ndce j ndca l perodo emporale d osservazon: s parla n queso caso d anals longudnale. Daa la sere { } n y =, emporale o d po cross-secon, l rcercaore vuole qund essere n grado d poer valuare y n un unà (emporale o spazale) dversa da quelle osservae. Per raggungere queso obevo è necessaro cosrure un modello sasco maemaco, nel quale sa espressa la relazone che lega la varable d neresse y ad un nseme d alre varabl, dee esplcave o predor. Un modello n cu una varable è espressa n funzone d alre, ossa n cu un nseme d varabl esplcave nfluenzano la

deermnazone della varable d neresse, per cu da un puno d vsa logco-deduvo ale varable è conseguene alle alre, è deo modello d po regressvo; se nvece nel modello non c è un nseme d varabl che spega un alra varable, ma ue le varabl s nfluenzano fra d loro, allora l modello è deo correlavo. Per ruscre a fare prevsone su una sngola varable bsogna consderare un modello d po regressvo. In un ale modello, le varabl esplcave, ndcae con l veore d- dmensonale ossa = (, ), non deermnano la varable y, ma,, d la nfluenzano; ossa ad un valore ben precso del veore non è assocao un unco valore della varable y, n modo deermnsco: s parla nfa d modellazone socasca e non deermnsca. La modellazone deermnsca è una modellazone che va bene nelle scenze esae, ma non è applcable nelle scenze soco-economche, caraerzzae da fenomen alamene varabl ed nrnsecamene socasc. Un modello regressvo d po socasco ena d modellare n manera ssemaca l valore aeso della varable y condzonaamene al veore d esplcave, ossa s cerca d rovare una funzone f che soddsf la seguene relazone: ( y ) f ( ) E =. La funzone f che lega l veore e la varable y, non è però noa al rcercaore (ranne cas parcolar), per cu cò che l rcercaore deve fare è deermnare una funzone fˆ che approssm bene la funzone gnoa f. Per fare cò s possono due segure due approcc dvers; un prmo approcco è quello paramerco, nel quale l rcercaore defnsce a pror una forma per la funzone f, che dpende da un veore d paramer θ (olre che da ), per cu la relazone precedene vene rscra nel seguene modo: [ y ] f ( ;θ ) E =

con f compleamene esplcaa e θ veore d paramer che dovrà essere smao per mezzo d un campone d osservazon {( )} n, y ; l alro = approcco, che vene defno non paramerco, non fa nessuna assunzone a pror sulla funzone f e non consdera nessun po d paramer θ da smare, ma sma dreamene la funzone f araverso una meda ponderaa locale delle y presen n un norno muldmensonale d ; alcun approcc enano d combnare due approcc consderando la funzone f come somma d due funzon: una defna a pror e specfcaa da un veore d paramer e l alra non specfcaa, ma smaa araverso mede ponderae local. Consderando un approcco d po paramerco nel quale, come gà affermao, occorre defnre a pror una funzone ben specfcaa f, la merca della varable y goca un ruolo chave nella scela del po d funzone f da consderare. Cò perché l codomno della funzone f, relavamene all nseme D ossa lo spazo de predor, deve concdere con lo spazo a cu apparene l valore aeso E [ y ] ; s consder, ad esempo, una varable y d po bernoullano, per cu l suo valore aeso condzonao [ y ] E, che ndca la probablà d successo condzonaamene a, gace nell nervallo (,) ed un veore d esplcave ale che D R d, n queso caso bsogna sceglere una funzone f l cu codomno, relavamene all nseme D, sa l nervallo (,), per cu appare ovvo che una funzone d po lneare f ( ) = θ non è ammssble, n quano l codomno d f relavamene a D è l nseme de numer real R, ossa f ( D) = R (,) ; n una smle suazone s scelgono, e = + e ad esempo, funzon d po logsco f ( ; θ ) che soddsfano la condzone rchesa. θ θ 3

In generale occorre dsnguere modell relav a varabl d po quanavo, da modell per varabl qualave: nel prmo caso s parla d regressone, menre nel secondo caso s parla d classfcazone. Regressone Ne modell d po regressvo, alla componene deermnsca del modello, ossa [ y ] f ( ) E =, raandos d modellazone d po socasco, s aggunge una componene casuale, per cu l modello vene rscro n ermn d y e s consdera: (,ε ) y = f ; mpegando un approcco d po paramerco, occorre aggungere l veore de paramer θ come argomeno della funzone f ; usualmene s pozza che l nfluenza della varable casuale ε sulla varable d neresse y sa d po addvo, per cu, aggungendo l veore de paramer come argomeno, l modello vene scro nel seguene modo: ( ) ε y = f ;θ +. S no che cò che è mporane è la merca della varable y, menre la merca della varable, che comunque ha una sua mporanza, non enra dreamene nella scela del po d funzone f. Infa, è sempre possble rasformare una varable qualava n una varable d po numerco, araverso l ulzzo d ndcaor, senza modfcare l nformazone presene ne da. S pozz ad esempo che la varable (con d=, per poes) sa qualava e che abba 3 possbl modalà, per rasformare ale varable n numerca occorre consderare un veore rdmensonale nel quale ogn sngola componene è assocaa ad una modalà qualava, che avrà (relavamene ad ogn osservazone) un valore par ad uno per la 4

componene assocaa alla modalà osservaa e zero per le alre due modalà; per cu se un unà camponara presena un valore par alla seconda modalà qualava, allora l veore numerco assocao sarà (,,). Con ale operazone è conservaa ua l nformazone presene ne da: la possblà d poer raare come numerca una varable qualava, ha l unco svanaggo d complcare la raazone del modello, ma daa la poenza degl aual elaboraor cò non cosusce pù un problema. La rasformazone d una varable quanava n qualava è pure possble, araverso una caegorzzazone n class, ma n queso caso s ha una noevole perda d nformazone, per cu non è consglable effeuare ale rasformazone, ranne ne cas n cu non neressa ua l nformazone presene nella varable, ma solano un nformazone pù rdoa. Seguendo un approcco d po paramerco, occorre defnre la forma funzonale della funzone f e fare una sere d assunzon plausbl, pù o meno for, sulla varable casuale ε. Defno compleamene l modello e le poes soosan, s passa alla sma del modello, che n un approcco paramerco corrsponde a smare l veore paramerco θ ; meod d sma sono dvers e dpendono dalle nformazon dsponbl e dalle poes fae sull errore casuale ε. I prncpal meod d sma sono: - della massma verosmglanza, qualora s renga d conoscere la dsrbuzone del campone d osservazon y = ( y y, ), ossa p ( y;θ );,, - de mnm quadra ordnar, se s pozza che l veore d error = ( ε ε ) abba una marce d varanza e covaranze V del ε,,, ε n y n po V = σ I (dove I è la marce denà), ossa gl error sano 5

omoschedasc (coè abbano la sessa varanza σ = σ e non correla Cov(,ε ) = j ε ; j =,,, ) n - de mnm quadra pondera, se l veore degl error ε ha una marce d varanze e covaranze V dagonale, del po: V = dag (, σ,, σ ) n σ = σ σ σ n ossa gl error sono eeroschedasc (coè con varanze dverse), ma ncorrela; - de mnm quadra generalzza, per V qualsas. Sma paramer del modello ed oenuo l veore d smaor θˆ, occorre verfcare se l modello smao f ( ;θˆ ) fornsce rsula soddsfacen; per ale ragone s mplemenano una sere d es sasc per verfcare che le assunzon fae sano plausbl con da e qund per verfcare la plausblà del modello smao. Uno srumeno ndspensable per verfcare l aendblà d un modello è l anals de resdu, dove resdu { r } n = sono defn come la dfferenza fra valor y osserva e calcola per mezzo del modello ossa r ( y f ( ;θˆ ) =. Dopo aver verfcao la valdà del modello, lo sesso può essere ulzzao per var scop, prncpal sono: - descrv; - prevsv; - smulav. Il modello consene, qund, d poer fornre una spegazone logca a fenomen e qund d descrverne la dnamca. Per ale scopo è però necessaro mplemenare un modello d facle leura, che consena qund 6

d capre con charezza l ruolo che ogn varable esplcava goca nell nfluenzare le deermnazon d y, cò corrsponde a defnre una funzone f non roppo complessa e ale che consena d arbure un sgnfcao specfco a paramer θ che la specfcano. Se nvece l ulzzo prncpale del modello è per scop prevsv, allora non mpora assoluamene l po d funzone f che lega ed y, ma neressa cosrure semplcemene un meccansmo che dao un nseme d npu sa n grado d fornre una prevsone accuraa dell oupu assocao. Per ale movo, n un coneso prevsvo, sanno avendo una connua dffusone modell defn black bo, ne qual l rcercaore non conosce esaamene qual è la funzone maemaca che lega npu ed oupu; l modello defnsce un meccansmo araverso l quale al varabl sono legae, araverso una sere d osservazon, n manera adava. Per evare che al modell s adano compleamene a da osserva, coè che s cre una funzone per cu resdu d ale modello sano u null, vengono consdera ermn d penalzzazone alla funzone d errore da mnmzzare per smare l modello, la quale msura la dsanza fra da osserva e da calcola medane l modello da adaare. Un esempo d modello a scaola nera è quello degl algorm a ree neurale, dove npu ed oupu sono lega da una funzone complessa, che l rcercaore non conosce esaamene. Lo scopo della prevsone, come gà accennao all nzo del lavoro, è quello d conoscere l valore d y n unà (emporal o spazal) non osservae; per cu se l modello adaao per l -esma unà è yˆ ( ; θ ) + ε = f ˆ, l rcercaore porà prevedere l valore d y n corrspondenza d una cera confgurazone del veore d varabl esplcave. 7

In un modello d sere sorche con d rard, coè n cu le esplcave sano valor aneceden della varable d neresse, ossa = ( y ), y,, y d e le n osservazon sono rfere ad n osservazon n perod dvers, allora l rcercaore porebbe voler prevedere l valore y n+, ossa l valore successvo all ulma osservazone emporale, e mpegando l modello adaao prevedrà y n+ nel seguene modo: ( y, y,, y ;θˆ ) ˆ n+ = f n n n d + y. Facendo assunzone pù for sugl error { ε }, sarà possble rcavare un nervallo d prevsone per y, ma affnché cò sa possble è necessaro conoscere la dsrbuzone d probablà della varable casuale ŷ, che dpenderà dalla dsrbuzone conguna degl error, dalla dsrbuzone conguna degl smaor e dalla funzone f che esprme la dpendenza. A queso puno sorge un grosso problema: per scop prevsv s ulzzano spesso funzon molo complesse, che speghno bene l comporameno d y n funzone d, ma se f è molo complessa allora è pracamene mpossble rcavare la dsrbuzone esaa o asnoca della varable aleaora ŷ, per cu sembrerebbe mpossble ruscre a fornre un nervallo d prevsone (a,b) al 95%, coè ale che sa: { yˆ b}, 95 Pr a =. Per rsolvere ale problema s possono mpegare ecnche smulave d po Mone Carlo, che ovvamene non c danno una rsposa esaa al problema, ma fornscono rspose molo soddsfacen. Per mplemenare al procedure è necessaro dsporre d un poene elaboraore e qund smulare la generazone d pseudo-campon dalle dsrbuzon d probablà consderae; pù precsamene, la procedura da segure può essere la seguene: 8

- s genera un elevao numero d campon d error accdenal { ε j }, provenen dalla dsrbuzone eorca pozzaa p ( ε ), con l ndce che ndca l unà camponara e l ndce j che ndca l campone esrao; - s fssa l veore paramerco θ (la procedura dovrà essere effeuaa per vare confgurazon d ale paramero); - s generano campon { y j } dalla dsrbuzone eorca ( y;θ ) p ; - s generano campon per le varabl esplcave, oppure s fssano confgurazon a pror del po { j }; - per ogn campone j, s sma l veore de paramer araverso l meodo d sma scelo e s avrà θˆ j ; - s calcolano valor eorc per ogn campone e per ogn unà, ossa: yˆ j j ( ; θ j ) + ε j = f ˆ - s deermna la dsrbuzone d probablà emprca d ŷ che rappresena una sma della vera dsrbuzone d probablà; per cu è possble smare un nervallo d prevsone sulla base d ale funzone. È comprensble che generando un numero elevao d osservazon, s avrà una dsrbuzone emprca che sarà pracamene smle alla vera dsrbuzone eorca ncogna, per cu l problema nconrao n precedenza è rsolvble rcorrendo a queso approcco. Sebbene sano aualmene dsponbl elaboraor molo poen, non sempre è possble segure ale va; s consder nfa l caso d modell molo compless, la cu sma rchede eleva emp d elaborazone (come avvene ad esempo per modell a scaola nera), è mpensable n ale suazone generare un elevao numero d campon e per ognuno d ques smare l modello consderao, al fne d rcavare la dsrbuzone emprca 9

d ŷ : se per un cero modello, ad esempo, emp d elaborazone rches per la sma sono d ora, generando. campon, l empo necessaro per poer smare. vole l modello è d. ore, ossa par a crca ann! In alcun cas è possble collegare n parallelo alcun compuer e generare un cero numero d campon e smarne l relavo modello su ognuno d ess, qund raccoglere le nformazon ndpenden forne da var compuer al fne d rcavare la dsrbuzone emprca d ŷ. Un ulzzo de modell molo analogo a quello prevsvo è quello smulavo: l rcercaore è neressao a capre quale dnamca avrebbe la y n funzone d una cera confgurazone delle esplcave. Poso n ques ermn, l problema sembra analogo a quello della prevsone; formalmene, ossa da un puno d vsa algormco, le due procedure s equvalogono, poché bsogna sempre verfcare cosa accade alla y facendo cere poes sulla. La dfferenza sosanzale fra due approcc è d po conceuale: n ambo prevsvo l rcercaore consdera una confgurazone d effeva, coè, per esempo, consderando un anals d sere sorche con = ( y y,, y ), l rcercaore,, d + conosce esaamene l valore che le esplcave assumono al empo, n quano al da sono presen nel campone d osservazon d cu dspone e che ha ulzzao per smare l modello; n ambo smulavo, nvece, l rcercaore fa un poes d lavoro, ossa s chede cosa accadrebbe alla y qualora capasse che la sa par a un valore fssao, ma non è deo che l valore s verfch; ad esempo, nell anals delle sere sorche, l rcercaore porebbe assumere che ad un cero perodo fuuro (+j ) s possa verfcare una cera confgurazone delle y aneceden ale perodo, ma conseguen l perodo auale n e cheders, qund, che valore assumerebbe

y +, daa l poes d lavoro ( y y,, y ) j + j = + j, + j + j d e pozzando che l modello smao al empo n sa valdo anche per l perodo fuuro oggeo d anals (problema della sablà). Il rcercaore, anche n queso caso, rcaverà l valore ndagao allo sesso modo, coè: ˆ ( ;θˆ ) y + j = f + j ma menre n ambo prevsvo l rcercaore avrebbe effeuao (j-) prevson, mpegando l modello smao, al fne d avere un veore d prevson ( yˆ, yˆ,, y ) ˆ + j = ˆ + j + j + j d, n ambo smulavo l rcercaore fa una forzaura ponendo l modello. j + j + = (con + j ˆ + j n generale) e ulzza 3 Classfcazone Se la varable y è d naura qualava, la ecnca regressva che consene d modellare la dpendenza d y dal veore esplcavo vene defna classfcazone ed l modello generale è del po: [ y ] f ( ) E =. Anche n queso caso è possble segure un approcco d po paramerco oppure non paramerco; se l approcco è paramerco, allora la funzone f vene defna a pror e compleamene specfcaa da un veore d paramer θ, per cu l modello vene scro nel seguene modo: [ y ] f ( ;θ ) E =. Nell approcco non paramerco, nvece, la funzone f non vene defna a pror, ma vene smaa a lvello locale, ossa s consderano var norn d

e n ogn norno s sma f medane una meda armeca ponderaa delle osservazon y assocae all norno consderao. Le vare ecnche non paramerche (kernel, splne, k-nn, regressogram, ecc.) dfferscono fra loro per l modo n cu ponderano al valor e per l modo n cu vene selezonao l norno sul quale verrà operaa la medazone. Nel caso d varabl qualave, molo spesso è noa la dsrbuzone d probablà d y condzonaamene ad, ad esempo per una varable bnara s consdera una dsrbuzone bernoullana con valore aeso E ( y ) f ( ) = π =, per cu la sua dsrbuzone sarà: P y ( ) ( ) ( y = π y) π ; se nvece supponamo che la varable y sa d po caegorale con J modalà, e che C = {,,..., J} sa l nseme delle possbl echee che essa può assumere, allora la sua dsrbuzone condzonaa, consderao { y = j} l eveno che un osservazone y sa par alla j-esma modalà avrà una dsrbuzone mulnomale defna dal veore paramerco π con: dove P{ y j } = π ( ) π π π = π J ( ) ( ) ( ) =, con l vncolo che : J j= j ( ) = π. ℵ Se nvece y è una varable con C { }, ndcane l numero d even che s verfcano n un prefssao domno emporale o spazale, allora la sua dsrbuzone condzonaa ad segue una dsrbuzone d Posson d paramero E( y ) f ( ) = λ =, per cu la sua dsrbuzone sarà:

P ( y ) y λ e λ =. y! Da quano sopra affermao, s comprende che n al suazon è preferble segure un approcco d po paramerco: noa la dsrbuzone d y, assumendo che le osservazon { y } n = sano fra d loro ndpenden, allora la dsrbuzone conguna del campone è par al prodoo delle sngole dsrbuzon margnal, per cu s ha: P n ( y ; θ ) = P( y, y,..., yn ) ; θ ) = P( y ; θ ) noa quesa dsrbuzone è allora possble applcare l meodo d sma paramerco della massma verosmglanza, araverso l quale s cerca l veore θ che massmzza ale funzone, osservandola però come funzone de paramer, dae le osservazon. Per mplemenare ale meodo, però, è spesso necessaro rcorrere a procedure erave, che deermnano ale veore per va numerca araverso procedure a pass. Dopo aver defno e smao l modello, anche per varabl qualave occorre verfcare la valdà dello sesso: s procede, dunque, all mplemenazone d una sere d es sasc, che verfcano la valdà delle assunzone fae, e n un coneso paramerco endono a saggare la sgnfcavà de paramer nclus nel modello sesso. Una vola oenuo la versone fnale del modello è possble ulzzarlo a fn prevsv; anche n queso caso è molo ule la conoscenza della dsrbuzone d y condzonaamene a valor d. Per cu assuno che n un cero arco emporale o domno spazale sa =, l valore y prevso dal modello è quel valore d y che massmzza la funzone ( y ) P, ossa è: y ( j ) = arg ma P. j = 3

La conoscenza della dsrbuzone ( y ) P non è ndspensable, n generale basa dsporre d una regola d decsone che consene d arbure un echea j relavamene alla varable y n corrspondenza d una specfcaa confgurazone del veore d esplcave. Ovvamene ale regola è n realà basaa su ale dsrbuzone d probablà e comunque la conoscenza d essa c consene d sapere con quale probablà samo prevedendo un cero valore, n quano se s ha che ( y = j ) p P = cò vuol dre che l rcercaore può sosenere che qualora sa =, allora con una probablà par a p c s deve aspeare che y sa par alla j-esma modalà. Uno srumeno ule al fne d gudcare la valdà del modello è la marce d confusone. Smao l modello paramerco f ( ;θˆ ) è possble valuare l veore de da eorc { ˆ } n dove l generco elemeno ŷ = è dao da: y y ˆ = arg ma P j ( j ;θˆ ) ossa rappresena l valore della varable y, deermnao dal modello smao, n corrspondenza della confgurazone del veore nell -esma unà camponara. È qund ule confronare valor osserva { y } n = modello, ossa { } n yˆ = con quell prevs dal. Enra n goco, dunque, la marce d confusone A, ossa una marce d dmensone ( J J ), se J sono le possbl modalà d y, l cu generco elemeno A hk ndca l numero d osservazon, fra le n, per le qual l valore osservao è par all h-esma modalà, menre l valore calcolao è par alla k-esma modalà, ossa: A hk = # {,,..., n} : ( y = h) ( yˆ = k). 4

Dove la funzone # esprme l coneggo delle unà che soddsfano requs dell argomeno poso fra parenes. I valor { A hh} della marce, ossa valor pos sulla dagonale prncpale d A, ndcano l numero d unà n cu da osserva e quell eorc calcola per mezzo del modello sono ugual, relavamene all h-esma modalà d y. Sommando al valor s oene, qund, l numero d osservazon classfcae n manera correa, ossa: unà classfcae correamene = J A hh h= Consderando dvers modell s sceglerà qund quello che classfcherà correamene l maggor numero d unà. Operando n al modo, s pozza mplcamene, che la perda oenua classfcando n modo non correo le unà delle vare modalà è la medesma, a prescndere dagl ndc consdera; n alcune suazon, però, classfcare nella generca h-esma modalà un unà della j-esma classe, può avere un peso dverso n base alle modalà consderae, s rende perano necessaro l nroduzone d un ssema d pes { C }, dove l generco elemeno esprme la perda suba nel classfcare un unà dell h-esma classe nella k-esma modalà. Inrodo al pes, s consdera una funzone, assocaa al modello,da massmzzare, precsamene:. hk E = J h= A hh C hh h k A hk C hk 5

4 Prncpal modell per varabl qualave bnare S consder l caso n cu la varable y possa assumere esclusvamene due valor, precsamene zero ed uno, dove un valore par ad uno ndca la presenza d un cero eveno, deo anche successo, menre l valore zero ndca l non presenars d un eveno, spesso deo nsuccesso. Se s assume che la probablà che l eveno n quesone s verfch è nfluenzaa da un cero nseme d varabl esplcave, allora è leco modellare ale fenomeno n funzone d quese varabl. Per modellare queso fenomeno, occorre qund specfcare una funzone f che lega l valore aeso d y condzonaamene a, a valor medesm e che dpenda da un se d paramer gno θ. In una suazone come quesa un modello paramerco molo mpegao è quello che va soo l nome d regressone logsca, dove la funzone f mpegaa è una funzone a forma d S allungaa, con l codomno par all nervallo (,), corrspondene allo spazo n cu vara l valore aeso condzonao d y, essendo una probablà. Precsamene l modello logsco è del po: Assumendo che fra due veor P θ e ( y = ; θ ) = f ( ; θ ) = = θ θ. + e + e d d R e che θ Θ R D, segue che l prodoo nerno θ è una varable reale, per cu poso η = θ, s ha che : ed nolre: - lm ( η) = η f ; f η e = + e ( η) η 6

- lm ( η) = η + f ; - f ( ) = puno d flesso della funzone. La funzone f è una funzone smmerca, ed ha una forma spccaamene non lneare alle code, ossa per valor eleva d η n valore assoluo, menre ha un andameno molo lneare norno a valor null d η. La fgura seguene mosra l andameno della funzone logsca f, n funzone della varable η. Fg. Funzone logsca Defno l modello logsco, s procede come specfcao nella sezone precedene, per cu la dsrbuzone del campone y = ( y, ), è l prodoo d n dsrbuzon bernoullane ndpenden, ossa: P n ( y ; θ ) f ( ; θ ) f ( ; θ ) = = y ( ) ( y ) per semplcà s passa al logarmo della funzone precedene e s oene la log-verosmglanza: log L n ( θ ) = [ y log( f ( ; θ ) + ( y ) log( f ( ; θ )] =, y n 7

. s deermnano, qund, le sme d massma verosmglanza de paramer, massmzzando ale funzone, al smaor non s oengono n forma chusa, ma araverso un procedmeno eravo e sono valor θˆ che soddsfano l ssema d equazon: log L =. θ Sma paramer che defnscono l modello, s eseguono dvers es sasc per saggare la sgnfcavà de paramer. Le dsrbuzon delle sasche es mpegae non sono noe per qualsas ampezza camponara, ma consderando che le sme sono quelle d massma verosmglanza è possble effeuare es basa sul rapporo delle verosmglanze, la cu dsrbuzone asnoca, come è noo, è d po χ con gl opporun grad d lberà; pù precsamene se θ = ( θ θ, ),, sono paramer del modello, è possble saggare l poes che un soonseme d ques sano null, per cu, ad esempo, s porebbe saggare l poes: H : θ = = θ k = La sasca es mpegaa, basaa sul rapporo delle verosmglanze, è : ( log L( θˆ ) log L( ˆ ) T = θ dove log L ( θˆ ) è la logverosmglanza calcolaa soo l poes del modello con d paramer, ossa l modello compleo d parenza, menre log L ( θˆ ) è la logverosmglanza calcolaa n relazone agl smaor d massma verosmglanza del modello rdoo, ossa quello n cu prm k paramer sono null, coè l modello valdo soo l poes nulla. Tale sasca es segue una dsrbuzone asnoca d po χ, soo l poes nulla, con k grad d lberà (n queso esempo). θ d 8

Deermnaa la versone fnale del modello, è qund possble fare prevsone araverso l procedmeno descro nella sezone precedene. Un modello paramerco alernavo a quello logsco è quello che va soo l nome d prob. In ale modello anzché consderare la funzone f logsca, s ulzza la funzone Φ, ossa la funzone d rparzone d una dsrbuzone normale d meda zero e varanza uno. Dove ale funzone d rparzone è defna come: Φ η ( η) = e π u du. Precsamene l modello è defno nel modo seguene: E [ y ] f ( θ ) = Φ( θ ) = ;. Anche n queso caso s segurà la procedura esegua n precedenza, poché è noa la dsrbuzone d y condzonaamene ad, ma rspeo l caso logsco camba l paramero π, ossa la probablà d successo. Il modello logsco ed l modello prob, sono cas parcolar d una vasa famgla d modell, applcabl anche a varabl rsposa connue, che prende l nome d modell lnear generalzza, espress con un acronmo GLM. Tal modell consderano una combnazone lneare de paramer, deo predore lneare, precsamene: η = θ qund modellano l valore aeso condzonao d y, araverso ale predore lneare, precsamene consderano una funzone g nverble che lega l predore lneare con l valore aeso condzonao, ossa: g ( E[ y ] ) = η per cu, essendo nverble la funzone g, s può scrvere: [ y ] g ( η) f ( η) E = =. 9

Sosanzalmene, qund, modell GLM sono modell dove la funzone f che lega ed l valore aeso d y è una funzone d e θ, araverso l loro prodoo nerno, che per comodà s ndca con η. Varando la funzone g vara l modello adaao, ma se s fa quesa poes (d lnearà generalzzaa) l modello renra comunque n quesa vasa famgla. Bblografa - Chod M. (997), Tecnche elemenar d smulazone n sasca. Appun del corso d sasca compuazonale, Palermo. - Davdan M., Glnan D.M, Nonlnear Models for Repeaed Measuremen Daa. Chapman & Hall - Ryan T. P., Modern Regresson Mehods, Wley - Granger C.W., Terasvra T. (99), Modellng nonlnear economc relaonshps. Oford Unversy Press - Smonoff J.S. Smoohng Mehods n Sascs. Sprnger - Bowman, Azzaln Appled smoohng echnques for daa analyss. Oford Scence Publcaons - Har P.E., Non paramerc smoohng and lack of f. Sprnger - Green P.J., Slverman B.W. (994), Non paramerc regresson and generalzed lnear models. Chapman & Hall - Sone C.J. (977), Conssen nonparamerc regresson. The Annals of Sascs, Vol.5, No.4, 595-645

- Slverman B.W.(985), Some Aspecs of he Splne Smoohng Approach o Non-paramerc Regresson Curve Fng. Royal Sascal Socey B 47, No., -5 - Hardle W. (989), Appled nonparamerc regresson. Cambrdge Unversy Press - Agres A. (99), Caegorcal Daa Analyss. John Wley & Sons. - Bshop C.M. (995), Neural Neworks for Paern Recognon. Clarendon Press, Oford. - Rpley B.D. (996), Paern Recognon and Neural Neworks. Cambrdge, Unversy Press. - Johnson J. (996), Economerca. Franco Angel - Corbea P. (99), Meod d anals mulvaraa per le scenze socal. Il Mulno. - Pccolo D. (994), Inroduzone all anals delle sere sorche. La Nuova Iala Scenfca.