Modelli di regressione dinamica Matteo Pelagatti 25 giugno 2007 Modello di regressione dinamica Il modello di regressione classico coglie solamente relazioni istantanee tra la variabile esplicative e la variabile dipendente, ma non reazioni dinamiche. Per rendere possibile la reazione dinamica a shock sulle variabile esplicativa avvenuti nel passato si può utilizzare un modello di regressione su variabili ritardate: y t = ν + β 0 x t + β x t + β 2 x t 2 +... + β k x t k + ε t. Il problema è che per modellare reazioni di lungo periodo k deve crescere indefinitivamente ed i parametri del modello diventano presto più numerosi dei dati: il modello non è quindi utilizzabile. Tuttavia, come si è fatto nel precedente paragrafo con i modelli ARIMA, è possibile approssimare la combinazione lineare infinita con (β 0 + β L + β 2 L 2 +...)x t ω v δ u x t, dove ω v = ω 0 + ω L +... + ω v L v, δ u = δ L... δ u L u. Similmente a quanto detto per i modelli ARIMA: il polinomio ω v è responsabile di reazioni ritardate sino ad un massimo di v periodi, rispetto al polinomio analogo dei modelli ARIMA, θ q ha il coefficiente di ordine 0 non unitario, che corrisponde al coefficiente di regressione istantanea β 0 ; il polinomio δ u è responsabile delle reazioni di lungo periodo e normalmente è sufficiente u 3; se l equazione δ u (x) = 0 ha una radice di valore e tutte le altre in modulo maggiori di, allora l effetto di ogni valore di x t si fa sentire per sempre, o detto altrimenti, cambia definitivamente il valor medio di y t, e conseguentemente la serie y t non può essere stazionaria;
se l equazione δ u (x) = 0 ha radici complesse in modulo maggiori di, y t reagisce ad ogni nuovo valore di x t oscillando fino a dimenticare gradualmente le x t più remote; se l equazione δ u (x) = 0 ha radici complesse in modulo pari a, allora y t oscilla perpetuamente dopo ogni nuovo valore di x t. Si invita il lettore ad usare un foglio elettronico per farsi un idea dei tipi di risposta ottenibile variando gli ordini e i valori dei coefficienti dei polinomi ω v e δ u. È chiaro come questi modelli possano essere utilizzati per modellare l effetto di una serie storica, per esempio, di investimenti in pubblicità di un prodotto sul fatturato dovuto alle vendite di quel prodotto. Si può generalizzare il modello visto permettendo k regressori dinamici in luogo di uno: y t = ω() v δ u () x() t +... + ω(k) v k δ u (k) k x(k) t + ε t () Questo ultimo modello potrebbe essere utilizzato per confrontare il rendimento di diversi tipi di pubblicità misurato come incremento del fatturato dovuto ad un Euro investito in ogni tipo di pubblicità, dopo un numero fissato di periodi: il coefficiente j-esimo dell espansione ω v δ u = ψ 0 + ψ L + ψ 2 L 2 +... misura l incremento del fatturato all j-esimo periodo dopo l investimento, e la somma cumulativa dei coefficienti j i=0 ψ i da l aumento del fatturato che l investimento ha fruttato fino a tale periodo. In figura sono rappresentate le funzioni di risposta ad impulso e le funzioni di risposta ad impulso cumulative per due investimenti diversi. L investimento 2 nel breve periodo (fino al 7 o periodo dopo l investimento) rende di più dell investimento, che, tuttavia, nel lungo periodo surclassa ampiamente l investimento 2. Il modello di regressione dinamica () può ulteriormente essere generalizzato e reso più flessibile supponendo che i sistemi dinamici non siano sporcati da un rumore bianco ε t, ma da un processo ARMA stazionario: y t = ν + ω() v δ u () x() t +... + ω(k) v k δ u (k) k x(k) t + θ q φ p ε t. (2) La 2 viene chiamata, oltre che modello di regressione dinamica, modello di funzione di trasferimento e modello ARMAX. 2
7.5 5.0 2.5 Rend Rend2 50 0 5 0 5 20 25 30 35 40 45 50 40 30 20 0 Rend.Cum Rend.Cum2 0 5 0 5 20 25 30 35 40 45 50 Figura : Funzioni di risposta ad impulso semplici (sopra) e cumulative (sotto) per due tipi di investimenti. 2 Identificazione del modello di regressione dinamica Come nel caso dell identificazione dei modelli ARIMA, abbiamo bisogno di una procedura dei modelli di regressione dinamica. Premesso che un approccio dal generale al particolare (stimo un modello con molti ritardi e poi elimino i coefficienti non significativi) non è da scartare a priori, l identificazione del modello di risposta dinamica è basato sulla funzione di cross-correlazione. La funzione di cross-correlazione è definita da γ yx (h) = Corr(y t, x t+h ), h =...,, 0,,... cioè dalla correlazione della variabile y t con anticipi e ritardi della variabile x t. Per la funzione di cross-correlazione vale la proprietà γ yx (h) = γ xy ( h). Prima di poter utilizzare con profitto la funzione di cross-correlazione è necessario fare una operazione di sbiancamento o pre-whitening delle serie x t e y t. Si deve identificare un modello ARMA per la serie x t e calcolarne i residui: ˆβ t = ˆφ p ˆθ q x t. 3
Lo stesso modello deve essere utilizzato sulla variabile y t per ottenere ˆα t = ˆφ p ˆθ q y t. A questo punto si può calcolare la funzione di cross correlazione campionaria ˆγ αβ (h) = Corr(α t, β t+h ); se, come ci si aspetta, x t causa (o precede) y t, ma non viceversa, per h > 0 ˆγ αβ (h) non sarà significamente diversa da zero. Se ciò non avvenisse i modelli di regressione dinamica sono inadatti e modelli con feedback quali VAR o VAR- MA sarebbero da utilizzare. Fatta questa premessa, la parte per h 0 del crosscorrelogramma identifica gli ordini della parte numeratore e denominatore del modello esattamente come il correlogramma permetteva di identificare la parte MA e la parte AR. Una differenza è dovuta alla possibilità che la prima cross-correlazione non nulla non avvenga per h = 0, ma per h = b, con b intero positivo. Ciò ha la semplice interpretazione che il primo effetto di x t non si fa sentire sulla y t contemporanea, bensì su y t+b. Il modello di regressione dinamica è quindi riscritto nel seguente modo: y t = ν + ω v δ u x t b + θ q φ p ε t. Una volta identificata la parte di funzione di trasferimento di x t su y t, sui residui di regressione y t ν ˆω v ˆδ u x t b si identifica il modello ARMA θ q φ p ε t, analogamente a quanto visto nella procedura Box-Jenkins. 3 Analisi d intervento Il modello di analisi d intervento è un modello di regressione dinamica per cui il regressore è una variabile dummy. Si usano solitamente due tipi di variabili dummy: l impulso e lo scalino I (τ) t = S (τ) t = { per t = τ, 0 altrimenti, { per t τ, 0 altrimenti. 4
L impulso si utilizza prevalentemente per eventi accaduti in un solo periodo t = τ, come uno sciopero o una tragedia come quella dell settembre 200, mentre lo scalino viene usato per fenomeni che permangono, come una nuova legge, l entrata di un nuovo concorrente, ecc. Il modello di analisi d intervento y t = ν + ω v δ u D(τ) t b + θ q φ p ε t, dove D (τ) t b è la generica variabile dummy, non presenta differenze sostanziali rispetto a ciò che si è detto per i più generali modelli di regressione dinamica, tuttavia la fase di identificazione non può più essere condotta per mezzo del cross-correlogramma. Per identificare un modello di analisi d intervento, per prima cosa si cerca di trovare un modello ARMA per quella parte di serie precedente l intervento, per la quale, essendo la dummy nulla, vale y t = ν + θ q φ p ε t, e una volta identificato un modello ARMA, si utilizza tutta la serie introducendo un modello abbastanza generale per la funzione di trasferimento delle dummy, per poi ridurlo, eliminando i parametri non significativi. Una tecnica alternativa per identificare la parte di funzione di trasferimento rispetto alla dummy consiste nel creare diversi ritardi della variabile dummy per poi fare una regressione con disturbi ARMA della y t sulle dummy ritardate. L andamento dei coefficienti di regressione sulle dummy ritardate è una stima dell andamento della funzione di risposta ad impulso per i primi ritardi e può essere usata per farsi un idea su quest ultima. 5