NOTA METODOLOGICA NEWSLETTER ISMEA LATTE E DERIVATI OTTOBRE 2003 Note metodologiche e modelli utilizzati per il forecast di latte e derivati in Italia per l anno 2003. Consulente Esterno Dott. Dario Buono dbuono@unina.it
Previsioni Latte e Derivati 2003 La previsione del tasso di crescita annuale per il 2003 è ottenuta tramite la specifica modellizzazione ARIMA delle serie in oggetto, disponibili a cadenza infra-annuale (mensile in questo caso). I modelli ARIMA incorporano gli avanzamenti compiuti negli ultimi anni nell ambito della cosidetta analisi moderna delle serie storiche. Essi vengono usati per fini previsivi e si basano sull ipotesi principale che il processo generatore della serie sia intrinseco nella serie stessa. A titolo semplificativo, l ipotesi sottostante è che la storia passata della serie aiuti a spiegare l andamento futuro della serie stessa a meno di un opportuno modello ARIMA. Per sua stessa natura quindi, il risultato dell ARIMA forecast deve essere interpretato come scenario-base tra i possibili andamenti futuri della serie e va utilizzato principalmente come termine di riferimento per la simulazione di scenari alternativi. La letteratura scientifica è solita rappresentare i modelli ARIMA con il seguente simbolismo: (p,d,q) (P,D,Q). Le lettere minuscole indicano rispetivamente la componente AR (autoregressive), I (integrated) e MA (moving average) non-stagionali del modello. Le lettere in maiuscolo indicano quelle stagionali. Per quanto riguarda le serie oggetto di analisi, il processo di indentificazione del miglior modello ARIMA, ha seguito la procedura Box-Jenkins tramite l ausilio dell interfaccia DEMETRA al software TRAMO. Dal punto di vista operativo la precedura effettua nell ordine: 1. l analisi preliminare della serie allo scopo di individuare eventuali effetti deterministici imputabili a fenomeni quali la presenza di festività fisse o mobili (ad esempio la Pasqua), l esistenza di valori anomali (outlier) legati a fenomeni accidentali o straordinari (scioperi, calamità naturali, ecc.), il diverso numero di giorni lavorativi (nei mesi o trimestri) ed effettuare opportune trasformazioni dei valori originari; la presenza di questi valori anomali può avere un impatto diretto sull'adeguatezza del modello ARIMA per la serie osservata e sull'efficienza della sua stima; pertanto è molto importante eliminare il loro effetto prima di procedere all'identificazione del modello. Per quanto riguarda gli outlier, va sottolineato che TRAMO ne considera tre tipi: a) outlier additivo: si manifesta con una brusca variazione della serie in un dato istante temporale, il cui effetto è però immediatamente riassorbito nell'istante successivo b) cambiamento temporaneo: è un cambiamento brusco in un dato istante temporale, che viene riassorbito gradualmente nel tempo c) cambiamento di livello: è un cambiamento brusco in un dato istante temporale che perdura nel tempo. 2. la fase di identificazione del modello che consente di specificarne gli ordini dei polinomi AR e MA e l'eventuale grado di integrazione del modello ARIMA che abbiamo indicato con (p, d, q) per la parte non stagionale e con (P, D, Q) per la parte stagionale; la serie, qualora si renda necessario, viene resa stazionaria applicando, rispettivamente, d volte e D volte gli operatori differenza prima e differenza 2
stagionale. Relativamente all'individuazione degli ordini dei polinomi AR ed MA stagionali e non stagionali si possono seguire due strade alternative e complementari: a) modello identificato automaticamente: questo modo di procedere si basa sul confronto di vari modelli utilizzando criteri standard sviluppati in letteratura; in particolare viene considerato il cosiddetto criterio BIC (Bayesian Information Criterion) (si veda Schwarz 1979 e Planas- 1997, pag. 56). In questo contesto ci limitiamo a notare che tale criterio consiste nello scegliere il modello che riporta il minor valore della statistica espressa dal BIC. b) modello identificato dall utente: in questo caso l'identificazione degli ordini del modello avviene sulla base delle funzioni di autocorrelazione. 3. la stima del modello ARIMA identificato, utilizzando il metodo della massima verosimiglianza 4. l elaborazione di test statistici per verificare se il modello individuato sia una buona rappresentazione del processo stocastico che ha generato la serie osservata. Queste fasi possono essere iterate finché non si perviene al modello ritenuto migliore. Individuato quest ultimo, si procede al calcolo della previsione per i periodi successivi. Il valore annuale è ottenuto come somma dei previsti futuri valori trimestrali. Per la sua stessa natura, la previsione ottenuta va sottoposta a revisione ogni qual volta nuova e significativa informazione riguardante la serie storia originaria (quella a cadenza infrannuale) diviene disponibile. Ai fini illustrativi riportiamo di seguito le statistiche associate ai modelli identificati ed utilizzati per le previsioni delle variabili: 1. Latte alimentare 2. Latte di Vacca 3. Burro 4. Formaggi Le figure riportano le serie originali in blu ed il trend identificato in rosso. Tra le inforamzioni relative al modello, sono riportati gli outliers identificati, laddove presenti. Per questi ultimi è dato anche un riferimento alla loro natura. Di seguito la simbologia: a. AO Outlier di tipo additivo b. TC Cambiamento transitorio c. LS Effetto scalino Le statistiche ed modelli associati alle altre variabili sono disponibili su richiesta. 3
previsioni latte 2003 - L_vacca 1000 L_vacca Final Trend from L_vacca - 950 900 850 800 750 Jan97 Jan98 Jan99 Jan2000 Jan2001 Jan2002 Jan2003 Jan2004 date Information on Models Information on Diagnostics Series Span (n of obs.) Jan1997 - Jul2003 (79) Model Span (n of obs.) Jan1997 - Jul2003 (79) Method Tramo/Seats PRE-ADJUSTMENT Transformation Mean Correction Yes Mean t-value 6.51 [-1.990, 1.990] 5% Correction for Trading Da... Correction for Easter Effect Correction for Outliers Autom.:AO,LS,TC; 1 Outli... Critical t-value 3.070 AO Sep1997 t-value 4.03 [-3.070, 3.070] crit.val. Corr. for Missing Obs. Corr. for Other Regr. Effects Specif. of the ARIMA model (1 0 0)(0 1 1) (fixed) Non-seas. AR (lag 1) value -0.4736 Non-seas. AR (lag 1) t-v... -4.27 [-1.990, 1.990] 5% Seasonal MA (lag 12) value -0.9294 Seasonal MA (lag 12) t-v... -20.62 [-1.990, 1.990] 5% Method of Estimation Exact Maximum Likelihood DECOMPOSITION ARIMA Decomposition Exact Seasonality Seasonal model imposed SA quality index (stand. to... 2.092 [0, 10] ad-hoc STATISTICS ON RESID... Ljung-Box on residuals 25.92 [0, 33.90] 5% Box-Pierce on residuals 2.38 [0, 5.99] 5% Ljung-Box on squared res... 14.42 [0, 33.90] 5% Box-Pierce on squared re... 0.60 [0, 5.99] 5% DESCRIPTION OF RESI... Normality 0.79 [0, 5.99] 5% Skewness 0.05 [-0.60, 0.60] 5% Kurtosis 2.47 [1.81, 4.19] 5% OUTLIERS Percentage of outliers 1.27% [0%, 5.0%] ad-hoc 4
previsioni latte 2003 - L_alimentare 300 L_alimentare Final Trend from L_alimentare - 290 280 270 260 250 240 230 220 date Jan97 Jan98 Jan99 Jan2000 Jan2001 Jan2002 Jan2003 Jan2004 Information on Models Information on Diagnostics Series Span (n of obs.) Jan1997 - Jul2003 (79) Model Span (n of obs.) Jan1997 - Jul2003 (79) Method Tramo/Seats PRE-ADJUSTMENT Transformation Mean Correction Correction for Trading Da... Correction for Easter Effect Correction for Outliers Autom.:AO,LS,TC; 2 Outli... Critical t-value 3.070 LS Jan2000 t-value -6.47 [-3.070, 3.070] crit.val. TC Jun1998 t-value 5.34 [-3.070, 3.070] crit.val. Corr. for Missing Obs. Corr. for Other Regr. Effects Specif. of the ARIMA model (0 1 1)(0 1 1) (fixed) Non-seas. MA (lag 1) value -0.9259 Non-seas. MA (lag 1) t-v... -19.60 [-1.990, 1.990] 5% Seasonal MA (lag 12) value -0.4686 Seasonal MA (lag 12) t-v... -4.24 [-1.990, 1.990] 5% Method of Estimation Exact Maximum Likelihood DECOMPOSITION ARIMA Decomposition Exact Seasonality Seasonal model imposed SA quality index (stand. to... 2.612 [0, 10] ad-hoc STATISTICS ON RESID... Ljung-Box on residuals 21.52 [0, 33.90] 5% Box-Pierce on residuals 1.76 [0, 5.99] 5% Ljung-Box on squared res... 23.16 [0, 33.90] 5% Box-Pierce on squared re... 0.95 [0, 5.99] 5% DESCRIPTION OF RESI... Normality 0.94 [0, 5.99] 5% Skewness -0.27 [-0.60, 0.60] 5% Kurtosis 2.74 [1.80, 4.20] 5% OUTLIERS Percentage of outliers 2.53% [0%, 5.0%] ad-hoc 5
previsioni latte 2003 - Burro 14 Burro Final Trend from Burro - 13 12 11 10 9 8 7 date Jan97 Jan98 Jan99 Jan2000 Jan2001 Jan2002 Jan2003 Jan2004 Information on Models Information on Diagnostics Series Span (n of obs.) Jan1997 - Jul2003 (79) Model Span (n of obs.) Jan1997 - Jul2003 (79) Method Tramo/Seats PRE-ADJUSTMENT Transformation Mean Correction Correction for Trading Da... Correction for Easter Effect Correction for Outliers Autom.:AO,LS,TC; 1 Outli... Critical t-value 3.070 AO Sep1997 t-value 4.22 [-3.070, 3.070] crit.val. Corr. for Missing Obs. Corr. for Other Regr. Effects Specif. of the ARIMA model (0 1 1)(0 1 1) (fixed) Non-seas. MA (lag 1) value -0.4114 Non-seas. MA (lag 1) t-v... -3.47 [-1.990, 1.990] 5% Seasonal MA (lag 12) value -0.6652 Seasonal MA (lag 12) t-v... -3.62 [-1.990, 1.990] 5% Method of Estimation Exact Maximum Likelihood DECOMPOSITION ARIMA Decomposition Exact Seasonality Seasonal model imposed SA quality index (stand. to... 2.152 [0, 10] ad-hoc STATISTICS ON RESID... Ljung-Box on residuals 25.11 [0, 33.90] 5% Box-Pierce on residuals 0.87 [0, 5.99] 5% Ljung-Box on squared res... 21.91 [0, 33.90] 5% Box-Pierce on squared re... 0.57 [0, 5.99] 5% DESCRIPTION OF RESI... Normality 0.70 [0, 5.99] 5% Skewness -0.11 [-0.60, 0.60] 5% Kurtosis 2.54 [1.81, 4.19] 5% OUTLIERS Percentage of outliers 1.27% [0%, 5.0%] ad-hoc 6
previsioni latte 2003 - Formaggi 90 Formaggi Final Trend from Formaggi - 85 80 75 70 65 60 Jan97 Jan98 Jan99 Jan2000 Jan2001 Jan2002 Jan2003 Jan2004 date Information on Models Information on Diagnostics Series Span (n of obs.) Jan1997 - Jul2003 (79) Model Span (n of obs.) Jan1997 - Jul2003 (79) Method Tramo/Seats PRE-ADJUSTMENT Transformation Mean Correction Correction for Trading Da... Correction for Easter Effect Correction for Outliers Autom.:AO,LS,TC; 2 Outli... Critical t-value 3.040 LS Jan2001 t-value 3.10 [-3.040, 3.040] crit.val. AO Dec1999 t-value 2.96 [-3.040, 3.040] crit.val. Corr. for Missing Obs. Corr. for Other Regr. Effects Specif. of the ARIMA model (1 0 0)(0 1 1) (fixed) Non-seas. AR (lag 1) value -0.5729 Non-seas. AR (lag 1) t-v... -5.53 [-1.990, 1.990] 5% Seasonal MA (lag 12) value -0.5828 Seasonal MA (lag 12) t-v... -3.78 [-1.990, 1.990] 5% Method of Estimation Exact Maximum Likelihood DECOMPOSITION ARIMA Decomposition Exact Seasonality Seasonal model imposed SA quality index (stand. to... 4.161 [0, 10] ad-hoc STATISTICS ON RESID... Ljung-Box on residuals 28.25 [0, 33.90] 5% Box-Pierce on residuals 1.09 [0, 5.99] 5% Ljung-Box on squared res... 14.37 [0, 33.90] 5% Box-Pierce on squared re... 0.42 [0, 5.99] 5% DESCRIPTION OF RESI... Normality 8.27 [0, 5.99] 5% Skewness 0.56 [-0.60, 0.60] 5% Kurtosis 4.34 [1.81, 4.19] 5% OUTLIERS Percentage of outliers 2.53% [0%, 5.0%] ad-hoc 7
Bibliografia [1] Barbone L. Bodo G. Visco. I., "Costi e profitti nell industria in senso stretto: un analisi su serie trimestrali, 1970-80", Bollettino della Banca d Italia, gennaio-dicembre,1981. [2] Barcellan R., "Aggregazione e disaggregazione temporale di serie storiche: un approccio basato sui modelli ARIMA", Università di Padova, 1992. [3] Barcellan R. Buono D. Kuhnert I., "GDP: Expenditure and Output approach non seasonal adjusted figures now available", Eurostat, SIF Theme2 10/2002, 2002. [4] Bournay J. Laroque G., "Refléxions sur la méthode d élaborations des Comptes Trimestriels", Annales de l INSEE, 36,3-30,1979. [5] Chow G. C.-Lin A. L., "Best Linear Unbiased Interpolation Distribution and Extrapolation of Time Series by Related Series", Review of Economics and Statistics, November, 1971. [6] Di Fonzo (2002), Temporal disaggregation of economic time series: towards a dynamic extension, Dipartimento di Scienze Statistiche, Università di Padova, working paper 2002.17 [7] Di Fonzo T., "La stima indiretta di serie economiche trimestrali", Cluep editore Padova, November, 1987. [8] Di Fonzo T., "The disaggregation of M time series when contemporaneous and temporal aggregates are known, Review of Economics and Statistics, 72,178-182,1990. [9] Fernandez R.B., "A methodological note on the estimation of Time series, Review of Economics and Statistics, 63,471-478,1981. [10] ISMEA, "Rapporto Annuale, 2002. [11] Litterman R.B., "A Random Walk, Markov Model for the distribution of Time Series, Journal of Business and Statistics, 1,169-173,1983. 8