Metodi di previsione statistica
Francesco Battaglia Metodi di previsrone statisttca ~ Springer
FRANCESCO BATTAGLIA Dipartimento di Statistica, Probabilita e Statistiche Applicate Universita La Sapienza Roma ISBN 978-88-470-0602-7 Springer Milan Berlin Heidelberg New York Springer-Verlag fa parte di Springer Science+Business Media springer.com Springer-Verlag Italia, Milano 2007 Quest'opera eprotetta dalla legge sul diritto d'autore. Tutti i diritti, in particolare quelli relativi alla traduzione, alla ristampa, all'uso di figure e tabelle, alla citazione orale, alla trasmissione radiofonica 0 televisiva, alla riproduzione su microfilm 0 in database, alla diversa riproduzione in qualsiasi altra forma (stampa 0 elettronica) rimangono riservati anche nel caso di utilizzo parziale. Una riproduzione di quest'opera, oppure di parte di questa, eanche nel caso specifico solo ammessa nei limiti stabiliti dalla legge sul diritto d'autore, ed esoggetta all'autorizzazione dell'editore. La violazione delle norme comporta sanzioni previste dalla legge. L'utilizzo di denominazioni generiche, nomi commerciali, marchi registrati, ecc., in quest' opera, anche in assenza di particolare indicazione, non consente di considerare tali denominazioni 0 marchi liberamente utilizzabili da chiunque ai sensi della legge sul marchio. Impianti forniti dall'autore Progetto grafico della copertina: Simona Colombo, Milano Stampa: Signum, Bollate (Mi) Stampato in Italia Springer- Verlag Italia srl Via Decembrio 28 20137 Milano
Prefazione Questo volume presenta una trattazione della metodologia statistica relativa alla previsione di fenomeni riferibili al tempo. L'occasione immediata per la realizzazione di questo testo estata determinata dalla istituzione di nuovi corsi di insegnamento sulla previsione statistica nelle lauree di primo e di secondo livello della Facolta di Scienze Statistiche dell'universita La Sapienza di Roma; cia ha condizionato la struttura generale del volume, richiedendo la possibilita di una lettura su due diversi livelli di approfondimento, e con differenti pre-requisiti. La trattazione si rivolge, comunque, a lettori che possiedano la formazione tipica dei contenuti di base e di quelli caratterizzanti del primo biennio di una laurea in Statistica. In particolare, e data per nota la conoscenza del calcolo differenziale e integrale di una e pili variabili con elementi di teoria della misura, di serie numeriche e serie di funzioni; della geometria analitica classica, spazi euclidei di dimensione finita e algebra lineare; del calcolo delle probabilita relativo aile variabili aleatorie univariate (compresi i teoremi limite); della statistica di base e dei fondamenti di inferenza statistica. Invece, alcuni approfondimenti necessari per una pili completa conoscenza degli argomenti trattati sono esposti brevemente nel volume stesso: quelli relativi alle variabili aleatorie multivariate e alle norrnali multiple nel terzo capitolo, altri concernenti l'analisi di Fourier e complementi di trigonometria nell'appendice A. Questo modo di procedere si erivelato opportuno poiche la piena comprensione dei metodi di previsione statistica richiede l'applicazione e la padronanza di un vasto ventaglio di discipline quantitative. Tuttavia, per non appesantire troppo 10 svolgimento, si e rinunciato a fornire dimostrazioni completamente esaurienti di tutti i risultati, anche se di ognuno si cerca costantemente di fornire la genesi, una spiegazione intuitiva e una prova formale anche se non sempre rigorosa. La scelta e la sistemazione logica del materiale, l'ordine in cui epresentato e la sua motivazione seguono una linea personale dell'autore, e differiscono in buona parte da altri volumi relativi alla stessa problematica, in particolare per
VI Prefazione quanto riguarda il primo capitolo (e segnatamente per i concetti di previsione statistica, globale e puntuale), per la bipartizione della parte strutturale nei suoi aspetti probabilistici e in quelli statistici, per la parallela distinzione tra processi e modelli autoregressivi a somma mobile, per il risalto dato ai risultati propri del dominio frequenziale, e per la trattazione, anche se succinta, delle catene di Markov e dei processi di punto. E naturale infine che in base agli interessi e alla sensibilita personale dell'autore, alcuni argomenti siano trattati pili approfonditamente della maggior parte dei testi del settore, e altri meno approfonditamente, 0 solo accennati rimandando alla bibliografia. Per un corso introduttivo di primo livello concernente l'analisi e previsione delle serie temporali univariate e i modelli ARIMA si possono prendere in considerazione i capitoli 1, 2, 3, 5 (paragrafi 1, 2, 6), 6, 8, 9 (paragrafi dal 1 al 4 e il 7), 10 (paragrafi dal 1 al 4 e il 6) e 13 (paragrafi 1 e 2). Per un corso pili approfondito di secondo livello si puo completare la trattazione utilizzando, oltre ad approfondimenti quali l'analisi nel dominio delle frequenze e il filtraggio lineare (paragrafi 3, 4 e 5 del capitolo 5 e paragrafo 5 del capitolo 9), le deviazioni dalle ipotesi (capitolo 11) e i modelli a eteroschedasticita condizionale, anche materiale sulle serie bivariate (paragrafi 8 e 9 del capitolo 5, paragrafo 6 del capitolo 9, paragrafo 7 del capitolo 10), sulle catene di Markov e i processi di punti (capitoli 4, 7, 12, 14) e su ulteriori approcci alla previsione puntuale, alternativi 0 complementari ai modelli ARIMA (paragrafi dal 3 al 6 del capitolo 13). Questo libro espone una impostazione e un punta di vista personali, maturati in pili di trent'anni di ricerca nel campo delle serie temporali, e quindi porta con se il riflesso degli insegnamenti e dell' esperienza dei tanti maestri e colleghi che ho incontrato nel mio percorso; non epossibile nominarli tutti anche se a tutti sono grato, rna non posso esimermi dal citare almeno Francesco Carlucci, che mi ha introdotto, fin da studente, ana problematica che sarebbe poi diventata il mio settore principale di ricerca. Desidero infine ringraziare in particolare gli amici e colleghi che con i loro consigli hanno contribuito a rendere pili chiaro e completo questo testo, tra essi Adelchi Azzalini, Roberto Baragona, Maria Maddalena Barbieri, Estela Bee Dagum e Anna Clara Monti. Rama, Febbraio 2007 Francesco Battaglia
Indice Parte I Fenomeni dinamici e previsione 1 La previsione.............................................. 3 1.1 Introduzione... 3 1.2 La previsione statistica................................... 6 1.2.1 Delimitazione del concetto di previsione statistica... 6 1.2.2 Previsione statistica globale......................... 10 1.2.3 Previsione statistica puntuale....................... 12 2 Caratteristiche generali dei fenomeni dinamici............. 15 2.1 II primo approccio: la rappresentazione grafica 15 2.2 Analisi delle tendenze di fondo............................ 22 2.3 Analisi della stagionalita 26 2.4 Analisi dei residui 28 Parte II La teoria dei processi aleatori 3 Processi aleatori e loro classificazione...................... 33 3.1 Che cos'e un processo aleatorio............................ 33 3.2 Richiami sulle distribuzioni di probabilita multivariate 34 3.3 La distribuzione normale multipla......................... 38 3.4 Alcune proprieta dei processi aleatori 44 3.5 Una classificazione dei processi aleatori..................... 47 4 Catene di Markov 51 4.1 Generalita... 51 4.2 Classificazione degli stati e delle catene..................... 58 4.3 Distribuzioni di equilibrio................................. 61 4.4 Processi non markoviani.................................. 67
VIII Indice 5 Processi stazionari......................................... 71 5.1 Introduzione... 71 5.2 Analisi nel dominio temporale............................. 74 5.3 Analisi nel dominio frequenziale........................... 78 5.4 Le relazioni tra i due domini.............................. 87 5.5 I filtri lineari............................................ 90 5.6 Operatori lineari 95 5.7 I filtri alle differenze per la depurazione di una componente ciclica.................................................. 98 5.8 Relazioni tra processi stazionari 102 5.9 Sistemi lineari bivariati 107 6 Processi lineari 111 6.1 La decomposizione di Wold 111 6.2 Processi puramente autoregressivi 115 6.3 Processi puramente a somma mobile 128 6.4 Processi misti 130 7 Processi di punti 133 7.1 Caratteristiche generali 133 7.2 Processi di Poisson 135 7.3 Cenni sull'analisi nel dominio temporale e frequenziale 138 Parte III La statistica dei fenomeni dinamici 8 Inferenza statistica per processi aleatori 143 8.1 Differenze rispetto all'inferenza parametrica classica 143 8.2 L'ergodicita 145 9 Inferenza per processi stazionari 147 9.1 Introduzione 147 9.2 Stima della media 148 9.3 Stima delle autocovarianze e delle autocorrelazioni 152 9.4 Stima delle autocorrelazioni parziali 161 9.5 Stima dello spettro 163 9.6 Inferenza per processi bivariati 179 9.7 Stima dei parametri per processi ARMA 181 10 I modelli rappresentativi 187 10.1 Introduzione 187 10.2 Identificazione del modena 190 10.3 Stima dei parametri e verifica del modello 201 10.4 Modelli per serie non stazionarie in media 207 10.5 Modelli per serie non stazionarie in varianza e ad eteroschedasticita condizionata 214
Indice IX 10.6 Modelli per serie stagionali 218 10.7 Modelli lineari per le relazioni tra due processi 227 11 Deviazioni dalle ipotesi 233 11.1 Perturbazioni nei dati e nella struttura 233 11.2 Perturbazioni dovute a fattori noti 234 11.3 Dati anomali 237 12 Inferenza per catene di Markov e processi di punti 243 12.1 Stima delle probabilita per catene di Markov 243 12.2 Inferenza per processi di Poisson 246 Parte IV Metodi di previsione puntuale 13 Previsioni per processi stazionari 253 13.1 Teoria della previsione 253 13.2 Previsioni con modelli ARIMA 257 13.3 Previsioni con metodi adattivi 266 13.4 Previsioni con modelli strutturali 271 13.5 Spazio degli stati e filtro di Kalman 274 13.6 La combinazione delle previsioni 284 14 Previsioni per catene di Markov e processi di punti 287 14.1 Previsioni nelle catene di Markov 287 14.2 Previsione per processi di punti 289 Parte V Appendici A Fondamenti di Analisi di Fourier 299 A.l Richiami di trigonometria e analisi complessa 299 A.2 Sviluppo di Fourier per funzioni periodiche 305 A.3 Analisi di Fourier per funzioni non periodiche 310 B Software per la previsione 313 Bibliografia 315 Indice 319