Metodi di previsione Giovanni Righini Università degli Studi di Milano Corso di Logistica
I metodi di previsione I metodi di previsione sono usati per ricavare informazioni a sostegno dei processi decisionali a partire dai dati. Le previsioni possono avere diversi orizzonti temporali: breve termine (es.: numero di chiamate ad un call center nelle prossime settimane) medio termine (es.: previsioni di vendita per il piano finanziario annuale di un azienda) lungo termine (es.: domanda di automobili a idrogeno nei prossimi decenni)
Testi di riferimento C. Vercellis, Modelli e decisioni : strumenti e metodi per le decisioni aziendali, Pitagora Editrice, Bologna 1997 G. Ghiani, R. Musmanno, Modelli e metodi per l organizzazione dei sistemi logistici, Pitagora Editrice, Bologna 2000 C. Vercellis, Business intelligence: modelli matematici e sistemi per le decisioni, McGraw-Hill, Milano 2006
Classificazione Esistono metodi qualitativi e quantitativi. Metodi qualitativi: Opinione di esperti Sondaggio di mercato Metodo Delphi Metodi qualitativi: Metodi esplicativi: si suppone esista un legame causa-effetto e lo si vuole rappresentare formalmente; Metodi estrapolativi: si vogliono desumere delle regolarità dalle osservazioni disponibili.
Metodi di regressione Analisi di regressione L obiettivo è di identificare un legame funzionale tra un effetto e le sue presunte cause. Si osserva una grandezza y (variabile dipendente) e si suppone sia funzione di altre grandezze x (variabili indipendenti). y = f (x) Se la variabile indipendente è una sola, si ha la regressione semplice. Conoscendo (da osservazioni precedenti) alcune coppie di valori (x i, y i ), si vuole trovare la funzione f () che meglio le spiega.
Metodi di regressione Analisi di regressione Invece di cercare una funzione, potenzialmente complicata, che spieghi esattamente le osservazioni, si preferisce cercare una funzione semplice che spieghi le osservazioni con una certa approssimazione. Si ammette quindi che i valori ottenuti dal calcolo di f (x i ) possano differire dai valori osservati y i. Se la funzione f () è una retta, si ha la regressione lineare. y = A + Bx + ɛ La differenza ɛ tra valori calcolati e valori osservati è il residuo ed è una variabile casuale che deve soddisfare due requisiti: distribuzione normale con media nulla indipendenza tra ɛ i ed ɛ j per ogni i j.
Metodi di regressione Metodo dei minimi quadrati Si assume come misura dell approssimazione Q = N (f (x i ) y i ) 2 i=1 che è la funzione obiettivo che si vuole minimizzare. Le incognite, o variabili decisionali, sono i parametri della retta, cioè A e B. Per trovare i loro valori ottimi, basta calcolare le derivate parziali di Q rispetto ad A e B e porle uguali a zero.
Metodi di regressione Metodo dei minimi quadrati 6 5 4 3 data 2 1 0-1 0 1 2 3 4 5 6-1 time
Metodi di regressione Metodo dei minimi quadrati Indicando i valori medi con N i=1 x = x N i i=1 e y = y i N N si ha: dove S xx = N i=1 (x i x) 2 S xy = N i=1 (x i x)(y i y) S yy = N i=1 (y i y) 2 B = S xy S xx e A = y Bx
Metodi di regressione Passaggio per l origine Se si vuole imporre che la retta di predizione y = A + Bx passi per l origine, si pone A = 0 e si stima solo B = N i=1 x iy i N i=1 x. i 2
Metodi di regressione Valutazione del modello A posteriori è importante valutare l affidabilità del modello usato. Pendenza della retta: Il modello si ritiene non-significativo se un dato intervallo di confidenza per B contiene il valore 0. Coefficiente di correlazione lineare (indice di Pearson): r = Sxy. Sxx S yy Si ha sempre 1 r 1. Se r > 0 la retta sale, se r < 0 la retta scende. Se r 1, la correlazione lineare è forte; se r 0, è debole. Stimatore della varianza: s 2 = N i=1 (f (x i ) y i ) 2 N 2 = 1 N 2 (S yy BS xy ).
Serie storiche Una serie storica è una sequenza di valori y t assunti da una grandezza di interesse in corrispondenza di istanti temporali t. Se essi definiscono un insieme discreto la serie storica viene detta a tempo discreto. Considereremo serie storiche a tempo discreto con istanti t uniformemente distanziati nel tempo (anni, settimane, giorni,...).
Classificazione I metodi estrapolativi si possono applicare alla previsione di un solo periodo o di più periodi in avanti. Metodi di scomposizione delle serie storiche Metodi di smoothing esponenziale: Metodo di Brown Metodo di Holt Metodo di Winters Modelli autoregressivi: Modelli autoregressivi (AR) Modelli a media mobile (MA) Modelli autoregressivi a media mobile (ARMA) Modelli autoregressivi a media mobile integrata (ARIMA)
Scomposizione di serie temporali Modelli di serie temporali Si fa l ipotesi che i valori osservati y t nella serie temporale siano il risultato della combinazione di componenti di natura diversa. Andamento tendenziale di lungo periodo m t Andamento dovuto ai cicli economici v t Andamento stagionale s t (noto il periodo L) Residuo casuale, imprevedibile r t. Relativamente al modo in cui le componenti si combinano si distinguono modelli additivi e moltiplicativi. Modelli additivi: y t = m t + v t + s t + r t Modelli moltiplicativi: y t = m t v t s t r t Nel seguito considereremo un modello moltiplicativo.
Scomposizione di serie temporali Media mobile Conoscendo il periodo L della componente stagionale, la si può rimuovere calcolando la media su tutti i periodi di lunghezza L. L dispari: (mv) t = L pari: (mv) t = t+ L 1 2 i=t L 1 y i 2 L 1 2 y t L + t+ L 2 1 2 i=t 2 L y +1 i + 1 2 y t+ 2 L L Per separare la componente tendenziale m dalla componente v, si ipotizza che la prima sia lineare e la si ricava con la regressione lineare semplice, dove il tempo è la variabile indipendente.
Scomposizione di serie temporali Indici di stagionalità La componente stagionale e aleatoria si ricava da (sr) t = Gli indici di stagionalità s 1,..., s L si ottengono come k s t = (sr) t+kl N t y t (mv) t. dove gli estremi della sommatoria sono tali da coprire tutti i (sr) calcolati in precedenza ed N t indica il numero degli addendi. Gli indici così ricavati vengono poi normalizzati: s t = Ls t L t=1 s t t = 1,..., L. Si ha quindi s t+kl = s t per ogni t e per ogni k intero.
Scomposizione di serie temporali Esempio: componente tendenziale Componente tendenziale 1200,0 1000,0 800,0 600,0 400,0 200,0 0,0 1 21 41 61 81 101 121 141 Periodi
Scomposizione di serie temporali Esempio: componente stagionale Componente stagionale 1,2 1,1 1,0 0,9 0,8 0,7 0,6 7 27 47 67 87 107 127 147 Periodi
Scomposizione di serie temporali Previsione La previsione è fatta combinando le componenti tendenziale m e stagionale s. Predizione 1100,0 1000,0 900,0 800,0 700,0 600,0 Serie storica Predizione 500,0 400,0 7 27 47 67 87 107 127 147 167 Periodi
Metodi di smoothing esponenziale Introduzione Sono metodi per la predizione di serie storiche semplici, versatili e accurati. Ne esistono diversi, che tengono o meno conto dell esistenza di componenti tendenziali e stagionali nella serie storica in esame. L idea di base è quella di pesare maggiormente le osservazioni più recenti rispetto a quelle più remote nel passato. Questo rende i metodi di smoothing capaci di adeguarsi rapidamente a variazioni improvvise nel valore della serie storica a causa di eventi che modificano la regolarità del fenomeno osservato (guasti tecnici, offerte speciali, fallimento di aziende concorrenti, crisi finanziarie...).
Metodi di smoothing esponenziale Metodo di Brown È il metodo di smoothing esponenziale semplice. Media smorzata: s t = αy t + (1 α)s t 1 t 2 s 1 = y 1 Predizione: f t+1 = s t con 0 α 1. Per α prossimo a 0 il modello è più inerte; per α prossimo a 1 è più reattivo. Il valore ottimo di α si ottiene minimizzando lo scarto quadratico medio.
Metodi di smoothing esponenziale Metodo di Holt È il metodo di smoothing esponenziale con correzione di tendenza. Media smorzata: s t = αy t + (1 α)(s t 1 + m t 1 ) t 2 m t = β(s t s t 1 ) + (1 β)m t 1 t 2 s 1 = y 1 m 1 = y 2 y 1 Predizione: f t+1 = s t + m t. con 0 β 1, ottimizzato minimizzando lo scarto quadratico medio.
Metodi di smoothing esponenziale Metodo di Winters È il metodo di smoothing esponenziale con correzione di tendenza e di stagionalità (di periodo L noto). Media smorzata: s t = α y t q t L + (1 α)(s t 1 + m t 1 ) t 2 m t = β(s t s t 1 ) + (1 β)m t 1 t 2 q t = γ y t s t + (1 γ)q t L t L + 1 s 1 = y 1 m 1 = y 2 y 1 y q t = t L t = 1,..., L τ=1 yτ /L con 0 γ 1, ottimizzato minimizzando lo scarto quadratico medio. La predizione è f t+1 = (s t + m t )q t L+1.
Metodi di smoothing esponenziale Eliminazione tendenza e stagionalità Per rimuovere da una serie storica la componente di tendenza o di stagionalità: calcolare la media mobile per rimuovere la tendenza differenziazioni successive B t (h) = y t y t h per rimuovere la tendenza identificare la tendenza con l analisi di regressione identificare la componente di stagionalità tramite scomposizione della serie Quindi è possibile: applicare il modello di Winters alla serie storica; applicare il modello di Holt alla serie storica destagionalizzata; applicare il modello di Brown alla serie storica dopo aver rimosso tendenza e stagionalità.