Cap 3 Meodi di scomposizione 31 3. Meodi di scomposizione 3.1 Inroduzione Moli meodi di previsione si basano sul fao che, se esise un paern sisemaico, queso possa essere individuao e separao da evenuali oscillazioni accidenali, mediane meodi di perequazione o smussameno (lisciameno, smoohing) dei dai della serie sorica. L effeo dello smussameno è quello di eliminare disurbi casuali cosicché, una vola individuao il paern, queso possa essere proieao nel fuuro per produrre la previsione. I meodi di scomposizione endono, di norma, a individuare due paern: il rend-ciclo e la sagionalià. Il rend-ciclo può essere scomposo, a sua vola, in componene di fondo (rend) e oscillazioni congiunurali (ciclo) (*). In queso capiolo sarà illusrao il meodo classico di scomposizione. Come si vedrà, ale procedimeno è più che alro uno srumeno di analisi della serie sorica, e necessia perano di alcuni perfezionameni per poer produrre la previsione. I meodi di scomposizione hanno cosiuio il primo approccio di analisi delle serie soriche. Il meodo classico risale agli anni 2 e cosiuisce ancora oggi la base per i meodi più frequenemene usai. Aualmene il meodo di scomposizione più diffuso è quello denominao Census II che viene usao per numerose serie economiche sia in ambio privao sia in ambio pubblico (Makridakis, Wheelwrigh, Hyndman, 19XX). E imporane precisare che, nel seguio, se non viene specificao diversamene, useremo il simbolo y, =1,,n per indicare la serie sorica, evenualmene aggiusaa per le variazioni dei prezzi, per le oscillazioni di calendario, ecc.. (*) In quese noe non affroneremo il problema della sima del ciclo.
32 Cap. 3 Meodi di scomposizione 3.2 Il modello di scomposizione Il modello maemaico ipoizzao nel meodo classico di scomposizione è: (3.1) y =f(s, T, E ) dove y è il dao riferio al periodo S è la componene sagionale al periodo T e la componene rend-ciclo al periodo E è la componene irregolare al empo. La forma di f() dipende dall approccio seguio. Una forma molo comune è la seguene: (3.2) y =S +T +E che viene definia modello addiivo. Un alra forma alreano frequene è il modello moliplicaivo: (3.3) y =S x T x E Un modello addiivo è appropriao quando l ampiezza dell oscillazione sagionale non varia col livello della serie. Se invece la fluuazione sagionale aumena (o diminuisce) proporzionalmene con l aumeno (diminuzione) del livello della serie, allora è più adeguao un modello moliplicaivo. Mole serie economiche esibiscono fluuazioni sagionali che crescono all aumenare del livello della serie; per ale moivo, in ambio economico, il modello moliplicaivo rova più larga applicazione. Nel modello addiivo, le componeni S,T, E sono espresse nella sessa unià di misura di y ; nel modello moliplicaivo, solo T (per convenzione) viene espresso nell unià di misura di y ; E e S sono numeri puri. Nel modello addiivo l errore può assumere valori posiivi o negaivi; è il valore neurale, nel senso che non influenza la serie. Nel modello moliplicaivo l errore può assumere solo valori non negaivi e ha 1 come valore neurale. Si noi che, col modello moliplicaivo, porebbe essere uile ricorrere alla rasformazione della serie. Poiché la funzione logarimica rasforma una espressione moliplicaiva in una addiiva si ha: (3.4) ln y =ln(s x T x E ) ln y =lns + lnt + lne Quindi, invece del modello moliplicaivo sui dai originari della serie, si porebbe applicare il modello addiivo sulle rasformae logarimiche.
Cap 3 Meodi di scomposizione 33 3.3 Rappresenazioni grafiche negli approcci di scomposizione La Fig. 3.1 mosra i principali grafici derivani da una analisi di scomposizione mediane un modello addiivo. I risulai fanno riferimeno ai dai di Tab. 2.4 (vendie di boiglie della bibia QQQ). Richiamiamo l aenzione soprauo sui segueni grafici: (i) il ime plo della serie desagionalizzaa ovvero depuraa dalla sagionalià (seasonally adjused daa), riporao in Fig, 3.1; (ii) il ime plo della componene sagionale (Fig. 3.2); (iii) la serie sorica dei residui (Fig. 3.3); (iv) il ime plo della serie originale e della serie simaa (Fig. 3.5). L andameno dei dai desagionalizzai dovrebbe mosrare una linea abbasanza liscia, priva di quelle oscillazioni regolari e marcae ipiche della sagionalià della serie. La Fig. 3.1 mosra che la desagionalizzazione mediane il modello addiivo non è soddisfacene: si ende a desagionalizzare roppo nel primo anno (infai, si può noare una inversione delle pune per il mese di giugno e di seembre); si desagionalizza poco nell ulimo anno (si noa, infai, che rimane un picco molo elevao). Il moivo risiede nel fao che il modello addiivo assume impliciamene che il range di variazione delle oscillazioni sagionali all inerno dell anno rimanga cosane menre, nel caso in esame, ende ad aumenare dal 1999 al 21 (Fig. 2.5). Perano la sima della sagionalià, rappresenaa nella Fig. 3.2, non è da rienersi valida. Un alra verifica sul modello di scomposizione adoao ci proviene dal grafico dei residui. Se la scomposizione è valida allora i residui devono presenare un andameno accidenale rispeo al empo. Dalla Fig. 3.3 si noa invece la presenza di una cera ciclicià degli sessi: i residui sono più vicini a zero nella pare cenrale della serie menre sono maggiori (in valore assoluo) alle esremià. L andameno dei residui può essere apprezzao anche dalla Fig. 3.4, in cui si ripora la serie osservaa e quella simaa, nell ipoesi di aver simao il rend mediane una funzione lineare di (su queso puno di vedrà più avani il procedimeno). Nel seguio, quando verrà illusrao in deaglio il procedimeno di scomposizione della serie, vedremo anche i risulai del modello moliplicaivo.
34 Cap. 3 Meodi di scomposizione Fig. 3.1 Dai desagionalizzai con modello addiivo (dai di Tab. 2.4) 9 8 Dai desagionalizzai 7 6 5 4 1 2 3 Fig. 3.2 Sagionalià simaa con modello addiivo (dai di Tab. 2.4) 6 5 4 Sagionalià 3 2 1-1 -2-3 1 2 3
Cap 3 Meodi di scomposizione 35 Fig. 3.3 Residui del modello addiivo (dai di Tab. 2.4) 1 Residui -1 1 2 3 4 5 6 7 8 9 111121314151617181922122232425262728293313233343536 Fig. 3.4 Dai simai e osservai (serie di Tab. 2.4; modello addiivo) 14 12 1 Acual Prediced Acual Prediced Y 8 6 4 2 1 2 3 4
36 Cap. 3 Meodi di scomposizione A conclusione di queso paragrafo, vogliamo punualizzare il significao di serie desagionalizzaa. Nel caso di un modello addiivo, il dao desagionalizzao D è derivao come: (3.1) D =y S =y +E menre nel modello addiivo: (3.2) D =y /S =y x E una vola che è saa simaa la componene sagionale S. 3.4 La media mobile La media mobile è un semplice meodo che smussa (liscia, perequa) la serie sorica. Tale procedura è basilare nei meodi di scomposizione. Se la serie è composa solo da rend e dalla componene residua, la media mobile elimina gli effei dei disurbi. Se nella serie originaria è presene anche il fenomeno sagionale di periodo p, allora una media mobile di ampiezza p è in grado di eliminare anche la sagionalià. Nei due casi, la media mobile si propone di isolare il rend-ciclo. Vediamo un esempio di serie che presena rend e sagionalià (Tab. 3.1). Si raa delle vendie mensili di shampoo (liri) vendui in re anni. Il ime plo della serie (Fig. 3.6) evidenzia la presenza di un marcao rend crescene e di disurbi di un cero rilievo; non si individuano ciclicià periodiche ipiche della sagionalià. La Fig. 3.6 ripora l evoluzione delle medie mobili a 3 ermini (MM3) e a 7 ermini (MM7); come si vede, la media mobile elimina una cera quoa di oscillazioni perurbarici. La media mobile a re ermini ci dà una sima del rend T 2 del mese di Febbraio 1999, mediane la media arimeica dei dai di Gennaio, Febbraio, Marzo 1999: T 2 =(y 1 +y 2 +y 3 )/3 Generalizzando, la media mobile a re ermini cenraa su è: (3.3) T =(y -1 +y +y +1 )/3, =2,,n-1 Si noino, nella Tab. 3.1, i valori della media mobile a re ermini: non c è sima del rend per i empi =1 e =n perché mancano le osservazioni al empo e al empo n+1. Come si sarà capio, quesa procedura è denominaa media mobile perché ogni successiva media viene calcolaa eliminando il valore più vecchio e inserendone un nuovo. La media mobile è un meodo di adaameno locale in quano crea una serie di valori smussai di lunghezza pari alla serie originaria, ognuno in corrispondenza del puno di osservazione.
Cap 3 Meodi di scomposizione 37 Tab. 3.1 Esempio di serie con rend e disurbi casuali Mese y MM3 MM5 MM7 1 266, 2 145,9 198,3 3 183,1 149,4 178,9 4 119,3 16,9 159,4 185, 5 18,3 156, 176,6 179,1 6 168,5 193,5 184,9 185,8 7 231,8 28,3 199,6 177,2 8 224,5 216,4 188,1 28,2 9 192,8 18,1 221,7 29, 1 122,9 217,4 212,5 212,7 11 336,5 215,1 26,5 2,9 12 185,9 238,9 197,8 198,9 1 194,3 176,6 215,3 21,4 2 149,5 184,6 22,6 22,1 3 21,1 211, 23,7 213,1 4 273,3 224,9 222,3 218,8 5 191,4 25,6 237,6 234,4 6 287, 234,8 256,3 254,5 7 226, 272,2 259,6 284,7 8 33,6 273,2 35,6 283,4 9 289,9 338,4 31,1 35, 1 421,6 325,3 324,4 312,5 11 264,5 342,8 331,6 343,1 12 342,3 315,5 361,7 344,9 1 339,7 374,1 34,6 366,2 2 44,4 365,3 375,5 363,3 3 315,9 398,5 387,3 388, 4 439,3 385,5 46,9 421,4 5 41,3 426, 433,9 431,1 6 437,4 471,4 452,2 465,6 7 575,5 473,5 5,8 488,3 8 47,6 555, 515,6 58,6 9 682, 521,6 544,3 543,7 1 475,3 579,5 558,6 11 581,3 567,8 12 646,9 Fone: Makridakis, Wheelwrigh, Hyndman (19XX)
38 Cap. 3 Meodi di scomposizione Il numero di ermini coinvoli nella media mobile influenza il risulao della perequazione. All aumenare dei ermini, la spezzaa che unisce i puni individuai dalle medie mobili si fa più smussaa. Nella Fig. 3.6 compare l andameno della media mobile a 7 ermini, che è calcolaa come: T =(y -3 +y -2 + y -1 +y +y +1 +y +2 +y +3 )/7, =4,,n-3 Fig. 3.5 Valori osservai e medie mobili (MM) per i dai di Tab. 3.1 8, 7, 6, 5, Osservai MM3 MM7 4, 3, 2, 1,, 5 1 15 2 25 3 35 4 Come si può facilmene verificare, una media mobile a k ermini, con k dispari, fa perdere (k 1)/2 ermini all inizio e alreani ermini alla fine della serie (Tab. 3.1). La perdia dei primi ermini ha poca imporanza; al conrario la perdia degli ermini più receni ha conseguenze rilevani ai fini della operazione di previsione. Una possibile soluzione consise nell effeuare, agli esremi, delle medie mobili con un numero inferiore di ermini. Ad esempio, nel caso di media mobile a re ermini si può calcolare T 1 come T 1 =(y 1 +y 2 )/2 e T n come T n =(y n-1 +y n )/2. Le medie mobili fin qui inrodoe hanno un numero dispari di ermini e perciò risulano auomaicamene cenrae su un puno di osservazione. Tali medie sono dee semplici poiché ui i ermini della media hanno associao lo sesso peso. Supponiamo che si voglia calcolare una media mobile con numero pari di ermini. Ad esempio, poso k=4, sui dai di Tab. 3.1 si ha: T =(y 1 +y 2 +y 3 +y 4 )/4= (266,+145,9+183,1+119,3)/4 T = (y 2 +y 3 +y 4 +y 5 )/4= (145,9+183,1+119,3+18,3)/4 La prima media sarebbe cenraa fra il secondo e il erzo ermine; la seconda media cenraa fra il erzo e il quaro. Per risolvere la quesione della
Cap 3 Meodi di scomposizione 39 cenraura, si effeua una media mobile a 2 ermini sulle due successive medie mobili a ermini pari. Con queso procedimeno la media arimeica delle due medie mobili a 4 ermini sopra calcolae, viene ad essere cenraa nel puno =3. Quindi: T 3 =(T +T )/2 Sosiuendo a T e T le espressioni precedeni, la formula di T 3 divena: (3.4) T 3 =(y 1 +2y 2 +2y 3 +2y 4 +y 5 )/8 che è una media ponderaa: i ermini cenrali hanno peso 2, i ermini esremi peso 1; il denominaore è, ovviamene, la somma dei pesi. Essa è dea media mobile cenraa a k ermini (k pari). Medie mobili con numero pari di ermini sono usae per eliminare l oscillazione sagionale. Su dai mensili si userà k=12; k=4 su dai rimesrali e k=2 su dai semesrali. Ovviamene, con k pari, si perdono k/2 ermini all inizio e alla fine della serie. 3.5 Scomposizione classica: il modello addiivo Riferendoci ai dai mensili sulle vendie di boiglie QQQ, supponiamo che il modello di scomposizione sia addiivo: y =S +T +E La scomposizione classica viene condoa svolgendo le fasi segueni. 1. Calcolo del rend-ciclo di prima approssimazione. Si raa di una fase srumenale che non produce una sima definiiva della componene rendciclo. Il rend-ciclo di prima approssimazione viene calcolao con una media mobile cenraa a 12 ermini. Indichiamo con MM il valore di dea media, dove =7,,n-6 a causa della perdia di dai all inizio e al ermine della serie. 2. Calcolo della componene (SE) : serie della sagionalià misa e errore. Anche quesa è una fase srumenale. La serie (SE) è calcolaa soraendo dalla serie originale, la grandezza MM : (SE) =y MM 3. Sima della componene sagionale. Dalla componene (SE) si elimina il disurbo e si perviene alla sima di S. Nell approccio classico si ipoizza che l oscillazione sagionale sia cosane da anno in anno, per cui, con dai
4 Cap. 3 Meodi di scomposizione mensili, S =S +12 =S +24 =. Si parla di modello di sagionalià cosane 1. Il coefficiene di sagionalià S m per il mese m (m=1,,12) viene calcolao effeuando la media arimeica dei ermini (SE) dove =m, m+12, m+24,. In alre parole la sima della sagionalià per gennaio è daa dalla media arimeica dei valori (SE) riferii a gennaio. Il risulao di quesa operazione produce 12 coefficieni di sagionalià Ŝ m, m=1,..,12 (dove m indica il mese), che si ripeono per ogni anno. I valori Ŝ m devono verificare la seguene proprieà: 12 m= 1 Ŝ m = Infai, per definizione di sagionalià nel modello addiivo, le oscillazioni sagionali esauriscono il loro effeo all inerno dell anno. 4. Derivazione della serie desagionalizzaa D. Il dao desagionalizzao D è calcolao nel modello addiivo come: D = y Ŝ e Ŝ = Ŝ m se si riferisce al mese m. La serie D coniene dunque il paern del ciclo-rend e l effeo del disurbo. Essa è perano uile per lo sudio del ciclo-rend. 5. Sima del ciclo-rend. La sima Tˆ del ciclo-rend è oenua mediane una media mobile a 3 ermini sui dai D. 6. Sima dell inera componene sisemaica della serie. Mediane le sime della sagionalià e del rend-ciclo si oiene la sima ŷ, che coniene solo il paern sisemaico della serie, dove: ŷ = Tˆ + Ŝ 7. Calcolo del residuo del modello. Il residuo del modello Ê è, infine: Ê = y ŷ La Tab. 3.2 ripora i risulai delle fasi sopra elencae, per la serie delle vendie di boiglie della bibia QQQ. 1 Si può condurre un analisi grafica per conrollare la validià dell ipoesi di sagionalià cosane. Si cosruisce, per ognuno dei 12 mesi, un plo di (SE) in ordinaa versus gli anni (in ascissa). Se i puni individuai si rovano collocai parallelamene all asse delle ascisse, allora il modello di sagionalià cosane è adeguao.
Cap 3 Meodi di scomposizione 41 Tab. 3.2 Risulai del modello addiivo (vendie bibia QQQ) ANNO MESE y Sima S Sima D Sima T Sima y Ê 1999 1 1 189-267, 456, 45,5 184 5,5 2 2 229-216, 445, 45,5 235-5,5 3 3 249-224,7 473,7 458,2 234 15,46 4 4 289-18,1 469,1 462,6 282 6,51 5 5 26-253,9 513,9 485,6 232 28,38 6 6 431 2,3 428,7 47,6 473-41,91 7 7 66 249, 411, 451,2 7-4,22 8 8 777 366,7 41,3 416,7 783-6,31 9 9 915 526, 389, 43,4 929-14,42 1 1 613 172,7 44,3 413,2 586 27,9 11 11 485 27,1 457,9 429,1 456 28,82 12 12 277-22,1 479,1 459,1 257 19,96 2 1 13 244-267, 511, 482,7 216 28,34 2 14 296-216, 512, 5,7 285 11,31 3 15 319-224,7 543,7 522,2 298 21,46 4 16 37-18,1 55,1 535,3 355 14,84 5 17 313-253,9 566,9 553,6 3 13,38 6 18 556 2,3 553,7 556,9 559-3,24 7 19 831 249, 582, 567,5 817 14,44 8 2 96 366,7 593,3 576,3 943 17,2 9 21 1152 526, 626, 6,4 1126 25,58 1 22 759 172,7 586,3 61,9 775-15,58 11 23 67 27,1 579,9 597,4 625-17,51 12 24 371-22,1 573,1 579,8 378-6,71 21 1 25 298-267, 565, 572,7 36-7,66 2 26 378-216, 594, 577,3 361 16,65 3 27 373-224,7 597,7 585,6 361 12,13 4 28 443-18,1 623,1 64,9 425 18,17 5 29 374-253,9 627,9 616,2 362 11,71 6 3 66 2,3 657,7 636,2 639 21,42 7 31 14 249, 755, 68,2 929 74,78 8 32 1153 366,7 786,3 733, 11 53,35 9 33 1388 526, 862, 81,1 1327 6,92 1 34 94 172,7 731,3 793,2 966-61,91 11 35 715 27,1 687,9 76,4 788-72,51 12 36 441-22,1 643,1 665,5 463-22,43
42 Cap. 3 Meodi di scomposizione Come si vede, si perdono 6 dai all inizio e 6 alla fine della serie. I dai sono recuperai araverso la sima della sagionalià mediane l ipoesi di modello sagionale cosane. Si può noare, infai, che la sequenza dei coefficieni di sagionalià si ripee nei re anni. Il segno e l enià del coefficiene di sagionalià esprime l imporanza e la direzione dell effeo: quando il segno del coefficiene è negaivo significa che la sagionalià provoca una conrazione (rispeo al livello che avrebbe il rend-ciclo senza l effeo dell oscillazione sagionale); il segno è posiivo, quando la sagionalià amplifica il fenomeno. Coefficieni di sagionalià posiivi ed elevai si presenano nei mesi più caldi. Il rend-ciclo è sao simao con una media a re ermini dei dai desagionalizzai, con eccezione dei due ermini esremi (v. valori in grasseo) per i quali è saa impiegaa una media a due ermini. In base al procedimeno descrio nella Tab. 3.2 si oiene un MAPE pari al 2,8%. Tuavia (v. Fig. 2.1, che si riferisce a queso sesso procedimeno, ma si veda anche la Fig. 3.6), il modello addiivo non realizza una soddisfacene desagionalizzazione dei dai. 3.6 Scomposizione classica: il modello moliplicaivo Uilizzando ancora i dai mensili sulle vendie di bibia QQQ, deriviamo la scomposizione mediane il modello moliplicaivo: y =S x T x E La scomposizione classica viene condoa svolgendo le fasi segueni. 1. Calcolo del rend-ciclo di prima approssimazione. Come accade per il modello moliplicaivo, esso viene calcolao con una media mobile cenraa a 12 ermini. Indichiamo con MM il valore di dea media, =7,,n-6 (sesso procedimeno del modello addiivo). 2. Calcolo della componene (SE) : serie della sagionalià misa e errore. La serie (SE), composa da sagionalià ed errore, è calcolaa dividendo la serie y per MM : (SE) =y /MM 3. Sima della componene sagionale. Dalla serie (SE) si elimina il disurbo e si perviene alla sima di S. Si ipoizza, anche qui, che l oscillazione sagionale sia cosane di anno in anno per cui, con dai mensili, S =S +12 =S +24 =. Il coefficiene di sagionalià S m per il mese m (m=1,,12) viene calcolao effeuando la media arimeica dei ermini (SE) dove =m, m+12, m+24,. Ancora, la sima della sagionalià per gennaio è daa dalla media arimeica dei valori (SE) riferii a gennaio. Il
Cap 3 Meodi di scomposizione 43 risulao sarà dao da 12 coefficieni di sagionalià che si ripeono per ogni anno. Si ricava quindi la sima m=1,,12 dove m indica il mese. I valori Ŝ m Ŝ m devono verificare la seguene proprieà: 1 12 12 m= 1 Ŝ m = 1 Infai, per definizione di sagionalià, le oscillazioni sagionali esauriscono il loro effeo all inerno dell anno. 4. Derivazione della serie desagionalizzaa D. Il dao desagionalizzao D si ricava come: D = y / Ŝ Quesa grandezza coniene il paern del ciclo-rend e l effeo del disurbo. Essa è uile per il successivo sudio del ciclo-rend. 5. Sima del ciclo-rend. La sima del ciclo-rend Tˆ è oenua mediane una media mobile a 3 ermini sui dai D. 6. Sima dell inera componene sisemaica della serie. Mediane le sime della sagionalià e del rend-ciclo, si ricava la sima ŷ che coniene solo il paern sisemaico della serie, dove: ŷ = Tˆ Ŝ 7. Calcolo del residuo del modello. Si ricava, infine, il residuo del modello Ê come: Ê = y / ŷ Tuavia, per consenire un confrono con l adaameno del modello addiivo, ai fini del calcolo degli indici MAPE, MAE, ecc., conviene uilizzare i residui calcolai nel modo consueo: Res = y ŷ I deagli della scomposizione mediane il modello moliplicaivo sono riporai in Tab. 3.3. Vale la pena noare che il modello moliplicaivo realizza un migliorameno del MAPE che è uguale a 1,8% e, soprauo, una più che soddisfacene desagionalizzazione dei dai. Ciò non ci sorprende in quano, già l analisi preliminare della serie aveva messo in luce la maggiore adeguaezza della forma moliplicaiva.
44 Cap. 3 Meodi di scomposizione Tab. 3.3 Risulai del modello moliplicaivo (vendie bibia QQQ) ANNO MESE y Sima Sm SimaD Sima T Sima y Res 1999 1 1 189,493 383 384 189 -,326 2 2 229,595 385 384 229,394 3 3 249,595 419 396 235 13,642 4 4 289,679 425 41 278 1,744 5 5 26,564 461 435 245 14,735 6 6 431,985 438 441 435-3,666 7 7 66 1,466 45 45 659,828 8 8 777 1,692 459 449 76 17,348 9 9 915 1,988 46 457 98 7,18 1 1 613 1,36 469 463 65 8,315 11 11 485 1,28 472 467 48 4,853 12 12 277,6 462 468 28-3,424 2 1 13 244,493 495 476 235 9,247 2 14 296,595 497 485 289 7,475 3 15 319,595 536 51 33 15,852 4 16 37,679 545 526 357 12,63 5 17 313,564 555 545 37 5,55 6 18 556,985 565 555 546 9,677 7 19 831 1,466 567 562 824 6,875 8 2 96 1,692 568 566 958 2,1 9 21 1152 1,988 579 571 1136 16,81 1 22 759 1,36 581 576 752 6,65 11 23 67 1,28 591 584 6 7,46 12 24 371,6 619 597 358 13,183 21 1 25 298,493 65 65 298 -,9 2 26 378,595 635 62 369 9,36 3 27 373,595 627 622 37 2,798 4 28 443,679 652 638 433 9,511 5 29 374,564 663 647 365 8,966 6 3 66,985 67 662 652 8,227 7 31 14 1,466 685 673 986 17,742 8 32 1153 1,692 682 679 1148 4,574 9 33 1388 1,988 698 688 1368 19,564 1 34 94 1,36 692 691 92 1,963 11 35 715 1,28 696 695 715,341 12 36 441,6 736 716 429 11,979
Cap 3 Meodi di scomposizione 45 Fig. 3.6 Dai desagionalizzai (vendie di bibia QQQ) 9, 8, Modello moliplicaivo Modello addiivo 7, D 6, 5, 4, 3, 3.6 Valuazione della scomposizione oenua Abbiamo già accennao (par. 2.4) che la valuazione dell adaameno oenuo mediane il modello di scomposizione può essere condoa mediane indici quali MSE, MAE, MAPE, riferii alla serie sorica disponibile. Olre al calcolo di ali indici, è buona norma condurre anche delle analisi grafiche dei residui Ê. L idea che sa alla base di quesi conrolli è la seguene: se la scomposizione è valida allora il residuo non dovrebbe evidenziare oscillazioni sisemaiche di nessun ipo e il suo line plo dovrebbe oscillare inorno al valore neurale ( per il residuo del modello addiivo, 1 per il residuo del modello moliplicaivo), in modo accidenale. Vediamo il caso del modello addiivo dove il residuo è: Ê = y ŷ I grafici che ci possono ineressare sono i segueni. 1. Andameno di Ê rispeo al empo. L ideale è che non si presenino oscillazioni sisemaiche, come avviene in Fig. 3.7. Siuazione dubbia è quella di Fig. 3.8 (la scomposizione oenua è più valida per periodi più remoi). La Fig. 3.9, infine, evidenzia che non siamo sai in grado di individuare un andameno ciclico (o comunque curvilineo) 2. Correlogramma di Ê. L ideale è quello di non avere valori elevai dell auocorrelazione uavia, difficilmene da un analisi di scomposizione, si oengono residui oimali.
46 Cap. 3 Meodi di scomposizione 3. Normal probabiliy plo di Ê. L idea che giusifica queso ipo di analisi è la seguene: se siamo sai in grado di scomporre bene la serie e abbiamo colo in modo adeguao la componene sisemaica, il residuo dovrebbe comporarsi approssimaivamene come un errore accidenale. Nel caso di modello moliplicaivo, resa in massima pare valido quano affermao nei puni 1 e 2. Non ha senso, invece, cosruire un normal probabiliy plo perché il residuo moliplicaivo Ê può assumere solo valori non negaivi menre una v.c. normale assume valori sia negaivi, sia posiivi. E più correo, se mai, cosruire il normal probabiliy plo delle rasformae logarimiche dei residui. La Fig. 3.1 ripora il line plo dei residui del modello addiivo, per i dai relaivi alle vendie della bibia QQQ. Si noa un risulao un po insoddisfacene per il periodo iniziale e finale; sappiamo che ciò è dovuo al fao che il modello addiivo ende a desagionalizzare male agli esremi della serie quando quesa è meglio rappresenaa da un modello moliplicaivo. Fig. 3.8 Esempio di residui privi di andameni sisemaici Residui 1 8 6 4 2-2 -4-6 -8-1 1 6 11 16 21 26 31 36
Cap 3 Meodi di scomposizione 47 Fig. 3.9 Esempio di residui con variabilià più ala per periodi receni 2 15 1 Residui 5-5 -1-15 -2 1 6 11 16 21 26 31 36 Fig. 3.1 Esempio di residui con andameno curvilineo 2 15 1 Residui 5-5 -1-15 -2 1 6 11 16 21 26 31 36
48 Cap. 3 Meodi di scomposizione 1, 8, 6, 4, 2, Fig. 3.11 Residui del modello addiivo di Tab. 3.2, -2, 1 4 7 1 13 16 19 22 25 28 31 34-4, -6, -8, 3.7 Alcune osservazioni uleriori sui meodi di scomposizione A conclusione di queso capiolo, vogliamo soffermarci a discuere alcune emaiche riguardani i meodi di scomposizione e precisamene: 1) l impiego della rasformazione logarimica per il modello moliplicaivo; 2) come eseguono la scomposizione procedure conenue nei pacchei saisici Saisica (www.sasof.com) e Miniab (www.miniab.com); 3) come si eseguono le previsioni una vola che si è condoa un analisi di scomposizione. Abbiamo già accennao al fao che si può passare da un modello moliplicaivo rispeo alla serie originarie y, (=1,,n) ad uno addiivo rispeo alla serie ln y. Quindi, volendo adoare per y il modello moliplicaivo, si porebbe decidere di eseguire la scomposizione con modello addiivo sui logarimi poiché si ha: ln y =ln(s x T x E ) ln y =lns + lnt + lne E bene precisare, uavia, che la scomposizione di y mediane modello moliplicaivo conduce a risulai diversi alla scomposizione di ln y mediane modello addiivo (come descrio nel paragrafo 3.4). Per capire quano appena affermao, vediamo nel deaglio l espressione della media mobile nei due approcci. Ad esempio, la media mobile a 2k+1 ermini (dispari) cenraa sul empo è, sui dai originari: + k + k 1 1 yi = Ti Si Ei 2k + 1 2k + 1 i= k Invece, se si usano dai rasformai: i= k
Cap 3 Meodi di scomposizione 49 + k + k 1 1 (3.5) ln yi = (lnti + ln Si + ln Ei ) 2k + 1 2k + 1 i= k i= k Ques ulima espressione equivale al logarimo della media geomerica dei valori originali: k 1 + + (lnti + ln Si + ln Ei ) = ln i Ti Si Ei + 1 i= k 1 /( 2k 1 ) (3.6) ( ) 2k Dal confrono fra (3.5) e (3.6) si capisce che i due approcci conducono, in generale, a risulai diversi. Vediamo, a queso puno, le procedure di scomposizione classica delle serie soriche, conenue nei pacchei saisici, Saisica e Miniab. Il paccheo Saisica, nella procedura Time Series>Decomposiion Census1, esegue i passi esaamene come da noi descrii. Nel paccheo Miniab, la procedura Time series>decomposiion, esegue le fasi dell analisi secondo un ordine diverso da quello da noi presenao. Come prima fase, Miniab sima il rend mediane inerpolazione di una rea rispeo al empo : Tˆ = a + b Successivamene deermina il dao derendizzao D che è: D = ( S + E ) = y Tˆ per il modello addiivo D = ( S E ) = y / Tˆ per il modello moliplicaivo Vengono poi calcolai i coefficieni di sagionalià come da noi descrio, ipoizzando il modello di sagionalià cosane. Si noa che la procedura Miniab non iene cono dell evenuale presenza del ciclo, in quano sima il solo rend con una rea (la rea non ha andameni oscillaori!). Si può, uavia, risolvere queso problema lavorando con Miniab in modo più flessibile e cioè ricorrendo a diverse procedure. In paricolare, la sequenza di fasi indicaa per condurre l analisi di scomposizione può essere realizzaa in Miniab nel seguene modo: i) mediane la procedura Time series>decomposiion adaare un modello senza rend e memorizzare i dai desagionalizzai; ii) mediane la procedura Time series>moving average procedere alla sima del ciclo-rend. Veniamo infine al ema della previsione. Ci sono sai moli enaivi di sviluppare previsioni basae direamene sul risulao di una analisi di scomposizione mediane medie mobili. Generalmene si procede alla
5 Cap. 3 Meodi di scomposizione previsione della singola componene (rend, ciclo, ecc.) per poi ricomporre il dao fuuro della serie (come prodoo dei valori delle singole componeni nel caso del modello moliplicaivo, come somma nel caso del modello addiivo). Non sempre queso procedimeno produce risulai soddisfaceni. In generale, il rend-ciclo è la componene più difficile da prevedere soprauo a causa dell oscillazione ciclica che non ha andameni regolari periodici. Il procedimeno può avere successo se il ciclo è assene oppure ha inensià rascurabile rispeo all ordine di grandezza del rend. In ale circosanza, il rend può essere validamene simao mediane una funzione analiica del empo f(). La previsione Tˆn+1 per il empo fuuro =n+1 (dove n è la lunghezza della serie disponibile) viene oenua esrapolando la rea, per cui Tˆn+1 =f(n+1). La componene sagionale è relaivamene semplice da prevedere nell ipoesi di sagionalià cosane. Infai, l effeo simao della sagionalià del mese (rimesre, semesre, ecc.) m (m=1,,12) è Ŝ m, che è cosane negli anni. Quindi, supponendo che il empo n+1 sia riferio al mese di gennaio, la previsione dell effeo sagionale è Ŝ 1. Per la componene irregolare viene adoao, come previsione, il valore neurale, che è pari a per il modello addiivo, a 1 per il modello moliplicaivo. La previsione F n+1 per il fenomeno in esame, si oiene ricomponendo le previsioni per le re componeni. Supponendo che il empo n+1 sia riferio al mese di gennaio, si oiene Fn + 1 = Tˆ n + 1 + Ŝ1 per il modello addiivo F Tˆ per il modello moliplicaivo n + 1 = n + 1 Ŝ1 Nel capiolo seguene affroneremo la sima del rend mediane adaameno di una forma analiica e deriveremo le previsioni per le vendie della bibia QQQ. Anche se per la previsione sono sai sviluppai numerosi meodi più sofisicai e più efficaci, i procedimeni di scomposizione resano un valido srumeno per comprendere le caraerisiche evoluive passae della serie. La scomposizione cosiuisce la fase preliminare per decidere sul meodo di previsione da adoare.
Cap. 4 Sudio del rend 51 4. Sudio del rend mediane forma analiica 4.1 Inroduzione L evoluzione di lungo periodo di una serie sorica è denominaa rend. Nell economia, ad esempio, il rend è deerminao dal leno sviluppo delle ecnologie, dei fenomeni demografici e sociali, ecc. L esisenza di una evoluzione di lungo periodo può essere evidenziaa dall andameno dei dai desagionalizzai risulani da un analisi di scomposizione, oppure dalla serie di dai annuali (anch essi privi della sagionalià). Nel capiolo precedene abbiamo illusrao la sima del rend mediane le medie mobili; ale procedimeno è denominao adaameno locale del rend o sima locale. In queso capiolo affroneremo la sima del rend mediane specificazione e sima di una funzione analiica del empo. Queso procedimeno è denominao analisi globale poiché la funzione simaa definisce come una sora di legge di dipendenza del rend dal empo. Varie forme funzionali sono uilizzae per rappresenare il rend. Quelle che vedremo in quese noe sono: la forma lineare, la quadraica e l esponenziale. 4.2 Forme analiiche per rappresenare il rend Ipoizziamo che y =T +e, dove y qui rappresena o il dao annuale o quello desagionalizzao e e la componene di disurbo. La forma lineare in è: (4.1) T =β +β 1 =1,,n dove β è l inercea e β 1 è la pendenza della rea. Se β 1 > il rend è crescene; se β 1 <, il rend è decrescene; se β 1 = esise un paern orizzonale. Un modo per capire se il rend lineare è appropriao per rappresenare la nosra serie, consise nel verificare se le differenze successive della serie (desagionalizzaa o annuale) sono approssimaivamene cosani rispeo a. Ciò scaurisce dal fao che, se vale la (4.1), si ha che: (4.2) Δ = T T 1 = β + β1 β β1( 1) = β1 cosane in.
52 Cap. 4 Sudio del rend Talvola il rend può esibire andameni non lineari rispeo al empo. Allora può essere appropriaa la forma quadraica: (4.3) T =β +β 1 +β 2 2 =1,,n La (4.2) può assumere una varieà di forme a seconda del segno dei coefficieni β 1 e β 2 ; da noare, ad esempio, che quando β 2 = si oiene una forma lineare in. Un modo per verificare l adeguaezza di un modello quadraico consise nell effeuare le seconde differenze fra ermini successivi della serie (cioè le differenze successive della serie Δ definia in (4.2)). Se i valori di ali differenze appaiono approssimaivamene cosani rispeo a, può essere valido un modello quadraico. Ciò scaurisce dal fao che, se vale la (4.3), allora Δ +1 -Δ è cosane in. Infai, se vale la (4.3), si ha: dove: Δ +1 -Δ =2 β 2 cosane in Δ = T T 1 β ) 2 1 = β + β1 + β 2 β β1( ) 1( 1 2 2 Δ + 1 = T + 1 T = β + β1( + 1) + β 2( + 1) β β1 β1 Un alra forma spesso usaa è quella esponenziale: (4.4) T =β exp(β 1 ) =1,,n Se vale la (4.4), si verifica la seguene espressione: T T β exp( β1 ) = β exp( β ( 1 1 1 = exp( β1 ) )) cosane in Un modo per verificare l adeguaezza di un modello esponenziale consise perano nell effeuare i rappori fra ermini successivi della serie e verificare se quesi sono approssimaivamene cosani rispeo a. 2 4.3 Sima del rend Una vola che è saa scela una forma analiica per rappresenare il rend, è necessario passare alla sua sima a parire da dai di osservazione. I dai sui quali viene simao il rend dovrebbero essere privi di andameno sagionale e ciclico. In alre parole, l unica componene sisemaica presene nei dai deve essere quella endenziale di lungo periodo. In assenza di significaive oscillazioni cicliche, i dai più idonei all analisi del rend sono: i valori desagionalizzai oppure la serie di dai annuali.
Cap. 4 Sudio del rend 53 A scopi di esemplificazione, viene condoa un analisi del rend sui dai relaivi alle vendie di bibia QQQ. In apricolare, dalla Fig. 3.6, si noa che i dai desagionalizzai mediane il modello moliplicaivo, possono essere rappresenai mediane una funzione lineare nel empo. Anziché procedere alla media mobile a 3 ermini, decidiamo quindi di adoare la sima di una funzione analiica, lineare in. Mediane il meodo dei minimi quadrai ordinari, la funzione analiica che rappresena il rend è in al caso: (4.5) Tˆ = 38, 3 + 9, 55 che regisra un indice di deerminazione lineare R 2 pari a,985. Nello sudio del rend mediane funzione analiica, viene usao il meodo dei minimi quadrai come in una consuea analisi di regressione. Tuavia non si procede alla verifica delle ipoesi sui coefficieni dal momeno che la sima del modello ha lo scopo di descrivere l andameno del rend rispeo al empo e non quello di valuare l effeo di sul rend, nel senso causale o esplicaivo. 4.4 Sima della componene sisemaica e previsione Mediane la sima della sagionalià oenua per il modello moliplicaivo (v. Tab. 3.3) e la sima del rend mediane la funzione (4.5), è possibile proporre una sima dell inera componene sisemaica del modello moliplicaivo che è (v. Tab. 4.1): yˆ = Tˆ Sˆ = ( 38, 3 + 9, 55 ) Sˆ A queso puno è possibile pervenire ad una deerminazione di E, componene casuale del modello, mediane la grandezza dove: y E ˆ = yˆ = y Tˆ Sˆ Tuavia, per proporre un confrono con alri meodi di scomposizione e con alri modelli, si usa frequenemene il residuo consueo: Res = y yˆ mediane il quale si può calcolare ad esempio il MAPE. In queso caso, il MAPE è pari a 1,93%, valore leggermene più alo di quello oenuo mediane l impiego della media mobile a 3 ermini per la sima del rend (v. paragrafo 3.6). Ê
54 Cap. 4 Sudio del rend Tab. 4.1 Risulai del modello moliplicaivo (vendie bibia QQQ). Trend simao mediane funzione lineare del empo ANNO MESE y Sima Sm SimaD Sima T Sima y Res 1999 1 1 189,493 383 39 192-3,13 2 2 229,595 385 399 238-8,64 3 3 249,595 419 49 243 5,77 4 4 289,679 425 418 284 4,79 5 5 26,564 461 428 241 18,79 6 6 431,985 438 437 431,34 7 7 66 1,466 45 447 649 1,57 8 8 777 1,692 459 456 772 5,9 9 9 915 1,988 46 466 926-11,29 1 1 613 1,36 469 475 621-7,89 11 11 485 1,28 472 485 498-13,4 12 12 277,6 462 494 296-19,4 2 1 13 244,493 495 54 248-4,34 2 14 296,595 497 513 36-9,53 3 15 319,595 536 523 311 7,91 4 16 37,679 545 532 362 8,3 5 17 313,564 555 542 36 7,48 6 18 556,985 565 551 543 13,2 7 19 831 1,466 567 561 815 15,8 8 2 96 1,692 568 57 965-4,84 9 21 1152 1,988 579 58 1153-1,9 1 22 759 1,36 581 589 77-1,87 11 23 67 1,28 591 599 616-8,65 12 24 371,6 619 68 365 6,21 21 1 25 298,493 65 618 35-6,56 2 26 378,595 635 627 373 4,59 3 27 373,595 627 637 379-5,95 4 28 443,679 652 646 439 3,8 5 29 374,564 663 656 37 4,17 6 3 66,985 67 665 655 4,7 7 31 14 1,466 685 675 981 23,2 8 32 1153 1,692 682 684 1158-4,78 9 33 1388 1,988 698 694 138 8,11 1 34 94 1,36 692 73 919-14,86 11 35 715 1,28 696 713 733-17,89 12 36 441,6 736 722 433 7,82 Queso ipo di scomposizione, che uilizza una forma analiica per rappresenare il rend, ci consene in modo esremamene semplice di proporre delle previsioni per i periodi fuuri. E necessario, però, ipoizzare che il modello simao sui dai passai rimanga valido anche nel fuuro. Per
Cap. 4 Sudio del rend 55 non rischiare roppo conviene limiarsi ad effeuare delle previsioni nel breve periodo. A iolo esemplificaivo, proponiamo qui le previsioni delle vendie di bibia QQQ, per i primi re mesi del 22: gennaio, febbraio e marzo ai quali corrisponde =37, 38, 39 e coefficieni di sagionalià pari a,493,,595,,595. Le previsioni che indichiamo come F 37, F 38, F 39 sono: F 37 =(38,3+9,55 x 37) x,493= 361 F 38 =(38,3+9,55 x 38) x,595= 441 F 39 =(38,3+9,55 x 39) x,595= 447 Come si vede le ipoesi di validià nel fuuro del modello riguardano: - la sabilià dei valori dei parameri della forma analiica usaa per rappresenare il rend; - la sabilià dei coefficieni sagionali per i re mesi fuuri, per i quali si cosruisce la previsione.