Serie storiche Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Documenti analoghi
Il Modello di Scomposizione

ESAME. 9 Gennaio 2017 COMPITO B

REGRESSIONE E CORRELAZIONE

Maria Prandini Dipartimento di Elettronica e Informazione Politecnico di Milano

Sperimentazioni di Fisica I mod. A Statistica - Lezione 2

Metodi di previsione

Statistica Metodologica

ANALISI DELLA DOMANDA E PROCESSO PREVISIONALE

Esplorazione dei dati

PAROLE CHIAVE Accuratezza, Accuracy, Esattezza, PRECISIONE, Precision, Ripetibilità, Affidabilità, Reliability, Scarto quadratico medio (sqm), Errore

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

()Probablità, Statistica e Processi Stocastici

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

()Probablità, Statistica e Processi Stocastici

Esercitazioni di Statistica Metodologica

Dispensa di Statistica

Indice. Previsioni. Serie con trend. Metodo di Holt. Previsioni: trend e stagionalità. serie con trend/tendenza serie con stagionalità

Fasi di uno Studio di Fattibilità. Corso di Progettazione degli Impianti Prof. Sergio Cavalieri

Stima della portata di piena: un esempio

STATISTICA A K (60 ore)

MATEMATICA FINANZIARIA RISCHI: RAPPRESENTAZIONE E GESTIONE (CENNI)

STATISTICA A-K (2014) Soluzione esercizi da svolgere prima settimana

Previsione della Domanda-Minimi Quadrati INTRODUZIONE PREVISIONE DELLA DOMANDA. Prof. Vincenzo Duraccio

Statistica Esercitazione. alessandro polli facoltà di scienze politiche, sociologia, comunicazione

Statistica di base per l analisi socio-economica

Note sulla probabilità

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

Generazione di numeri random. Distribuzioni uniformi

Teoria e tecniche dei test. Concetti di base

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

Generazione di Numeri Casuali- Parte 2

Indici di variabilità ed eterogeneità

LA DISTRIBUZIONE NORMALE o DI GAUSS

L analisi dei dati. Primi elementi. EEE- Cosmic Box proff.: M.Cottino, P.Porta

Il modello di regressione (VEDI CAP 12 VOLUME IEZZI, 2009)

Modelli e Metodi per la Simulazione (MMS)

Analisi degli Errori di Misura. 08/04/2009 G.Sirri

Il Corso di Fisica per Scienze Biologiche

STATISTICA SERALE (NOF) Appello del 12/07/12 Effettuare i calcoli arrotondando alla seconda cifra decimale A PARTE PRIMA

STATISTICA 1 ESERCITAZIONE 6

Corso di Laurea: Diritto per le Imprese e le istituzioni a.a Statistica. Statistica Descrittiva 3. Esercizi: 5, 6. Docente: Alessandra Durio

VALUTAZIONE DELLE POLITICHE PUBBLICHE

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Indicatori di Posizione e di Variabilità. Corso di Laurea Specialistica in SCIENZE DELLE PROFESSIONI SANITARIE DELLA RIABILITAZIONE Statistica Medica

STATISTICA AZIENDALE Modulo Controllo di Qualità

Esercitazione del

Sistemi di regolazione, monitoraggio e controllo degli impianti di climatizzazione in edifici complessi e/o distretti energetici

Sintesi numerica di distribuzioni statistiche

STATISTICHE DESCRITTIVE Parte II

Casa dello Studente. Casa dello Studente

Capitolo 6. La distribuzione normale

Capitolo 6 La distribuzione normale

Regressione lineare semplice

Presentazione dell edizione italiana

Modelli e metodologie per l analisi strategica - CDLM DA

Statistica multivariata Donata Rodi 17/10/2016

L analisi della Varianza (ANOVA): i disegni fattoriali tra i soggetti

STATISTICA ECONOMICA STATISTICA PER L ECONOMIA

Modelli matematici e Data Mining

Ringraziamenti dell Editore

CORSO DI STATISTICA (parte 1) - ESERCITAZIONE 4

La congiuntura del commercio al dettaglio in provincia di Treviso nel quarto trimestre 2013

STATISTICA (I modulo - Statistica Descrittiva) Esercitazione I 24/02/2006

COMUNE DI CONSIGLIO DI RUMO

Esercitazione 8 del corso di Statistica 2

Elementi di Statistica

La media e la mediana sono indicatori di centralità, che indicano un centro dei dati.

CURVE DI DURATA: Introduzione e Rappresentazione analitica

LE DISTRIBUZIONI CAMPIONARIE

L AFFIDABILITA NELLA FASE DI PRODUZIONE

Statistica Applicata all edilizia: il modello di regressione

TOPOGRAFIA 2013/2014. Prof. Francesco-Gaspare Caputo

Esercitazioni di statistica

Lezione Le incertezze nel calcolo strutturale

Università degli Studi Roma Tre Anno Accademico 2016/2017 ST410 Statistica 1

P ( X n X > ɛ) = 0. ovvero (se come distanza consideriamo quella euclidea)

Calcolo della Concentrazione Rappresentativa della Sorgente (CRS)

STATISTICA (modulo I - Statistica Descrittiva) Soluzione Esercitazione I

Università degli studi della Tuscia. Principi di Statistica dr. Luca Secondi A.A. 2014/2015. Esercitazione di riepilogo Variabili casuali

Esempi di confronti grafici

POLITECNICO DI TORINO

Principi di analisi causale Lezione 3

Prof. Anna Paola Ercolani (Università di Roma) Lez Indicatori di dispersione

STATISTICHE DESCRITTIVE

Σ (x i - x) 2 = Σ x i 2 - (Σ x i ) 2 / n Σ (y i - y) 2 = Σ y i 2 - (Σ y i ) 2 / n. 13. Regressione lineare parametrica

Esercizi di statistica descrittiva. Giulia Simi (Università di Siena) Istituzione di matematica e fondamenti di Biostatistica Siena / 30

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"

Statistica. Alfonso Iodice D Enza

Test per l omogeneità delle varianze

TRACCIA DI STUDIO. Indici di dispersione assoluta per misure quantitative

Analisi della varianza

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

L ELABORAZIONE DEL BUDGET DELLE VENDITE: MOMENTO FONDAMENTALE NEL PROCESSO DI ELABORAZIONE DEL BUDGET

Corso C Geomatica. Teoria degli errori. Massimiliano Cannata

Statistica multivariata 27/09/2016. D.Rodi, 2016

La sintesi delle distribuzioni

Problema tipico delle applicazioni idrologiche: qual'è la portata con tempo di ritorno T?

Metodi statistici per l economia (Prof. Capitanio) Slide n. 10. Materiale di supporto per le lezioni. Non sostituisce il libro di testo

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

Gli errori nella verifica delle ipotesi

Transcript:

Serie storiche

Introduzione Per alcuni dataset, l attributo target è soggetto ad un evoluzione temporale e risulta associato ad istanti di tempo successivi. I modelli di analisi delle serie storiche si propongono di identificare eventuali regolarità, con l obiettivo di ricavare predizioni per il futuro. Vedremo alcuni esempi, i principali indicatori di valutazione, i metodi di scomposizione e quelli predittivi.

Definizione di serie storica Una serie storica è una sequenza di valori {y t } assunti da una grandezza misurabile in corrispondenza di specifici istanti temporali t. Istanti di tempo t discreti: serie a tempo discreto. Altrimenti, serie a tempo continuo. Analizzeremo serie a tempo discreto e supporremo gli istanti t distribuiti uniformemente.

Consumo elettrico bimestrale 110 105 100 95 consumo 90 85 80 75 70 65 1998 1999 2000 2001 2002 2003 2004 tempo (bimestri)

Modello di serie storica Supponiamo che ciascuna osservazione y t rappresenti la realizzazione di una variabile casuale Y t. Un modello della serie storica {y t } consiste nella definizione della distribuzione di probabilità congiunta della sequenza di variabili casuali {Y t }. I modelli predittivi analizzano le serie per evidenziare le regolarità che si sono verificate nel passato, per effettuare previsioni. Detta f t una predizione del valore casuale Y t, cerchiamo F: f t+1 = F(y t, y t-1,, y t-k+1 ) idonea a rappresentare la serie storica.

Valutazione dei modelli Nella fase di identificazione e sviluppo di un modello, la misura dell accuratezza permette di confrontare modelli diversi. Dopo averlo sviluppato e utilizzato, occorre svolgere periodicamente il monitoraggio dell accuratezza, per evidenziare eventuali anomalie o inadeguatezze. Errore di predizione: Errore di predizione percentuale:

Misure di distorsione Errore medio Errore percentuale medio Tra due modelli si ritiene migliore quello con errore medio più prossimo a zero.

Misure di dispersione Scarto medio assoluto (MAD) Scarto percentuale medio assoluto (MAPE) Scarto quadratico medio (MSE) -4-3 -2-1 0 1 2 3 4

Segnale di tracking Indicatore utile in fase di monitoraggio del modello TS k 0 Previsioni in linea con quelle osservate TS k -1 Previsioni inferiori a quelle osservate TS k 1 Previsioni superiori a quelle osservate Il segnale di tracking viene confrontato con una soglia e se la condizione è violata, viene segnalata un anomalia.

Analisi delle componenti Y t = g(m t, Q t, ε t ) Tendenza. Andamento medio della serie nel tempo (M t ). Si cerca di approssimare M t con funzioni semplici. Stagionalità. Fluttuazioni di periodicità regolare (Q t ). Oscillazioni Q t legate ai cicli naturali. Fluttuazione casuale. Variazioni ε t non spiegate dalle altre componenti. In genere si richiede un rumore bianco (µ 0 e σ costante). Si possono considerare anche altre componenti, come ad esempio la ciclicità economica. Periodo di lunga durata.

Media mobile La media mobile m t (h) è calcolata come media aritmetica di h osservazioni consecutive di una serie {y t }. Media mobile centrata (h dispari) Media mobile centrata (h pari) Media delle medie mobili centrate in (t-1/2) e (t+1/2) su h/2 osservazioni Può essere impiegata per effettuare previsioni.

Media mobile per consumo energia 110 105 100 95 consumo 90 85 80 75 70 65 1998 1999 2000 2001 2002 2003 2004 tempo (bimestri)

Scomposizione di una serie Attività di analisi e comprensione del fenomeno. Si postula la forma della funzione g che indica la dipendenza della serie dalle sue componenti. Modello additivo Y t = M t + Q t + ε t, Modello moltiplicativo Y t = M t Q t ε t, Altri modelli possibili Es. Modello di Winters

1. Rimozione della tendenza Si calcola la media mobile centrata con h uguale alla stagionalità L del fenomeno, da cui la relazione: M t m t (h) In un modello moltiplicativo, si identifica la componente congiunta di stagionalità e fluttuazione casuale mediante il calcolo di {B t }: In alternativa, si può rimuovere la tendenza: Differenziando D t = Y t Y t-1, t 2. Attraverso un modello di regressione della M t.

1. Rimozione della tendenza 1.06 1.04 1.02 detrend - consumo 1 0.98 0.96 0.94 0.92 1998 1999 2000 2001 2002 2003 2004 tem po (bim estri) Rimozione moltiplicativa della tendenza della serie storica del consumo di energia elettrica

2. Identificazione della stagionalità In primo luogo bisogna valutare se la serie presenta una regolarità periodica. L esame visivo del grafico costituisce il punto di partenza. Il valore L della stagionalità è spesso suggerito dal fenomeno. Per osservazioni mensili L = 12, dati giornalieri, L = 7,

2. Identificazione della stagionalità Si calcolano gli indici di stagionalità Q l, l=1,,l, ottenuti come media dei Q t ε t per i periodi omologhi ad l. Se la stagionalità è in mesi, i periodi omologhi al mese di gennaio, sono tutti i gennaio compresi nell orizzonte temporale. Posto: con z l insieme degli indici dei periodi omologhi a l. La destagionalizzazione si calcola mediante y t /Q l(t) l(t) indica il tipo di periodo corrispondente a t.

2. Identificazione della stagionalità 1.04 1.03 indici di stagionalità - consumo 1.02 1.01 1 0.99 0.98 0.97 0.96 0.95 1998 1999 2000 2001 2002 2003 2004 tem po (bim estri) Indici di stagionalità per la serie storica del consumo di energia elettrica

Rimozione della stagionalità 105 100 destagionalizzazione - y/q 95 90 85 80 75 70 1998 1999 2000 2001 2002 2003 2004 tem po (bim estri) Destagionalizzazione e regressione per la serie storica del consumo di energia elettrica

Modelli di predizione I modelli di smoothing esponenziale sono tra i modelli predittivi per l analisi di serie storiche più versatili ed accurati. Si sono dimostrati particolarmente adatti per la previsione di fenomeni di natura economica. Originariamente formulati su base empirica, hanno trovato adeguate giustificazioni teoriche.

Modello di Brown Modello di smoothing esponenziale semplice: s t = α y t-1 + (1-α) s t-1 s 1 =y 1, α [0, 1] Si dimostra che: Il valore del parametro α è indice dell inerzia del modello.

Modello di Holt Il modello di Brown non è in grado di cogliere la tendenza presente tra le componenti della serie. La relazione ricorsiva viene quindi modificata con: s t = α y t + (1-α)(s t-1 + m t-1 ) Un analoga relazione ricorsiva governa l aggiornamento della tendenza smorzata: m t = β (s t -s t-1 ) + (1 - β) m t-1 La predizione per l istante t +1 è: f t+1 =s t + m t

Modello di Winters Se nella serie è presente anche la stagionalità è necessario estendere i modelli precedenti. Se ogni ciclo è costituito da L periodi, si modificano gli aggiornamenti di m t e s t introducendo un aggiornamento della stagionalità: La previsione diventa quindi: f t+1 =(s t + m t )q t-l+1.

Esercizi Generare un dataset sintentico per il consumo di bottiglie di vino Ponter negli anni 2000 2006 che abbia le seguenti caratteristiche moltiplicative: Nel primo Trimestre ne sono state consumate 10K unità Trend di crescita lineare del 10% all anno Stagionalità trimestrale tra [ 0.96, 1.03] con un aumento del 7% tra il primo e secondo mese e diminuzione del 4% tra secondo e terzo. Errore bianco con ampiezza in [0.96, 1.04] Separare le componenti e valutare il modello determinato. Predirre il consumo di Ponter nel primo e secondo trimestre 2007.

Sommario Abbiamo visto come alcuni fenomeni vengano descritti da serie storiche Abbiamo introdotto gli indici di valutazione Abbiamo scomposto le serie storiche in componenti Abbiamo derivato modelli di previsione Modello di Brown Modello di Holt Modello di Winters

Nella prossima lezione Classificazione Valutazione Alberi di classificazione Metodi bayesiani Regressione logistica Reti neurali Support vector machines