1. ANALISI DEI RESIDUI recupero dati----- X = scan("clipboard") accessori.auto = ts(x, frequency=12, start=c(1995,1)) plot(accessori.

Documenti analoghi
1. ANALISI DEI RESIDUI inizio recupero dati----- X = scan("clipboard") accessori.auto = ts(x, frequency=12, start=c(1995,1))

1. ALTRI ALGORITMI DI DECOMPOSIZIONE DI SERIE STORICHE. X = scan("clipboard") accessori.auto = ts(x, frequency=12, start=c(1995,1))

par(mfrow=c(1,2)) plot(holtwinters(trend2, gamma = FALSE)) plot(holtwinters(trend2))

()Probablità, Statistica e Processi Stocastici

()Probablità, Statistica e Processi Stocastici

Proprietà della varianza

Il Corso di Fisica per Scienze Biologiche

La distribuzione delle frequenze. T 10 (s)

Dal campione alla popolazione

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Esercitazione 8 maggio 2014

Statistical Process Control

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

Esercitazione del

Scheda n.3: densità gaussiana e Beta

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Soluzione di alcuni esercizi di statistica con R

Fit di una densità. 1. si usa il modello prescelto per fare previsioni

05. Errore campionario e numerosità campionaria

Statistica - metodologie per le scienze economiche e sociali S. Borra, A. Di Ciaccio - McGraw Hill

Analisi delle Serie Storiche con R

a) 36/100 b) 1/3 c)

Prova scritta Affidabilità dei sistemi stocastici e controllo statistico di qualità 28 Marzo 2013

> Ciliegi <- read.table("i:/modelli/cherry.dat", + col.names=c( diametro, altezza, volume ))

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA

Analisi degli Errori di Misura. 08/04/2009 G.Sirri

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Statistica Un Esempio

Schema lezione 5 Intervalli di confidenza

Distribuzione Normale

L indagine campionaria Lezione 3

Esame di Istituzioni di Matematiche II del 20 giugno 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola

Esercizi di Calcolo delle Probabilità

CAPITOLO 11 ANALISI DI REGRESSIONE

Microsoft Access. Obiettivo della lezione. Useremo Access per interrogare una base di dati (query)

Generazione di Numeri Casuali- Parte 2

Distribuzioni di probabilità e principi del metodo di Montecarlo. Montecarlo

0.1 Percorrenza e Cilindrata

La statistica. Elaborazione e rappresentazione dei dati Gli indicatori statistici. Prof. Giuseppe Carucci

lezione n. 6 (a cura di Gaia Montanucci) Verosimiglianza: L = = =. Parte dipendente da β 0 e β 1

Calcolare con il computer: Excel. Saro Alioto 1

ESERCIZI SVOLTI Giuliano Bonollo - Michele Bonollo

Teoria e tecniche dei test

SOLUZIONE. a) Calcoliamo il valore medio delle 10 misure effettuate (media campionaria):

CURRICOLO VERTICALE MATEMATICA RELAZIONI/ DATI E PREVISIONI/ MISURA

STATISTICA esercizi svolti su: INTERPOLAZIONE PONDERATA, REGRESSIONE E CORRELAZIONE

ISTOGRAMMI E DISTRIBUZIONI:

Note sull implementazione in virgola fissa di filtri numerici

Statistica Applicata all edilizia: il modello di regressione

obbligatorio - n. iscrizione sulla lista

Dispensa di Statistica

Vedi: Probabilità e cenni di statistica

Risultati esperienza sul lancio di dadi Ho ottenuto ad esempio:

Esercizi in preparazione all esame di. Laboratorio del corso di Principi di Informatica. Prof.sse M. Anselmo e R. Zizza. a.a.

Prova scritta di STATISTICA. CDL Biotecnologie. (Programma di Massimo Cristallo - A)

Calcolo della Concentrazione Rappresentativa della Sorgente (CRS)

Statistica II Laurea magistrale in Ing. Gestionale a.a. 2012/13 Registro delle lezioni

Esercitazione: La distribuzione NORMALE

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Variabile Casuale Normale

La codifica digitale

Anno 3 Equazione dell'ellisse

FREEFEM++ Marcello Bellomi. 18 Aprile Università di Verona FREEFEM++

Probablità, Statistica e Processi Stocastici

Università del Piemonte Orientale Corso di Laurea in Medicina e Chirurgia. Corso di Statistica Medica. Correlazione. Regressione Lineare

Esame di Istituzioni di Matematiche II del 11 luglio 2001 (Corso di Laurea in Biotecnologie, Universitá degli Studi di Padova). Cognome Nome Matricola

io e la mia calcolatrice

LABORATORIO DI PROBABILITA E STATISTICA

ESERCIZIO SVOLTO N 1 ESERCIZIO SVOLTO N 2. Determinare e rappresentare graficamente il dominio della funzione

Progetto lauree scientifiche Scheda 2 Studente:. Scuola e classe: Data:.. Programma DataStudio Sensore di moto PASPORT Interfaccia PASPORT-USB Link

Esame di Statistica del 7 luglio 2006 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova).

DESCRITTIVE, TEST T PER IL CONFRONTO DELLE MEDIE DI CAMPIONI INDIPENDENTI.

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

VALIDAZIONE DEL MODELLO

Distribuzione Gaussiana - Facciamo un riassunto -

Statistica. Matematica con Elementi di Statistica a.a. 2015/16

Capitolo 6. La distribuzione normale

1.4. Siano X B(1, 1/2) e Y B(1, 1/2) variabili aleatorie indipendenti. Quale delle seguenti affermazioni é falsa? E(X + Y ) = 1 V ar(x + Y ) = 1/2

secondi secondi= secondi secondi secondi= secondi

Capitolo 6 La distribuzione normale

Gli errori nella verifica delle ipotesi

Distribuzioni campionarie

SCHEDA N 8 DEL LABORATORIO DI FISICA

Esercitazione # 6. a) Fissato il livello di significatività al 5% si tragga una conclusione circa l opportunità di avviare la campagna comparativa.

R - seconda lezione. 1 Simulazione e rappresentazioni grafiche in R

ISTITUTO OMNICOMPRENSIVO ALTO ORVIETANO FABRO PROGRAMMAZIONE ANNUALE MATEMATICA CLASSE II SECONDARIA I GRADO

DISTRIBUZIONI DISTRIBUZIONE DI GAUSS

Serie storiche Mario Guarracino Laboratorio di Sistemi Informativi Aziendali a.a. 2006/2007

Uso elementare di R in Statistica G. Marchetti

13 Le funzioni di ricerca e riferimento

Analisi delle Serie Storiche con R

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Esame di Statistica del 14 dicembre 2007 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola

Note sulla probabilità

Misure Meccaniche e Termiche. punti massa. Valore atteso: Varianza:

1 Alcuni risultati sulle variabili Gaussiane multivariate

LEZIONI IN LABORATORIO Corso di MARKETING L. Baldi Università degli Studi di Milano. Strumenti statistici in Excell

Distribuzione Gaussiana

Analisi dei dati con Excel

1 4 Esempio 2. Si determini la distribuzione di probabilità della variabile casuale X = punteggio ottenuto lanciando un dado. Si ha immediatamente:

Transcript:

1. ANALISI DEI RESIDUI ----- recupero dati----- X = scan("clipboard") 11849 1316 4712 800 5097 3270 5390 2135 5962 5795 9271 6864 4247 7961 7191 4970 5012 2929 7363 4907 4700 8219 8674 8263 4294 6097 9115 8924 12561 8626 9559 1706 7405 8057 6463 7595 6702 11052 8422 10019 9594 6443 12052 3535 7962 12876 10614 6469 9396 8421 10895 16583 13724 15362 10740 6999 8168 11241 12206 9600 13865 11190 11306 9760 16678 17245 17059 6331 17635 25429 24124 8025 16168 23902 15618 24579 23023 16311 18848 8986 19745 21513 17378 17839 20271 13917 22520 30279 33373 27728 29400 12759 32293 39832 21975 13304 21511 24382 27790 19053 30140 18024 39378 9351 29202 30944 30984 51181 25809 23035 33939 26385 37051 27823 26570 27587 23434 40944 30355 37954 21883 28773 37127 41490 40786 48097 42233 31002 44818 52006 44235 47597 41311 29891 65657 46764 56831 45358 42840 22724 54484 60902 59253 30692 54913 49463 61164 53140 53932 61780 76395 25181 52878 59362 36356 22600 69768 62622 48934 43957 46525 47652 68435 23165 65990 60518 38106 21206 accessori.auto = ts(x, frequency=12, start=c(1995,1)) plot(accessori.auto) Y = scan("clipboard") 70.6 121.8 165.1 159.9 210.3 188.8 191.1 41.9 141.7 96.4 67.7 41.1 90.7 113.7 137.1 113.0 117.7 122.6 112.0 19.6 85.7 74.0 71.3 48.3 64.7 101.1 117.9 113.0 139.8 123.8 128.7 27.1 89.9 85.7 72.6 48.0 71.1 94.9 112.1 119.2 123.5 117.0 129.0 23.8 111.9 96.8 82.1 58.2 85.8 110.2 142.2 133.2 142.8 140.9 131.2 28.7 101.5 82.1 69.7 56.1 76.7 86.3 115.8 132.1 147.3 139.9 131.2 41.0 105.5 86.6 86.3 51.3 80.3 120.5 172.4 133.0 169.1 168.3 146.8 38.0 105.1 97.6 88.1 63.7 96.9 120.6 154.7 137.3 166.5 158.9 150.1 35.9 119.0 103.6 89.6 60.6 92.1 118.1 140.5 157.8 157.6 153.3 151.3 17.2 106.7 94.1 70.9 57.9 61.6 83.1 113.0 109.2 121.5 122.4 123.2 18.3 103.1 68.2 57.1 33.1 59.3 100.1 115.2 116.0 126.0 109.2 105.1 10.0 75.0 vendite.moto = ts(y, frequency=12, start=c(2000,1))

plot(vendite.moto) HW.auto = HoltWinters(accessori.auto) plot(hw.auto,predict(hw.auto,12)) HW.moto = HoltWinters(vendite.moto) plot(hw.moto,predict(hw.moto,12)) -----inizio estrazione residui----- I residui si estraggono con RES.auto=residuals(HW.auto) RES.moto=residuals(HW.moto) A titolo di confronto, calcoliamo i residui coi seguenti comandi. E utile anche per rendersi conto della finestra dei residui. Esercizio 1. Osservare il risultato del comando HW.auto$fitted. Che anni riguarda, rispetto a accessori.auto? Esercizio 2. Calcolare i residui, differenza tra i valori veri e quelli stimati dal modello; disegnarne il grafico. stimati = HW.auto$fitted[,1] > length(x) [1] 168 residui = X[13: 168]- stimati ts.plot(residui) Confrontare i valori numerici prodotti da residuals(hw.auto) con quelli che si leggono in residui. -----fine estrazione residui-----

-----riepilogo prime analisi residui----- Abbiamo già visto delle prime analisi dei residui. Rieseguiamole qui. Esercizio 3. Visualizzare acf dei residui, osservando se somiglia a quella di un white noise. Visualizzare l istogramma dei residui e della serie storica. Calcolare la varianza spiegata. Visualizzare il qqplot. residui =. par(mfrow=c(1,2)) acf(residui); acf(rnorm(156)) hist(residui,20); hist(x,20) 1-var(residui)/var(X[13: 168]) qqnorm(residui); qqnorm(rnorm(156)) (Ricordiamo inoltre l uso del comando qqnorm() serve a valutare graficamente la gaussianità: essa è tanto più stretta quanto rettilineo è il grafico di qqnorm) -----fine riepilogo prime analisi residui----- -----stima dell incertezza tramite i residui----- I residui possono servire per stimare l incertezza delle previsioni future. Esercizio. 4. Dare un intervallo di confidenza al 90% non parametrico, sulle predizioni future. Prima farlo numericamente sul primo valore futuro. Poi graficamente sui primi 12 valori futuri.

Soluzione. I quantili non parametrici offerti dal software R si ottengono col comando quantile. Ad esempio: residui = quantile(residui,0.05); quantile(residui,0.95) Li si confronti graficamente con l istogramma. Questo però è un intervallo centrato nell origine, non nella predizione futura. Ad esempio, per la predizione del primo mese successivo: predict(hw.auto,1)+ quantile(residui,0.05); predict(hw.auto,1)+quantile(residui,0.95) Si confronti con par(mfrow=c(1,1)) plot(hw.auto,predict(hw.auto,12)) lines(predict(hw.auto,12)+ quantile(residui,0.05),col= " green ") lines(predict(hw.auto,12)+ quantile(residui,0.95), col= " green ") plot(predict(hw.auto,12)) lines(predict(hw.auto,12)+ quantile(residui,0.05),col= " green ") lines(predict(hw.auto,12)+ quantile(residui,0.95), col= " green ") Esercizio. 5. Calcolare la deviazione standard dei residui ed utilizzarla per dare un intervallo di confidenza parametrico, al 90%, sulle predizioni future. Confrontare col metodo non parametrico, anche disegnando in verde le bande non parametriche ed in rosso quelle parametriche. sd(residui)

ampiezza intervallo al 90%: qnorm(0.95)*sd(residui) oppure qnorm(0.95,0,sd(residui)) Intervallo: predict(hw.auto,1)- qnorm(0.95)*sd(residui) predict(hw.auto,1)+ qnorm(0.95)*sd(residui) plot(predict(hw.auto,12)) lines(predict(hw.auto,12)+ quantile(residui,0.05),col= "green") lines(predict(hw.auto,12)+ quantile(residui,0.95), col= "green") lines(predict(hw.auto,12) - qnorm(0.95)*sd(residui), col= "red") lines(predict(hw.auto,12)+ qnorm(0.95)*sd(residui), col= "red") Eventualmente, invece che imporre d ufficio che la media è nulla (cosa che produce un intervallo simmetrico attorno al valore previsto), si possono usare i valori qnorm(0.05, mean(residui),sd(residui)) qnorm(0.95, mean(residui),sd(residui)) 2. ESERCIZIO: ANALISI MANUALI Si consideri la serie delle moto. A. Creare Una figura in cui compaiono sovrapposti i diversi anni. Vedere sotto alcuni comandi che lo fanno relativamente ai primi tre anni.

B. Raffigurare il profilo medio annuale. C. Aggiungere, sopra e sotto il profilo annuale, due bande di confidenza, ottenute calcolando la sigma (o 2*sigma ecc.) dei dati di quel mese: in corrispondenza di marzo, comparirà il valore medio dei valori di marzo più e meno la sigma di marzo. Moto1 = Y[1:12] Moto2 = Y[(1+12):(12+12)] Moto3 = Y[(1+12*2):(12+12*2)] plot(c(1,12),c(0,250),type n ) lines(moto1, col=1) lines(moto2, col=2) lines(moto3, col=3) ecc. 3. ESERCIZI DUL TREND Confonde le variazioni periodiche con cambi di trend. Esercizio: trovare a mano parametri con cui viene catturato meglio il trend, per entrambe le serie storiche (provare con parametri conservativi). Esercizio: usare il comando HoltWinters(X,, gamma=false, b.start=0) per inizializzare diversamente, mitigando alcuni difetti visivi. 4. ESERCIZI VARI Esercizio 1. Provare a cambiare frequency, prima di applicare stl. Esercizio 2. Estrarre il trend da decompose (o da stl) ed applicare SET ad esso. Esercizio 3. Sovrapporre la densità gaussiana all istogramma dei residui.

Esercizio 4. Nel caso della serie accessori, estrarre i residui e calcolare la varianza spiegata di SE ed SET, per capire quale è migliore. Esercizio 5: Creare (con R) una serie con forte trend ed applicare SE. Esercizio 6: Creare (con R) una serie con forte stagionalità ed applicare SE. Osservare le differenze a seconda della lunghezza del periodo. 5. METODI REGRESSIVI: a) RESIDUI; b) FATTORI ESOGENI ----- Richiamo ----- L=length(Y) > L [1] 129 y=y[13:l]; x1=y[12:(l-1)]; x12=y[1:(l-12)] fit = lm(y~x1+x12) P=1:(L+12); P[1:L]=Y for (i in 1:12) {P[L+i]=coef(fit)%*%c(1, P[L+i-1], P[L+i-12])} Pplus = ts(p, frequency =12, start=c(2000,1)) plot(pplus)

----- fine richiamo ----- Nel caso di questa metodologia, non abbiamo in automatico i valori della previsione del metodo in corrispondenza della parte nota della serie (passato e presente). Ma ovviamente possiamo applicare il modello regressivo ai dati passati. Come si faceva per la regressione, con RES = residuals(fit) Si ottegono i residui sul passato. Questi poi possono essere utilizzati in modo del tutto analogo ai precedenti. Esercizio. Applicare le analisi viste sopra ai residui del metodo regressivo. Supponiamo di avere due serie storiche, X ed Z e supponiamo di voler utilizzare Z come fattore esogeno per X, cioè per rafforzare la previsione auto regressiva di X. Per semplificare le formule (solo per questo) usiamo un modello auto regressivo molto semplice. L=length(X) y=x[13:l]; x12=x[(13-12):(l-12)] Ora decidiamo un ritardo da dare a Z: k= zk = Z[(13-k):(L-k)]

Ora eseguiamo la regressione: fit = lm(y~x12+zk) Veniamo alla previsione: P=1:(L+12); P[1:L]=X Possiamo eseguire la previsione solo fino al tempo minimo tra k e 12 (supponiamo sia k) for (i in 1:k) {P[L+i]=coef(fit)%*%c(1, P[L+i-12], Z[L+i-k])} Infatti per tempi superiori non avremmo il dato Z[L+i-k]. Se vogliamo andare a tempi superiori, bisogna prima allungare la serie storica Z, tramite una previsione. Come scegliere k? ccf(z,x) Si veda la chiave di lettura sulle dispense a pagina 121. Esempio. x=1:100+rnorm(100); z=1:100; plot(ccf(z,x)) x=y[6:129]; z=y[1:123]; plot(ccf(x,z))

6. PROGETTINO, FASE FINALE Note: alcuni hanno consegnato dei progettino molto lunghi. Non verranno premiati. Le richieste sono sempre molto precise e delimitate e le divagazioni non contribuiscono alla chiarezza. I tre aspetti importanti appresi sulle serie storiche sono i punti i, ii, iii seguenti, a cui aggiungiamo due punti più specifici o avanzati. i) Identificazione di un trend più ragionevole possibile e suo prolungamento nel futuro, con discussione del perché si è fatta quella scelta ii) Previsione, la più ragionevole possibile, di un tratto futuro, con discussione del perché si è fatta quella scelta; eventuale utilizzo dei residui per giudicare la predizione scelta (nuovo) iii) Determinazione dell incertezza della previsione iv) Eventuali modelli più elaborati, come ad esempio quelli con fattori esogeni. v) Cercare di capire e quantificare se intorno al 2008 le serie storiche considerate hanno mostrato una flessione. Completare il progettino iniziato tramite lo svolgimento di tutte o alcune delle aggiunte segnate in italico.