Caratterizzazione dei consumi energetici (parte 3)

Documenti analoghi
Confronto tra due popolazioni Lezione 6

IL CONFRONTO TRA LE VARIANZE DI DUE POPOLAZIONI

Analisi della varianza

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

Esercitazione 8 maggio 2014

Esercitazione 8 del corso di Statistica 2

Contenuti: Capitolo 14 del libro di testo

La verifica delle ipotesi

CHEMIOMETRIA. CONFRONTO CON VALORE ATTESO (test d ipotesi) CONFRONTO DI VALORI MISURATI (test d ipotesi) CONFRONTO DI RIPRODUCIBILITA (test d ipotesi)

Test di ipotesi su due campioni

05. Errore campionario e numerosità campionaria

Test d Ipotesi Introduzione

STATISTICA AZIENDALE Modulo Controllo di Qualità

STATISTICA ESERCITAZIONE 13

Statistica Inferenziale

Test per una media - varianza nota

Corso di Psicometria Progredito

Intervalli di confidenza

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Presentazione dell edizione italiana

STATISTICA (2) ESERCITAZIONE Dott.ssa Antonella Costanzo

Approssimazione normale alla distribuzione binomiale

Teorema del Limite Centrale

R - Esercitazione 6. Andrea Fasulo Venerdì 22 Dicembre Università Roma Tre

i dati escludono vi sia una relazione tra variabile indipendente e variabile dipendente (rispettivamente

Metodi statistici per la ricerca sociale Capitolo 7. Confronto tra Due Gruppi Esercitazione

Analisi della regressione multipla

Esercizi di Probabilità e Statistica

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Questo calcolo richiede che si conoscano media e deviazione standard della popolazione.

Esercitazione: La distribuzione NORMALE

Esercitazione del

DISTRIBUZIONI DI CAMPIONAMENTO

Università del Piemonte Orientale. Corso di laurea in medicina e chirurgia. Corso di Statistica Medica. La distribuzione t - student

Esercizio 1. Stima intervallare: IC per la media incognita (varianza ignota)

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson Apogeo

PSICOMETRIA. Corso di laurea triennale (classe 34) VERIFICA DELL IPOTESI CON DUE CAMPIONI

Argomenti della lezione:

Capitolo 10. Test basati su due campioni e ANOVA a una via. Statistica II ed. Levine, Krehbiel, Berenson. Casa editrice: Pearson

STATISTICA A K (60 ore)

Esercizi riassuntivi di Inferenza

Test delle Ipotesi Parte I

Statistica. Esercitazione 14. Alfonso Iodice D Enza Università degli studi di Cassino. Statistica. A. Iodice. Verifica di ipotesi

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

UNIVERSITÀ DEGLI STUDI DI PERUGIA

Casa dello Studente. Casa dello Studente

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +

Premessa: la dipendenza in media

Test d ipotesi: confronto fra medie

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

Gli errori nella verifica delle ipotesi

Distribuzione Normale

Università degli Studi di Padova. Corso di Laurea in Medicina e Chirurgia - A.A

Intervallo di fiducia del coefficiente angolare e dell intercetta L intervallo di fiducia del coefficiente angolare (b 1 ) è dato da:

Intervallo di confidenza

SOLUZIONI ESERCITAZIONE NR. 8 Test statistici

Statistica - metodologie per le scienze economiche e sociali /2e S. Borra, A. Di Ciaccio - McGraw Hill

Prova Scritta di METODI STATISTICI PER L AMMINISTRAZIONE DELLE IMPRESE (Milano, )

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Statistica. Capitolo 12. Regressione Lineare Semplice. Cap. 12-1

SOLUZIONE. a) Calcoliamo il valore medio delle 10 misure effettuate (media campionaria):

Variabili indipendenti qualitative. In molte applicazioni si rende necessario l introduzione di un fattore a due o più livelli.

Prova di recupero di Probabilità e Statistica - A * 21/04/2006

ESAME. 9 Gennaio 2017 COMPITO B

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

LA DISTRIBUZIONE NORMALE (Vittorio Colagrande)

Test F per la significatività del modello

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II

Analisi della varianza

Esame di Statistica del 16 aprile 2007 (Corso di Laurea Triennale in Biotecnologie, Università degli Studi di Padova). Cognome Nome Matricola

Statistica inferenziale. La statistica inferenziale consente di verificare le ipotesi sulla popolazione a partire dai dati osservati sul campione.

Quanti soggetti devono essere selezionati?

NOTE DALLE LEZIONI DI STATISTICA MEDICA ED ESERCIZI VERIFICA DI IPOTESI PER IL CONFRONTO TRA DUE PROPORZIONI

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 5

Il confronto fra medie

PROCEDURE/TECNICHE DI ANALISI / MISURE DI ASSOCIAZIONE A) ANALISI DELLA VARIANZA

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VII

Distribuzioni e inferenza statistica

Esame di Statistica (10 o 12 CFU) CLEF 11 febbraio 2016

Cognome e Nome:... Matricola e corso di laurea:...

Ipotesi statistiche (caso uno-dimensionale) Ipotesi poste sulla (distribuzione di) popolazione per raggiungere una decisione sulla popolazione stessa

Test per l omogeneità delle varianze

Laboratorio di Didattica di elaborazione dati 5 STIMA PUNTUALE DEI PARAMETRI. x i. SE = n.

Z-test, T-test, χ 2 -test

3.1 Classificazione dei fenomeni statistici Questionari e scale di modalità Classificazione delle scale di modalità 17

x, y rappresenta la coppia di valori relativa La rappresentazione nel piano cartesiano dei punti ( x, y ),( x, y ),...,( x, y )

C.I. di Metodologia clinica

obbligatorio - n. iscrizione sulla lista

Schema lezione 5 Intervalli di confidenza

Dispensa di Statistica

Elementi di Psicometria con Laboratorio di SPSS 1

Lezione VII: t-test. Prof. Enzo Ballone

FACOLTÀ DI ECONOMIA Prova scritta di Statistica II Perugia, 27 gennaio 2006 COGNOME NOME

Prova d'esame di Statistica I - Corso Prof.ssa S. Terzi

Analisi descrittiva: calcolando medie campionarie, varianze campionarie e deviazioni standard campionarie otteniamo i dati:

Test delle ipotesi sulla media.

Elementi di Psicometria con Laboratorio di SPSS 1

Analisi della varianza: I contrasti e il metodo di Bonferroni

Transcript:

ESERCITAZIONE 4 Caratterizzazione dei consumi energetici (parte 3) 4.1 CuSum: elementi di analisi statistica Il diagramma delle somme cumulate dei residui in funzione del tempo (CuSum) può essere in generale schematizzato come una successione di segmenti rettilinei separati da nodi. I segmenti individuano modelli di consumo potenzialmente diversi mentre i nodi individuano gli istanti di tempo in cui si sono verificati i presunti cambiamenti nel sistema. N.B. Tratti paralleli tra loro indicano che in quei periodi il modello seguito è stato lo stesso. Concentriamoci su un caso semplice di CuSum costituito da due soli segmenti separati da un nodo. Siano n 1 i punti (settimane mesi) che si collocano sul segmento a sinistra del nodo e n quelli che cadono sul segmento a destra del nodo. Gli indizi di potenziale cambiamento forniti dal Cusum devono essere testati cioè bisogna stabilire se i due modelli (quello che interpola gli n 1 punti del periodo 1 e quello che interpola gli n punti del periodo ) siano significativamente diversi tra loro oppure no. A livello operativo: 1. si calcola l equazione del modello di regressione per il periodo 1;. per ciascuno dei punti appartenenti ai due sottoinsiemi individuati si calcolano i residui y i ŷ i ovvero le differenze tra consumo effettivo nell i-esimo mese (settimana) e consumo previsto in base al modello di caratterizzazione relativo al periodo 1; 3. volendo si diagramma il nuovo CuSum in cui i consumi previsti sono calcolati non in base al modello di caratterizzazione relativo a tutti i dati bensì in base al modello che interpola i soli dati del periodo 1: adesso per come è stato costruito deve presentare un andamento oscillante intorno allo zero durante il periodo 1 per poi deviare nel periodo. I dati di cui si dispone a questo punto sono quindi: Gestione dei Sistemi Energetici - Esercitazioni 7

Caratterizzazione dei consumi energetici (parte 3) un campione di numerosità n 1 di residui appartenenti alla popolazione 1 (cioè alla popolazione dei residui nel periodo 1); un campione di numerosità di residui appartenenti alla popolazione. n Il modo di procedere che adottiamo è il seguente: per decidere se sia avvenuto un cambiamento effettivo (cioè se i due modelli differiscano tra loro in modo significativo dal punto di vista statistico) o se invece si tratti soltanto di variazioni che rientrano nella variabilità normale del processo in esame si fa un indagine sui residui appena definiti. In particolare si ritiene che si sia verificato un cambiamento se le popolazioni a cui i due gruppi di residui appartengono possono essere ritenute distinte. Una delle assunzioni che è alla base dell analisi di regressione nonchè delle carte di controllo per i residui è che le popolazioni dei residui y i ŷ i seguano una distribuzione normale (gaussiana). Assumiamo che valga l ipotesi di normalità; i parametri di tali distribuzioni normali (medie µ 1 e µ varianze σ 1 e σ ) sono ignoti di essi possiamo solo conoscere delle stime ricavabili dai campioni. Per il campione estratto dalla popolazione 1 si ha: i 1 media campionaria dei residui: = --------------------------- = = µˆ 1 (4.1) i = 1 varianza campionaria dei residui: = --------------------------------------------- = σˆ (4.) n 1 1 Analogamente per il campione estratto dalla popolazione : y 1 ( ) i 1 media campionaria dei residui: = --------------------------- = = µˆ (4.3) y i = 1 varianza campionaria dei residui: = --------------------------------------------- = σˆ (4.4) n Riteniamo diverse due popolazioni se presentano diverse medie e/o diverse varianze. Per valutare se le medie e le varianze di due popolazioni possano essere ritenute uguali o diverse ricorriamo a test d ipotesi. Supponendo che valga l ipotesi di normalità i test che si utilizzano sono: il test F sull uguaglianza di due varianze; il test t sull uguaglianza di due medie. Poiché il test t sull uguaglianza di due medie ha procedure diverse a seconda che le varianze delle popolazioni da cui provengono i dati possano essere ritenute uguali oppure no si conduce per primo il test F sull uguaglianza delle due varianze. s 1 s n1 n n1 y i n 1 y i ŷ i [ ] ( y i ŷ i ) y 1 ( ) n n ŷ i [ ] ( y i ŷ i ) y 8 Gestione dei Sistemi Energetici - Esercitazioni

CuSum: elementi di analisi statistica La tabella che segue riassume tutti i casi che si possono verificare. Varianze uguali Varianze diverse Medie uguali 1. Nessun cambiamento. Stesso modello diversa variabilità Medie diverse 3. Modello diverso stessa variabilità 4. Modello diverso diversa variabilità Il caso ) corrisponde ad un campanello di allarme: il team di gestione dell energia non deve modificare l equazione del modello ma deve interrogarsi su cosa possa essere successo nel sistema da provocare una diversa variabilità. 4.1.1 Test d ipotesi sull uguaglianza tra le varianze di due popolazioni normali: il test F Ipotesi nulla H 0 : =. σ 1 σ Ipotesi alternativa H 1 : σ 1 σ. Si fissa l errore di prima specie α. E la probabilità che l esito del test porti a rifiutare l ipotesi nulla quando invece è vera. L errore di prima specie α è anche detto livello di significatività. Il valore più comunemente utilizzato è α pari al 5% ma nulla vieta di adottare altri valori a seconda della situazione. Il complemento a 1 del livello di significatività 1 α è detto livello di fiducia. Si calcola il valore della statistica test: s F 1 calc = --- s (4.5) F calc è una particolare determinazione di una variabile casuale che segue la distribuzione F di Fisher con n 1 e n gradi di libertà (sono i parametri della distribuzione di Fisher che coincidono con i gradi di libertà corrispondenti alla varianza posta a numeratore e a denominatore). Con un livello di fiducia pari a 1 α - o equivalentemente con un rischio pari a α - si rifiuta l ipotesi nulla se F calc è esterno all intervallo compreso tra i due valori critici cioè se: F calc F α oppure F F calc α (4.6) n1 n n n 1 Viceversa se: -- -- F α n1 n -- < F calc < F α n1 n 1 --- (4.7) non si può rifiutare l ipotesi nulla con un livello di fiducia pari a 1 α. I valori F α m n 1 -- devono essere letti su apposite tavole. Ogni tavola è caratterizzata da un certo valore di α ed è una tabella a due entrate: sulle colonne ci sono i valori del primo parametro ( m) mentre sulle righe ci sono i valori del secondo ( n). Per determinare i valori di proprietà: F α m n -- che non compaiono sulle tavole si sfrutta la Gestione dei Sistemi Energetici - Esercitazioni 9

Caratterizzazione dei consumi energetici (parte 3) F α nm -- = 1 --------------------- F α m n 1 -- (4.8) 4.1. Test d ipotesi sull uguaglianza tra le medie di due popolazioni normali con varianze e incognite ma che possono ritenersi σ 1 σ uguali: il test t Ipotesi nulla H 0 : µ 1 = µ. Ipotesi alternativa H 1 : µ 1 µ. Si fissa α. Si calcola il valore della statistica test: y 1 y t calc = --------------------------- 1 s ---- 1 + ---- n 1 n (4.9) dove s è la radice quadrata della miglior stima di cui si dispone al momento della varianza comune σ = σ 1 = σ. In altri termini s è la miglior stima della deviazione standard comune σ = σ 1 = σ. s s ( n 1 ) s 1 + ( n ) s = = -------------------------------------------------------------- n 1 + n 4 (4.10) t calc è una particolare determinazione di una variabile casuale che segue la distribuzione t di Student con n 1 + n 4 gradi di libertà. L ipotesi nulla viene rifiutata a favore dell ipotesi alternativa se: t calc t α oppure t t (4.11) n1 n 4 1 -- calc + n1 + n 4 1 α --- Invece non si può rifiutare l ipotesi nulla se: t α n1 + n 4 1 -- < t < t calc α n1 n 4 1 + --- (4.1) I valori di Student. t α gdl 1 -- devono essere letti sulla tavola della distribuzione cumulativa t 30 Gestione dei Sistemi Energetici - Esercitazioni

CuSum: elementi di analisi statistica 4.1.3 Test d ipotesi sull uguaglianza tra le medie di due popolazioni normali con varianze e incognite che non possono ritenersi σ 1 σ uguali: il test t Ipotesi nulla H 0 : µ 1 = µ. Ipotesi alternativa H 1 : µ 1 µ. Si fissa α. Si calcola il valore della statistica test: y t 1 y calc = -------------------- s ---- 1 n 1 s n + ---- (4.13) L ipotesi nulla viene rifiutata a favore dell ipotesi alternativa se: t calc t α oppure t t calc (4.14) ν 1 -- ν 1 α --- dove il numero dei gradi di libertà per la variabile casuale t di Student che in precedenza era dato da n 1 + n 4 risulta calcolabile dall espressione: ν = s ---- 1 s + ---- n 1 n ------------------------------------------------ 4 ( s 1 n 1 ) ( s -------------------- n ) + -------------------- n 1 + 1 n + 1 Viceversa non si può rifiutare l ipotesi nulla se: < t < t calc α ν 1 t α ν 1 -- -- (4.15) (4.16) Gestione dei Sistemi Energetici - Esercitazioni 31

Caratterizzazione dei consumi energetici (parte 3) 4. Appendice A 3 Gestione dei Sistemi Energetici - Esercitazioni

Appendice B 4.3 Appendice B Gestione dei Sistemi Energetici - Esercitazioni 33

Caratterizzazione dei consumi energetici (parte 3) 4.4 Esercizi DIPARTIMENTO DI ENERGETICA - POLITECNICO DI TORINO ESERCITAZIONE N. 4 DI GESTIONE DEI SISTEMI ENERGETICI 1. La tabella che segue si riferisce ai consumi di energia elettrica del reparto lastratura scocche di un azienda automobilistica nel periodo dicembre 1999-Febbraio 00. Mese- Anno Consumo di energia elettrica (MWh/mese) Numero di scocche prodotte al mese Dec-99 988 15401 Jan-00 1068 17451 Feb-00 1171 19555 Mar-00 100 0035 Apr-00 1185 1617 May-00 1375 19684 Jun-00 1331 176 Jul-00 116 13139 Aug-00 560 403 Sep-00 139 17009 Oct-00 1310 1660 Nov-00 1357 17951 Dec-00 1154 11886 Jan-01 88 3100 Feb-01 116 1933 Mar-01 1334 1606 Apr-01 107 10607 May-01 110 9954 Jun-01 1157 1069 Jul-01 1355 8730 Aug-01 1038 5367 Sep-01 1163 11714 Oct-01 1390 18339 Nov-01 1387 1994 Dec-01 1383 16646 Jan-0 1493 165 Feb-0 1356 190 Il modello di caratterizzazione ottenuto con l analisi di correlazione e regressione è: Reparto lastratura scocche Consumi EE (MWh/mese) 1600 1400 100 1000 800 600 400 00 0 y = 0.074x + 810.6 R = 0.5965 0 5000 10000 15000 0000 5000 N. scocche/mese Il team di gestione dell energia decide di approfondire l indagine energetica utilizzando la tecnica CuSum; esso mostra che nel tempo sembra essere avvenuto un cambiamento di modello di consumo. 34 Gestione dei Sistemi Energetici - Esercitazioni

Esercizi Diagramma CuSum (rif. tutti i dati) 00 0-00 -400-600 -800-1000 -100 Dec-99 Feb-00 Apr-00 Jun-00 Aug-00 Oct-00 Dec-00 Feb-01 Apr-01 Jun-01 Aug-01 Oct-01 Dec-01 Feb-0 MWh Mesi Sapendo che il modello che interpola i dati del primo periodo (dicembre 1999- agosto 000) è: Consumo MWh ------------ pz = 0.0349 N scocche ------------ + 575.73 mese mese a) diagrammare il Cusum utilizzando come equazione per il calcolo dei consumi previsti il modello del periodo 1 e commentarlo; b) stabilire se i due modelli che sembrano emergere dal CuSum possano essere ritenuti significativamente diversi con un livello di fiducia del 95%; c) in caso affermativo stimare l impatto del cambiamento sui consumi. Quanta energia elettrica sarebbe stata risparmiata nel reparto nel periodo settembre 000-febbraio 00 se non si fosse verificato il peggioramento?. Stabilire se con un rischio di errore di prima specie α = 0.10 si può affermare che il modello di caratterizzazione energetica dell azienda in esame sia cambiato nel tempo. 450000 400000 Consumi EE (kwh/mese) 350000 300000 50000 00000 150000 100000 50000 y = 4.7374x + 138501 R = 0.6416 Periodo I Periodo II y = 4.3755x + 9016 R = 0.7734 0 0 10000 0000 30000 40000 50000 60000 Produzione (elementi/mese) Dati: n 1 = 31 y 1.35 10 11 kwh = ------------ s ; mese 1 = 885604370 ------------ kwh mese n = 1 y 61581.4 kwh = ------------ s. mese = 346667105 ------------ kwh mese Gestione dei Sistemi Energetici - Esercitazioni 35

Caratterizzazione dei consumi energetici (parte 3) Soluzione Esercitazione 4 - Esercizio 1 - parte a) Periodo 1 Periodo Mese- Anno Consumo di energia elettrica (MWh/mese) Numero di scocche prodotte al mese Consumo previsto (rif. periodo 1) Residui Cusum Dec-99 988 15401 1113-15 -15 Jan-00 1068 17451 1185-117 -4 Feb-00 1171 19555 158-87 -39 Mar-00 100 0035 175-75 -404 Apr-00 1185 1617 1140 45-359 May-00 1375 19684 163 11-47 Jun-00 1331 176 1177 154-93 Jul-00 116 13139 1034 18 35 Aug-00 560 403 590-30 5 Sep-00 139 17009 1169 160 165 Oct-00 1310 1660 1155 155 30 Nov-00 1357 17951 10 155 474 Dec-00 1154 11886 991 163 638 Jan-01 88 3100 684 198 836 Feb-01 116 1933 107 189 105 Mar-01 1334 1606 1141 193 117 Apr-01 107 10607 946 16 1344 May-01 110 9954 93 197 1540 Jun-01 1157 1069 949 08 1749 Jul-01 1355 8730 880 475 3 Aug-01 1038 5367 763 75 498 Sep-01 1163 11714 985 178 677 Oct-01 1390 18339 116 174 851 Nov-01 1387 1994 149 138 989 Dec-01 1383 16646 1157 6 315 Jan-0 1493 165 1318 175 3390 Feb-0 1356 190 1341 15 3405 CUSUM (rif. periodo 1) 4000 3000 000 MWh 1000 0-1000 -000 Dec-99 Feb-00 Apr-00 Jun-00 Aug-00 Oct-00 Dec-00 Feb-01 Apr-01 Jun-01 Aug-01 Oct-01 Dec-01 Feb-0 Mesi 36 Gestione dei Sistemi Energetici - Esercitazioni