Analisi statistica dell Output



Похожие документы
CONCETTI BASE DI STATISTICA

Metodi statistici per l analisi dei dati

DEFINIZIONE PROCESSO LOGICO E OPERATIVO MEDIANTE IL QUALE, SULLA BASE

Un problema! La letteratura riporta che i pazienti affetti da cancro. = mesi

LA VERIFICA DELLE IPOTESI SUI PARAMETRI

Il test parametrico si costruisce in tre passi:

Campionamento stratificato. Esempio

Matematica II: Calcolo delle Probabilità e Statistica Matematica

Le carte di controllo

Calcolo della risposta di un sistema lineare viscoso a più gradi di libertà con il metodo dell Analisi Modale

Successioni. Grafico di una successione

Corso di Laurea Magistrale in Ingegneria Informatica A.A. 2014/15. Complementi di Probabilità e Statistica. Prova scritta del del

Random walk classico. Simulazione di un random walk

Random walk classico. Simulazione di un random walk

SUCCESSIONI E SERIE NUMERICHE

Statistica 1 A.A. 2015/2016

SUCCESSIONI NUMERICHE

Anno 5 Successioni numeriche

V Tutorato 6 Novembre 2014

Statistica I, Laurea triennale in Ing. Gestionale, a.a. 2011/12 Registro delle lezioni

STATISTICA DESCRITTIVA

5 ln n + ln. 4 ln n + ln. 6 ln n + ln

LA GESTIONE DELLA QUALITA : IL TOTAL QUALITY MANAGEMENT

1 Limiti di successioni

EQUAZIONI ALLE RICORRENZE

STATISTICA INFERENZIALE SCHEDA N. 2 INTERVALLI DI CONFIDENZA PER IL VALORE ATTESO E LA FREQUENZA

Soluzione La media aritmetica dei due numeri positivi a e b è data da M

IMPLICAZIONE TRA VARIABILI BINARIE: L Implicazione di Gras

IL CALCOLO COMBINATORIO

Principi base di Ingegneria della Sicurezza

SUCCESSIONI e LIMITI DI SUCCESSIONI. c Paola Gervasio - Analisi Matematica 1 - A.A. 15/16 Successioni cap3b.pdf 1

8. Quale pesa di più?

Elementi di matematica finanziaria

PARTE QUARTA Teoria algebrica dei numeri

Alcuni parametri statistici di base

ESERCIZI DI STATISTICA DESCRITTIVA ALCUNI TRATTI DA PROVE D ESAME DA REALIZZARE ANCHE CON L AUSILIO DI UN FOGLIO DI CALCOLO. Angela Donatiello 1

Statistica (Prof. Capitanio) Alcuni esercizi tratti da prove scritte d esame

52. Se in una città ci fosse un medico ogni 500 abitanti, quale sarebbe la percentuale di medici? A) 5 % B) 2 % C) 0,2 % D) 0,5% E) 0,02%

Sistemi e Tecnologie della Comunicazione

Approfondimenti di statistica e geostatistica

ANALISI MATEMATICA 1 Area dell Ingegneria dell Informazione. Appello del TEMA 1. f(x) = arcsin 1 2 log 2 x.

Serie numeriche: esercizi svolti

Statistica di base. Luca Mari, versione

Le onde elettromagnetiche. Origine e natura, spettro delle onde e.m., la polarizzazione

Teorema 13. Se una sere converge assolutamente, allora converge:

1. Distribuzioni campionarie legate alla distribuzione normale. 3. Intervallo bilatero di confidenza bilatero per la frazione p di una popolazione

ESERCIZI DI ANALISI I. Prof. Nicola Fusco 1. Determinare l insieme in cui sono definite le seguenti funzioni:

Esercitazioni di Statistica

LA DERIVATA DI UNA FUNZIONE

Numerazione binaria Pagina 2 di 9 easy matematica di Adolfo Scimone

Statistica descrittiva

LE MISURE DI VARIABILITÀ DI CARATTERI QUANTITATIVI

Foglio di esercizi N. 1 - Soluzioni

Interesse e formule relative.

Campi vettoriali conservativi e solenoidali

3.4 Tecniche per valutare uno stimatore

Test non parametrici. sono uguali a quelle teoriche. (probabilità attesa), si calcola la. , cioè che le frequenze empiriche

Limiti di successioni

Problemi di Scheduling Definizioni. Problemi di Scheduling Definizioni. Problemi di Scheduling Definizioni. Problemi di Scheduling Definizioni

Esercizi riguardanti limiti di successioni

Modelli multiperiodali discreti. Strategie di investimento


SERIE NUMERICHE Esercizi risolti. 2 b) n=1. n n 2 +n

CARATTERISTICHE MECCANICHE DI PIETRE NATURALI PER FACCIATE VENTILATE. Di seguito verranno utilizzati i seguenti simboli:

CAPITOLO SETTIMO GLI INDICI DI FORMA 1. INTRODUZIONE

Capitolo 3 CARATTERIZZAZIONE MECCANICA DELLE FIBRE

Capitolo 27. Elementi di calcolo finanziario EEE

DISTRIBUZIONI DOPPIE

Il confronto fra proporzioni

Una funzione è una relazione che ad ogni elemento del dominio associa uno e un solo elemento del codominio

INFERENZA o STATISTICA INFERENTE

La dispersione cromatica

Capitolo uno STATISTICA DESCRITTIVA BIVARIATA

Risposte. f v = φ dove φ(x,y) = e x2. f(x) = e x2 /2. +const. Soluzione. (i) Scriviamo v = (u,w). Se f(x) è la funzione richiesta, si deve avere

Sintassi dello studio di funzione

Introduzione all assicurazione. (Dispensa per il corso di Microeconomia per manager. Prima versione, marzo 2013; versione aggiornata, marzo 2014)

SERIE NUMERICHE Con l introduzione delle serie vogliamo estendere l operazione algebrica di somma ad un numero infinito di addendi.

Транскрипт:

Aalisi statistica dell Output IL Simulatore è u adeguata rappresetazioe della Realtà! E adesso? Come va iterpretato l Output? Quado le Osservazioi soo sigificative? Quati Ru del Simulatore è corretto effettuare? Per otteere ua determiata accuratezza dei risultati? 1

Aalisi dell Output r f( r ) SIMULATORE Dal mometo che l Output di u Simulatore è fuzioe di variabili aleatorie, l Aalisi è u problema di statistica ifereziale. Due campi applicativi pricipali: Test e Covalida delle ipotesi (p.es., Test Goodess of Fit) Stima etro u certo livello di accuratezza (p.es., qual è la differeza tra la media vera di ua distribuzioe teorica e la media 3 stimata otteuta da osservazioi) Tipi di Simulazioe Simulazioe Termiatig o Trasieti Simula Sistemi che o raggiugoo mai uo stato stabile. I questo caso la lughezza del ru è determiata dal problema stesso. Le misure di iteresse soo defiite: Nei termii del tempo richiesto per compiere uo specifico isieme di attività. Nei termii del umero di attività ecessarie per raggiugere uo stato specifico, dato uo stato iiziale. 4

Simulazioe sistemi trasieti Simulazioe del processo di ri-accesioe ( cold start ) di u elaboratore. Simulazioe di Sistemi i cui parametri si modificao col tempo. Per l accuratezza dei risultati: Quate volte bisoga ripetere la Simulazioe (co differeti sequeze) per otteere ua determiata accuratezza? 5 Simulazioe Steady-State (di iteresse per il corso) Simula Sistemi che raggiugoo, dopo u determiato trasiete,uo stato stabile. I questo caso sia le codizioi iiziali che la lughezza della Simulazioe soo determiati dal simulazioista. Le misure di iteresse soo defiite i fuzioe di u valore limite raggiuto co i ru di simulazioe tedeti all ifiito. 6 3

ESEMPIO Misura: Tempo medio di Attesa i coda Ta Per (clock ifiito), la distribuzioe del Tempo di Attesa si defiisce, e Ta coverge ad u valore limite. Caratteristiche dell Aalisi dell Output: Dal mometo che, i pratica, sia il ru che le osservazioi soo fiite, bisoga determiare quato la media stimata si avvicia a quella teorica otteuta dalla distribuzioe. Per defiizioe di Steady-State, i valori dell output devoo essere idipedeti dallo stato iiziale. 7 Tipi di Misure (1) I geere, le misure di prestazioe cercate soo valori medi (talvolta variaze, molto più raramete distribuzioi complete). Per u Processo a tempo-discreto, date osservazioi,...,, la loro media è detta: 1, X ( ) = i= 1 Per u Processo a tempo-cotiuo: i X T = Media Campioaria 0 X ( t) dt / T 8 4

Tipi di Misure () La Media Campioaria è ua variabile aleatoria la cui distribuzioe f (X ) (per il Teorema del Limite Cetrale ) è ormale se f (X ) è ormale, altrimeti tede a ua distribuzioe ormale se è grade (>30) co parametri : E(X ) = µ σ σ ( X ) = σ σ ( X ) = Valore Atteso Variaza Deviazioe Stadard Tutti e tre dao ua misura della dispersioe delle variabili aleatorie di ua distribuzioe. 9 Teorema del Limite Cetrale (Fodametale per la Statistica e per la Simulazioe) La fuzioe di Distribuzioe di ua media aritmetica calcolata su di u gra umero di variabili casuali idipedeti e ideticamete distribuite (i.i.d.) è approssimabile co ua fuzioe di distribuzioe ormale. 10 5

ESEMPIO X () µ σ Media osservata su campioi i.i.d. ( grade) Media teorica Variaza teorica X ( ) µ C = Variabile aleatoria co σ distribuzioe N(0,1) I valori derivati per C ( gradi) seguoo ua distribuzioe ormale co Media = 0 Variaza = 1 11 Applicazioe del Teorema del limite cetrale Aalisi dell Output di u Simulatore Ogi ru di Simulazioe produce u campioe di osservazioi (derivate dalla stessa distribuzioe) di uo o più parametri di prestazioe Altri ru di Simulazioe eseguiti co u diverso isieme di semi producoo altri campioi di osservazioi statisticamete idipedeti 1 6

Applicazioe del Teorema () Sebbee la distribuzioe o sia ota, il Teorema del Limite Cetrale ci assicura che la media teorica µ può essere stimata mediate X() co u umero grade di osservazioi i.i.d. i quato X ( ) è distribuita ormalmete. La media teorica sarà compresa co ua certa probabilità tra due valori che costituirao il cosiddetto itervallo di cofideza: a < µ < b X () serve per calcolare a e b 13 Itervalli di Cofideza (1) Problema : Stimare quato ua media campioaria otteuta da ua Simulazioe fiita approssimi la Media µ otteuta dalla Distribuzioe Teorica. X Soluzioe : Si determia ua misura detta Itervallo di Cofideza. Metodo 1) Per grade, la variabile : X ( ) µ C( ) = z = σ / È ach essa ormale co N(0,1), media=0 e variaza=1. 7

Itervalli di Cofideza () La fuzioe cumulativa F z tutti i mauali di statistica. ( u) = prob( z u) ) Si preda u valore di u tale che è tabulata i F z ( u) = 1 ( ) 3) Di cosegueza: dove = u < 1 Perché la ormale è simmetrica itoro alla media (=0) prob( z u ) = prob( z > u ) = 1 F( u ) = 15 Itervalli di Cofideza() 4)Si ha, quidi : prob( u z u ) = 1 X µ prob( u u ) = 1 σ Livello di cofideza σ σ prob[ X u µ X + u ] = 1 Itervallo di cofideza 16 8

Itervalli di Cofideza(3) u 5) Per calcolare si usa la tabella della distribuzioe ormale: F( u ) = 1 ( Se si sceglie ad esempio, u livello di cofideza del 95% : 1 = 0.95 > = 0.05 > = Dalla Tavola bisoga ricavare il valore di che F( u ) = 0.975 1.960 tale Allora, è possibile affermare che la media teorica µ cade ell itervallo σ 0.05 F ( u ) = 1 = 0. 975 X ±1.960 ) u al 95% di probabilità. 17 Tavola della Normale (1) a µ b 18 9

Tavola della Normale () Distribuzioe cumulativa ormale z X Area z X Area -4.65 µ -4.65 σ 0.00001 0 0.50-3.719 µ -3.719 0.0001 0.16 µ +0.16 0.55-3.090 µ -3.090 σ σ µ σ 0.001 0.53 µ +0.53 0.60 -.576 µ -.576 0.005 0.385 µ +0.385 0.65 -.36 -.36 0.01 0.54 +0.54 0.70 -.054 -.054 0.0 0.674 +0.674 0.75-1.960 µ µµ σ σ σ σ µ σ σ µ σ -1.960 σ 0.05 0.84 µ +0.84 σ 0.80-1.881 µ -1.881 σ 0.03 1.036 µ +1.036 σ 0.85 Tavola della Normale (3) z X Area z X Area -1.751 µ -1.751 σ 0.04 1.8 µ +1.8 σ 0.90-1.645 µ -1.645 σ 0.05 1.341 µ +1.341 σ 0.91-1.555 µ -1.555 σ 0.06 1.405 µ +1.405 σ 0.9-1.476 µ -1.476 σ 0.07 1.476 µ +1.476 σ 0.93-1.405 µ -1.405 σ 0.08 1.555 µ +1.555 σ 0.94-1.341 µ -1.341 σ 0.09 1.645 µ +1.645 σ 0.95-1.8 µ -1.8 σ 0.10 1.751 µ +1.751 σ 0.96-1.036 µ -1.036 σ 0.15 1.881 µ +1.881 σ 0.97-0.84 µ -0.84 σ 0.0 1.960 µ +1.960 σ 0.975 10

Tavola della Normale (4) z X Area z X Area -0.674 µ -0.674 σ 0.5.054 µ +.054 σ 0.98-0.54 µ -0.54 σ 0.30.36 µ +.36 σ 0.99-0.385 µ -0.385 σ 0.35.576 µ +.576 σ 0.995-0.53 µ -0.53 σ 0.40 3.090 µ +3.090 σ 0.999-0.16 µ -0.16 σ 0.45 3.719 µ +3.719 σ 0.9999 4.65 µ +4.65 σ 0.99999 1 Problema della variaza teorica Nella pratica, la Variaza σ, ecessaria per il calcolo dell itervallo di cofideza, o è ota. Pertato la si sostituisce co la variaza campioaria Vale soltato per osservazioi idipedeti Ora la variabile stadard o è più ormale, ma Studet-T s 1 = ( 1 i= 1 t = X s i µ X ) 11

Problema della variaza teorica () Di cosegueza l itervallo di cofideza è dato da : t s s X t µ X + t dovrebbe essere calcolato dalla tabella della fuzioe di distribuzioe Studet-t. Tuttavia, poiché per gradi (>30), la fuzioe Studet-t tede alla fuzioe ormale, è possibile i molti casi utilizzare la tavola della ormale co miima 3 approssimazioe. Problema della Normalità Il Teorema del Limite Cetrale assicura che la media di variabili aleatorie (>c) idipedeti e ideticamete distribuite è approssimativamete distribuita ormalmete. Tutti i calcoli statistici sfruttao queste proprietà, per cui è importate far presete che i campioi di uteti cosecutivi (ovvero osservazioi di eveti cosecutivi) o possoo risultare idipedeti. E molto probabile che vi siao correlazioi tra le osservazioi e quidi si viola il pricipio della i.i.d. su cui si basa il Teorema. 1

Come ricodursi i codizioi di osservazioi i.i.d Per risolvere il problema della ormalità si utilizzao strumeti che redoo idipedeti le osservazioi I pratica, si aumeta il umero di ru del simulatore, possibilmete co semi differeti. Tre metodi pricipali: Metodo Rigeerativo Metodo Prove Ripetute Metodo Batch 5 Metodo Rigeerativo Applicabile solo el caso i cui il sistema si riporta aturalmete i codizioi iiziali Batch 1 Batch Batch 3 Tempo di simulazioe 13

Metodo Rigeerativo(1) Può essere applicato a quei Simulatori che, ad u istate aleatorio (puto rigeerativo) ritorao ello stesso stato del precedete puto rigeerativo. Dal mometo che questi puti rappresetao stati idetici del Simulatore, il comportameto di u ciclo rigeerativo è idipedete dagli altri cicli. I particolare, le variabili di Output di cicli differeti soo idipedeti. Dal mometo che la lughezza dei cicli è radom si devoo modificare le istruzioi per il calcolo dell itervallo di cofideza. 7 Metodo Batch Servoo periodi di geeratori di umeri pseudo-casuali molto lughi ovvero devoo poter essere sufficieti poche osservazioi Output parameter Trasiet Period batch1 batch batch3 batch4 batch 0 t t+t t+t t+3t t+4t. t+t 8 14

Metodo Batch (1) Il Metodo Batch supera il problema del Trasiete suddividedo u ru molto lugo del Simulatore i u isieme di k sotto-ru (Batch) di lughezza. - Calcola ua media campioaria per ogi Batch - Usa queste k medie per calcolare la media campioaria e la variaza campioaria dell esperimeto che servoo per il calcolo dell itervallo di cofideza. 9 Metodo Batch () L elimiazioe del Trasiete va fatta solo prima del Batch 1. Se la dimesioe del Batch è sufficietemete grade, le medie campioarie sarao approssimativamete idipedeti e ormalmete distribuite. Poiché vi è u solo Trasiete da elimiare il metodo Batch risulta essere il più efficiete. 30 15

Metodo Prove Ripetute Oggi è il metodo più utilizzato, i quato poe meo vicoli ed il tempo di computazioe (additivo per l elimiazioe del periodo trasiete) tipicamete o è più u problema Parametro di output Ru Batch1 Ru Batch Ru Batch 0 t t+t 0 t t+t 0 t t+t Ru 1 Ru Ru 31 Metodo Prove Ripetute () Rigeerazioe Artificiale E il metodo più semplice per otteere osservazioi idipedeti. Si effettuao k ru ( repliche ) del Simulatore, ciascuo co sequeze pseudo-casuali diverse. I ciascu ru si effettuao m k ( può essere u umero casuale) osservazioi (autocorrelate) della variabile aalizzata. 3 16

Metodo Prove Ripetute (3) Al termie si ottegoo k campioi, ciascuo di osservazioi, potezialmete autocorrelate : m k 11 1 31 1 3......... 1 m 1 3 m 3 m Osservazioe #1 k 1 Si calcolao: k... km k Osservazioe #k m j y j = ji i= 1 m j z j = ji i= 1 33 Metodo Prove Ripetute (4) Se il sistema ha raggiuto la stazioarietà e i k esperimeti soo stati codotti co sequeze di umeri radom idipedeti, le tre serie y,..., 1 y k z 1,..., zk m 1,..., mk possoo cosiderarsi i.i.d. m,..., m k Se 1 soo uguali, i calcoli segueti si semplificao 34 17

18 35 Metodo Prove Ripetute (5) Per il metodo delle prove ripetute è possibile utilizzare l aalisi statistica classica per il calcolo di E(X) e ) ( σ X γ δ = = = = ) ( ) ( ) ( 1 j m i ji m E E X E X j γ λ = = = = ) ( ( ) ( 1 j i ij m E E X E X j ) ( ) ( ) ( ) ( γ δ γ λ σ = = X E X E X 36 ANALISI STATISTICA DELL OUTPUT NUMERO RUN DI SIMULAZIONE

Prove da effettuare Dove: Numero di prove ecessario Si stabilisce u ERRORE ACCETTABILE e tra la media teorica µ e la stima X() Il umero di prove ripetute (o campioi di osservazioi) per garatire per la differeza tra µ e X() sia iferiore ad e è dato da t N = S( ) t 1,1 1,1 e S ( ) umero prove effettuate Se N> bisoga aumetare le prove Se N< si può accettare N= Deviazioe stadard campioaria Valore della Distribuzioe Studet-T co -1 gradi di libertà e livello di cofideza Prova i 1 3 4 5 6 7 8 9 10 Esempio: Media X i [X i -X(10)] 1,96 10,163 8,66 1,334 6,37 1,493,1 9,168 5,16 0,0001 5,63 0,3,0 8,690 5,67 0,7 8,01 8,191 5,70 0,304 51,48/10=5,184 50,85/9=5,65 MEDIA CAMPIONARIA VARIANZA CAMPIONARIA 38 19

Esempio(): Media Campioaria X(10)=51,48/10=5,148 Variaza Campioaria S =50,85/9=5,65 Deviazioe Stadard Campioaria S(10)=,38 Valore critico Studet-t t -1,1-/ =,6 Gradi di libertà -1=9 10 prove 1 Livello di cofideza =0,10 Errore e=1 5,184 e=1 µ N=((,6*,38)/1) =8,9 9 prove ripetute! 39 ANALISI STATISTICA DELL OUTPUT TECNICHE PER LA RIDUZIONE DELLA VARIANZA (CENNI) 40 0

Nota All aumetare della probabilità (ovvero al dimiuire di ) l itervallo di cofideza diveta più ampio Compromesso: è meglio essere cofideti al 95% e 1<µ<15 piuttosto che essere cofideti al 99% e 8<µ<19 41 Nota () E auspicabile, ma o sempre possibile che l itervallo di cofideza abbia u ampiezza o superiore al 10%, massimo 15 0% Restrigere l itervallo di cofideza sigifica ridurre la VARIANZA, ciò si ottiee co: Più osservazioi per prova (ru) e/o Più prove ripetute 4 1

Ua tecica per la riduzioe della VARIANZA USO DI VARIABILI ANTITETICHE Per ogi prova si effettuao i realtà due repliche Ua co la sequeza di variabili pseudocasuali geerate {r 1,r,,r z } La secoda co la sequeza di variabili atitetiche {1-r 1,1-r,,1-r z } Per esempio il umero atitetico di 0,135 è 1 0,135 = 0,78765 I risultati dei valori di prestazioe osservati elle due repliche soo mediati La media rappreseta l output osservato per ogi prova 43 Ua tecica per la riduzioe della VARIANZA USO DI VARIABILI ANTITETICHE() MOTIVAZIONE Ridurre la probabilità che u valore osservato sia dipedete da ua polarizzazioe dei umeri geerati a µ siistra o a destra della media 44