Parte 5. L ambiente di sviluppo ARENA



Documenti analoghi
Parte 5. L ambiente di sviluppo ARENA


Introduzione al package ARENA

Introduzione alla Simulazione Numerica

Facciamo qualche precisazione

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Scheduling della CPU. Sistemi multiprocessori e real time Metodi di valutazione Esempi: Solaris 2 Windows 2000 Linux

La variabile casuale Binomiale

E naturale chiedersi alcune cose sulla media campionaria x n

1. Distribuzioni campionarie

LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di

Sistemi Operativi. Scheduling della CPU SCHEDULING DELLA CPU. Concetti di Base Criteri di Scheduling Algoritmi di Scheduling

Sistemi Operativi SCHEDULING DELLA CPU. Sistemi Operativi. D. Talia - UNICAL 5.1

Inferenza statistica. Statistica medica 1

matematica probabilmente

Corso di Automazione Industriale 1. Capitolo 4

Grafici delle distribuzioni di frequenza

Corso di Automazione Industriale 1. Capitolo 4

Capitolo 12 La regressione lineare semplice

Il confronto fra proporzioni

Metodi statistici per le ricerche di mercato

Esercitazione 1 del corso di Statistica 2 Prof. Domenico Vistocco

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

PROGRAMMA SVOLTO NELLA SESSIONE N.

Elementi di Psicometria con Laboratorio di SPSS 1

Statistica inferenziale

Cosa è un foglio elettronico

Scheduling. Sistemi Operativi e Distribuiti A.A Bellettini - Maggiorini. Concetti di base

Riassunto 24 Parole chiave 24 Commenti e curiosità 25 Esercizi 27 Appendice

GESTIONE INDUSTRIALE DELLA QUALITÀ A

Ing. Simone Giovannetti

Tecniche di Simulazione: Introduzione. N. Del Buono:

Dispensa di database Access

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

Parte 4. Progettazione di una simulazione

11. Analisi statistica degli eventi idrologici estremi

Riccardo Dutto, Paolo Garza Politecnico di Torino. Riccardo Dutto, Paolo Garza Politecnico di Torino

CAPITOLO 8 LA VERIFICA D IPOTESI. I FONDAMENTI

4.1 FAX Sollecito consegne via (Nuova funzione)

FONDAMENTI di INFORMATICA L. Mezzalira

LEZIONE n. 5 (a cura di Antonio Di Marco)

Temi di Esame a.a Statistica - CLEF

Università degli Studi di Milano Bicocca CdS ECOAMM Corso di Metodi Statistici per l Amministrazione delle Imprese CARTE DI CONTROLLO PER VARIABILI

Elementi di Psicometria con Laboratorio di SPSS 1

Il campionamento statistico

Università di Roma Tor Vergata Corso di Laurea triennale in Informatica Sistemi operativi e reti A.A Pietro Frasca.

Calcolo delle probabilità

SCHEDULATORI DI PROCESSO

TECNICHE DI SIMULAZIONE

La distribuzione Gaussiana

SOLUZIONI ESERCITAZIONE NR. 6 Variabili casuali binomiale e normale

VERIFICA DELLE IPOTESI

ESERCIZI DI PROBLEM SOLVING E COMPOSIZIONE DEI DIAGRAMMI DI FLUSSO per le classi terza

Analisi di dati di frequenza

La categoria «ES» presenta (di solito) gli stessi comandi

Statistica. Lezione 6

RAPPRESENTAZIONE GRAFICA E ANALISI DEI DATI SPERIMENTALI CON EXCEL

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Corso di Laurea in Ingegneria Informatica e Automatica (A-O) Università di Roma La Sapienza

Simulazione termine molto vasto metodi e applicazioni per imitare sistemi reali, di solito tramite computer

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V

Test statistici di verifica di ipotesi

Relazioni statistiche: regressione e correlazione

Organizzazione degli archivi

DISTRIBUZIONI DI VARIABILI CASUALI DISCRETE

13. Campi vettoriali

Ottimizzazione Multi Obiettivo

Programmazione Disciplinare: Calcolo Classe: Quarte - Quinte

Informatica 3. LEZIONE 21: Ricerca su liste e tecniche di hashing. Modulo 1: Algoritmi sequenziali e basati su liste Modulo 2: Hashing

Corso Sistemi Informativi Aziendali, Tecnologie dell Informazione applicate ai processi aziendali. Sistemi informativi aziendali

Sistemi di Servizio e Simulazione

Istruzioni (1): L elaborato verrà letto, compilato e fatto girare per verificare la correttezza della sintassi e delle operazioni svolte

Esercizi del Corso di Statistica. Parte I - Variabili Aleatorie Continue

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Database. Si ringrazia Marco Bertini per le slides

ECDL AM5 Access Advanced

RISK MANAGEMENT: MAPPATURA E VALUTAZIONE DEI RISCHI AZIENDALI. UN COSTO O UN OPPORTUNITA?

COLLI. Gestione dei Colli di Spedizione. Release 5.20 Manuale Operativo

Corso di. Dott.ssa Donatella Cocca

Regione Toscana. ARPA Fonte Dati. Manuale Amministratore. L. Folchi (TAI) Redatto da

Sistemi Operativi SCHEDULING DELLA CPU

Ricerca di outlier. Ricerca di Anomalie/Outlier

INFORMATICA 1 L. Mezzalira

3. Confronto tra medie di due campioni indipendenti o appaiati

Primi esercizi per gli studenti del corso di Statistica ed Elementi di Probabilita

Un gioco con tre dadi

Progettazione di Basi di Dati

Scheduling della CPU

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 1

L Analisi della Varianza ANOVA (ANalysis Of VAriance)

Testi di Esercizi e Quesiti 1

LABORATORIO-EXCEL N. 2-3 XLSTAT- Pro Versione 7 VARIABILI QUANTITATIVE

Pag. 1. Introduzione allo scheduling. Concetti fondamentali. Scheduling della CPU. Concetti fondamentali. Concetti fondamentali. Algoritmi.

PROGETTO INDAGINE DI OPINIONE SUL PROCESSO DI FUSIONE DEI COMUNI NEL PRIMIERO

1a) Calcolare gli estremi dell intervallo di confidenza per µ al 90% in corrispondenza del campione osservato.

Istituzioni di Statistica e Statistica Economica

Un sistema operativo è un insieme di programmi che consentono ad un utente di

CORSO ACCESS PARTE II. Esistono diversi tipi di aiuto forniti con Access, generalmente accessibili tramite la barra dei menu (?)

Probabilità II Variabili casuali discrete

Test d ipotesi. Statistica e biometria. D. Bertacchi. Test d ipotesi

Transcript:

Parte 5 L ambiente di sviluppo ARENA

Caratteristiche Arena distributore: applicazioni: Rockwell Software Manufacturing, supply chain, business process, military, warehousing e logistics improvement sistemi operativi: Windows 95, 98, ME, NT, 2000 e XP caratteristiche: ambiente grafico, run-time debugger, fitting delle distribuzioni di input, supporto all analisi dell output, riusabilità (oggetti e template), animazione, esecuzione e visualizzazione real-time

Principali proprietà Moduli di dati: Entità Entity Type: Initial Picture: Holding Cost/Hour: nome (unico) del tipo di entità rappresentazione grafica costo orario di attraversamento del sistema da parte dell entità Costi iniziali: costo che l entità ha prima ancora di entrare nel sistema. I costi sono classificati in: Initial VA Cost: costo delle attività a valore aggiunto Initial NVA Cost: costo delle attività non a valore aggiunto Initial Waiting Cost: costo dei tempi di attesa Initial Transfer Cost: costo dei trasferimenti Initial Other Cost: altri costi

Principali proprietà Moduli di dati: Code Name: Type: Nome (unico) della coda disciplina di attesa: First In First Out, Last In First Out, Lowest Attribute Value (first) Highest Attribute Value (first) Attribute Name: Se la disciplina di attesa è del tipo Lowest Attribute Value oppure Highest Attribute Value, l ordinamento viene fatto rispetto a questo attributo. Shared: indica se la coda è condivisa da più risorse

Principali proprietà Moduli di dati: Risorse Name: Type: Capacity: nome (unico) della risorsa indica se la risorsa è a capacità fissa o variabile numero di entità processabili simultaneamente Costi: time-dependent: costi orari di utilizzo (Busy/Hour) e di fermo (Idle/Hour) time-independent: costo per unità processata (Per Use) StateSet Name: Initial State: Failures: Failure Rule: insieme che definisce i possibili stati della risorsa stato iniziale failures associate alla risorsa comportamento della risorsa nei confronti dell entità se si verifica una failure durante un processamento (Ignore, Wait, Preempt)

Moduli di dati: Variabili e Sets Principali proprietà delle variabili Name: Rows: Columns: Clear Option: Initial Values: nome (unico) della variabile numero di righe (se la variabile è un vettore o tabella) numero di colonne (se la variabile è un vettore o tabella) le variabili sono inizializzate ogni volta che lo sono le statistiche (Statistics) ogni volta che lo è il sistema (System) mai (None) valori iniziali Principali proprietà degli insiemi Name: Type: Members: nome (unico) dell insieme Tipo di insieme (Resource, Entity Type, ) Lista degli elementi dell insieme

Moduli di Flowchart (1) Create 0 Creazione di un entità rappresenta il punto di ingresso delle entità nel sistema Principali proprietà Name: Entity Type: Type: Entities per Arrival: Max Arrivals: First Creation: identificatore del modulo tipo di entità generata modalità di generazione (con tempi di interarrivo esponenziali, costanti o distribuiti secondo una funzione di probabilità) numerosità del gruppo di arrivo numero totale di entità generate istante di arrivo della prima entità

Moduli di Flowchart (2) Dispose 0 Distruzione di un entità rappresenta il punto di uscita delle entità dal sistema Principali proprietà Name: Record Entity Statistics: Identificatore del modulo vero se le statistiche delle entità in arrivo vanno memorizzate (wait time, transfer time, total time, value added cost, )

Moduli di Flowchart (3) Process 0 Processamento di un entità rappresenta un attività svolta dalle entità che lo attraversano. Serve anche per definire sottomodelli Name: identificativo del modulo Type: standard processing oppure submodel. Action: tipo di processamento: Delay: è richiesto un tempo di processamento ma nessuna risorsa Seize Delay: è richiesto un tempo di processamento e una risorsa che viene allocata ma non rilasciata Seize Delay Release: è richiesto un tempo di processamento e una risorsa che viene allocata e rilasciata Delay Release: è richiesto un tempo di processamento, trascorso il quale una risorsa precedentemente allocata è rilasciata. Esempi: lavorazione di una parte, servizio di un cliente,...

Moduli di Flowchart (3) Process 0 Processamento di un entità rappresenta un attività svolta dalle entità che lo attraversano. Serve anche per definire sottomodelli Priority: Resources: Delay Type: Units: Allocation: livello di priorità delle entità che attraversano il modulo risorsa o insieme di risorse usate per il processamento distribuzione utilizzata per generare i tempi di processamento unità di misura del tempo indica in quali categorie vanno conteggiati i tempi e costi di processamento Esempi: lavorazione di una parte, servizio di un cliente,...

Moduli di Flowchart (4) Assign Assegnamento di variabili e attributi L operazione avviene quando una entità attraversa il modulo Name: Assignments: Type: Identificatore unico del modulo specifica l assegnamento da effettuare ogni volta che un entità attraversa il modulo. Per modificare variabili di sistema utilizzare Other.

Moduli di Flowchart (5) Decide 0 False 0 True Instradamento logico di un entità Permette di implementare processi che decidono. In base alla condizione l entità viene instradata su uno dei 2 rami di uscita del modulo. Name: Type: identificativo del modulo decisione su condizione (es: Entity.WaitTime >= 2) oppure su base probabilistica (es: 50% true) Esempi: rilavorazione di parti difettose, selezione di diversi tipi di clienti, regole di dispatching, selezione del server in stadi multi-processore

Moduli di Flowchart (6) Record Salvataggio di dati e/o statistiche Permette di collezionare statistiche Name: identificativo del modulo Type: Tipo di statistica Count: incremento/decremento di una statistica Entity statistics: statistiche generali sulle entità (informazioni su tempi e costi) Time Interval: differenza tra il valore di un attributo e il tempo corrente di simulazione Time Between: tempi di interarrivo delle entità nel modulo Expression: espressione specifica

Moduli di Flowchart (7) Batch 0 Raggruppamento di più entità Le entità che raggiungono il modulo attendono in una coda fino a quando il lotto non è completato. A quel punto viene generata una entità rappresentativa del lotto. Name: Type: Batch Size: Save Criterion: Rule: Identificativo del modulo Tipo di raggruppamento (Temporaneo o Permanente) Dimensione del lotto Criterio per assegnare il valore all attributo rappresentante (First, Last, Sum, Product) Regola di batching: tutte le entità (any Entity) o solo quelle con caratteristiche date (by Attribute) Esempi: assemblaggio, raggruppamento di utenti in particolari trasporti,...

Moduli di Flowchart (8) Separate 0 0 Original Duplicate Separazione di più entità Permette di duplicare entità singole o di separare lotti precedentemente creati con il modulo Batch. Name: Type: Percent Cost to Duplicates: # of Duplicates: Identificativo del modulo Tipo di separazione (Duplicate Original, Split Existing Batch) Allocazione dei tempi e costi delle entità entranti nei duplicati uscenti. Numero di duplicati Esempi: separare i singoli oggetti di un container, avviare diverse pratiche da un ordine di produzione (e.g., ordine e fattura),...

Esempi (basic Process) Moduli Modulo Process (Smart007) Modulo Assign (Smart022) Modulo Decide (Smart005) Modulo Record (Smart163) Moduli Batch e Separate (Smart002) Batching by Attribute (Smart057) Uso delle espressioni (Smart026) Animazione Animazione nei flowcharts (Smart035) Animazione delle entità (Smart023) Animazione dello stato delle risorse (Smart010)

Esempi (basic Process) Code Numero di clienti in coda (Smart058) Tempo trascorso nel sistema (Smart043) Abbandono della coda (Smarts154) Disciplina di attesa per priorità (Smarts158) Gestione di code miste (Smarts115) Gestione dinamica delle priorità (Smarts085) Risorse Schedulazione di risorse (Smarts114) Risorse a capacità multipla (Smarts004) Report sui costi delle risorse (Smarts019) Seizing multiplo (Smarts118)

Advanced Transfer (1) Station Stazione fisica Definisce una stazione corrispondente ad una locazione fisica o logica dove avviene il processamento di una entità Name: Station Type: Station Name: Identificativo del modulo Stazione singola o insieme di stazioni Identificativo della stazione Esempi: isole di lavorazione, punti di carico o scarico merce,

Advanced Transfer (2) Enter Stazione fisica (advanced) E una versione avanzata del modulo Station. Una entità può raggiungere il modulo anche attraverso una connessione grafica Name: Station Type: Station Name: Delay: Allocation: Transfer In: Identificativo del modulo Stazione singola o insieme di stazioni Identificativo della stazione Ritardo che subisce l entità che arriva e che tipicamente rappresenta il tempo di scarico da un transfer device categorie di tempo e costo in cui verrà contabilizzato il ritardo indica la risorsa (eventualmente) da liberare quando l entità entra nel modulo. La risorsa può essere un trasportatore, un conveyor o una risorsa generica

Advanced Transfer (3) Route Trasferimento di una entità Smista l entità alla sua stazione di destinazione Name: Identificativo del modulo Route Time: Tempo di trasferimento alla stazione di destinazione Destination Type: Station oppure Sequential Le entità trasferite con il modulo Route possono essere animate associando opportune stazioni grafiche alle stazioni corrispondenti ai punti di partenza e di arrivo delle entità.

Advanced Transfer (4) Leave Trasferimento di un entità (advanced) E una versione avanzata del modulo Route Name: Allocation: Transfer Out: Queue Type: Connect Type: Identificativo del modulo categorie di tempo e costo in cui verrà contabilizzato il ritardo Indica il tipo di risorsa necessaria per il trasferimento (request transporter, access conveyor, seize resource o none) Indica la disciplina di attesa per il trasferimento Indica qual è la modalità di trasferimento dell entità (Connect, Convey, Route, Transport) Tipicamente Transfer Out e Connect Type concordano sul mezzo di trasporto; per esempio Transfer Out = Request Transporter implica Connect Type = Transport

Advanced Transfer (5) Request Assegnamento di transporter a entità L entità attende nel modulo fino a quando il transporter selezionato non arriva nella locazione dell entità. Name: Transporter Name: Selection Rule: Velocity: Queue Type: identificativo del modulo indica il transporter richiesto regola si selezione del transporter (Cyclical, Random, Preferred Order, Specific Member, Largest Distance, e Smallest Distance) specifica la velocità con la quale il transporter specificato si muoverà verso la stazione richiedente disciplina adottata per l attesa di un transporter

Advanced Transfer (6) Transport Spostamento di transporter e entità Il trasferimento avviene tra 2 stazioni ed è possibile solo se l entità ha già acquisito il controllo del transporter con il modulo Request. Name: Transporter Name: Destination Type: Station Name: Velocity: Identificativo del modulo Indica in transporter da utilizzare Sequential oppure Station Stazione di destinazione specifica la velocità con la quale il transporter specificato si muoverà verso la stazione di destinazione

Advanced Transfer (7) Free Rilascio di un transporter Se non richiesto da altre entità, il transporter attenderà inattivo presso la stazione di destinazione dell entità. Name: Transporter Name: Identificativo del modulo nome del transporter che sarà liberato. Se non specificato sarà l ultimo transporter allocato all entità in ordine di tempo

Esempi (advanced Transfer) Moduli Modulo Route (Smarts073) Routing delle entità (Smarts169) Moduli Request Transport Free (Smarts146) Moduli Leave Transport Free (Smarts148) Altri Esempi PickStation tra stazioni singole (Smarts113) PickStation in un set di Stazioni (Smarts138)

Esempi (Advanced) Sottomodelli (Smarts008) Scrittura su file e Lettura da file (Smarts154 e Smarts162) Variabili di Sistema (Smarts144) Variabili associate alle code (Smarts141) Variabili associate alle risorse (Smarts139) Entità che fungono da logica di controllo (Smarts018) Condizioni avanzate di terminazione (Smarts130) Automation (Smarts182) Lettura da Excel con Automation (Smarts100) User Function in Automation (Smarts161) Animazione (Smarts074)

Esempi (sistemi di produzione) Blocking Flow Line (Smart125) Flow Line con buffer limitati (Smarts082) Parallel machine (Smarts173) Job Shop A (Smarts172) Job Shop B (Smarts168)

Parte 6 Scelta delle distribuzioni di input

Motivazioni Per eseguire simulazioni che comprendono sorgenti di incertezza si devono selezionare le loro distribuzioni di probabilità la simulazione procede generando valori (realizzazioni) dalle distribuzioni scelte Esempio: La simulazione di un lancio di un dado si ottiene scegliendo una legge di probabilità con 6 valori equiprobabili. Dati reali (se possono essere collezionati) sulla v.a. di interesse guidano la scelta della distribuzione

Metodi basati su dati reali 1. I dati collezionati sono utilizzati direttamente per alimentare la simulazione (Trace-driven simulation) 2. I dati collezionati sono utilizzati per definire una distribuzione empirica che li descriva 3. I dati collezionati sono utilizzati per individuare una distribuzione teorica che li rappresenti (1) è consigliato nella validazione del modello, ma non permette una analisi previsionale (2) preferibile a (1) (3) preferibile a (2) quando possibile

Distribuzione Teorica vs. Distribuzione Empirica una DE può presentare irregolarità dipendenti dai dati (particolarmente se i dati sono scarsi), mentre una DT rappresenta meglio il comportamento generale. una DE non permette la generazione di realizzazioni al di fuori degli intervalli osservati (i.e., può escludere eventi eccezionali ) le DT possono essere modificate più semplicemente delle DE, in quanto è sufficiente modificare i suoi parametri. Esempio: variazione nella frequenza media degli arrivi

Distribuzione Teorica vs. Distribuzione Empirica anche in casi in cui esistono motivi fisici per scegliere una DT, è consigliabile l utilizzo di serie storiche come supporto empirico (validazione) in numerosi casi pratici non esiste una DT che presenta un buon fitting con i dati osservati. Una DT può generare valori molto grandi (anche se con probabilità molto basse) che non corrispondono a realizzazioni praticamente significative

Distribuzioni empiriche osservazioni X 1,, X n ordinate per valori crescenti Distribuzione continua lineare a tratti: F( x) = 0 se x < X1 i 1 x Xi se Xi x Xi, per i,..., n n + < + 1 = 1 1 1 ( n 1)( Xi+ 1 Xi ) 1 se x Xn 1 4/5 3/5 2/5 1/5 X 1 X 2 X 3 X 4 X 5 X 6

Esempio Valori osservati: 0.4, 1, 2, 2.5, 3, 3.6, 4 F( x) = 0 se x < X1 i 1 x Xi se Xi x Xi, per i,..., n n + < + 1 = 1 1 1 ( n 1)( Xi+ 1 Xi ) 1 se x Xn 1 5/6 2/3 1/2 1/3 1/6 0.4 1 2 2.5 3 3.6 4

Scelta di una distribuzione teorica Step 1: Verifica dell indipendenza delle osservazioni Step 2: Identificazione di una famiglia candidata di distribuzioni Step 3: Stima dei parametri Step 4: Verifica sui dati reali della rappresentatività della distribuzione

Step 1: Indipendenza delle osservazioni Molte tecniche per la scelta di una distribuzione teorica richiedono che le osservazioni X 1, X 2,, X n siano indipendenti. In certi casi le osservazioni collezionate in un intervallo di tempo possono essere dipendenti. Esempio. X 1, X 2,, X n rappresentano le temperature misurate ogni ora in una certa città, a partire dalla mezzanotte: campioni vicini in tempo sono positivamente correlati Esempio. X 1, X 2,, X n rappresentano i ritardi dei clienti misurati nella coda di un sistema a singolo servente: se la frequenza media degli arrivi è paragonabile al service rate medio il sistema è soggetto a congestione e gli X i sono positivamente correlati.

Correlazione di variabili aleatorie Siano date n coppie di realizzazioni, (X 1, Y 1 ), (X 2, Y 2 ),, (X n, Y n ) di 2 v.a. X e Y. X e Y sono v.a. correlate se il coefficiente di correlazione è non nulla: ρ = E[( X = E[ X Y i i E( X ))(( Y i ] E( X ) E( Y ) i E( Y )))]

Diagrammi a scattering 0,6 0,4 0,2 Y v.a. non correlate (ρ = -0,004) 0-0,6-0,4-0,2 0 0,2 0,4 0,6-0,2 X -0,4-0,6 0,6 0,4 0,2 Y v.a. correlate (ρ = 0,9958) 0-0,6-0,4-0,2 0 0,2 0,4 0,6-0,2 X -0,4-0,6

Auto-correlazione Una tecnica informale per verificare l indipendenza di un insieme di dati X 1, X 2,, X n è basata sulla stima del coefficiente di autocorrelazione tra tutte le coppie di osservazioni distanti j : ρˆ j n j i= 1 = ( X i X n ( n )( X j) S i+ j 2 n X n ) Se le osservazioni X 1, X 2,, X n sono indipendenti, allora ρ j = 0 per j = 1, 2,, n-1 Dato che ρˆ j è una stima di ρ, può essere ρˆ j 0 anche se le X i sono indipendenti. Tuttavia, valori molto distanti da 0 sono un forte indizio della dipendenza delle osservazioni

Diagrammi di auto-correlazione: esempio 0,2 0,15 0,1 0,05 0-0,05-0,1-0,15 ρˆ j 1 3 5 7 9 11 13 15 17 19 j max = 0.159 min = -0.129 Diagramma da 100 realizzazioni indipendenti di una distribuzione esponenziale con β = 1

ρˆ Diagrammi di auto-correlazione: esempio j 1 0,8 0,6 max = 0.77 0,4 0,2 0-0,2 1 3 5 7 9 11 13 15 17 19 j min = -0.22-0,4 Diagramma da 100 ritardi in coda di un M/M/1 con ρ = 0.8

Step 2: Ipotizzare una distribuzione Ipotesi teorica: il ruolo della sorgente di incertezza può suggerire la scelta o l eliminazione di una distribuzione dall insieme delle candidate Esempio. Se gli arrivi ad un centro di servizio sono individuali, ad un rate costante e tali che i numeri di clienti che arrivano in intervalli disgiunti sono indipendenti, esistono ragioni teoriche per ipotizzare che i tempi di interarrivo siano v.a. IID con distribuzione esponenziale Esempio. I tempi di servizio di una facility non sono modellati da una (generica) distribuzione normale, in quanto le sue realizzazioni possono assumere valori negativi.

Distribuzione Bernoulli p( x) = 1 p 0 p se x = 0 se x = 1 altrimenti p 1- p p(x) 0 F( x) = 1 p 1 se x < 0 se 0 x < 1 se1 x Range: {0, 1} Parametri: p (0,1) Valor medio: E(X) = p Varianza: V(X) = p(1 p ) 0 1 Applicazioni: esperimento con due possibili risultati

Distribuzione Binomiale p( x) = n p x 0 x (1 p) n x se x { 0,1, K, n} altrimenti p(x) 0.6 0.5 0.4 0.3 0.2 0.1 0 t = 5 p = 0.5

Distribuzione Binomiale Range: {0, 1} Parametri: n > 0 intero, p (0,1) Valor medio: E(X) = np Varianza: V(X) = np(1 p) Applicazioni: numero di successi in n esperimenti bernoulliani ciascuno con probabilità p di successo; numero di parti difettose in un lotto di dimensione n;

Distribuzione di Poisson p( x) = e 0 λ ( λ) k! k per k = 0,1, 2,...; altrimenti 0,25 0,2 λ = 4 0,15 0,1 λ = 8 0,05 0 0 5 10 15 20 25

Distribuzione di Poisson Range: N Parametri: λ > 0 Valor medio: E(X) = λ Varianza: V(X) = λ Applicazioni: processi di arrivo poissoniani; numero di eventi in processi senza memoria; clienti in una giornata, telefonate in un ora,

Ipotizzare una distribuzione: v.a. discrete Tecnica del diagramma a bastone: X 1, X 2,, X n dati Per ogni possibile valore x j che può essere assunto dai dati sia h j la proporzione degli X i pari a x j. Definire il diagramma con un segmento verticale di altezza h j in corrispondenza di ciascun valore x j. Confrontare graficamente la forma di h(x) con la legge di probabilità ipotizzata

1 a x b f ( x) = b a 0 altrimenti Distribuzione uniforme: U(a,b) 0 se x < a x a F( x) = se a x b a b x b a 1 se x > b Range: [a, b] Parametri: a, b con a < b; Valor medio: E(X) = (a + b)/2 Varianza: V(X) = (b a) 2 /12 f (x) 1 b a Applicazioni: utilizzata come primo modello nei casi in cui l informazione disponibile è scarsa. Nei simulatori è utilizzata per derivare le altre distribuzioni

Distribuzione esponenziale: expo(λ) f ( x) λe = 0 λx x 0 altrimenti f (x) 1,2 1 0,8 0,6 expo(1) 1 e F( x) = 0 λx se x 0 altrimenti 0,4 0,2 0 0 0,4 0,8 1,2 1,6 2 2,4 2,8 3,2 3,6 4 4,4 4,8 5,2 5,6 6 6,4 6,8 Range: [0, ) Parametri: λ > 0 Valor medio: E(X) = 1/λ Varianza: V(X) = 1/λ 2 Applicazioni: tempi di interarrivo quando il numero di arrivi in un intervallo di tempo fissato ha una distribuzione di Poisson

Distribuzione normale: N( µ,σ ) f (x) 0,45 f ( x µ ) 1 2 2σ ( x) = e 2πσ 2 0,4 0,35 0,3 0,25 0,2 0,15 0,1 0,05 0 N(0,1) -4-3,6-3,1-2,7-2,2-1,8-1,4-0,9-0,5-0 0,4 0,84 1,28 1,72 2,16 2,6 3,04 3,48 3,92 Range: (-, ) Parametri: µ R, σ > 0 Valor medio: E(X) = µ Varianza: V(X) = σ 2 Applicazioni: La distribuzione normale è la distribuzione limite di molte altre distribuzioni di probabilità. Può quindi essere utilizzata per variabili che descrivono disturbi risultati da tante piccole azioni (ritardi dovuti al traffico, errori di misura, )

Distribuzione Gamma: gamma(α, β ) f ( x ) = β 0 α x ( α α 1 e 1)! x / β se x 0 altrimenti α x / β 1 e = F( x ) j = 0 ( x / β ) j! Range: [0, ) Parametri: a > 0, β > 0 Valor medio: E(X) = αβ Varianza: V(X) = αβ 2 1 0 j se x 0 altrimenti solo per α intero: distribuzione Erlang Applicazioni: buona approssimazione di tempi di servizio: expo(1/β) = gamma(1,β); tempo totale di servizio di a serventi in serie ognuno con tempi di servizio esponenziali

Distribuzione Gamma: gamma(α, β ) 63.185 80 ( ) (, +, β, t0) (, +, β+ 0.02, t0) (, +, β+ 0.02, t0) gamd z ix, α, β, t0 gamd z ix α 1 gamd z ix α 1 gamd z ix α 3 60 40 20 α α+1 α+2 α+3 0.1 0 0 10 20 30 40 0 ix 40

Ipotizzare una distribuzione: v.a. continue Tecnica dell istogramma: X 1, X 2,, X n dati suddividere l intervallo dei valori coperti dai dati in k intervalli adiacenti [b 0, b 1 ), [b 1, b 2 ),, [b k-1, b k ) di uguale ampiezza b. Per j = 1, 2,, k definire h j come la proporzione degli X i contenuti nell intervallo j. Definire la funzione: h h 0 se ( x) = j se bj 1 0 se x < b x < b, x b 0 k j per j =1,...,k Confrontare graficamente la forma di h( x ) con la ddp ipotizzata.

Fondamento del metodo Sia X una v.a. distribuita come gli X i, con ddp f. Allora, per j fissato, j =1, 2,, k, risulta: P ( bj 1 X b j ) = b b j j 1 f ( x) dx = b f ( y j ) per un certo y j ( b j 1, b j ) teorema del valor medio Ma h j approssima P ( b j 1 j X b ) h( y j ) = h j b f ( y j ) Quindi, h( y ) è approx. proporzionale a f ( y ) h ed f hanno forme simili Difficoltà: non esistono criteri generali per scegliere k. Regola di Sturges: k = 1 + log 2 n. In genere, preferibile scegliere il più piccolo k che genera un istogramma smooth

Esempi X i ~ N(0,1) 35 30 25 20 15 10 5 0 k = 3 12 10 k = 11 8 6 4 2 0 1 2 3 1 2 3 4 5 6 7 8 9 10 11 3,5 3 2,5 k = 41 2 1,5 1 0,5 0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41

Step 3: Stima dei parametri Definizione. La popolazione oggetto è la totalità degli elementi in esame dai quali si vogliono ottenere informazioni (es: una v.a. X). Definizione. Un campione è un gruppo di elementi estratti da una popolazione (es: un certo numero di realizzazioni di X) allo scopo di raccogliere informazioni sulla popolazione stessa. Il campione è casuale se le estrazioni degli elementi sono indipendenti. Definizione. Una statistica campionaria è una funzione delle realizzazioni di una v.a., a sua volta v.a. osservabile. Il valor medio di una statistica campionaria può essere utilizzato per stimare un parametro della funzione di distribuzione della popolazione.

Problema: Metodi per la stima dei parametri Data la distribuzione di probabilità f della popolazione, determinare sulla base di un campione X 1,,X n un valore per ognuno dei parametri che caratterizzano f che sia la miglior approssimazione possibile dei parametri incogniti. Stime puntuali Metodo dei momenti Si impone che i parametri della distribuzione coincidano con gli stimatori forniti dalle statistiche campionarie (media e varianza campionaria) 2. Metodo della massima verosimiglianza Si determinano i parametri in modo che sia massima la probabilità che i campioni osservati siano stati estratti dalla distribuzione ipotizzata Stime per intervalli Intervalli di confidenza Si determina un intervallo in cui il parametro che si sta stimando cade con probabilità fissata.

Statistiche campionarie: media e varianza campionaria X 1, X 2,, X n osservazioni di variabili aleatorie IID ognuna con valor medio E(X i ) = µ e varianza Var(X i ) = σ 2 [non noti] Media campionaria X( n) n i = = 1 X n i stimatore corretto di µ, i.e., E[ X( n)] = µ Varianza campionaria S 2 n [ X i X( n)] i = 1 ( n) = n 1 2 stimatore corretto di σ 2, i.e., 2 E[ S ( n)] = σ 2

Stima di Var(X( n )) Motivazione: X(n) è una v.a. con varianza Var[ X( n)] e può differire notevolmente da µ in alcuni esperimenti. 1 n 1 n 1 n 2 Var [ X( n)] = Var( X i ) = E( X i µ ) = Var( 2 X n n n i = 1 i = 1 i = 1 i ) = n 1 2 = 1 Var X i n 2 ( ) = σ = σ 2 n n n i = 1 2 indipendenza degli X i 2 S ( n) n Estimatore corretto di Var[ X( n)]

Massima verosimiglianza Dati osservati IID: X 1, X 2,, X n ddp ipotizzata: f θ (x), parametro ignoto θ Una misura della probabilità di aver ottenuto le osservazioni X 1, X 2,, X n proprio dalla distribuzione ipotizzata è data dalla funzione di verosimiglianza: L(θ)= f θ (X 1 ) f θ (X 2 ) f θ (X n ) Il metodo della massima verosimiglianza consiste nello scegliere come estimatore del valore ignoto θ il valore θˆ che massimizza L(θ)