Simulazione. rappresentare sistemi reali anche complessi tenendo conto anche delle sorgenti di incertezza;

Dimensione: px
Iniziare la visualizzazioe della pagina:

Download "Simulazione. rappresentare sistemi reali anche complessi tenendo conto anche delle sorgenti di incertezza;"

Transcript

1 3 Simulazione Con il termine simulazione si intende la riproduzione del comportamento di un sistema. In generale, si parla di simulazione sia nel caso in cui viene utilizzato un modello concreto, sia nel caso in cui viene utilizzato un modello astratto che riproduce la realtà mediante l uso del computer. Un esempio di modello concreto è il modello in scala di una nave che viene poi posto in un apposita vasca per effettuare prove simulate allo scopo di stimare opportune misure di prestazione. È chiaro che esistono, leggi teoriche della fisica dalle quali ottenere informazioni sulle prestazioni della nave, ma le analisi di queste leggi è spesso troppo complicata, per essere effettuata; naturalmente, è anche impraticabile (o quanto meno non conveniente) la costruzione reale della nave e la prova diretta in mare. All interno della Ricerca Operativa, la simulazione utilizza modelli astratti che vengono costruiti al fine di replicare le caratteristiche di un sistema. Essa gioca un ruolo molto importante soprattutto nel progettare un sistema stocastico e nel definirne le procedure operative: il funzionamento di un sistema è simulato utilizzando distribuzioni di probabilità per generare casualmente eventi del sistema e dal sistema simulato si ottengono osservazioni statistiche sulle prestazioni dello stesso. Naturalmente affinché ciò possa essere realizzato è necessario costruire un modello di simulazione, che permetta di descrivere le operazioni di un sistema e come esse devono essere simulate. Gli aspetti rilevanti che fanno della simulazione uno strumento largamente utilizzato sono legati al fatto che essa permette di rappresentare sistemi reali anche complessi tenendo conto anche delle sorgenti di incertezza; 115

2 116 SIMULAZIONE riprodurre il comportamento di un sistema in riferimento a situazioni che non sono sperimentabili direttamente. D altra parte deve essere sempre tenuto sempre ben presente il fatto che la simulazione fornisce indicazioni sul comportamento del sistema, ma non risposte esatte; l analisi dell output di una simulazione potrebbe essere complessa e potrebbe essere difficile individuare quale può essere la configurazione migliore; l implementazione di un modello di simulazione potrebbe essere laboriosa ed inoltre potrebbero essere necessari elevati tempi di calcolo per effettuare una simulazione significativa. 3.1 GENERALITÀ SUI MODELLI DI SIMULAZIONE Come abbiamo già osservato, per simulare il comportamento di un sistema è necessario costruire un modello di simulazione. Il modello dovrà essere sufficientementre complesso da rispondere alle esigenze dal caso, ma deve comunque rimanere il più semplice possibile. Devono inotre essere chiari i limiti di utilizzo del modello stesso Elementi di un modello di simulazione Vediamo ora gli elementi che costituiscono un modello di simulazione. Variabili di stato Innanzitutto ricordiamo che un sistema è descritto in ogni istante di tempo da un insieme di variabili che prendono nome di variabili di stato. Quindi, ad esempio, in riferimento ad un sistema a coda, è una variabile di stato il numero degli utenti presenti nel sistema in un certo istante di tempo. Ricordiamo, inoltre, che esistono sistemi discreti in cui le variabili cambiano istantaneamente in corrispondenza di precisi istanti di tempo che sono finiti oppure appartenenti ad un insieme numerabile e sistemi continui in cui le variabili variano con continuità rispetto al tempo. Si osservi fin d ora che la scelta di un modello continuo o discreto da utilizzare non è necessariamente obbligata dalla tipologia del sistema; si può infatti decidere, ad esempio, di costruire un modello discreto per un sistema continuo, a seconda dello studio che si vuole effettuare. Un esempio tipico è il caso in cui nel rappresentare una linea ferroviaria, la posizione del treno può essere descritta da una variabile reale che fornisce la distanza dalla stazione di origine, oppure da variabili binarie che descrivono lo stato libero occupato di ciascuna delle sezioni di blocco in cui è divisa la linea.

3 GENERALITÀ SUI MODELLI DI SIMULAZIONE 117 Eventi Si definisce evento un qualsiasi accadimento istantaneo che fa cambiare il valore di almeno una delle variabili di stato. L arrivo di un utente ad un sistema a coda è un evento, così come il completamento di un servizio. Esistono eventi esterni al sistema (eventi esogeni) ed eventi interni (eventi endogeni). Ad esempio, l inizio del servizio ad un utente che è in coda in un sistema a coda è un evento endogeno, perché interno al sistema; l arrivo di un utente ad un sistema a coda è un evento esogeno. Entità e attributi Le entità sono singoli elementi del sistema che devono essere definiti. Un esempio di entità è un utente presso un sistema a coda, oppure può essere un servente. Nel primo caso l entità fluisce all interno del sistema e si parla di entità dinamica, nel secondo caso si parla di entità statica. Le entità possono essere caratterizzate da attributi che forniscono un valore di un dato assegnato all entità stessa. Ad esempio, in un sistema a coda monoservente dove le entità sono il servente e gli utenti, un attributo di un entità utente potrebbe essere il suo tempo di arrivo al sistema, mentre il servente è caratterizzato dall attributo status che può assumere valore di libero o occupato. È chiaro che alcuni attributi possono essere di interesse in alcuni casi e non in altri. Le entità possono essere raggruppate in classi che sono insiemi di entità dello stesso tipo, ovvero si possono raggruppare le entità in base ad attributi. Se, ad esempio, consideriamo persone di sesso maschile e femminile come utenti di un sistema a coda, essendo le entità le persone, esse possono essere raggruppate in dua classi in base all attributo sesso. Risorse Le risorse sono elementi del sistema che forniscono un servizio alle entità. Un entità può richiedere una o più unità di risorsa e se questa non è disponibile l entità dovrà mettersi, ad esempio, in una coda in attesa che si renda disponibile, oppure intraprendere un altra azione. Se invece la risorsa è disponibile, essa viene catturata dall entità, trattenuta per il tempo necessario e poi rilasciata. Un esempio di risorsa potrebbe essere data da un operaio che sovrintende il funzionamento di una macchina che non può funzionare senza l operaio stesso; quando è richiesto l utilizzo di questa macchina, se la risora operaio è disponibile allora l esecuzione del lavoro è effettuata altrimenti si attende che ci sia risorsa (operaio) disponibile. L operaio verrà trattenuto per la durata dell esecuzione del lavoro e poi rilasciato. Si osservi che, in generale, un elemento del modello potrebbe essere considerato parimenti un entità o una risorsa. Questo, ovviamente, dipende da come si è scelto di costruire un modello.

4 118 SIMULAZIONE Attività e ritardi Un attività è un operazione la cui durata è nota a priori all inizio dell esecuzione dell attività stessa. Tale durata può essere una costante, un valore aleatorio generato da una distribuzione di probabilità, oppure data in input o calcolata in base ad altri eventi che accadono nel sistema. Un esempio è dato dal tempo di servizio in un sistema a coda. Un ritardo è un periodo di tempo di durata indefinita che è determinata dalle condizioni stesse del sistema. Il tempo che un entità trascorre presso una coda prima che si liberi una risorsa della quale necessita è un ritardo Classificazione dei modelli si simulazione I modelli di simulazione si possono classificare in base a diversi criteri; una prima distinzione già vista è tra modelli continui, in cui le variabili variano con continuità; modelli discreti, in cui il valore delle variabili cambia in ben definiti istanti di tempo. Un altra distinzione è tra: modelli statici, che rappresentano un sistema in un particolare istante di tempo; modelli dinamici, che rappresentano un sistema in evoluzione nel tempo. Infine, si possono distinguere modelli deterministici, che non contengono componenti probabilistici; modelli stocastici, che presentano elementi soggetti ad aleatorietà. In questa trattazione considereremo modelli di simulazione discreti, dinamici, stocastici che vengono comunemente chiamati modelli di simulazione ad eventi discreti. Molte applicazioni sono ben rappresentate da modelli di questo tipo ed inoltre approssimando variazioni continue con variazioni discrete è possibile utilizzare modelli ad eventi discreti anche per approssimare il comportamento di sistemi continui semplificando quindi molto l analisi Simulazione ad eventi discreti Nella simulazione ad eventi discreti il sistema è rappresentato, nella sua evoluzione nel tempo, con variabili che cambiano instantaneamente il loro valore in ben definiti istanti di tempo appartenenti ad un insieme numerabile. Questi istanti sono quelli nei quali accadono gli eventi. È chiaro che, essendo questi modelli di natura dinamica, è necessario registrare, ovvero tenere memoria, del tempo

5 GENERALITÀ SUI MODELLI DI SIMULAZIONE 119 (simulato) che procede. In particolare sarà necessario definire un meccanismo di avanzamento del tempo per far procedere il tempo simulato da un valore ad un altro. La variabile che in un modello di simulazione fornisce il valore corrente del Simulation tempo simulato si chiama simulation clock, ed esistono due modi per definire clock il suo avanzamento: avanzamento del tempo al prossimo evento, avanzamento del tempo ad incrementi prefissati. Il primo è quello più diffuso ed è quello a cui faremo riferimento. In questo caso il simulation clock è inizializzato a zero e viene avanzato al tempo dell accadimento del primo degli eventi futuri; poi il sistema viene aggiornato tenendo conto dell evento che è accaduto, si aggiornano i tempi degli eventi futuri e si itera il procedimento. A differenza dell avanzamento ad incrementi prefissati, i periodi di inattività non vengono considerati. Un esempio può essere visto considerando un sistema di code in cui gli eventi sono l arrivo di un cliente, la conclusione di un servizio; entrambi sono eventi perché provocano il cambiamento di valore di qualche variabile di stato. Il meccanismo di avanzamento del tempo segue in questo caso l accadere di questi due eventi nell ordine cronologico in cui essi si verificano. Un esempio di simulazione ad eventi discreti Vediamo, ora, un semplice esempio di come si realizza un simulazione ad eventi discreti. Consideriamo a tale scopo un sistema a coda costituito da una coda e da un singolo servente e supponiamo che i tempi di interarrivo siano uniformemente distribuiti tra 1 e 3 minuti e che anche i tempi di servizio siano uniformemente distribuiti tra 0.5 e 2 minuti. Vediamo, ora, come si può effettuare una simulazione di questo sistema. Poiché si tratta di un sistema regolato da due processi stocastici (gli arrivi e i servizi) per generare gli eventi è necessario generare osservazioni casuali dalle due distribuzioni di probabilità che regolano i due processi (come questo può essere effettuato sarà oggetto di considerazioni successive nel paragrafo??). Supponiamo di avere a disposizione le due liste che forniscono, rispettivamente i tempi di interarrivo generati casualmente dalla distribuzione corrispondente e i tempi di servizio anch essi generati casualmente dalla distribuzione corrispondente: Tempi di interarrivo Tempi di servizio

6 120 SIMULAZIONE Supponendo che al tempo t = 0 nessun utente è presente nel sistema. Osservando i valori campionati riportati nelle due liste, si ricava facilmente la successione degli eventi: Tempo t Eventi 1.9 arriva un utente inizia il servizio 3.2 arriva un utente e si pone in coda 3.6 finisce un servizio e il primo utente in coda inizia il servizio 4.3 arriva un utente e si pone in coda 5.3 arriva un utente e si pone in coda 5.4 finisce un servizio e il primo utente in coda inizia il servizio.. Limitando questa semplice simulazione al tempo t = 5.4 (in modo che due utenti sono entrati e hanno completato il servizio), possiamo calcolare, ad esempio, il tempo medio di permanenza nel sistema: il primo utente rimane nel sistema 1.7 minuti, il secondo 2.2 minuti e quindi il valore medio è Questa stima, ovviamente non ha alcun senso perché ottenuta dalla particolare sequenza di numeri casuali delle due liste. Quindi, se l esempio da un lato vuole mettere evidenza il meccanismo di una simulazione ad eventi discreti, dall altro mette fin d ora in evidenza un errore che si potrebbe commettere nel reputare affidabili i risultati di una sola esecuzione e che ha avuto una durata arbitraria. D altra parte c è anche da tener presente che se siamo interessati a valutare misure di prestazioni del sistema a regime, ovvero quando sono state raggiunte condizioni di stazionarietà, sarà necessario non prendere in considerazione il sistema durante il periodo iniziale di transitorio. Queste problematiche rappresentano un elemento chiave di ogni simulazione e saranno considerate in dettaglio nel seguito Schema dello studio di un problema basato sulla simulazione In questo paragrafo riportiamo uno schema che descrive la successione delle varie fasi che caratterizzano uno studio basato sulla simulazione. 1. Analisi del problema Consiste nel comprendere il problema cercando di capire quali sono gli scopi dello studio e di identificare quali sono le componenti essenziali e quali sono le misure di prestazione che interessano. Naturalmente, se una versione del sistema è già operativa, si deve osservare tale sistema per dedurne le caratteristiche fondamentali. 2. Formulazione del modello di simulazione Poiché stiamo trattando sistemi stocastici, per formulare un modello di si-

7 GENERALITÀ SUI MODELLI DI SIMULAZIONE 121 mulazione è necessario conoscere le distribuzioni di probabilità delle quantità di interesse. Infatti, per generare vari scenari rappresentativi di come un sistema funziona, è essenziale che una simulazione generi osservazioni casuali da queste distribuzioni. Ad esempio, nei sistemi a coda è necessaria la distribuzione dei tempi di interarrivo e i tempi di servizio; nella gestione delle scorte è necessaria la distribuzione della richiesta dei prodotti e la distribuzione del tempo tra un ordine e il ricevimento della merce; nella gestione dei sistemi di produzione con macchine che occasionalmente possono guastarsi, sarà necessario conoscere la distribuzione del tempo fino a che una macchina si guasta e la distribuzione dei tempi di riparazione. Generalmente è possibile solo stimare queste distribuzioni derivandole, ad esempio, dall osservazione di sistemi simili già esistenti. Se dall analisi dei dati si vede che la forma di questa distribuzione approssima una distribuzione tipo standard, si può utilizzare la distribuzione teorica standard effettuando un test statistico per verificare se i dati possono essere rappresentati bene mediante quella distribuzione di probabilità. Se non esistono sistemi simili dai quali ottenere dati osservabili si deve far ricorso ad altre fonti di informazioni: specifiche delle macchine, manuali di istruzioni delle stesse, studi sperimentali, etc. La costruzione di un modello di simulazione è un procedimento complesso. In particolare, facendo riferimento alla simulazione ad eventi discreti, la costruzione di un modello prevede le seguenti fasi: (a) Definizione delle variabili di stato. (b) Identificazione dei valori che possono essere assunti dalle variabili di stato. (c) Identificazione dei possibili eventi che fanno cambiare lo stato del sistema. (d) Realizzazione di una misura del tempo simulato, simulation clock, che registra lo scorrimento del tempo simulato. (e) Realizzazione di un metodo per generare casualmente gli eventi. (f) Identificazione delle transizioni di stato generate dagli eventi. 3. Analisi del modello di simulazione Nella fase di analisi del modello deve essere verificata l accuratezza del modello realizzato con diverse modalità. Di solito ciò viene fatto attraverso un analisi concettuale del modello che può essere effettuata insieme agli esperti del settore applicativo in modo da evidenziare eventuali errori e/o omissioni.

8 122 SIMULAZIONE 4. Scelta del software e costruzione di un programma Dopo aver costruito il modello, esso deve essere tradotto in un programma. A tale scopo è possibile utilizzare diversi strumenti. Linguaggi general purpose. Linguaggi come C++, FORTRAN, etc. Erano molto utilizzati alla nascita della simulazione ma richiedono molto tempo di programmazione e quindi si preferisce, in genere, utilizzare linguaggi specifici per la simulazione. Linguaggi di simulazione generali. Forniscono molte caratteristiche necessarie per realizzare un modello di simulazione riducendo così il tempo di realizzazione; esempi sono MODSIM, GPSS, SIMSCRIPT, etc. Anche se meno flessibili dei linguaggi general purpose sono il modo più naturale per realizzare un modello di simulazione. Simulatori. Sono packages per la simulazione orientati alle applicazioni. Esistono numerosi pacchetti software di tipo interattivo per la simulazione come ARENA, WITNESS, EXTEND, MICRO SAINT. Alcuni sono abbastanza generali anche se dedicati a specifici tipi di sistemi come impianti industriali, sistemi di comunicazione, altri invece sono molto specifici come, ad esempio, nel caso di simulatori di centrali nucleari o di simulatori della fisiologia cardiovascolare. I simulatori permettono di costruire un programma di simulazione utilizzando menù grafici senza bisogno di programmare. Sono abbastanza facili da imparare e un inconveniente che molti di essi hanno è di essere limitati a modellare quei sistemi previsti dalle loro caratteristiche standard. In ogni caso alcuni simulatori prevedono la possibilità di incorporare routines scritte in un linguaggio general purpose per trattare elementi non standard. Spesso hanno anche capacità di animazione per mostrare la simulazione in azione e questo permette di illustrare facilmente la simulazione anche a persone non esperte. Fogli elettronici (spreadsheets). Quando si hanno problemi di piccole dimensioni si possono anche utilizzare fogli elettronici, come ad esempio Excel, per avere un idea del funzionamento di un sistema. 5. Validazione del modello di simulazione Nella fase successiva è necessario verificare se il modello che è stato realizzato fornisce risultati validi per il sistema in esame. Più in particolare si deve verificare se le misure di prestazione del sistema reale sono bene approssimate dalle misure generate dal modello di simulazione. Ciò è molto

9 GENERALITÀ SUI MODELLI DI SIMULAZIONE 123 difficile da effettuare, specialmente in fase di progettazione quando il sistema reale non esiste. 6. Progettazione della simulazione Prima di passare all esecuzione della simulazione è necessario decidere come condurre la simulazione. Spesso una simulazione è un processo che evolve durante la sua realizzazione e dove i risultati iniziali aiutano a condurre la simulazione verso configurazioni più complesse. Ci sono inoltre problematiche di tipo statistico: la determinazione della lunghezza del transitorio del sistema prima di raggiungere condizioni di stazionarietà, momento dal quale si inizia a raccogliere dati se si vogliono misure di prestazione del sistema a regime; la determinazione della lunghezza della simulazione (durata) dopo che il sistema ha raggiunto l equilibrio. Infatti, si deve sempre tener presente che la simulazione non produce valori esatti delle misure di prestazione di un sistema in quanto ogni singola simulazione può essere vista come un esperimento statistico che genera osservazioni statistiche sulle prestazioni del sistema. Queste osservazioni sono poi utilizzate per produrre stime delle misure di prestazione e naturalmente aumentando la durata della simulazione può aumentare la precisione di queste stime. 7. Esecuzione della simulazione e analisi dei risultati L output della simulazione fornisce stime statistiche delle misure di prestazione di un sistema. Un punto fondamentale è che ogni misura sia accompagnata dall intervallo di confidenza all interno del quale essa può variare. Questi risultati potrebbero evidenziare subito una configurazione del sistema migliore delle altre, ma più spesso verranno identificate più di una configurazione candidata ad essere la migliore. In questo caso potrebbero essere necessarie ulteriori indagini per confrontare queste configurazioni. 8. Presentazione delle conclusioni In conclusione, è necessario redigere una relazione ed una presentazione che riassuma lo studio effettuato, come è stato condotto e includendo la documentazione necessaria. Includere nella presentazione un animazione di una simulazione è di solito molto efficace Applicazioni tipiche della simulazione La simulazione è uno strumento molto flessibile: può essere utilizzata per studiare la maggior parte dei sistemi esistenti. È impossibile enumerare tutte le aree

10 124 SIMULAZIONE specifiche in cui la simulazione può essere utilizzata. Come esempi, riportiamo, di seguito, solo alcune importanti tipiche categorie di applicazioni in cui si usa la simulazione. Progettazione e definizione delle procedure operative di un sistema di servizio. Gestione di sistemi di scorte. Progetto e definizione delle procedure operative di sistemi di produzione. Progetto e funzionamento del sistemi di distribuzione. Analisi dei rischi finanziari. Gestione dei progetti.

11 ELEMENTI DI STATISTICA INFERENZIALE ELEMENTI DI STATISTICA INFERENZIALE In questo paragrafo verranno illustrati alcuni elementi di Statistica che sono essenziali per procedere alla costruzione di un modello di simulazione e per effettuare correttamente una simulazione. Si tratta essenzialmente della stima dei parametri e dei test statistici, elementi chiave per l analisi dell input e dell output di una simulazione. Infatti, per effettuare una simulazione di un sistema che presenta elementi stocastici è necessario specificare le distribuzioni di probabilità che regolano i processi che caratterizzano il sistema stesso. Se è possibile raccogliere dati reali (osservazioni) sulle variabili aleatorie di interesse, essi possono essere utilizzati per determinare queste distribuzioni facendo uso di tecniche di inferenza statistica (analisi dell input). Una volta stabilite tali distribuzioni, la simulazione procede generando valori casuali da queste distribuzioni, ovvero, durante ogni esecuzione, la simulazione genera osservazioni casuali di variabili aleatorie distribuite secondo particolari distribuzioni di probabilità. Oltre che per progettare una simulazione, è necessario l uso di tecniche statistiche anche per interpretare i risultati ottenuti da una simulazione (analisi dell output). La trattazione degli argomenti riportati in questo paragrafo sarà sintetica e considera esclusivamente quegli elementi che risulteranno utili all interno dello studio della simulazione. Per ogni trattamento più esteso e approfondito si rimanda ai testi specifici come, ad esempio [?] Statistiche campionarie e loro distribuzione In generale, nello studio di un fenomeno riguardante un insieme di elementi (popolazione) che presenta caratteristiche aleatorie, molto spesso si dispone solo di informazioni su una parte di essi (campione) e si vogliono dedurre proprietà generali riguardanti l intera popolazione. L inferenza statistica si occupa di questa problematica e riveste un importante strumento di analisi. Solitamente viene fatta l assunzione che esiste una distribuzione di probabilità della popolazione nel senso che se da essa vengono estratti casualmente alcuni elementi, ad essi sono associate variabili aleatorie indipendenti identicamente distribuite secondo tale distribuzione. In questo senso, un insieme di variabili aleatorie X 1,...,X n di variabili aleatorie indipendenti tutte con la stessa distribuzione si dice campione di questa distribuzione. L interesse principale risiede nella possibilità di dedurre caratteristiche della distribuzione non nota sulla base dei dati a disposizione. Naturalmente ci sono casi in cui della distribuzione della popolazione non si conosce nulla (se non il fatto che essa è discreta o continua), mentre in altri casi la distribuzione è nota ma non sono noti alcuni suoi parametri. Esamineremo entrambi i casi, introducendo, innanzitutto alcuni elementi che riguardano le statistiche campionarie e la loro distribuzione.

12 126 SIMULAZIONE Dato un campione X 1,...,X n estratto da una popolazione, ogni funzione delle osservazioni campionarie è chiamata statistica campionaria e i valori ottenuti da una qualsiasi funzione dei soli valori osservati sono chiamati statistiche. I due principali esempi di statistiche sono la media campionaria e la varianza campionaria. Media campionaria e varianza campionaria Sia dato un campione X 1,...,X n estratto da una popolazione, ovvero le X i sono variabili aleatorie indipendenti identicamente distribuite, e sia µ e σ 2 rispettivamente la loro media e la loro varianza (ovvero la media e la varianza della popolazione). Media campionaria La media campionaria è data da X n = 1 n X i. n X n è una variabile aleatoria funzione delle X i e si verifica facilmente che risulta E( X n ) = µ e V ar( X n ) = σ2 n. La varianza campionaria è data da Varianza campionaria s 2 n = 1 n 1 i=1 n ( Xi X ) 2 n i=1 e si verifica facilmente che risulta E(s 2 n) = σ 2. Distribuzione (approssimata) della media campionaria La distribuzione della media campionaria può essere determinata grazie al Teorema del limite centrale. Siano date le osservazioni X 1,...,X n estratte da una distribuzione di probabilità. Le X i sono variabili aleatorie indipendenti identicamente distribuite e sia µ e σ 2 rispettivamente la loro media e la loro varianza. Definendo la variabile aleatoria Z n = X X n µ n σ, n e la sua funzione di distribuzione F n (z) = P(Z n z), il Teorema del Limite Centrale afferma che lim F n(z) = 1 z e y2 2 dy, (3.2.1) n 2π ovvero F n (z) converge alla funzione di distribuzione della distribuzione Normale standard. Questo risultato permette di ottenere l importante proprietà riportata nel seguente teorema riguardante la media campionaria X n.

13 ELEMENTI DI STATISTICA INFERENZIALE 127 Proposizione Sia X 1,...,X n un campione estratto da una distribuzione di probabilità a media µ e varianza σ 2. Allora, per n sufficientemente grande, X n µ σ (3.2.2) n è una variabile aleatoria distribuita approssimativamente secondo la distribuzione Normale standard. Questo risultato si ricava immediatamente dal Teorema del Limite Centrale, osservando che la (3.2.1) può essere interpretata nel seguente modo: per n sufficientemente grande, la variabile aleatoria Z n è distribuita approssimativamente come una variabile Normale standard, indipendentemente dalla distribuzione delle X i. Ricordando che il valore atteso di Xn è µ e che la sua deviazione standard è pari a σ/ n, la Proposizione afferma che se si normalizza X n sottraendo la sua media e dividendo per la sua deviazione standard, si ottiene una variabile aleatoria che è approssimativamente distribuita secondo una Normale standard purché n sia sufficientemente grande. La problematica che nasce nell utilizzare questo risultato sta nel fatto che non è noto quanto deve essere grande n affinché l approssimazione sia buona; naturalmente questo dipende dalla distribuzione in questione. Osservazioni sperimentali hanno portato a formulare la regola empirica comunemente adottata secondo la quale quando n > 30, si ha in genere una buona approssimazione, qualsiasi sia la distribuzione della popolazione considerata. Distribuzioni delle statistiche di popolazioni normali Assumiamo ora che la distribuzione della popolazione sia Normale a media µ e varianza σ 2 e sia X 1,...,X n un campione estratto da tale popolazione. In questo caso ovviamente si ha che la variabile aleatoria (3.2.2) è una variabile Normale standard per qualsiasi valore di n, ovvero vale il seguente risultato. Proposizione Sia X 1,...,X n un campione estratto da una distribuzione di probabilità Normale a media µ e varianza σ 2. Allora X n µ σ n (3.2.3) è una variabile aleatoria distribuita secondo la distribuzione Normale standard.

14 128 SIMULAZIONE Si osservi che avendo assunto che le X i sono variabili aleatorie normali, il risultato ora enunciato non vale più in senso approssimato, come nel caso della Proposizionea 3.2.1, ma è un risultato esatto che vale per qualsiasi valore di n (non necessariamente grande). Si può inoltre dimostrare che vale il seguente importante risultato: Teorema Sia X 1,...,X n un campione estratto da una distribuzione Normale a media µ e varianza σ 2. Allora i) X n e s 2 n sono variabili aleatorie indipendenti; ii) X n è una variabile aleatoria normale con media µ e varianza σ 2 /n; iii) (n 1) s2 n è una variabile aleatoria distribuita secondo la distribuzione σ2 Chi-quadro a n 1 gradi di libertà (χ 2 n 1 ). Questo teorema ha un importante conseguenza che enunciamo nella seguente proposizione. Proposizione Sia X 1,...,X n un campione estratto da una distribuzione di probabilità Normale a media µ. Allora X n µ s n n (3.2.4) è una variabile aleatoria distribuita secondo la distribuzione t di Student con n 1 gradi di libertà (t n 1 ). Confrontando la (3.2.3) e la (3.2.4) si nota che nella Proposizione la variabile aleatoria considerata differisce da quella considerata nella Proposizione per la presenza di s n al posto di σ. Quindi possiamo riepilogare i risultati fino ad ora ottenuti dicendo che, data una popolazione Normale, se si normalizza la media campionaria X n sottraendo la sua media µ e dividendo per la sua deviazione standard σ/ n, si ottiene una variabile aleatoria Normale standard; se invece si divide per s n / n, si ottiene una variabile aleatoria con distribuzione t di Student con n 1 gradi di libertà.

15 ELEMENTI DI STATISTICA INFERENZIALE Stima di parametri Supponiamo ora che la popolazione sia distribuita secondo una distribuzione di probabilità nota, ma caratterizzata da uno o più parametri incogniti. Siamo in questo caso interessati a determinare tali parametri incogniti sulla base di un campione X 1,...,X n. Si tratta di un problema di stima di parametri che consiste nel determinare, sulla base del campione X 1,...,X n, un valore per ciascuno dei parametri in modo che essi costituiscano la migliore approssimazione dei parametri incogniti. Esistono diversi metodi di stima che non sono altro che tecniche per ricavare statistiche e che sono detti stimatori. Uno stimatore è quindi Stimatori e una funzione h(x 1,...,X n ) delle osservazioni campionarie e il valore che tale stime funzione assume in corrispondenza di una particolare realizzazione del campione è detto stima. Se θ è un parametro incognito, si indicherà con θ la stima di θ. In alcuni casi si determina un unico valore θ come migliore approssimazione possibile del parametro θ e tale valore viene detto stima puntuale. In altri casi, può Stima essere preferibile calcolare due valori dello stimatore ovvero θ 1 = h 1 (X 1,...,X n ) puntuale e θ 2 = h 2 (X 1,...,X n ) che definiscono un intervallo [θ 1, θ 2 ] tale che, in un campionamento ripetuto, il valore incognito θ apparterrà all intervallo in una determinata percentuale di casi che è detta confidenza dell intervallo. In questo caso Stima per si parla di stima per intevalli. intervalli Proprietà degli stimatori Continuando ad indicare con θ un parametro incognito, con θ una sua stima e con h = h(x 1,...,X n ) uno stimatore, riportiamo in questo paragrafo alcune definizioni standard. Definizione Si definisce valore dell errore di campionamento la differenza θ θ. Si chiama distorsione di uno stimatore h la differenza E(h) θ. L errore quadratico medio dello stimatore h è dato da EQM(h) = E(h θ) 2. Definizione Uno stimatore h = h(x 1,...,X n ) si dice stimatore corretto del parametro θ se risulta E(h) = θ. Se invece si ha E(h) θ si dice che h è uno stimatore distorto per θ. Uno stimatore h = h(x 1,...,X n ) si dice stimatore efficiente del parametro θ se i) E(h) = θ ii) V ar(h) V ar(h 1 ) per ogni h 1 stimatore corretto di θ.

16 130 SIMULAZIONE Stima di media e varianza Supponiamo di avere un campione casuale X 1,...,X n e di voler stimare stimare la media µ e la varianza σ 2 della popolazione mediante questo campione, ovvero supponiamo che X 1,...,X n siano variabili aleatorie indipendenti identicamente distribuite con E(X i ) = µ e V ar(x i ) = σ 2, i = 1,...,n con µ e σ 2 non note. Uno stimatore corretto per la media µ è dato dalla media campionaria µ = X n = 1 n X i, n in quanto risulta E( X n ) = µ. Uno stimatore corretto per la varianza σ 2 è dato dalla varianza campionaria σ 2 = s 2 n = 1 n ( Xi n 1 X ) 2 n, in quanto risulta E(s 2 n) = σ 2. i=1 i=1 Stimatore di massima verosimiglianza Metodi di stima Esistono diversi metodi per stimare i parametri incogniti di una distribuzione. Riporteremo brevemente nel seguito lo stimatore di massima verosimiglianza (Maximum Likelihood Estimator MLE) che è molto utilizzato e per il quale rimandiamo alla letteratura specifica per una trattazione completa. Riportiamo di seguito una breve descrizione. Date n osservazioni X 1,...,X n, assumiamo che esse siano ottenute da una distribuzione di probabilità continua avente densità f θ (x), dove θ è un parametro che caratterizza la distribuzione. Nell ipotesi che le osservazioni X i sono indipendenti, una misura della probabilità di aver ottenuto quelle osservazioni proprio da quella distribuzione (se θ è il valore del parametro incognito) è data dalla funzione di verosimiglianza L(θ) = f θ (X 1 )f θ (X 2 ) f θ (X n ). Nel caso di distribuzioni di probabilità discrete con funzione di probabilità data da p θ (x), la funzione di verosimiglianza è definita da L(θ) = p θ (X 1 )p θ (X 2 ) p θ (X n ). Il metodo della massima verosimiglianza consiste nello scegliere come stimatore del parametro incognito θ il valore θ che massimizza L(θ). In generale, può non essere facile massimizzare la funzione di verosimiglianza e naturalmente la difficoltà aumenta se la distribuzione ha più di un parametro e quindi la funzione L sarà una funzione di più variabili. Nell effettuare questa operazione di massimizzazione invece di considerare la funzione L(θ) si può considerare la funzione l(θ) = lnl(θ)

17 ELEMENTI DI STATISTICA INFERENZIALE 131 ovvero il logaritmo della funzione di verosimiglianza (log-likelihood function) che Loglikelihood potrebbe essere più facile da massimizzare. Infatti, poichè la funzione logaritmo è una funzione strettamente crescente, un valore θ massimizza L(θ) se e solo se θ function massimizza l(θ). Si osservi, comunque, che l operazione di massimizzazione non è sempre facile e che potrebbe anche essere necessario ricorrere a metodi numerici per risolvere l equazione che si ottiene dall annullamento della derivata. Esempio Date n osservazioni X 1,..., X n dalla distribuzione esponenziale, determinare con il metodo della massima verosimiglianza il parametro λ della distribuzione. La funzione di verosimiglianza è data da L(λ) = (λe λx 1 )(λe λx 1 ) (λe λxn ) = λ n e λ n i=1 X i = λ n e λn X n. Uguagliando a zero la derivata (rispetto a λ) si ha dl(λ) dλ = nλn 1 e λn X n ( 1 λ Xn ) = 0, da cui si ha ˆλ = 1 Xn. Poiché si ha d2 L(ˆλ) < 0, dλ ˆλ è un punto di massimo per la funzione L(λ). 2 Il valore ottenuto per ˆλ non ci sorprende perché la media campionaria è uno stimatore corretto della media della distribuzione che è 1/λ. Allo stesso risultato si può arrivare considerando la funzione log-likelihood, ovvero Infatti si ha l(λ) = ln L(λ) = n ln λ λ dl dλ = n λ per ˆλ = 1 Xn ed inoltre d2 l(ˆλ) dλ 2 = ṋ λ 2 < 0. n X i = 0 i=1 n X i. Esempio Date n osservazioni X 1,..., X n dalla distribuzione geometrica, determinare con il metodo della massima verosimiglianza il parametro p (0, 1) della distribuzione. La distribuzione geometrica è una distribuzione di probabilità discreta caratterizzata da { p p(x) = p(1 p) x se x = 1, 2,... 0 altrimenti. La funzione di verosimiglianza è data da L(p) = p p(x 1)p p(x 2) p p(x n) = p(1 p) X 1 p(1 p) X2 p(1 p) Xn = p n (1 p) Si ha l(p) = ln L(p) = nln p + Annulliamo quindi la derivata della l(p), ottenendo dl(p) dp n i=1 i=1 n X i ln(1 p). i=1 X i = n p 1 p = 0. n X i i=1.

18 132 SIMULAZIONE Risolvendo l equazione si ottiene e poiché risulta 1 ˆp = 1 + X n d 2 l(ˆp) dp 2 < 0, allora ˆp è un massimo per la l(p) e quindi anche per la funzione di massima verosimiglianza L(p). Esercizio Siano date n osservazioni indipendenti X 1,..., X n estratte dalla distribuzione di Poisson di parametro λ. Determinare lo stimatore di massima verosimiglianza del parametro λ. Stime per intervalli Nei metodi di stima puntuale è sempre presente un errore θ θ dovuto al fatto che la stima θ in genere non coincide con il parametro θ. Sorge quindi l esigenza di determinare una misura dell errore commesso. Inoltre, dato il campione X 1,...,X n estratto da una distribuzione di probabilità caratterizzata da un parametro incognito θ, qualunque sia lo stimatore h(x 1,...,X n ) scelto per stimare θ, esso dipende dal campione, ovvero lo stimatore fornirà stime diverse in corrispondenza di campioni diversi. Queste due osservazioni fanno nascere l esigenza di considerare stime per intervalli. Infatti, sulla base dei valori di θ ottenuti considerando un campione casuale X 1,...,X n, si può definire un intervallo in cui sono compresi i valori più probabili per il parametro θ, secondo un livello di confidenza fissato. Per fare ciò si può procedere indirettamente utilizzando una statistica campionaria g(x 1,...,X n ) la cui distribuzione sia nota e non dipendente da θ. Naturalmente, visto che la g è nota, fissato un livello di confidenza (1 α), è possibile determinare due valori g 1 e g 2, indipendenti da θ tali che, comunque scelto α (0, 1), P(g 1 g g 2 ) = 1 α. Lo scopo è quello di tradurre una probabilità su un intervallo per g in una probabilità su intervallo per θ in modo da poter avere P(h 1 θ h 2 ) = 1 α, ovvero in modo tale che h 1 e h 2 rappresentino gli estremi dell intervallo per θ. Le distribuzioni note alle quali si fa di solito riferimento sono la distribuzione Normale, la distribuzione t di Student e la distribuzione Chi quadro. Lo scopo sarà quello di avere un valore di α ben superiore a 0.5 in modo che la probabilità che il parametro θ appartenga all intervallo [h 1, h 2 ] sia tale da assicurare all evento h 1 θ h 2 (evento che si verifica nel 100(1 α)% dei casi) una caratteristica di sistematicità, mentre all evento complementare (che si verifica nel 100α% dei casi) una caratteristica di accidentalità.

19 ELEMENTI DI STATISTICA INFERENZIALE 133 Formalmente si può fornire la seguente definizione. Definizione Intervallo di confidenza. Dato un campione X 1,...,X n, dato α (0, 1) e date le statistiche h 1 = h 1 (X 1,...,X n ) e h 2 = h 2 (X 1,...,X n ) con h 1 < h 2, per le quali P(h 1 θ h 2 ) = 1 α, l intervallo [h 1, h 2 ] si dice intervallo di confidenza per θ con livello di confidenza pari ad (1 α). Naturalmente tanto più è piccolo α, tanto più è ampio l intervallo di confidenza ad esso associato. Stima per intervalli di una media Siano date le osservazioni X 1,...,X n estratte da una distribuzione di probabilità a media µ e varianza σ 2. Assumiamo inizialmente che la media µ sia incognita mentre la varianza sia nota. Dalla Proposizione sappiamo che per n Caso sufficientemente grande, la variabile aleatoria Z n = X n µ σ n (3.2.5) è distribuita approssimativamente secondo la distribuzione Normale standard, indipendentemente dalla distribuzione delle X i. Quindi per n sufficientemente grande risulta P ( ) ( z 1 α Z n z 2 1 α = P z 2 1 α X n µ 2 σ n z 1 α 2 ) 1 α, dove z 1 α è il punto critico (1 α 2 2 ) per una distribuzione Normale standard e può essere immediatamente determinato dai valori tabulati 1 Segue che ( ) σ P X n z 1 α µ X σ 2 n + z n 1 α 1 α. 2 n Quindi, per n sufficientemente grande, il valore incognito di µ si trova nell intervallo [ ] σ σ X n z 1 α, Xn + z 2 n 1 α 2 n varianza nota 1 Sono ampiamente disponibili tabelle che, per una variabile Normale standard Z, riportano il valore di P(Z z) = 1 2π z e y2 2 dy.

20 134 SIMULAZIONE con un livello di confidenza pari a 1 α. Si parla di intervallo di confidenza del 100(1 α)%. Ad esempio, per determinare un intervallo di confidenza al 95% per una media, dato un campione X 1,...,X n, si trova il punto critico z 1 α = z = 1.96 dalle 2 tabelle della distribuzione Normale standard e facilmente si ricava tale intervallo [ X n 1.96 σ, Xn σ ]. n n Si noti che l intervallo di confidenza può contenere o meno il valore della media µ. Questo implica che un singolo intervallo di confidenza, da un punto di vista probabilistico, fornisce informazioni non complete. La corretta interpretazione dell intervallo di confidenza è la seguente: se si costruisce un numero molto elevato di intervalli di confidenza al 100(1 α)%, indipendenti e ciascuno basato su n osservazioni, con n sufficientemente grande, una frazione di questi intervalli pari ad 1 α conterrà µ. Questa frazione si chiama copertura per l intervallo di confidenza. Quindi solamente una proporzione α di casi darà luogo ad intervalli che non contengono µ. Osservazione Affermare che l intervallo di confidenza, ad esempio per una media µ è al 100(1 α)% non significa che la probabilità che µ appartenga a questo intervallo è pari a (1 α)%; questo perché prima di osservare i dati si può parlare di probabilità che l intervallo che si otterrà contenga µ in quanto gli estremi dell intervallo sono variabili aleatorie. Dopo l osservazione dei dati, ovvero dopo aver determinato gli estremi dell intervallo, si può solamente affermare che l intervallo trovato contiene µ con il 100(1 α)% di confidenza in quanto non si ha a che fare con nessuna variabile aletoria (µ è incognita, ma costante e gli estremi dell intervallo, una volta determinati sono valori numerici). Caso varianza non nota Quanto esposto fino ad ora assume che la varianza σ 2 sia nota. Se invece σ 2 non si conosce sono necessarie altre considerazioni. Infatti, anche se la varianza σ 2 non è nota, considerando la varianza campionaria s 2 n, poiché si ha lim n s2 n = σ 2, il Teorema del Limite Centrale continua a valere se nell espressione (3.2.5) della Z n sostituiamo σ 2 con la sua stima s 2 n. Questo significa che, per n sufficientemente grande la variabile Z n = X n µ s n, n è approssimativamente distribuita secondo la distribuzione Normale standard. Quindi di ha ( ) s n P X n z 1 α µ X s n 2 n + z n 1 α 1 α, 2 n

21 ELEMENTI DI STATISTICA INFERENZIALE 135 dove z 1 α è il punto critico (1 α 2 2 ) per una distribuzione normale standard. Quindi, per n sufficientemente grande, con livello di confidenza 1 α il valore incognito di µ si trova nell intervallo [ ] s n s X n z 1 α n, Xn + z 2 n 1 α. 2 n Esempio Siano dati i seguenti valori di dieci osservazioni 1.20, 1.50, 1.68, 1.89, 0.95, 1.49, 1.58, 1.55, 0.50, 1.09, da una distribuzione Normale a media e varianza non note. Si ricava facilmente che X 10 = 1.34 e s 2 10 = Volendo costruire un intervallo di confidenza al 90% per la media si ha 1 α = 0.90, ovvero 1 α = Dalla tavola dei valori di P(Z z) 2 per Z variabile Normale standard si ricava che risulta P(Z c) = 0.95 per c = 1.65, ovvero z 1 α/2 = z 0.95 = Quindi gli estremi dell intervallo richiesto sono dati da X n ± z 1 α 2 s 2 n n = X 10 ± z 0.95 s = 1.34 ± Pertanto l intervallo di confidenza richiesto è dato da [1.12, 1.55]. La difficoltà nell utilizzare questo tipo di intervallo di confidenza per µ sta nel fatto che esso ha valore asintotico, ovvero per n sufficientemente grande e quindi risulta approssimato. Inoltre il valore di n per cui la F n (z) approssima bene la funzione di distribuzione di una variabile Normale standard dipende dalla distribuzione delle osservazioni X i. Se si scelgono valori di n troppo piccoli si ottiene una copertura di un intervallo di confidenza al 100(1 α)% inferiore a 1 α. In questo caso, ovvero per valori piccoli di n si può utilizzare una definizione alternativa dell intervallo di confidenza che fa riferimento non più alla distribuzione Normale standard, ma alla distribuzione t di Student a n 1 gradi di libertà. Dalla Proposizione si ha che se le X i sono variabili Normali, la variabile Z n = X n µ s n n ha distribuzione t di Student con n 1 gradi di libertà per ogni n > 1. Quindi, per ogni n > 1 un intervallo di confidenza esatto al 100(1 α)% è dato da [ X n t n 1,1 α 2 s n n, Xn + t n 1,1 α 2 ] s n, n dove t n 1,1 α è il punto critico 1 α per una distribuzione t di Student ad n 1 t intervallo 2 2 gradi di libertà 2. Questo intervallo si chiama t intervallo di confidenza. di confidenza Poichè risulta t n 1,1 α > z 1 α l intervallo di confidenza definito in riferimento 2 2 alla distribuzione t di Student è più ampio di quello definito in riferimento alla distribuzione Normale standard. 2 Anche in questo caso sono disponibili tavole che riportano valori tabulati di tali punti critici

22 136 SIMULAZIONE Esempio Volendo determinare il t intervallo di confidenza nel caso delle osservazioni dell Esempio è sufficiente ricavare dai valori tabulati il valore di t 9,0.95 che è pari a Quindi l intervallo di confidenza richiesto è dato da [1.10, 1.58]. Tuttavia anche questo secondo tipo di intervallo di confidenza presenta aspetti problematici; infatti, nella sua definizione si assume che le osservazioni X i sono estratte da una distribuzione Normale e poiché questa assuzione, in generale, non è verificata, anche questo tipo di intervallo di confidenza è, di fatto, approssimato. In conclusione, possiamo dire che l intervallo di confidenza definito in riferimento alla distribuzione Normale standard è basato sul Teorema del Limite Centrale e la copertura dipende dalla scelta di n. L intervallo di confidenza definito in riferimento alla distribuzione t di Student è approssimato perché influenzato dalla distribuzione delle X i che in generale non sono Normali; tuttavia questo secondo tipo di intervallo di confidenza ha maggiore copertura dell altro.

23 ELEMENTI DI STATISTICA INFERENZIALE Test delle ipotesi Nel cercare di costruire un legame tra dati osservati e ipotesi teoriche sulle caratteristiche dell intera popolazione si deve, in genere, prendere una decisione per il raggiungimento di tale conclusione generale e nasce il problema di esprimere un giudizio di plausibilità di un ipotesi che si è specificata per la popolazione. Per verificare la coerenza tra osservazioni e ipotesi fatta si fa uso di test statistici che prendono nome di test delle ipotesi. In sintesi, possiamo dire che tali test devono confrontare i valori osservati e i corrispondenti valori teorici attesi condizionatamente all ipotesi fatta. Le differenze che vengono riscontrate possono essere ovviamente ricondotte a due possibilità: l ipotesi specificata è corretta e la differenza riscontrata è puramente casuale; l ipotesi specificata è errata e quindi non ci si può aspettare che i due valori siano vicini. Il procedimento consiste nel confrontare due ipotesi: l ipotesi da sottoporre a verifica e il suo complemento. Si indica con H 0 il sottoinsieme dei valori individuati dall ipotesi da sottoporre a verifica che viene detta ipotesi nulla, mentre il suo complemento si indica con H 1 e viene detto ipotesi alternativa. Si osservi che se un test di ipotesi non scarta l ipotesi H 0, questo non vuol dire che H 0 è accettata come vera, ma solamente che essa non deve essere scartata, ovvero che può essere considerata possibile. Si parla di errore di I specie se il test porta a rifiutare un ipotesi H 0 quando questa è corretta e di errore di II specie se il test porta ad accettare H 0 quando questa è falsa. Si noti che l obiettivo non è quello di dire se l ipotesi fatta è vera o falsa, ma piuttosto di verificare se l ipotesi fatta sia compatibile con i dati. In genere, c è un ampio margine di tolleranza nell accettare H 0, mentre per rifiutarla occorre che i dati siano veramente poco probabili quando H 0 dovesse essere corretta. Per ottenere questo, si specifica un valore α, detto livello di significatività e si impone che il test sia tale che, quando l ipotesi H 0 è corretta, la probabilità che essa venga scartata è non superiore ad α. Quindi un test con livello di significatività pari ad α deve essere tale che una probabilità di commettere un errore di I specie è minore o uguale ad α. Rimandiamo alla letteratura specifica per una trattazione generale dei test d ipotesi; nel seguito faremo esclusivamente riferimento al problema di decidere se le osservazioni sono un campione indipendente di una particolare distribuzione di probabilità con funzione di distribuzione F. Ovvero, si vuole utilizzare un test delle ipotesi per avvalorare o smentire un ipotesi fatta sulla distribuzione di probabilità che meglio rappresenta tali dati. Quindi, date le osservazioni X 1,...,X n,

24 138 SIMULAZIONE l ipotesi da sottoporre a verifica è la seguente: { H 0 = X 1,...,X n sono variabili aleatorie indipendenti, identicamente distribuite con funzione di distribuzione F } Esistono diversi test di ipotesi; consideriamone brevemente nel seguito due, rimandando alla letteratura specifica per una trattazione completa. Test Chi quadro Siano X 1,...,X n variabili aleatorie indipendenti identicamente distribuite. Per applicare il test si effettua il seguente procedimento: si suddivide il range della distribuzione in k intervalli adiacenti [a 0, a 1 ), [a 1, a 2 ), [a 2, a 3 ),... [a k 1, a k ), Caso parametri noti dove può anche essere a 0 = e/o a k =. Si definisce ora N j come il numero delle X i contenute nell intervallo j-esimo, ovvero in [a j 1, a j ) per j = 1, 2,...k. Naturalmente risulta k j=1 N j = n. Si calcola la proporzione p j che le X i cadono nell intervallo j-esimo se le osservazioni fossero dalla distribuzione ipotizzata, ovvero aj f(x)dx nel caso continuo a j 1 p j = p(x i ) nel caso discreto a j 1 x i <a j dove f(x) è la densità di probabilità della distribuzione ipotizzata nel caso continuo e p(x i ) sono i valori della distribuzione di probabilità nel caso discreto. Si definisce k χ 2 (N j np j ) 2 =. (3.2.6) np j j=1 Poiché np j è il numero atteso che n X i cadano nell j-esimo intervallo se l ipotesi H 0 fosse vera, ci si può aspettare che χ 2 sia piccolo se la distribuzione ipotizzata realizza un buon fitting delle X 1,...,X n e quindi l ipotesi H 0 è scartata se χ 2 è troppo grande. Per effettuare praticamente il test dobbiamo considerare il caso in cui tutti i parametri della distribuzione sono noti e il caso in cui questo non avviene. Il test Chi-quadro può essere effettuato in entrambi i casi. Nel primo caso, se α è il livello di significatività del test, si vuole trovare la cosiddetta regione critica, ovvero si vuole calcolare un valore z tale che P H0 (χ 2 z) = α, dove la notazione P H0 indica il condizionamento della probabilità al fatto che H 0 sia vera. Il test dovrà rifiutare l ipotesi nulla quando il valore osservato per χ 2 è

2 Simulazione. rappresentare sistemi reali anche complessi tenendo conto anche delle sorgenti di incertezza;

2 Simulazione. rappresentare sistemi reali anche complessi tenendo conto anche delle sorgenti di incertezza; 2 Simulazione Con il termine simulazione si intende la riproduzione del comportamento di un sistema. In generale, si parla di simulazione sia nel caso in cui viene utilizzato un modello concreto, sia nel

Dettagli

ELEMENTI DI STATISTICA INFERENZIALE ELEMENTI DI STATISTICA INFERENZIALE

ELEMENTI DI STATISTICA INFERENZIALE ELEMENTI DI STATISTICA INFERENZIALE ELEMENTI DI STATISTICA INFERENZIALE 129 2.2 ELEMENTI DI STATISTICA INFERENZIALE In questo paragrafo verranno illustrati alcuni elementi di Statistica che sono essenziali per procedere alla costruzione

Dettagli

Statistica Applicata all edilizia: Stime e stimatori

Statistica Applicata all edilizia: Stime e stimatori Statistica Applicata all edilizia E-mail: orietta.nicolis@unibg.it 15 marzo 2011 Statistica Applicata all edilizia: Indice 1 2 Statistica Applicata all edilizia: Uno dei problemi principali della statistica

Dettagli

Statistica 2. Esercitazioni. Dott. Luigi Augugliaro 1. Università di Palermo

Statistica 2. Esercitazioni. Dott. Luigi Augugliaro 1. Università di Palermo Statistica 2 Esercitazioni Dott. L 1 1 Dipartimento di Scienze Statistiche e Matematiche S. Vianelli, Università di Palermo ricevimento: lunedì ore 15-17 mercoledì ore 15-17 e-mail: luigi.augugliaro@unipa.it

Dettagli

Richiami di inferenza statistica Strumenti quantitativi per la gestione

Richiami di inferenza statistica Strumenti quantitativi per la gestione Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Parametri e statistiche Esempi Tecniche di inferenza Stima Precisione delle stime Intervalli

Dettagli

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer

Richiami di inferenza statistica. Strumenti quantitativi per la gestione. Emanuele Taufer Richiami di inferenza statistica Strumenti quantitativi per la gestione Emanuele Taufer Inferenza statistica Inferenza statistica: insieme di tecniche che si utilizzano per ottenere informazioni su una

Dettagli

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari"

Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in Scienze e Tecnologie Alimentari Levine, Krehbiel, Berenson Statistica Capitolo 5 Variabili aleatorie discrete notevoli Insegnamento: Statistica Applicata Corso di Laurea in "Scienze e Tecnologie Alimentari" Unità Integrata Organizzativa

Dettagli

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1

Statistica. Capitolo 10. Verifica di Ipotesi su una Singola Popolazione. Cap. 10-1 Statistica Capitolo 1 Verifica di Ipotesi su una Singola Popolazione Cap. 1-1 Obiettivi del Capitolo Dopo aver completato il capitolo, sarete in grado di: Formulare ipotesi nulla ed ipotesi alternativa

Dettagli

UNIVERSITÀ DEGLI STUDI DI PERUGIA

UNIVERSITÀ DEGLI STUDI DI PERUGIA SIGI, Statistica II, esercitazione n. 3 1 UNIVERSITÀ DEGLI STUDI DI PERUGIA FACOLTÀ DI ECONOMIA CORSO DI LAUREA S.I.G.I. STATISTICA II Esercitazione n. 3 Esercizio 1 Una v.c. X si dice v.c. esponenziale

Dettagli

Analisi e scelta dei dati di input

Analisi e scelta dei dati di input Analisi e scelta dei dati di input Corso di Tecniche di Simulazione, a.a. 2005/2006 Francesca Mazzia Dipartimento di Matematica Università di Bari 24 Aprile 2006 Francesca Mazzia (Univ. Bari) Analisi e

Dettagli

Contenuto del capitolo

Contenuto del capitolo Capitolo 8 Stima 1 Contenuto del capitolo Proprietà degli stimatori Correttezza: E(Stimatore) = parametro da stimare Efficienza Consistenza Intervalli di confidenza Per la media - per una proporzione Come

Dettagli

Verifica delle ipotesi

Verifica delle ipotesi Statistica inferenziale Stima dei parametri Verifica delle ipotesi Concetti fondamentali POPOLAZIONE o UNIVERSO Insieme degli elementi cui si rivolge il ricercatore per la sua indagine CAMPIONE Un sottoinsieme

Dettagli

Esercitazioni di Statistica

Esercitazioni di Statistica Esercitazioni di Statistica Stima Puntuale Prof. Livia De Giovanni statistica@dis.uniroma.it Esercizio In ciascuno dei casi seguenti determinare quale tra i due stimatori S e T per il parametro θ è distorto

Dettagli

rappresentare sistemi reali anche complessi tenendo conto anche delle sorgenti di incertezza;

rappresentare sistemi reali anche complessi tenendo conto anche delle sorgenti di incertezza; 2 Simulazione Con il termine simulazione si intende la riproduzione del comportamento di un sistema. In generale, si parla di simulazione sia nel caso in cui viene utilizzato un modello concreto, sia nel

Dettagli

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori. Parametri e statistiche Popolazione Parametri Valori fissi, spesso non noti Campione Statistiche o Stimatori Variabili casuali, le cui determinazioni dipendono dalle particolari osservazioni scelte Parametri

Dettagli

rappresentare sistemi reali anche complessi tenendo conto anche delle sorgenti di incertezza;

rappresentare sistemi reali anche complessi tenendo conto anche delle sorgenti di incertezza; 2 Simulazione Con il termine simulazione si intende la riproduzione del comportamento di un sistema. In generale, si parla di simulazione sia nel caso in cui viene utilizzato un modello concreto, sia nel

Dettagli

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza

Statistica Metodologica Avanzato Test 1: Concetti base di inferenza Test 1: Concetti base di inferenza 1. Se uno stimatore T n è non distorto per il parametro θ, allora A T n è anche consistente B lim Var[T n] = 0 n C E[T n ] = θ, per ogni θ 2. Se T n è uno stimatore con

Dettagli

Corso in Statistica Medica

Corso in Statistica Medica Corso in Statistica Medica Introduzione alle tecniche statistiche di elaborazione dati Intervalli di confidenza Dott. Angelo Menna Università degli Studi di Chieti G. d Annunziod Annunzio Anno Accademico

Dettagli

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA

STATISTICHE, DISTRIBUZIONI CAMPIONARIE E INFERENZA Metodi statistici e probabilistici per l ingegneria Corso di Laurea in Ingegneria Civile A.A. 2009-10 Facoltà di Ingegneria, Università di Padova Docente: Dott. L. Corain 1 STATISTICHE, DISTRIBUZIONI CAMPIONARIE

Dettagli

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 II Esonero - 15 Gennaio 2015

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 II Esonero - 15 Gennaio 2015 UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 014/015 II Esonero - 15 Gennaio 015 1 3 4 5 6 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,

Dettagli

rappresentare sistemi reali anche complessi tenendo conto anche delle sorgenti di incertezza;

rappresentare sistemi reali anche complessi tenendo conto anche delle sorgenti di incertezza; 2 Simulazione Con il termine simulazione si intende la riproduzione del comportamento di un sistema. In generale, si parla di simulazione sia nel caso in cui viene utilizzato un modello concreto, sia nel

Dettagli

Simulazione. rappresentare sistemi reali anche complessi tenendo conto anche delle sorgenti di incertezza;

Simulazione. rappresentare sistemi reali anche complessi tenendo conto anche delle sorgenti di incertezza; Simulazione Con il termine simulazione si intende la riproduzione del comportamento di un sistema. In generale, si parla di simulazione sia nel caso in cui viene utilizzato un modello concreto, sia nel

Dettagli

Il campionamento e l inferenza. Il campionamento e l inferenza

Il campionamento e l inferenza. Il campionamento e l inferenza Il campionamento e l inferenza Popolazione Campione Dai dati osservati mediante scelta campionaria si giunge ad affermazioni che riguardano la popolazione da cui essi sono stati prescelti Il campionamento

Dettagli

Distribuzioni e inferenza statistica

Distribuzioni e inferenza statistica Distribuzioni e inferenza statistica Distribuzioni di probabilità L analisi statistica spesso studia i fenomeni collettivi confrontandoli con modelli teorici di riferimento. Tra di essi, vedremo: la distribuzione

Dettagli

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica

Capitolo 8. Intervalli di confidenza. Statistica. Levine, Krehbiel, Berenson. Casa editrice: Pearson. Insegnamento: Statistica Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 8 Intervalli di confidenza Insegnamento: Statistica Corso di Laurea Triennale in Economia Dipartimento di Economia e Management, Università

Dettagli

Elaborazione statistica di dati

Elaborazione statistica di dati Elaborazione statistica di dati CONCETTI DI BASE DI STATISTICA ELEMENTARE Taratura strumenti di misura IPOTESI: grandezza da misurare identica da misura a misura Collaudo sistemi di produzione IPOTESI:

Dettagli

TECNICHE DI SIMULAZIONE

TECNICHE DI SIMULAZIONE TECNICHE DI SIMULAZIONE Analisi e scelta dei dati di input Francesca Mazzia Dipartimento di Matematica Università di Bari a.a. 2004/2005 TECNICHE DI SIMULAZIONE p. 1 Dati di input Per l esecuzione di una

Dettagli

Distribuzioni campionarie. Antonello Maruotti

Distribuzioni campionarie. Antonello Maruotti Distribuzioni campionarie Antonello Maruotti Outline 1 Introduzione 2 Concetti base Si riprendano le considerazioni fatte nella parte di statistica descrittiva. Si vuole studiare una popolazione con riferimento

Dettagli

Statistica Metodologica

Statistica Metodologica Statistica Metodologica Esercizi di Probabilita e Inferenza Silvia Figini e-mail: silvia.figini@unipv.it Problema 1 Sia X una variabile aleatoria Bernoulliana con parametro p = 0.7. 1. Determinare la media

Dettagli

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015

UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015 UNIVERSITÀ DEGLI STUDI ROMA TRE Corso di Laurea in Matematica ST410 - Statistica 1 - A.A. 2014/2015 Appello B - 5 Febbraio 2015 1 2 3 4 5 6 7 Tot. Avvertenza: Svolgere ogni esercizio nello spazio assegnato,

Dettagli

INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA

INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA INTRODUZIONE ALLA STATISTICA PER LA RICERCA IN SANITA IRCBG 19027 Modulo Dal campione alla popolazione: l'inferenza e l'intervallo di confidenza IRCCS Burlo Garofolo Formazione, Aula A via dell Istria

Dettagli

Stima puntuale di parametri

Stima puntuale di parametri Probabilità e Statistica Esercitazioni a.a. 2009/2010 C.d.L.: Ingegneria Elettronica e delle Telecomunicazioni, Ingegneria Informatica Stima puntuale di parametri Ines Campa Probabilità e Statistica -

Dettagli

STATISTICA ESERCITAZIONE

STATISTICA ESERCITAZIONE STATISTICA ESERCITAZIONE Dott. Giuseppe Pandolfo 1 Giugno 2015 Esercizio 1 Una fabbrica di scatole di cartone evade il 96% degli ordini entro un mese. Estraendo 300 campioni casuali di 300 consegne, in

Dettagli

Gli errori nella verifica delle ipotesi

Gli errori nella verifica delle ipotesi Gli errori nella verifica delle ipotesi Nella statistica inferenziale si cerca di dire qualcosa di valido in generale, per la popolazione o le popolazioni, attraverso l analisi di uno o più campioni E

Dettagli

LEZIONI DI STATISTICA MEDICA

LEZIONI DI STATISTICA MEDICA LEZIONI DI STATISTICA MEDICA Lezione n.11 - Principi dell inferenza statistica - Campionamento - Distribuzione campionaria di una media e di una proporzione - Intervallo di confidenza di una media e di

Dettagli

05. Errore campionario e numerosità campionaria

05. Errore campionario e numerosità campionaria Statistica per le ricerche di mercato A.A. 01/13 05. Errore campionario e numerosità campionaria Gli schemi di campionamento condividono lo stesso principio di fondo: rappresentare il più fedelmente possibile,

Dettagli

Gli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana

Gli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana Statistica Lez. 1 Gli intervalli di confidenza Intervallo di confidenza per la media (σ nota) nel caso di popolazione Gaussiana Sia X una v.c Gaussiana di media µ e varianza σ. Se X 1, X,..., X n è un

Dettagli

Stima puntuale di parametri

Stima puntuale di parametri Probabilità e Statistica Esercitazioni a.a. 006/007 C.d.L.: Ingegneria per l Ambiente ed il Territorio, Ingegneria Civile, Ingegneria Gestionale, Ingegneria dell Informazione C.d.L.S.: Ingegneria Civile

Dettagli

STATISTICA APPLICATA Prof.ssa Julia Mortera. INTRODUZIONE al STATISTICA

STATISTICA APPLICATA Prof.ssa Julia Mortera. INTRODUZIONE al STATISTICA STATISTICA APPLICATA Prof.ssa Julia Mortera INTRODUZIONE al CAMPIONAMENTO e all INFERENZA STATISTICA Inferenza Statistica Nell inferenza statistica si usano le statistiche campionarie per fare previsioni

Dettagli

Definizione della variabile c 2 Distribuzione della variabile c 2

Definizione della variabile c 2 Distribuzione della variabile c 2 Definizione della variabile c Distribuzione della variabile c In queste definizioni ho N variabili indipendenti, nessun vincolo e quindi N coincide con i gradi di libertà In un sistema fisico dove il numero

Dettagli

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie.

Ulteriori Conoscenze di Informatica e Statistica. Popolazione. Campione. I risultati di un esperimento sono variabili aleatorie. Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it I risultati di un esperimento

Dettagli

rappresentare sistemi reali anche complessi tenendo conto anche delle sorgenti di incertezza;

rappresentare sistemi reali anche complessi tenendo conto anche delle sorgenti di incertezza; 2 Simulazione Con il termine simulazione si intende la riproduzione del comportamento di un sistema. In generale, si parla di simulazione sia nel caso in cui viene utilizzato un modello concreto, sia nel

Dettagli

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B

Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B Statistica inferenziale, Varese, 18 novembre 2009 Prima parte - Modalità B Cognome Nome: Part time: Numero di matricola: Diurno: ISTRUZIONI: Il punteggio relativo alla prima parte dell esame viene calcolato

Dettagli

Test delle ipotesi. Le differenze che vengono riscontrate possono essere ovviamente ricondotte a due possibilità:

Test delle ipotesi. Le differenze che vengono riscontrate possono essere ovviamente ricondotte a due possibilità: Test delle ipotesi Test delle ipotesi Nel cercare di costruire un legame tra dati osservati e ipotesi teoriche sulle caratteristiche dell intera popolazione si deve, in genere, prendere una decisione per

Dettagli

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 7: Basi di statistica

Costruzione di macchine. Modulo di: Progettazione probabilistica e affidabilità. Marco Beghini. Lezione 7: Basi di statistica Costruzione di macchine Modulo di: Progettazione probabilistica e affidabilità Marco Beghini Lezione 7: Basi di statistica Campione e Popolazione Estrazione da una popolazione (virtualmente infinita) di

Dettagli

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA

IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Metodi per l Analisi dei Dati Sperimentali AA009/010 IL CRITERIO DELLA MASSIMA VEROSIMIGLIANZA Sommario Massima Verosimiglianza Introduzione La Massima Verosimiglianza Esempio 1: una sola misura sperimentale

Dettagli

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017

Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 23/5/2017 Esercitazione 3 - Statistica II - Economia Aziendale Davide Passaretti 3/5/017 Contents 1 Intervalli di confidenza 1 Intervalli su un campione 1.1 Intervallo di confidenza per la media................................

Dettagli

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo 1. Gli studi di simulazione possono permetterci di apprezzare alcune delle proprietà di distribuzioni campionarie ricavate

Dettagli

Stima puntuale. Stimare: attribuire un valore plausibile ad una grandezza. (parametro) non misurabile esattamente.

Stima puntuale. Stimare: attribuire un valore plausibile ad una grandezza. (parametro) non misurabile esattamente. Stima puntuale Stimare: attribuire un valore plausibile ad una grandezza (parametro) non misurabile esattamente. Stimatore del parametro θ: ogni statistica T = t(x 1, X 2,..., X n ) utilizzata per stimare

Dettagli

Statistica Elementare

Statistica Elementare Statistica Elementare 1. Frequenza assoluta Per popolazione si intende l insieme degli elementi che sono oggetto di una indagine statistica, ovvero l insieme delle unità, dette unità statistiche o individui

Dettagli

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = +

x ;x Soluzione Gli intervalli di confidenza possono essere ottenuti a partire dalla seguente identità: da cui si ricava: IC x ;x = + ESERCIZIO 6.1 Si considerino i 0 campioni di ampiezza n = estratti da una popolazione X di N = 5 elementi distribuiti normalmente, con media µ = 13,6 e σ = 8,33. A partire dalle 0 determinazioni della

Dettagli

RICHIAMI DI CALCOLO DELLE PROBABILITÀ

RICHIAMI DI CALCOLO DELLE PROBABILITÀ UNIVERSITA DEL SALENTO INGEGNERIA CIVILE RICHIAMI DI CALCOLO DELLE PROBABILITÀ ing. Marianovella LEONE INTRODUZIONE Per misurare la sicurezza di una struttura, ovvero la sua affidabilità, esistono due

Dettagli

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07

PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 2006/07 PROVE SCRITTE DI MATEMATICA APPLICATA, ANNO 006/07 Esercizio 1 Prova scritta del 16/1/006 In un ufficio postale lavorano due impiegati che svolgono lo stesso compito in maniera indipendente, sbrigando

Dettagli

Tecniche di sondaggio

Tecniche di sondaggio SMID a.a. 2005/2006 Corso di Statistica per la Ricerca Sperimentale Tecniche di sondaggio 24/1/2006 Nomenclatura Indicheremo con P una popolazione, con N la sua numerosità, con k la sua etichetta e con

Dettagli

STATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE

STATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE S.S.I.S TOSCANA F.I.M. -II anno STATISTICA INDUTTIVA: STIMA DI PARAMETRI STIMA PUNTUALE PROBLEMA 1 Vogliamo valutare la percentuale p di donne fumatrici tra le donne in età fertile. Procediamo all estrazione

Dettagli

LE DISTRIBUZIONI CAMPIONARIE

LE DISTRIBUZIONI CAMPIONARIE LE DISTRIBUZIONI CAMPIONARIE Argomenti Principi e metodi dell inferenza statistica Metodi di campionamento Campioni casuali Le distribuzioni campionarie notevoli: La distribuzione della media campionaria

Dettagli

Ulteriori Conoscenze di Informatica e Statistica

Ulteriori Conoscenze di Informatica e Statistica Ulteriori Conoscenze di Informatica e Statistica Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 (I piano) tel.: 06 55 17 72 17 meneghini@fis.uniroma3.it Indici di forma Descrivono le

Dettagli

Approssimazione normale alla distribuzione binomiale

Approssimazione normale alla distribuzione binomiale Approssimazione normale alla distribuzione binomiale P b (X r) costoso P b (X r) P(X r) per N grande Teorema: Se la variabile casuale X ha una distribuzione binomiale con parametri N e p, allora, per N

Dettagli

Brevi cenni all intervallo di confidenza

Brevi cenni all intervallo di confidenza Brevi cenni all intervallo di confidenza INFERENZA STATISTICA L INFERENZA STATISTICA è un insieme di metodi con cui si cerca di «raggiungere una conclusione» sulla popolazione, sulla base delle informazioni

Dettagli

5. Analisi dei dati di input

5. Analisi dei dati di input Anno accademico 2007/08 Analisi e scelta dei dati di input Per l esecuzione di una simulazione è necessario disporre di dati di input che siano una adeguata rappresentazione di ciò che accadrà in realtà

Dettagli

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni

Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni La statistica inferenziale Il processo inferenziale consente di generalizzare, con un certo grado di sicurezza, i risultati ottenuti osservando uno o più campioni E necessario però anche aggiungere con

Dettagli

Schema lezione 5 Intervalli di confidenza

Schema lezione 5 Intervalli di confidenza Schema lezione 5 Intervalli di confidenza Non centrerò quella barca, ne sono convinto al 95% COMPRENDERE: Significato di intervallo di confidenza Uso degli stimatori come quantità di pivot per stime intervallari

Dettagli

Capitolo 9 Verifica di ipotesi: test basati su un campione

Capitolo 9 Verifica di ipotesi: test basati su un campione Levine, Krehbiel, Berenson Statistica II ed. 2006 Apogeo Capitolo 9 Verifica di ipotesi: test basati su un campione Insegnamento: Statistica Corsi di Laurea Triennale in Economia Facoltà di Economia, Università

Dettagli

DISTRIBUZIONI DI PROBABILITA (parte 3) 1 / 34

DISTRIBUZIONI DI PROBABILITA (parte 3) 1 / 34 DISTRIBUZIONI DI PROBABILITA (parte 3) 1 / 34 Distribuzione Binomiale 2 / 34 La più importante distribuzione di probabilità per variabili casuali discrete è la distribuzione binomiale. Questa distribuzione

Dettagli

Variabili casuali. - di Massimo Cristallo -

Variabili casuali. - di Massimo Cristallo - Università degli Studi di Basilicata Facoltà di Economia Corso di Laurea in Economia Aziendale - a.a. 2012/2013 lezioni di statistica del 16 e 27 maggio 2013 - di Massimo Cristallo - Variabili casuali

Dettagli

2.3.1 Generazione di numeri pseudocasuali con distribuzione uniforme

2.3.1 Generazione di numeri pseudocasuali con distribuzione uniforme GENERAZIONE DI OSSERVAZIONI CASUALI 145 2.3 GENERAZIONE DI OSSERVAZIONI CASUALI Una volta determinate le distribuzioni di input, la simulazione dovrà generare durante ogni esecuzione osservazioni casuali

Dettagli

E n 1 n. n i. n 2. n 2 ( n

E n 1 n. n i. n 2. n 2 ( n Lezione n. 7 7.1 Ancora sulle proprietà degli stimatori Esempio 7.1 [continua dall Esempio 6.1] Studiare varianza e MSE dei due stimatori e verificare se T n raggiunge il limite di Cramer- Rao. Soluzione.

Dettagli

Teorema del Limite Centrale

Teorema del Limite Centrale Teorema del Limite Centrale Teorema. Sia data una popolazione numerica infinita di media µ e deviazione standard σ da cui vengono estratti dei campioni casuali formati ciascuno da n individui, con n abbastanza

Dettagli

INTERVALLI DI CONFIDENZA e TEST D IPOTESI 1 / 30

INTERVALLI DI CONFIDENZA e TEST D IPOTESI 1 / 30 INTERVALLI DI CONFIDENZA e TEST D IPOTESI 1 / 30 Intervallo di confidenza: media 2 / 30 Supponiamo di considerare la media campionaria X e assumiamo che Intervallo di confidenza: media 2 / 30 Supponiamo

Dettagli

assuma valori in un determinato intervallo è data dall integrale della sua densità ( = )=

assuma valori in un determinato intervallo è data dall integrale della sua densità ( = )= VARIABILI ALEATORIE CONTINUE Esistono parecchi fenomeni reali per la cui descrizione le variabili aleatorie discrete non sono adatte. Per esempio è necessaria una variabile aleatoria continua ovvero una

Dettagli

Esercitazione 8 maggio 2014

Esercitazione 8 maggio 2014 Esercitazione 8 maggio 2014 Esercizio 2 dal tema d esame del 13.01.2014 (parte II). L età media di n gruppo di 10 studenti che hanno appena conseguito la laurea triennale è di 22 anni. a) Costruire un

Dettagli

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1

Campionamento La statistica media campionaria e la sua distribuzione. Paola Giacomello Dip. Scienze Sociali ed Economiche Uniroma1 Campionamento La statistica media campionaria e la sua distribuzione 1 Definisco il problema da studiare: es. tempo di percorrenza tra abitazione e università Carattere: tempo ossia v.s. continua Popolazione:

Dettagli

4. Stime & Test. Corso di Simulazione. Anno accademico 2008/09

4. Stime & Test. Corso di Simulazione. Anno accademico 2008/09 Anno accademico 2008/09 Media campionaria X 1, X 2,..., X n v.c. indipendenti con distribuzione F, e: E[X i ] = µ Var[X i ] = σ 2, i = 1,..., n Media campionaria: X n è uno stimatore di µ. È uno stimatore

Dettagli

I appello di calcolo delle probabilità e statistica

I appello di calcolo delle probabilità e statistica I appello di calcolo delle probabilità e statistica A.Barchielli, L. Ladelli, G. Posta 8 Febbraio 13 Nome: Cognome: Matricola: Docente: I diritti d autore sono riservati. Ogni sfruttamento commerciale

Dettagli

Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazion

Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazion Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazione lineare di N variabili aleatorie le cui funzioni

Dettagli

II Esonero - Testo B

II Esonero - Testo B Dip. di Ingegneria, Univ. Roma Tre Prof. E. Scoppola, Dott.M. Quattropani Probabilità e Statistica, 2017-18, I semestre 29 Gennaio 2018 II Esonero - Testo B Cognome Nome Matricola Esercizio 1. (20%) Si

Dettagli

I modelli probabilistici

I modelli probabilistici e I modelli probabilistici Finora abbiamo visto che esistono modelli probabilistici che possiamo utilizzare per prevedere gli esiti di esperimenti aleatori. Naturalmente la previsione è di tipo probabilistico:

Dettagli

Elementi di base su modello binomiale e modello normale

Elementi di base su modello binomiale e modello normale Elementi di base su modello binomiale e modello normale (alcune note) Parte 1: il modello binomiale Di fondamentale importanza nell analisi della qualità sono i modelli. I due principali modelli statistico-probablistici

Dettagli

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva

Probabilità classica. Distribuzioni e leggi di probabilità. Probabilità frequentista. Probabilità soggettiva Probabilità classica Distribuzioni e leggi di probabilità La probabilità di un evento casuale è il rapporto tra il numero dei casi favorevoli ed il numero dei casi possibili, purchè siano tutti equiprobabili.

Dettagli

) V ar(x 1 ) + V ar(x 2 ) + 2Cov(X 1, X 2 ).

) V ar(x 1 ) + V ar(x 2 ) + 2Cov(X 1, X 2 ). TECNICHE PER LA RIDUZIONE DELLA VARIANZA 163 2.5 TECNICHE PER LA RIDUZIONE DELLA VARIANZA Come abbiamo avuto modo più volte di osservare, l output di una simulazione necessita di un analisi statistica

Dettagli

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1

Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1 Università degli Studi Roma Tre Anno Accademico 2017/2018 ST410 Statistica 1 Lezione 1 - Mercoledì 27 Settembre 2017 Introduzione al corso. Richiami di probabilità: spazi di probabilità, variabili aleatorie,

Dettagli

Introduzione alla verifica d ipotesi

Introduzione alla verifica d ipotesi Introduzione alla verifica d ipotesi Dipartimento di Matematica Università di Roma Tor Vergata 17 dicembre 2017 Consideriamo il caso in cui la nostra variabile risposta sia continua Immaginiamo che obiettivo

Dettagli

Capitolo 9 Verifica di ipotesi: test basati su un campione

Capitolo 9 Verifica di ipotesi: test basati su un campione Levine, Krehbiel, Berenson Statistica Casa editrice: Pearson Capitolo 9 Verifica di ipotesi: test basati su un campione Insegnamento: Statistica Corsi di Laurea Triennale in Economia Dipartimento di Economia

Dettagli

λ è detto intensità e rappresenta il numero di eventi che si

λ è detto intensità e rappresenta il numero di eventi che si ESERCITAZIONE N 1 STUDIO DI UN SISTEMA DI CODA M/M/1 1. Introduzione Per poter studiare un sistema di coda occorre necessariamente simulare gli arrivi, le partenze e i tempi di ingresso nel sistema e di

Dettagli

Il Test di Ipotesi Lezione 5

Il Test di Ipotesi Lezione 5 Last updated May 23, 2016 Il Test di Ipotesi Lezione 5 G. Bacaro Statistica CdL in Scienze e Tecnologie per l'ambiente e la Natura I anno, II semestre Il test di ipotesi Cuore della statistica inferenziale!

Dettagli

Cenni di statistica statistica

Cenni di statistica statistica Cenni di statistica La statistica è una disciplina che ha come fine lo studio quantitativo e qualitativo di un particolare fenomeno in condizioni di incertezza o non determinismo, ovvero di non completa

Dettagli

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche

Lezione 16. Statistica. Alfonso Iodice D Enza Università degli studi di Cassino. Lezione 16. A. Iodice. Ipotesi statistiche Statistica Alfonso Iodice D Enza iodicede@unicas.it Università degli studi di Cassino () Statistica 1 / 23 Outline 1 2 3 4 5 6 () Statistica 2 / 23 La verifica delle ipotesi Definizione Un ipotesi statistica

Dettagli

Ulteriori Conoscenze di Informatica e Statistica

Ulteriori Conoscenze di Informatica e Statistica ndici di forma Ulteriori Conoscenze di nformatica e Statistica Descrivono le asimmetrie della distribuzione Carlo Meneghini Dip. di fisica via della Vasca Navale 84, st. 83 ( piano) tel.: 06 55 17 72 17

Dettagli

Test d Ipotesi Introduzione

Test d Ipotesi Introduzione Test d Ipotesi Introduzione Uno degli scopi più importanti di un analisi statistica è quello di utilizzare i dati provenienti da un campione per fare inferenza sulla popolazione da cui è stato estratto

Dettagli

Test delle Ipotesi Parte I

Test delle Ipotesi Parte I Test delle Ipotesi Parte I Test delle Ipotesi sulla media Introduzione Definizioni basilari Teoria per il caso di varianza nota Rischi nel test delle ipotesi Teoria per il caso di varianza non nota Test

Dettagli

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4

CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4 CORSO DI STATISTICA (parte 2) - ESERCITAZIONE 4 Dott.ssa Antonella Costanzo a.costanzo@unicas.it Esercizio 1. Stimatore media campionaria Il tempo in minuti necessario a un certo impiegato dell anagrafe

Dettagli

Test d ipotesi Introduzione. Alessandra Nardi

Test d ipotesi Introduzione. Alessandra Nardi Test d ipotesi Introduzione Alessandra Nardi alenardi@mat.uniroma2.it 1 Consideriamo il caso in cui la nostra variabile risposta sia continua Immaginiamo che obiettivo del nostro studio sia valutare il

Dettagli

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati.

La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. RICHIAMI DI STATISTICA La statistica è la scienza che permette di conoscere il mondo intorno a noi attraverso i dati. Quale è la media della distribuzione del reddito dei neolaureati? Per rispondere dovremmo

Dettagli

Corso di Statistica Esercitazione 1.8

Corso di Statistica Esercitazione 1.8 Corso di Statistica Esercitazione.8 Test su medie e proporzioni Prof.ssa T. Laureti a.a. 202-203 Esercizio Un produttore vuole monitorare i valori dei livelli di impurità contenute nella merce che gli

Dettagli

Intervallo di confidenza.

Intervallo di confidenza. Intervallo di confidenza annarita.vestri@uniroma1.it campione inferenza popolazione Media Riportare sempre anche la deviazione standard Stima puntuale di Media, dev.standard, numerosità Qualche semplice

Dettagli

DISTRIBUZIONI DI PROBABILITA (parte 1) 1 / 19

DISTRIBUZIONI DI PROBABILITA (parte 1) 1 / 19 DISTRIBUZIONI DI PROBABILITA (parte 1) 1 / 19 Variabili casuali (o aleatorie) 2 / 19 Disponendo di metodi corretti per raccogliere i dati e costruire i campioni data una popolazione, i valori numerici

Dettagli