Analisi statistica della bontà di un programma di simulazione del lancio di dadi

Documenti analoghi
Teorema del limite centrale TCL Questo importante teorema della statistica inferenziale si applica a qualsiasi variabile aleatoria che sia combinazion

distribuzione normale

GENERAZIONE DI NUMERI PSEUDOCASUALI

DISTRIBUZIONI DI PROBABILITA (parte 2) 1 / 27

Esercitazione 5 del corso di Statistica 2 Prof. Domenico Vistocco

Esercitazione 4 Distribuzioni campionarie e introduzione ai metodi Monte Carlo

Modulo di Statistica e Tecnologia (Dott. Giorgio Poletti

Laboratorio di Calcolo B 68

Elaborazione statistica di dati

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

(a) Qual è la probabilità che un neonato sopravviva al primo anno?

Parametri statistici

UNIVERSITA DEGLI STUDI DI BRESCIA-FACOLTA DI MEDICINA E CHIRURGIA CORSO DI LAUREA IN INFERMIERISTICA SEDE DI DESENZANO dg STATISTICA MEDICA.

Elaborazione statistica di dati

Note sulla probabilità

Corso integrato di informatica, statistica e analisi dei dati sperimentali Esercitazione VI

Laboratorio di Calcolo I. Applicazioni : Metodo Monte Carlo

Esercitazione: La distribuzione NORMALE

Statistica Descrittiva Soluzioni 6. Indici di variabilità, asimmetria e curtosi

Teorema del limite centrale TCL

Distribuzioni e inferenza statistica

Alcune v.a. discrete notevoli

SCHEDA DIDATTICA N 7

Modelli probabilistici variabili casuali

Statistica Inferenziale

Gli intervalli di confidenza. Intervallo di confidenza per la media (σ 2 nota) nel caso di popolazione Gaussiana

PROBABILITA. Distribuzione di probabilità

Probabilità e numeri casuali Teoria e programmazione Pascal e C++

NUMERI CASUALI E SIMULAZIONE

Valutazione incertezza di categoria B

Analisi e scelta dei dati di input

Laboratorio di Calcolo B 67

Tecniche di simulazione

Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria della probabilità A.A

Esercizi di Probabilità e Statistica

Fondamenti di statistica per il miglioramento genetico delle piante. Antonio Di Matteo Università Federico II

Statistica Inferenziale

MEDIA aritmetica semplice (Gli indicatori di posizione)

deve utilizzarsi la variabile t ν,α/2 , dove n è il numero di gradi di libertà pari al numero delle misure diminuito di 1 (ν=n-1).

INFERENZA STATISTICA I (CANALE B)

CdL in Informatica e Comunicazione Digitale Statistica Matematica anno accademico 2005/06 ulteriori esercizi di Statistica Inferenziale

I modelli probabilistici

Statistica descrittiva I. La frequenza

lezione 4 AA Paolo Brunori

Analisi statistica in simulazione

Analisi statistica classica. Analisi statistica in simulazione. Stima della media. Stima della media

Corso di Laurea a Distanza in Ingegneria Elettrica Corso di Comunicazioni Elettriche Teoria della probabilità A.A

5 - Esercizi: Probabilità e Distribuzioni di Probabilità (Uniforme, Gaussiana)

Lezione 13 Corso di Statistica. Domenico Cucina

Le variabili casuali o aleatorie

PROBABILITÀ SCHEDA N. 5 SOMMA E DIFFERENZA DI DUE VARIABILI ALEATORIE DISCRETE

FONDAMENTI DI SEGNALI E TRASMISSIONE 5 Laboratorio

Il campionamento e l inferenza. Il campionamento e l inferenza

Laboratorio di Calcolo Paola Gallo

Statistica. Lezione 4

Esercitazione 4 del corso di Statistica 2 Prof. Domenico Vistocco

LA DISTRIBUZIONE DEGLI ERRORI DI MISURA. La distribuzione normale. Dott.ssa Marta Di Nicola

LA DISTRIBUZIONE NORMALE. La distribuzione Gaussiana. Dott.ssa Marta Di Nicola

Esercizi di Calcolo delle Probabilità

TECNICHE DI SIMULAZIONE

Vedi: Probabilità e cenni di statistica

Cenni di statistica statistica

i=1 x i = e che n

INFERENZA STATISTICA I (CANALE B)

Distribuzioni di probabilità nel continuo

Distribuzione Gaussiana - Facciamo un riassunto -

Probabilita' mediante l'analisi combinatoria D n,k =Disposizioni di n oggetti a k a k (o di classe k)

STATISTICA (modulo II - Inferenza Statistica) Soluzione Esercitazione I

UNIVERSITÀ DEGLI STUDI DI PERUGIA

1! 4! = 5. Quindi la probabilità di ottenere 1 successo su 5 lanci sarà 5 2 = 5! 2! 3! = 10

Esercizi di statistica

University of Messina, Italy

N.B. Per la risoluzione dei seguenti esercizi, si fa riferimento alle Tabelle riportate alla fine del documento.

CALCOLO DELL ERRORE E VALUTAZIONE DI UN METODO ANALITICO

Statistica. Lezione : 18, 19. Variabili casuali

Dato che i risultati ottenuti tramite campioni casuali ed esperimenti comparativi sono legati al caso, non possiamo essere certi che le nostre

Correlazione tra due variabili

Scuola di Calcolo Scientifico con MATLAB (SCSM) 2017

Coppie di variabili aleatorie

Parametri e statistiche. Parametri e statistiche. Distribuzioni campionarie. Popolazione Parametri Valori fissi, Statistiche o Stimatori.

Teoria dei Fenomeni Aleatori AA 2012/13

S 2 p n X. + S2 p. n Y

Utilizzando la terminologia generica di prima, la variabile standardizzata X si calcola quindi

PROBABILITÀ - SCHEDA N. 3 VARIABILI ALEATORIE CONTINUE E SIMULAZIONE

ESAME. 9 Gennaio 2017 COMPITO B

17. LA DISTRIBUZIONE NORMALE E LA FUNZIONE DI GAUSS

Franco Ferraris Marco Parvis Generalità sulle Misure di Grandezze Fisiche. Prof. Franco Ferraris - Politecnico di Torino

5. Analisi dei dati di input

Distribuzioni di probabilità. Un po' di teoria

Variabili casuali. - di Massimo Cristallo -

Simulazione. Introduzione

ESAME. 9 Gennaio 2017 COMPITO A

UNIVERSITÀ di ROMA TOR VERGATA

La simulazione con DERIVE Marcello Pedone LE SIMULAZIONI DEL LANCIO DI DADI CON DERIVE

Transcript:

Analisi statistica della bontà di un programma di simulazione del lancio di dadi Jacopo Nespolo, Jonathan Barsotti, Oscar Pizzulli 19/2/2007 1 Obbiettivi Con questa esperienza si intende analizzare i dati forniti da un programma di simulazione del lancio di dadi per controllare l'eettivo comportamento casuale della generazione del risultato dei lanci. Quest'analisi verrà eettuata in varie condizioni, al variare del numero n dei dadi lanciati e del numero N delle ripetizioni del lancio. 2 Lancio di un dado per 100 e 100000 volte È stato eseguito il lancio di un dado per 100 e 100000 volte. Dalla comparazione delle uscite ottenute nelle due simulazioni, si nota che, in rispetto al Teorema del Limite Centrale, media µ e varianza σ si avvicinano al valore di previsione al crescere del numero di ripetizioni del lancio N. 3 Lancio di 2 e 10 dadi per 100000 volte Sono stati virtualmente lanciati 2 e 10 dadi per 100000 volte ed è stato eseguito un test del χ 2 sulla distribuzione della somma delle uscite. Nel caso n = 2 la teoria prevede una distribuzione della somma delle uscite di tipo triangolare con media µ = 7.00 e σ = 2.42. Il programma Dadi usato per la simulazione ha restituito per questi valori rispettivamente µ osservato = 7.00652 e σ osservato = 2.42048, evidentemente in accordo con il modello, com'è anche ben visibile dall'istogramma di gura (1). Dai risultati del test del χ 2 a ν = 11 1 = 10 gradi di libertà (consultabile in dettaglio in tabella (1)) si ottiene un χ 2 = 13.65. La funzione cdfchi che implementa la funzione di distribuzione del χ 2 nel programma Scilab associa a questo risultato un livello di signicatività Q = 0.190. 1

18000 Lancio di Dadi 16000 14000 12000 Occorrenza 10000 8000 6000 4000 2000 0 0 2 4 6 8 10 12 Somma delle uscite Figura 1: Distribuzione della somma delle uscite di 2 dadi i O i e i /10 5 χ 2 i 2 2789 1/36 0.45340 3 5559 2/36 0.00214 4 8263 3/36 0.59361 5 11232 4/36 1.31530 6 13904 5/36 3.38690 7 16676 6/36 0.00523 8 13904 5/36 0.01644 9 11231 4/36 1.29360 10 8180 3/36 2.82130 11 5618 2/36 0.70188 12 2876 1/36 3.47310 Totale χ 2 = 13.65 Tabella 1: Tabella riassuntiva dell'analisi del lancio di 2 dadi per 100000 volte Nel caso n = 10 si è usato un modello che apprissima la distribuzione della somma delle uscite ad una curva Gaussiana con media µ = 35 e varianza σ = 5.40, in quanto sarebbe stato piuttosto laborioso il calcolo della probabilità di tutte e 51 le possibili uscite. Il programma Dadi ci ha ancora una volta fornito dei dati in accordo con il modello teorico: µ osservato = 35.0207 e σ osservato = 5.39559. Si osservi in gura (2) l'istogramma che rappresenta la distribuzione della somma delle uscite. È evidente la somiglianza con una campana Gaussiana. Si noti anche la scarsità di occorrenze per i valori i della somma dei dadi nelle code della campana, che sono risultati essere di molto inferiori alla previsione del modello. Questo fenomeno ha determinato 2

8000 Lancio di Dadi 7000 6000 5000 Occorrenza 4000 3000 2000 1000 0 10 20 30 40 50 60 Somma delle uscite Figura 2: Distribuzione delle uscite di 10 dadi un valore della varianza che come si è visto dal dato fornito dal programma, è più basso delle aspettative. In seguito alla scarsità di occorrenze per i valori delle code, i canali i 16 e i 55 sono stati uniti per poter procedere con il test del χ 2 a ν = 51 1 = 50 gradi di libertà, che nonostante ciò ha fornito un valore di χ 2 = 110.42, a cui corrisponde un livello di signicatività Q 0.00. Comparando questo risultato con quello ottenuto per il lancio di 2 dadi si può aermare che apparentemente il programma Dadi genera dei risultati meno casuali al crescere di n = numero dei dadi lanciati. 3.1 Analisi del risultato per 10 dadi e possibili cause Questo valore del χ 2 ottenuto nel lancio dei 10 dadi può essere dovuto in parte al fatto che non è stata usata la reale distribuzione delle somme delle uscite, ma solo una sua approssimazione Gaussiana. Inoltre può anche aver inuito il modo stesso in cui Dadi genera le sue uscite: infatti l'algoritmo della funzione random chiamata dal programma, usa come seme per la generazione il tempo segnato dall'orologio di sistema del calcolatore al momento della chiamata di funzione. Nel nostro caso, quasi certamente, questa chiamata veniva fatta 10 volte, per poi sommare le uscite, passarle come output e dunque procedere con l'iterazione successiva. Considerando la relativa semplicità dell'operazione, il calcolatore da noi usato ha chiamato la funzione di generazione a intervalli di tempo innitesimi. Sovrastimando il tempo di elaborazione a 0.5s, è facile calcolare che per ottenere 10 5 uscite di 10 dadi, l'algoritmo è stato eseguito un milone di volte. Ciò vuol dire che la funzione di generazione di numeri casuali è stata chiamata circa 3

una volta ogni 5 10 7 s. È dunque ovvio che il seme generatore non può essere cambiato di molto nell'intervallo di tempo durante il quale è avvenuta la computazione, e ne consegue che le uscite non sono state generate in modo perfettamente indipendente. Per vericare questa teoria occorrerebbe studiare il comportamento delle uscite per numeri n di dadi via via crescenti. 3.2 Possibile miglioramento dell'algoritmo di generazione dell'output Ammettendo che il programma Dadi utilizzi l'algoritmo illustrato sopra, un espediente per aumentare la casualità delle uscite potrebbe essere la seguente: mantenendo la consueta notazione n per il numero di dadi e N per il numero di ripetizioni e indicando con o i l'i-esimo numero generato, per prima cosa generiamo tutte le uscite di un dado che occorrono per l'intera computazione (n N). Poi, invece di sommare i numeri a n a n nell'ordine in cui sono usciti, sommiamo, n i N o i + o N+i + + o (n 1)N+i. Con questa implementazione, i numeri che verranno poi sommati insieme sono generati lungo un intervatto di tempo, seppur di poco, più ampio, che in teoria dovrebbe garantire una minore dipendenza dei semi usati per generare ciascun output. 4 Distribuzione delle medie di 30 lanci di 1 dado per 100 volte Sono state eseguite 30 ripetizioni del lancio di n = 1 dado per N = 100 volte e sono state annotate le medie dei lanci, ottenute dall'output del programma, e riportate nella seguente tabella (2). Secondo la teoria, la distribuzione delle medie segue una legge di tipo Gaussiano con media µ = 3.50 e varianza σ = 0.171. 3.23 3.26 3.27 3.27 3.29 3.31 3.32 3.34 3.39 3.40 3.40 3.41 3.43 3.44 3.44 3.45 3.48 3.51 3.53 3.57 3.59 3.60 3.61 3.61 3.62 3.63 3.64 3.68 3.69 3.69 Tabella 2: Medie ottenute nelle 30 ripetizioni del lancio di 1 dado per 100 volte In gura (3) è riportato l'istogramma della distribuzione delle medie. Il dettaglio dei dati e del calcolo del χ 2 è riportato nella tabella (3). Il χ 2 calcolato è pari a 5.87 su ν = 5 gradi di libertà. Ciò si traduce in un livello di signicatività dell' ipotesi di distribuzione Gaussiana Q = 0.319. Si de- 4

duce dunque che la funzione di generazione di numeri casuali eettivamente approssimativamente delle uscite casuali. 10 Distribuzione delle Medie di 30 Lanci 8 Occorrenza 6 4 2 0 3.25 3.3 3.35 3.4 3.45 3.5 3.55 3.6 3.65 Medie dei Lanci Figura 3: Distribuzione delle medie Limiti del canale x z O i e i /30 e i χ 2 i 3.23-1.588 6 0.1335 4.005 0.993 3.31-1.118 2 0.1054 3.162 0.427 3.38-0.7059 8 0.1663 4.989 1.817 3.46-0.2353 3 0.1896 5.688 1.270 3.54 0.2353 5 0.1474 4.422 0.076 3.61 0.6471 6 0.1264 3.792 1.286 3.69 1.1176 Totale χ 2 = 5.87 Tabella 3: Tabella riassuntiva della distribuzione delle medie 5 Conslusioni Dall'analisi eseguita si deduce che il programma Dadi produce delle uscite discretamente casuali, ma la bontà della generazione peggiora con l'aumen- 5

tare del numero di dadi. 6