Un seminario sull analisi statistica di formiche virtuali



Documenti analoghi
La variabile casuale Binomiale

Slide Cerbara parte1 5. Le distribuzioni teoriche

PROBABILITÀ - SCHEDA N. 2 LE VARIABILI ALEATORIE

Esercitazione #5 di Statistica. Test ed Intervalli di Confidenza (per una popolazione)

Cosa dobbiamo già conoscere?

La propagazione delle onde luminose può essere studiata per mezzo delle equazioni di Maxwell. Tuttavia, nella maggior parte dei casi è possibile

La distribuzione Gaussiana


Viene lanciata una moneta. Se esce testa vinco 100 euro, se esce croce non vinco niente. Quale è il valore della mia vincita?

Metodi statistici per le ricerche di mercato

Esercizi di Probabilità e Statistica

La distribuzione Normale. La distribuzione Normale

Statistica Matematica A - Ing. Meccanica, Aerospaziale I prova in itinere - 19 novembre 2004

Funzioni funzione dominio codominio legge argomento variabile indipendente variabile dipendente

VARIABILI ALEATORIE CONTINUE

La categoria «ES» presenta (di solito) gli stessi comandi

Probabilità discreta

Analisi di dati di frequenza

Testi di Esercizi e Quesiti 1

PROGRAMMA SVOLTO NELLA SESSIONE N.

Probabilità condizionata: p(a/b) che avvenga A, una volta accaduto B. Evento prodotto: Evento in cui si verifica sia A che B ; p(a&b) = p(a) x p(b/a)

Esercizi riassuntivi di probabilità

Corso di Matematica per la Chimica

Potenza dello studio e dimensione campionaria. Laurea in Medicina e Chirurgia - Statistica medica 1

Il confronto fra proporzioni

E NECESSARIO RICORRERE ALLE VARIABILI CASUALI

Statistica inferenziale

Facciamo qualche precisazione

Test statistici di verifica di ipotesi

Istituzioni di Statistica e Statistica Economica

Laboratorio sulle dinamiche Socio-Economiche

DI D AGRA R MM M I M A BLOCC C H C I TEORI R A E D D E SERC R I C ZI 1 1

TRAGUARDI PER LO SVILUPPO DELLE COMPETENZE AL TERMINE DELLA SCUOLA PRIMARIA

DISTRIBUZIONI DI VARIABILI CASUALI DISCRETE

Consideriamo due polinomi

1) Si consideri un esperimento che consiste nel lancio di 5 dadi. Lo spazio campionario:

Calcolo delle probabilità

Aprire WEKA Explorer Caricare il file circletrain.arff Selezionare random split al 66% come modalità di test Selezionare J48 come classificatore e

ISTITUTO COMPRENSIVO MONTEGROTTO TERME SCUOLA PRIMARIA DISCIPLINA: MATEMATICA - CLASSE PRIMA OBIETTIVI DI APPRENDIMENTO

Corso di Calcolo Numerico

Probabilità II Variabili casuali discrete

APPUNTI DI MATEMATICA ALGEBRA \ INSIEMISTICA \ TEORIA DEGLI INSIEMI (1)

Automazione Industriale (scheduling+mms) scheduling+mms.

LA STATISTICA si interessa del rilevamento, dell elaborazione e dello studio dei dati; studia ciò che accade o come è fatto un gruppo numeroso di

Elementi di Psicometria con Laboratorio di SPSS 1

Teoria della probabilità Assiomi e teoremi

Statistica e biometria. D. Bertacchi. Variabili aleatorie. V.a. discrete e continue. La densità di una v.a. discreta. Esempi.

Se si insiste non si vince

Corso integrato di informatica, statistica e analisi dei dati sperimentali Altri esercizi_esercitazione V

Distribuzioni discrete

Tecniche di Simulazione: Introduzione. N. Del Buono:

Mete e coerenze formative. Dalla scuola dell infanzia al biennio della scuola secondaria di II grado

PROBABILITA MISURARE L INCERTEZZA Lanciamo due dadi, facciamo la somma dei punteggi ottenuti. Su quale numero mi conviene scommettere?

Syllabus delle conoscenze per il modulo: linguaggio matematico di base, modellizzazione e ragionamento. Esempi di domande

Esercizi di Calcolo delle Probabilità con Elementi di Statistica Matematica

Ing. Simone Giovannetti

Una sperimentazione. Probabilità. Una previsione. Calcolo delle probabilità. Nonostante ciò, è possibile dire qualcosa.

Fasi di creazione di un programma

Matematica Applicata. Probabilità e statistica

Percorsi, strategie e geometrie in gioco Complementi e spunti di lavoro Primaria e Secondaria Inferiore

Psicometria (8 CFU) Corso di Laurea triennale STANDARDIZZAZIONE

Inferenza statistica. Statistica medica 1

STATISTICA ESERCITAZIONE 11 Dott. Giuseppe Pandolfo 3 febbraio Modelli continui di probabilità: la v.c. uniforme continua

Il concetto di valore medio in generale

OSSERVAZIONI TEORICHE Lezione n. 4

Tasso di interesse e capitalizzazione

Elementi di Psicometria con Laboratorio di SPSS 1

Calcolo delle Probabilita, INGEGNERIA INFORMATICA, semestre II, laurea (ord. Leonardo.

Statistica. Lezione 6

Introduzione al MATLAB c Parte 2

A.S CLASSE PRIMA SCUOLA PRIMARIA D ISTITUTO COMPETENZA CHIAVE EUROPEA DISCIPLINA

PROBABILITA, VALORE ATTESO E VARIANZA DELLE QUANTITÁ ALEATORIE E LORO RELAZIONE CON I DATI OSSERVATI

Corso di Laurea in Scienze e Tecnologie Biomolecolari. NOME COGNOME N. Matr.

DISTRIBUZIONI DI PROBABILITÀ

Tutorato di Probabilità e Statistica

11. Analisi statistica degli eventi idrologici estremi

Raccomandazione del Parlamento europeo 18/12/2006 CLASSE PRIMA COMPETENZE ABILITÀ CONOSCENZE. Operare con i numeri

matematica probabilmente

Il Controllo Interno di Qualità dalla teoria alla pratica: guida passo per passo IL MODELLO TEORICO. Pasquale Iandolo

LE CARTE DI CONTROLLO (4)

Esercizi di Probabilità e Statistica

Lezione 8. La macchina universale

Primi esercizi per gli studenti del corso di Statistica ed Elementi di Probabilita

Esercitazioni di Calcolo Numerico 23-30/03/2009, Laboratorio 2

LA CONOSCENZA DEL MONDO SCUOLA DELL INFANZIA. OBIETTIVI DI APPRENDIMENTO 3 anni 4 anni 5 anni

2 CERTAMEN NAZIONALE DI PROBABILITA E STATISTICA FELICE FUSATO Fase di Istituto 15 febbraio 2011

Lezioni di Matematica 1 - I modulo

l insieme delle misure effettuate costituisce il campione statistico

1.5. ISTOGRAMMA 17. Figura 1.3: Istogramma ottenuto mediante campionamento da VA Gaussiana (η x =0, σ 2 X =1).

PROVA INVALSI Scuola Secondaria di I grado Classe Prima

Ulteriori problemi di fisica e matematica

Un gioco con tre dadi

Scheduling della CPU. Sistemi multiprocessori e real time Metodi di valutazione Esempi: Solaris 2 Windows 2000 Linux

E naturale chiedersi alcune cose sulla media campionaria x n

Funzioni. Funzioni /2

GIUSTIFICARE LE RISPOSTE. Non scrivere la soluzione di esercizi diversi su uno stesso foglio.

MATEMATICA DEL DISCRETO elementi di teoria dei grafi. anno acc. 2009/2010

Un po di statistica. Christian Ferrari. Laboratorio di Matematica

Cenno sui metodi Monte Carlo

Introduzione all analisi dei segnali digitali.

Transcript:

Un seminario sull analisi statistica di formiche virtuali Dr. Andrea Fontana Universita di Pavia http://www.pv.infn.it/~fontana/formiche Numeri casuali Tests di casualita Distribuzione uniforme in C e C++ Formica di Langton (con ROOT) Formica ubriaca (con ROOT) Formicai virtuali Caso o Caos? Introduzione ai Frattali Formiche

Numeri casuali Simulazione di processi fisici -> generazione di numeri casuali con distribuzione uniforme nell intervallo [0,1]. Sequenza di numeri casuali: - non prevedibile; - non riproducibile. Esempi in natura: decadimento radioattivo di nuclei instabili, rumore termico di apparecchiatura elettronica Come fare per ottenere sequenze di numeri casuali (o random)? - misurare fenomeni naturali casuali: poco pratico - usare calcolatori per memorizzare tabelle precalcolate: uso di spazio in memoria - usare calcolatori collegati a strumenti: richiede tempo Generazione di numeri casuali con algoritmi matematici!

Numeri pseudocasuali Sequenze di numeri generate al calcolatore: sono sempre prevedibili ed esattamente riproducibili (seme), ma hanno le stesse proprieta delle sequenze casuali vere. Generatori di numeri casuali: funzioni disponibili in ogni linguaggio di programmazione (C, C++, Fortran) per generare sequenze pseudocasuali con algoritmi matematici. Vari metodi disponibili: metodo del medio quadrato (J. von Neumann, fine 2^a G.M.) metodo congruenziali (vari autori, anni 60-80) metodo di Fibonacci

Metodo del medio quadrato Ogni numero della sequenza e generato elevando al quadrato il predecessore e prendendo le cifre di mezzo del risultato. Lavorando con 4 cifre e partendo da x 0 =5678, si ha: x 0 =5678 (x 0^2 =32239684) x 1 =2396 (x 1^2 =05740816) x 2 =7408 Caratteristiche delle sequenze pseudocasuali: - ogni numero viene ricavato da quello precedente e, se un numero ricompare nella sequenza, tutti i numeri successivi vengono ripetuti (periodo di ogni algoritmo) - la correlazione tra i numeri non e mai nulla.

Metodo congruenziale Ogni numero della sequenza e generato a partire da altri tre numeri: m (modulo), a (incremento) e x 0 (valore iniziale), secondo il seguente schema: x i a x i 1 modm i x i /m Esempio con a=5, x 0 =1 e m=64: 1,5,25,61,49,53,9,45,33,37,57,29,17,21 (sempre dispari!) Metodo di Fibonacci Ogni elemento della sequenza e la somma dei due elementi precedenti (routine RANLUX della libreria del CERN).

Tests di casualita Non tutte le sequenze sono equivalenti: in generale, anche a parita di algoritmo, si hanno sequenze differenti su calcolatori differenti ed esistono sequenze di numeri pseudocasuali che sono migliori o piu casuali di altre. Test sulla media di N numeri pseudocasuali: semplice controllo per generatore uniforme Test di equidistribuzione: reale uniformita dei numeri generati Test seriale: reale uniformita di coppie di numeri generati Test del gap: la distanza tra due numeri uguali nella sequenza segue una distribuzione geometrica Test del poker: controllo su numeri uguali entro quintuple casuali consecutive

Distribuzione uniforme Semplice test da fare su un calcolatore: generare N numeri pseudocasuali secondo la distribuzione uniforme e stimare media e deviazione standard con errori e CL gaussiani. Entro 1s, la statistica di base prevede che le stime di media m e deviazione standard s per dati che provengono da distribuzioni qualunque siano: m s s N 4 D4 s 2 4s (N 1) con livelli di confidenza gaussiani. D 4 e il momento di quarto ordine della distribuzione: 1 D4 (xi m) N Formiche i 4

Risultati del test sulla media statistica: 10000 m(em)=0.499446(0.00285817) intervallo: 0.496587-0.502304 esatto: 0.5 s(es)=0.285817(0.00453816) intervallo: 0.281278-0.290355 esatto: 0.288675 Sequenza Istogramma Formiche

Risultati del test del gap La probabilita p r di avere un gap di lunghezza r e data da: pr p (1 p) cioe segue una distribuzione geometrica. r Gap tra gli 0 di un sequenza casuale di numeri nell intervallo [0,9].

Test del poker Si considerano N gruppi consecutivi di 5 interi consecutivi e si cerca in quale categoria cade ogni quintupla considerata in base al numero di valori distinti in essa contenuti: 5 tutti diversi a,b,c,d,e 4 coppia a,a,b,c,d 3 doppia coppia o tris a,a,b,b,c o a,a,a,b,c 2 full o poker a,a,a,b,b o a,a,a,a,b 1 colore a,a,a,a,a Si conta il numero di occorrenze di ogni quintupla e si confrontano le distribuzioni con le probabilita teoriche (note esattamente dal calcolo combinatorio).

Teoria del poker Probabilita che, considerati N gruppi di k numeri successivi (tra d elementi), in uno di essi ci siano r numeri diversi: p r d(d 1)...(d k d r 1) k r dal Knuth k d Disposizioni con ripetizione di d oggetti in classe k (in gruppi di k). d(d 1)...(d r 1) Numero di scelte ordinate di r oggetti diversi da un insieme di d oggetti. k r Coefficiente di Stirling (tabulato): numero di ripartizioni di un insieme di k oggetti in r parti.

Risultati del test del poker Per il poker con 10 cifre [0,9] e gruppi di 5 cifre si ha: d=10, k=5 e r=5,4,3,2,1. Usando il generatore di numeri casuali uniforme del C++, si ottengono, con una statistica di 200000 quintuple, questi risultati: N=200000 dato teoria tutti diversi 60803 60480 coppia 100722 100800 doppia coppia/tris 35802 36000 full/poker 2650 2700 colore 23 20

Altre distribuzioni casuali Grazie al teorema della distribuzione cumulativa, se X e una variabile aleatoria con densita qualunque p(x), la variabile aleatoria cumulativa C: C(X) X p(x)dx e uniforme nell intervallo [0,1]. Se l integrale e noto in modo analitico, si puo scrivere: c F(x) Usando un generatore casuale uniforme su un calcolatore, si possono generare variabili aventi una densita qualsiasi usando l equazione: 1 X F (random)

La Formica di Langton Una formica cammina su una grande griglia di quadrati, inizialmente tutti bianchi. Quando la formica arriva su un quadrato bianco, lo colora di nero e gira a destra. Quando arriva su un quadrato nero, lo colora di bianco e gira a sinistra. Per circa 10000 passi, la formica continua a girare, tornando sui propri passi e creando questa distribuzione di punti apparentemente caotica. Ma a un certo punto, crea un percorso chiuso lungo un autostrada e riesce a scappare!

Primi passi della Formica

La Formica ubriaca Una delle molte possibili varianti della formica, con un elemento casuale (random walker): la formica adesso ha una moneta con se e la lancia ad ogni passo: se esce testa, gira a destra, mentre se esce croce gira a sinistra. Inoltre, se la casella e bianca la colora di nero e viceversa. Il moto risultante e (ad esempio) il seguente: La formica non sembra finire piu in un loop e cammina proprio a caso, come se fosse ubriaca!

Tests di casualita e Formiche Vogliamo verificare se le sequenze di numeri (che ne rappresentano il moto) generate dalle due formiche sono generate in modo casuale oppure no. Due possibilita (coincidenti per Langton): a. Sequenza di 0 e 1 a seconda che la formica colori la casella di nero o di bianco (rispettivamente). b. Sequenza di 0 e 1 a seconda che la formica giri a destra o a sinistra (rispettivamente). Esempio di sequenza da studiare: 0,0,1,1,0,1,1,0,1,1,0,0,0,0,1,1,0,0,0,1,0,1,1,0

Test di frequenza e Formiche Langton Ubriaca Non uniforme e correlato al colore iniziale del foglio. Uniforme

Test del gap e Formiche Langton Ubriaca

Il poker delle Formiche! Per il poker con 2 cifre [0,1] e gruppi di 5 cifre si ha: d=2, k=5 e r=3,2,1. Infatti, in questo poker semplificato, sono definibili solo full, poker e colore. full: 00111 00011 poker: 01111 00001 colore: 00000 11111 N=20000 dato teoria full 12578 12500 poker 6175 6248 colore 1247 1248 Risultati del test del poker ridotto per il generatore uniforme del C++.

Test del poker e Formiche Probabilita teoriche date da legge binomiale: full poker colore 0.3125 (x2) 0.1562 (x2) 0.0312 (x2) Langton N=11654 dato teoria full 1197 1457 poker 1133 728 colore 0 145 Ubriaca N=13879 dato teoria full a. 1507 b. 1716 poker a. 887 b. 874 colore a. 381 b. 165 1735 867 173

Caso o Caos? Formica di Langton: sistema non casuale che fallisce i tests statistici di casualita. Comportamento caotico. Formica ubriaca: sistema casuale, governato dalle leggi della statistica, che puo presentare proprieta non casuali in casi particolari. Occorre discriminare tra distribuzioni casuali (cioe non deterministiche) e distribuzioni caotiche (ma deterministiche): distribuzioni di punti disordinate, apparentemente simili, possono in realta essere molto diverse. Caos e Caso sono concetti molto diversi, ma e difficile capire dove sta il confine che li separa: i tests di casualita sono uno strumento che ci puo aiutare

Formicai virtuali Distribuzione finale con 10 formiche di Langton generata con il programma Ants95 (disponibile in rete).

Problemi filosofici La Formica di Langton e un problema molto studiato e costituisce ancora un puzzle, anche per la Fisica Teorica attuale: Esiste un sistema di cui conosciamo esattamente la Legge del Tutto, ma il cui moto non e prevedibile. Queste formiche hanno inoltre moltissime altre proprieta interessanti: sono un esempio di automi cellulari ed esibiscono in alcuni casi particolari anche delle proprieta frattali.

Il concetto di Frattale Frattale: oggetto che appare simile a se stesso a vari livelli di ingrandimento e in cui, grazie a questa proprieta di simmetria su diverse scale, ogni piccola parte e una copia dell oggetto intero (proprieta di autosomiglianza). Frattali matematici Autosomiglianza ad ogni scala: non esistono in natura, ma sono mostruosita matematiche. insieme di Cantor insieme di Sierpinski insieme di Mandelbrot Frattali Fisici Autosomiglianza solo su certe scale: esistono in natura come oggetti veri, ma anche come rappresentazioni di processi fisici. profilo costiero galassie pendolo caotico

Esempi di Frattali Nuvole Felce Profili di coste e montagne Crateri lunari

Insieme di Mandelbrot Iterazione nel piano complesso della sequenza: z n 1 z 2 n c

Galassie La distribuzione delle galassie nell universo sembra essere di natura frattale! fotografia simulazione

Al confine tra Caso e Caos Studio del moto Browniano e di sistemi detti fbms, cioe fractional Brownian motion(s). Sistemi molto diffusi in natura che riproducono le caratteristiche tipiche del moto dei pollini di grano sulla superficie dell acqua, osservato per la prima volta dal botanico scozzese Brown. Presentano caratteristiche frattali e mostrano un comportamento casuale o caotico a seconda dei valori di alcuni parametri critici che li descrivono. Recente linea di ricerca, di grande attualita, su cui non si sa ancora molto: la sfida e aperta!!!

Bibliografia A. Rotondi, P. Pedroni, A. Pievatolo Probabilita, Statistica e Simulazione Springer D.E. Knuth The Art of Computer Programming Addison-Wesley P. Pedroni Elementi di Simulazione DFNT A.K. Dewdney Le Scienze, Settembre 1994